Aplicaciones del anlisis de correspondencia, simple y mltiple. Clases latentes

 

Applications of correspondence analysis, simple and multiple. Latent classes

Aplicaes de anlise de correspondncia, simples e mltiplas. Classes latentes

 



Correspondencia: yoel.hernandez@uta.edu.ec

 

 

Ciencias tcnicas y aplicadas

Artculo de investigacin

 

*Recibido: 05 de julio de 2020 *Aceptado: 20 de agosto 2020 * Publicado: 07 de septiembre de 2020

 

 

 

 

        I.            Mster en Ciencias Matemticas Mencin Probabilidades y Estadsticas, Licenciado en Educacin en la Especialidad de Matemtica Computacin, Investigador Independiente, Ecuador.

     II.            Investigador Independiente, Ecuador.


Resumen

Se exponen ejemplos clsicos y de aplicaciones reales sobre la vinculacin de varios mtodos de anlisis de datos categricos.

Palabras Claves: Anlisis de las correspondencias; Anlisis de las frecuencias de configuraciones; anlisis de clases latentes.

 

Abstract

Classical and real-life application examples of linking various methods of categorical data analysis are presented.

Keywords: Analysis of the correspondences; Analysis of the frequencies of configurations; latent class analysis.

 

Resumo

So apresentados exemplos de aplicativos clssicos e reais de vinculao de vrios mtodos de anlise de dados categricos.

Palavras-chave: Anlise das correspondncias; Anlise das frequncias das configuraes; anlise de classe latente.

 

Introduccin

El trabajo contiene aplicaciones a problemas, uno real y otro de libro de texto, para poner de manifiesto no slo las caractersticas del anlisis con esos mtodos, sino tambin para discutir, sobre la base de los ejemplos, algunas ideas que pueden ser de inters para los especialistas, especialmente con el fin de establecer una forma de anlisis ms cabal y abarcadora.

Consideraciones acerca la vinculacin de los mtodos

La idea de utilizar varios mtodos para llegar a una mejor interpretacin de un conjunto de datos no es nueva. En el caso de datos continuos es muy frecuente combinar, por ejemplo, el anlisis de componentes principales con el cluster analysis y, en ciertas ocasiones, con el anlisis discriminante.

Estas combinaciones se hacen intuitivamente, sin que, en la mayora de las ocasiones, medien consideraciones tericas que las justifiquen, sino la prctica y la capacidad de interpretacin del analista, as como el conocimiento profundo del material de estudio.

De igual forma, podra procederse en el caso del anlisis de datos categricos y trabajar con los diversos mtodos de manera concatenada para lograr una interpretacin cabal.

No obstante, lo antes expuesto permite, hasta cierto punto, un trabajo menos dependiente de la intuicin y constituye, de hecho, un interesante ensayo de justificacin del uso conjunto de diversas tcnicas.

En este sentido, es importante destacar que todava existe un campo de investigacin que podra llegar a ser muy productivo y que podra desembocar en una justificacin ms completa que permitiera la formulacin de una metodologa de trabajo para el anlisis de datos categricos.

 

Aplicaciones prcticas

En la interpretacin slo se har hincapi en los aspectos de inters para el presente trabajo. Las implicaciones propias del anlisis dentro de las disciplinas correspondientes se salen de este marco y queda abiertas para el trabajo conjunto con los especialistas. Los datos fueron procesados con el programa LEM 1.0 (VERMUNT, 1997).

Formas de suicidio en Alemania segn sexo y ao (Krauth & Lienert, 1973; von Eye et al., 1995).

Aqu interesa conocer si los suicidas de ambos sexos se valen de los mismos mtodos para llevar a cabo su intencin y, asimismo, si esto depende del tiempo que ha transcurrido desde el fin de la II Guerra Mundial.

Las variables en estudio son: Ao (1944, 1952), Sexo (Masculino, Femenino), Forma de suicidio (gas, cuerda, soporfero, ahogado, venas, disparo, salto). Por tanto, se trata de una tabla de 3 entradas de dimensin 2 x 2 x 7. Los datos se presentan en forma tabular a continuacin:

 

Tabla 1: Suicidios en Alemania

Ao y forma de suicidio

Sexo

Masculino

Femenino

1952, gas

52

47

1952, cuerda

31

14

1952, soporfero

44

97

1952, ahogado

20

10

1952, venas

22

5

1952, disparo

3

0

1952, salto

2

2

1944, gas

16

61

1944, cuerda

76

35

1944, soporfero

7

9

1944, ahogado

19

54

1944, venas

15

4

1944, disparo

35

11

1944, salto

9

2

 

Resultados

Aqu slo se presentar el anlisis de los resultados. El grfico ternario no se presenta porque los resultados no son en absoluto explicativos.

1.      Anlisis de las frecuencias de configuraciones (AFC)

Se determinaron 2 tipos: (1952, soporferos, mujeres) y (1944, disparo, hombres)

Figura 1: Configuraciones en el plano determinado por el ACM

 

Figura 2: Configuraciones en el espacio determinado por el ACM (3 dimensiones)

 

Anlisis de clases latentes

El ajuste del modelo de 3 clases no fue bueno. No obstante, no se busc qu modelo ajustaba mejor para poder apreciar qu relaciones se tienen entre ambos mtodos en este caso.

 

Se hizo la correspondiente transformacin de rescalamiento de los datos. Los resultados aparecen en la tabla siguiente:

 

Tabla 2: Suicidios en Alemania (Rescalados)

Variables manifiestas

Clase latente

1

2

3

0.4467

0.3124

0.2409

Ao 1952

0.8644

0.1357

0

Ao 1944

0.0338

0.4871

0.4791

Gas

0.5545

0.1110

0.3344

Cuerda

0.162

0.6181

0.2208

Soporfero

0.9292

0.0341

0.0368

Ahogado

0.2268

0.2538

0.5193

Venas

0.4097

0.5125

0.0779

Disparo

0

0.7752

0.2247

Salto

0.1861

0.6857

0.1297

Masculino

0.3751

0.6248

0

Femenino

0.5183

0

0.4818

 

Figura 3: Grfico del anlisis de las correspondencias mltiples

 

Figura 4: Grfico de los parmetros rescalados (2 dimensiones)

Captura de pantalla de un celular con letras

Descripcin generada automticamente

Figura 5: Grfico de los parmetros rescalados (3 dimensiones)

Imagen que contiene texto, mapa

Descripcin generada automticamente

 

Discusin

Se encontraron dos tipos, uno que habla de que el ao 1952 las mujeres se suicidaban con soporferos (1,3,2), mientras que el otro tipo da que en 1944 los hombres se suicidaban con disparos (2,6,1). Cuando se analizan las coordenadas del ACM (Figs. 2 y 3) se aprecia que efectivamente estas dos configuraciones conforman los extremos del grfico. Un aspecto interesante que se ve tambin es la divisin de los aos, con lo cual podra concluirse que hay un cambio en la forma de suicidios en esos dos momentos.

El anlisis de clases latentes coincide completamente con los resultados del ACM . En ellos se aprecia una divisin de los aos (Figs. 4, 5 y 6). Al aplicar el anlisis de los ngulos en el grfico del ACM se ve la asociacin clara de las mujeres con la forma de suicidio por soporfero en el ao 1952, mientras que la forma asociada al hombre aparece en el otro extremo. Es bueno sealar que la representacin bidimensional no tiene un gran porcentaje de inercia, por lo que las conclusiones no tienen la fuerza que tendran en el caso de un alto porcentaje.

Como se aprecia, aunque el modelo de clases latentes no se ajust, se puede hacer una interpretacin con el ACM que coincide con los resultados del ACL.

Desarrollo del lenguaje del nio cubano (Gonzlez, Snchez & Lpez, 2006)

Se encuestaron 213 nios con edades entre 3 y 4 aos, en el perodo de septiembre de 1993 a enero de 1994, en 8 provincias del pas (Lpez et al., 2000). Aqu slo se presenta un estudio parcial referido a la expresin de los componentes del grupo lxico sustantivos (A), verbos (B), adjetivos (C) y adverbios (D). A continuacin, se dan los datos:

Tabla 3: Evolucin del lenguaje en nios cubanos

SUSTANTIVOS

VERBOS

ADJETIVOS

ADVERBIOS

Incorrecto

Correcto

Incorrecto

Incorrecto

Incorrecto

52

3

Incorrecto

Incorrecto

Correcto

5

4

Incorrecto

Correcto

Incorrecto

8

5

Incorrecto

Correcto

Correcto

3

2

Correcto

Incorrecto

Incorrecto

14

10

Correcto

Incorrecto

Correcto

10

6

Correcto

Correcto

Incorrecto

18

19

Correcto

Correcto

Correcto

17

46

 

Resultados

Aqu slo se presentar el anlisis de los resultados. Al igual que en el caso anterior, en este tambin se prescinde del grfico ternario.

1.      Anlisis de las frecuencias de configuraciones (AFC)

Se determinaron 2 tipos correspondientes a la configuracin (incorrecto, incorrecto, incorrecto, incorrecto) y (correcto, correcto, correcto, correcto), A continuacin, se presentan los grficos, segn el ACM, de las configuraciones en 2 y 3 dimensiones:

Figura 6: Configuraciones en el plano determinado por el ACM

 

Figura 7: Configuraciones en el espacio determinado por el ACM.

Imagen que contiene texto

Descripcin generada automticamente

2.      Anlisis de clases latentes

Se ajust el modelo de 3 clases latentes con un valor de L2 = 1.9983 (p = 0.1575). En el trabajo original, tambin se ajust el modelo para clases ordinales, los interesados se remiten a la publicacin Gonzlez et al. (2006), pero aqu slo se trabajar con el de 3 clases por simplicidad.

Se hizo la correspondiente transformacin para obtener los datos rescalados que aparecen en la tabla que sigue:

Tabla 4: Desarrollo del lenguaje (parmetros rescalados)

Variables manifiestas

Clase latente

1

2

3

0.2309

0.5555

0.2143

Sustantivo Incorrecto

0.600

0.401

0

Sustantivo Correcto

0

0.652

0.348

Verbo Incorrecto

0.457

0.544

0

Verbo Correcto

0.015

0.567

0.419

Adjetivo Incorrecto

0.399

0.602

0

Adjetivo Correcto

0.014

0.496

0.491

Adverbio Incorrecto

0.387

0.562

0.051

Adverbio Correcto

0

0.546

0.455

 

Figura 8: Grfico del anlisis de las correspondencias mltiples

Captura de pantalla de un celular

Descripcin generada automticamente

 

Figura 9: Grfico de los parmetros rescalados (2 dimensiones)

Captura de pantalla de un celular con texto

Descripcin generada automticamente

 

Figura 10: Grfico de los parmetros rescalados (3 dimensiones)

Imagen que contiene texto

Descripcin generada automticamente

 

Discusin

En el AFC se encontraron dos tipos, uno correspondiente a los nios que contestaron incorrectamente todos los items (1,1,1,1) y el otro formado por los que respondieron correctamente (2,2,2,2). Como se aprecia en el grfico del ACM asociado a las configuraciones (Fig. 6) , estas dos aparecen en los extremos, mientras que entre ellas se ordenan las configuraciones en el sentido de ir respondiendo correctamente mayor cantidad de items.

El ACL de 3 clases repite la estructura del AFC, ya que presenta una clase para los que responden correctamente a todos los Items, otra para los que fallan y una tercera clase que rene a todos aquellos que fallan en alguna. Como se aprecia en los grficos correspondientes (Figs. 8, 9 y 10), el ACM da una estructura semejante con 2 dimensiones.

Evidentemente, en este conjunto de datos hay una componente ordinal que, si bien no se consider explcitamente, s sale de todos los anlisis.

Al considerar el estudio del desarrollo del lenguaje con los mtodos combinados se obtiene una visin ms completa del fenmeno en estudio.

 

Conclusiones y recomendaciones

Si bien se considera que este es un estudio preliminar, no obstante, pueden formularse algunas conclusiones que resultan de inters, porque pudieran considerarse, a su vez, puntos de arranque para nuevos trabajos.

 

                     El uso de las posibilidades grficas del AC, en sus dos variantes, permite una visualizacin de los resultados de los otros dos mtodos planteados, al tiempo que permite un anlisis ms completo, cuando se consideran sus propios resultados.

 

                     En los ejemplos y aplicaciones realizados en este trabajo, se aprecian nuevos aspectos del problema que permiten una visin ms profunda de la naturaleza de los datos.

 

Referencias

1.      AGRESTI, A. (2002): Categorical Data Analysis (2nd Edition), Wiley, Nueva York

2.      BENZCRI, J.-P et collaborateurs ( 1973) : L'Analyse des Donns. L'Analyse des Correspondences, Duno, Pars

3.      BENZCRI, J.-P. (1992): Correspondence Analysis Handbook, Marcel Dekker, Inc., Nueva York, 665 + xi pp.

4.      FERNNDEZ, R. S. M. (2011). Anlisis de correspondencias simples y mltiples. Universidad Autnoma de Madrid: Facultad de Ciencias Econmicas y Empresariales.

5.      GABRIEL, K. R. (1971): The biplot graphic display of matrices with application to principal component analysis, Biometrika 58(3), 453-467 pp.

6.      GONZALEZ, D. A. (2006): Dos enfoques para el anlisis de clases latentes ordinales. En: Revista de la Facultad de Matemtica y Computacin de la Universidad de La Habana. Cuba. Vol. 27, Nm. 1.

7.      GONZALEZ, D. A. (2006): Algunas consideraciones prcticas acerca de la estimacin de parmetros en el modelo clsico de clases latentes. En: Revista de la Facultad de Matemtica y Computacin de la Universidad de La Habana. Cuba. Vol. 27, Nm. 1.

8.      GONZLEZ, A., SNCHEZ, J.E. y LPEZ, Marcia (2006): Dos enfoques para el anlisis de clases latentes ordinales. Investigacin Operacional, 27(1), pp. 4-11

9.      GOODMAN, L.A. (1997): Statistical Methods, Graphical Displays, and Tukey's Ladder of Re-expression in the Analysis of Nonindependence in Contingency Tables: Correspondence. Analysis, Association Analysis, and the Midway View of Nonindependence, en: BRILLINGER, D., FERNHOLZ, L.T. & MORGENTHALER, S.: The Practice of Data Analysis: Essays in Honor of John W. Tukey, Princeton, Nueva Jersey, Princeton University Press, pp0. 101-132

10.  GOODMAN, L. A. (2000) : The Analysis of Cross-Classified Data: Notes on a Century of Progress in Contingency Table Analysis, and Some Comments on Its Prehistory and Its Future, Marcel Dekker, Inc., New York, 231 + i pp.

11.  GREENACRE, M. (1984): Theory and Applications of Correspondence Analysis, Academic Press, Londres

12.  GREENACRE, M. (2006) : Tying up the loose ends in simple correspondence analysis, Economic Working Paper 940.

13.  GREENACRE, M. (2005): From correspondence analysis to mltiple and joint correspondence analysis.

14.  JAMBU, M. (1991) : Exploratory and Multivariate Data Analysis, Academic Press, Inc., Boston, 474 + xv pp.

15.  KRAUTH, J. y LIENERT, G.A. (1973) : Die Konfigurationsfrequenzanalyse und ihre Anwendung in Psychologie und Medizin, Freiburg, Albert

16.  LAUTSCH, E. y PLICHTA, M.M. (2003): Configural Frecuency Analysis (CFA), Mltiple Correspondence Analysis (MCA) and Latent Class Analysis (LCA): An empirical comparison, Psychology Science 45(2), 298-323 pp.

17.  LAZARSFELD, P.F. (1950): The logical and mathematical foundation of latent structure analysis. En: STOUFFER, S. A.et al. (Eds.): The American Soldier, Vol. IV, Measurement and Prediction, Princeton

18.  LAZARSFELD, P.F. y HENRY, N. W. (1968): Latent Structure Analysis, Houghton Mifflin, Boston

19.  LEEUW, J. & Van der HEIJDEN, P.G.M. (1991): Reduced rank models for contingency tablas, Biometrika, 78, pp. 229-232

20.  LPEZ, M., REGAL, N. , PASCUAL, M., GONZLEZ, A. y SNCHEZ, J.E. (2000): Desarrollo del lenguaje del nio cubano menor de 18 meses. Revista Cubana de Pediatra, 72(1), 32-39 (pdf)

21.  MOOD, A.M., GRAYBILL, R.A. y BOES, D.C. (1974): Introduction to the Theory of Statistics (3rd Edition), MacGraw Hill, Londres

22.  MONTGOMERY, D, C. (1991) : Design and Analysis of Experiments, Third Edition, John Wiley and Sons, Nueva York, 649 + xvii pp.

23.  RAO, C.R. y SZKELY, G.J. (Eds.) (2000) : Statistics for the 21st Century. Methodologies for Applications of the Future, Marcel Dekker, Inc., Nueva York

24.  Van der HEIJDEN, GILULA, P. G. y van der ARK, L. A. (1999) : An extended study into the relationships between correspondence analysis and latent class analysis, 40 + vii pp.

25.  VERMUNT, J. K. (1997): LEM 1.0: A general programa for the analysis of categorical data. Tilburg: Tilburg university Von EYE, A. y NIEDERMEIER, K.E. (1999) : Statistical Analysis of Longitudinal Categorical Data in the Social and Behavioral Sciences, Lawrence Erlbaum Associates, Mahwah, Nueva Jersey.

26.  Von EYE, A., SPIEL, C. y ROVINE, M.J. (1995): Concepts of nonindependence in configural frequency analysis, Journal of Mathematical Sociology, 20, pp. 41-54

 

 

 

 

 

 

 

 

2020 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) (https://creativecommons.org/licenses/by-nc-sa/4.0/).

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/