M. Comas-Cufí, J. A. Martín-Fernández, G. Mateu-Figueras, J. Palarea-Albaladejo
El análisis estadístico basado en coordenadas log-cociente se ha convertido en la principal metodología para el estudio de vectores de datos multivariantes en los que la información relevante está en las magnitudes relativas. Este tipo de datos son comúnmente llamados datos composicionales y los valores observados sólo pueden ser interpretados por comparación entre variables. Dentro de este marco metodológico, proponemos un método paramétrico para identificar grupos en conjuntos de datos de conteo multivariantes. Mediante el reemplazamiento de ceros de conteo y mixturas de distribuciones, aproximamos la distribución de las coordenadas log-cociente, que serán utilizadas para crear las agrupaciones. La propuesta permite el análisis incluso cuando los datos contienen ceros, algo que habitualmente dificulta la aplicación del enfoque log-cociente en la práctica. Sus ventajas e inconvenientes se discuten en comparación con otros métodos de agrupación de datos de conteo existentes.
Palabras clave: Datos Composicionales, Agrupación Paramétrica, Log-cociente, Datos de Conteo
Programado
GT04 Análisis Multivariante y Clasificación II
7 de junio de 2022 15:30
Sala de Claustros