M. M. Rueda García, L. Castro, B. Cobo Rodríguez, R. Ferri García, S. Pasadas del Amo
En los últimos años se han proporcionado diferentes métodos para combinar información de múltiples fuentes de datos. Nosotros nos centramos en caso de muestras probabilísticas y no probabilísticas que comparten el mismo cuestionario, combinando ambas para maximizar la eficiencia de las estimaciones con la ayuda de métodos de aprendizaje automático.
Desarrollamos un nuevo método de estimación para integrar datos de muestras probabilísticas y no probabilísticas, evaluamos la eficiencia de las estimaciones resultantes comparándolas con otras estrategias que se han utilizado antes. La aplicación de este método a la segunda ola de la Encuesta sobre el impacto de la pandemia de COVID-19 en España nos permite concluir que el método de estimación que proponemos es la mejor opción para reducir los sesgos observados en nuestros datos.
Palabras clave: encuestas no probabilísticas, técnicas de aprendizaje automático, Propensity score matching, muestreo de encuestas
Programado
Sesión Invitada Data Analysis and Social Science. Integración de datos encuestas probabilísticas, no probabilísticas y big data
7 de junio de 2022 15:30
A11