M. Novás Filgueira, L. Sanguiao Sande, C. Sáez Calvo, A. Garcia Monmeneu, J. Muñoz Estepa
La Encuesta Estructural de Empresas (EEE) es una encuesta anual con un método mixto de recogida por cuestionario y registros administrativos.
Los registros administrativos son una fuente muy valiosa para la EEE. Es importante utilizar estas fuentes de datos para reducir costes y las cargas de respuesta a las empresas.
Se han probado diferentes modelos: Elastic Net, Random Forest, XGBoost, etc, para cada una de las variables de la Encuesta Estructural a Empresas, utilizando como regresores las variables de los registros administrativos. El objetivo es determinar el modelo óptimo para cada una de las variables de la EEE, que permita predecir estas variables en todas las unidades del Directorio Central de Empresas (DIRCE), que formen parte del ámbito poblacional de la EEE.
Los modelos de Machine Learning son muy útiles para imputación masiva, proporcionando indicadores de calidad.
Palabras clave: Machine Learning, imputación masiva, Elastic Net, Random Forest, XGBoost
Programado
XIII Jornadas Estadística Pública. Aplicaciones de nuevos métodos estadísticos y nuevas fuentes para la producción estadística oficial I
9 de junio de 2022 10:10
Sala de Claustros