M. Novás Filgueira, L. Sanguiao Sande, C. Sáez Calvo, A. Garcia Monmeneu, J. Muñoz Estepa
La Encuesta Estructural de Empresas (EEE) es una encuesta anual con un método mixto de recogida por cuestionario y registros administrativos.
Los registros administrativos son una fuente muy valiosa para la EEE. Es importante utilizar estas fuentes de datos para reducir costes y las cargas de respuesta a las empresas.
Se han probado diferentes modelos: Elastic Net, Random Forest, XGBoost, etc, para cada una de las variables de la Encuesta Estructural a Empresas, utilizando como regresores las variables de los registros administrativos. El objetivo es determinar el modelo óptimo para cada una de las variables de la EEE, que permita predecir estas variables en todas las unidades del Directorio Central de Empresas (DIRCE), que formen parte del ámbito poblacional de la EEE.
Los modelos de Machine Learning son muy útiles para imputación masiva, proporcionando indicadores de calidad.
Keywords: Machine Learning, imputación masiva, Elastic Net, Random Forest, XGBoost
Scheduled
XIII Public Statistics Conference. Applications of new statistical methods and new sources for official statistical production (I)
June 9, 2022 10:10 AM
Cloister room