A. Martínez Castaño, M. Ruiz Echeverria
Desde octubre de 2020 Eustat ha introducido en la explotación de la Encuesta de Establecimientos Turísticos Receptores (ETR) una fuente externa para la estimación de la variable Tarifa media diaria por habitación ocupada (ADR) y, como consecuencia, en la variable indirecta Ingresos por habitación disponible (Revpar). Mediante la utilización de técnicas de Big data en distintas plataformas online de reservas se obtiene una estimación del ADR de los
establecimientos hoteleros con oferta en la C.A. de Euskadi.
En este trabajo se comenta el procedimiento seguido para la extracción de los datos de distintas plataformas, así como de su almacenamiento y procesamiento en los servidores de Eustat. Además, se describen el linkado con el marco poblacional de la encuesta de todos los datos scrapeados, así como los modelos estadísticos utilizados para ajustar los precios estimados al ADR observado. De especial interés es el necesario ejercicio de industrialización seguido para
incorporar este procedimiento en la aplicación de gestión, que permite su plena integración en los procesos de estimación de las distintas variables incluidos en la ETR.
Por último, se hace hincapié en la necesidad de una continua monitorización de los modelos estadísticos utilizados para poder acomodar diferencias en las relaciones entre las variables que pueden producirse, por ejemplo, en épocas convulsas como la derivada de la pandemia COVID19.
Keywords: ADR, RevPar, Modelos Big Data, Web scraping, Estadística oficial, Turismo receptor
Scheduled
XIII Public Statistics Conference. Applications of new statistical methods and new sources for official statistical production (I)
June 9, 2022 10:10 AM
Cloister room