Capítulo 1 OPERATIVOS ESTADÍSTICOS
1.1 ETI
La Encuesta de Turismo Internacional (ETI) es un operativo con frecuencia mensual que se realiza de manera conjunta entre el Ministerio de Turismo y Deportes de la Nación y el INDEC y tiene como principal objetivo la caracterización de los viajes turísiticos y la medición del gasto turístico de los viajeros no residentes (mientras permanecen en Argentina) y de los viajeros residentes (mientras permanecen en el exterior).
Esta encuesta se realiza en los Aeropuertos Internacionales de Ezeiza, Aeroparque J. Newbery, Aero Córdoba, Aero Mendoza, Puerto de Buenos Aires y el paso Internacional Cristo Redentor y sus resultados se expanden a los datos de turistas estimados a partir del procesamiento de migraciones, detallado en el capítulo de Registros Administrativos.
A continuación, se detallan los pasos implementados para la elaboración, a partir del insumo original (las bases de datos enviadas por el INDEC), de los siguientes productos:
Dos base acumuladas anuales, una de residentes y otra de no residentes. Los datos de las mismas se añaden a :
bases agrupadas históricas:
- base de residentes.
- base de no residentes expandida al total del universo.
- base de no residentes expandida al total muestral. Estas tres bases sirven de insumo a tres pivots de uso interno
base acumulada histórica:
- insumo para recursos. - insumo para base por localidad para tablero de turismo internacional.
Todos los scripts y detalles se encuentran en el repositorio: https://github.com/d4t4tur/eti
1.1.1 Desde base enviada por INDEC a base acumulada anual y pivots
Entrada
Se descargan todos los meses del compartido que tiene el Ministerio con el INDEC, las bases de residentes y no residentes con los datos del mes (o del trimestre, para el último mes de cada trimestre) en formato sas. Las bases trimestrales tienen nuevos datos que se estiman trimestralmente, como el gasto y la estimación de excursionistas.
Procesos:
Para cada base, se corren los scripts de las carpetas correspondientes del repositorio: residentes y no residentes.
Salidas:
Base mensual o trimestral, la cual se suma a una base acumulada anual, en formato .
sav
y se copia ensrv/DataDNMYE/eti/entradas
. Se genera una base de residentes y otra de no residentes. Los datos de las mismas se añaden a tres bases agrupadas históricas:- base de residentes expandida al total del universo (ponderada por
WPF
), en Access. - base de no residentes expandida al total del universo (ponderada por
WPF
), en .csv
- base de no residentes expandida al total muestral (ponderada por cantidad de personas en el grupo de viaje:
p18_1
), en .csv
- base de residentes expandida al total del universo (ponderada por
Estas tres bases se copian en /DataDNMYE/eti/pivots/bases_pivots
y sirven de insumo a tres pivots de uso interno, las cuales se copian en /DataDNMYE/eti/pivots
. La función original de las mismas era tener un fácil y rápido acceso a los datos para usuarios que no estén tan familiarizados con el uso de base de datos. Además, tenía información histórica en un momento en el que las bases eran solamente anuales, y no existía una base acumulada histórica. Las de no residentes se utilizaban para realizar los informes de mercado. Cuando se retomen estos informes, se pueden hacer también directamente con las bases csv. recién señaladas5, de las cuales las pivots toman los datos.
Las bases/pivots expandidas al total poblacional sirven para datos generales o desagregados por los países/regiones publicables, los cuales están calibrados. En tanto, la base/pivot expandida al total muestral sirve para tener información sobre turistas residentes en países/regiones no publicables. Esta información solo permite ver relaciones o porcentajes, pero no cantidades. Se recomienda usar la información con aperturas de al menos 50 casos muestrales.
1.1.2 Elaboración de la base histórica en rds
a a partir de la base acumulada anual
Actualmente contamos con una base acumulada histórica que se va actualizando todos los meses a la base anual. A continuación se detalla este proceso.
No residentes
Para la elaboración de la base .rds
se utilizan dos insumos:
- La base actualizada de la ETI no residentes en formanto .
sav
de nombreETI E 2023
que se encuentra ensrv/DataDNMYE/eti/entradas
. - La base histórica 2009-2022 en formato .
rds
eti_nr_2014_2022
.rds
que se encuentra ensrv/DataDNMYE/eti/bases
.
Con estos insumos, utilizando el script que se encuentra en el repositorio https://github.com/d4t4tur/eti.git
(en la carpeta scripts/armado_base_rds
) de nombre armado_base_nr
se genera la base en .rds
de nombre eti_nr_2009_2023
que se encuentra en srv/DataDNMYE/eti/bases
.
Residentes
Para la elaboración de la base .rds se utilizan dos insumos:
- La base actualizada de la ETI no residentes en formanto .
sav
de nombreETI A 2023
que se encuentra ensrv/DataDNMYE/eti/entradas
. - La base histórica 2009-2022 en formato .
rds
eti_a_2014_2022
.rds que se encuentra ensrv/DataDNMYE/eti/bases
Con estos insumos, utilizando el script que se encuentra en el repositorio https://github.com/d4t4tur/eti.git
(en la carpeta scripts/armado_base_rds
) de nombre armado_base_arg
se genera la base en .rds de nombre eti_a_2009_2023
que se encuentra en srv/DataDNMYE/eti/bases
.
1.1.3 Generación de recursos de datos abiertos
Los scripts que se utilizan para generar los recursos de la ETI en formato .csv que se suben a data abierta se encuentran en https://github.com/d4t4tur/data_abierta_insumos.git
, en la carpeta scripts
.
Con el script
eti_recursos_emisivo
se generan los recursos del turismo emisivo que se guardan en el servidor ensrv/DataDNMYE/eti/recursos/emisivo
.Con los scripts
eti_recursos_receptivo
yeti_recursos_receptivo_por_provincia
que se guardan en el servidor ensrv/DataDNMYE/eti/recursos/receptivo
.
1.1.4 Generación de base por localidad para el tablero de turismo internacional
Correr script base_por_localidad/base_por_localidad_para_tablero.R
que se encuentra en el repositorio para generar la base por localidad que sirve de insumo al tablero de turismo internacional: eti_localidad.rds
. El día de la publicación de turismo internacional a las 16 horas se debe copiar en: /DataDNMYE/eti
.
1.2 EOH
La Encuesta de Ocupación Hotelera (EOH) es un operativo con frecuencia mensual que se realiza de manera conjunta entre el Ministerio de Turismo y Deportes de la Nación y el INDEC y tiene como principal objetivo la medición del impacto del turismo internacional e interno sobre la actividad de los establecimientos hoteleros y parahoteleros del país.
En la actualidad se relevan 49 localidades, cuyos resultados se expanden para lograr representatividad a nivel regional (y total país).
A continuación, se detallarán los pasos implementados para la elaboración, a partir del insumo original (la base de datos enviada por el INDEC), de los siguientes productos:
- Una base en formato .
sav
, que sirve de insumo para el procesamiento de datos en r y actualizar una base Access - Una base Access que nutre a una base PIVOT .
xlsx
(de uso interno) - Una base en formato .
rds
- Recursos en formato .
csv
- Un informe mensual (en
pdf
) - Actualización mensual del reporte de la EOH (
htlm
)
1.2.1 Procesamiento de la base de datos
La base de datos de la EOH es enviada mensualmente por el personal del INDEC (generalmente, el envío se realiza aproximadamente una semana antes de la publicación del informe de prensa elaborado por dicho Instituto -entre el 20 y 30 de cada mes-).
La base tiene formato .xlsx
y la misma se levanta y procesa en SPSS
. El procesamiento se realiza en diferentes etapas (para cada una hay una sintaxis diferente) y se puede resumir de la siguiente manera:
- Se levanta la base .
xlsx
, se procesa la información y se genera una base en formato .sav
- Se generan bases agregadas que se utilizan de insumo para actualizar la base en ACCESS
- Se actualiza la base PIVOT (que se nutre de la base ACCESS)
Luego, utilizando r, se levanta la base en formato .sav
y corre un script para generar una base formato .rds
.
El detalle de los pasos implementados en este apartado se encuentra en el siguiente repositorio.
1.2.2 Generación de recursos de la EOH
En esta etapa (que utiliza como insumo la base de la EOH en formato .rds
) se generan una serie de recursos en formato .csv
que sirven para:
- Nutrir el dataset del relevamiento en el sitio de SINTA
- Generar el informe mensual de la EOH
- Actualizar el reporte de la EOH
El detalle de los pasos implementados en este apartado se encuentra en el siguiente repositorio.
1.2.3 Generación del informe y actualización del tablero
El informe mensual de la EOH elaborado por la Dirección Nacional de Mercados y Estadística presenta información referida a la evolución de viajeros y pernoctes (y estadías promedio) en establecimientos hoteleros y para hoteleros del país, desagregada por origen de los viajeros, región y localidad de destino y categoría hotelera. También se presenta información vinculada a la oferta: ocupación y disponibilidad de plazas (y el indicador que surge del cociente entre esos dos datos: la tasa de ocupación en plazas).
Mientras que el tablero de la EOH dispone de la misma información que el informe mensual, con la diferencia que las tablas y datos presentados se encuentran en formato .htlm
(lo cual habilita, en algunos casos, la interactividad de los mismos).
El detalle de los pasos implementados en este apartado se encuentra en los siguientes repositorios:
- https://github.com/d4t4tur/informes_pdf.git (para el informe)
- https://github.com/dnme-minturdep/dnme_apps.git (para el tablero).
1.3 EVYTH
La Encuesta de Viajes y Turismo de los Hoares (EVyTH) es un operativo con frecuencia mensual que tiene como objetivo medir la evolución de los viajes realizados por los hogares residentes en los grandes aglomerados urbanos de Argentina, sus características y computar aspectos socio-demográficos que permitan caracterizar a los turistas residentes.
Brinda información contínua del turismo nacional de la Argentina y de los viajes turísticos de los visitantes argentinos dentro de nuestro territorio nacional.
En la actualidad se releva 32 aglomerados que que se agrupan en las regiones Ciudad de Buenos Aires, Partidos del Conurbano de la Provincia de Buenos Aires, Región Interior de la Provincia de Buenos Aires (compuesto todos los aglomerados pertenecientes a dicha Provincia, excepto Partidos del Conurbano de la Provincia de Buenos Aires), Región Córdoba (compuesto por todos los aglomerados pertenecientes a la Provincia de Córdoba), Región Litoral (compuesto por todos los aglomerados pertenecientes a las Provincias de Santa Fe, Entre Ríos, Corrientes, Misiones, Formosa y Chaco), Región Norte (compuesto por todos los aglomerados pertenecientes a las provincias de Jujuy, Salta, Tucumán, Santiago del Estero, Catamarca y La Rioja), Región Cuyo (compuesto por todos los aglomerados pertenecientes a las provincias de Mendoza, San Luis, San Juan), Región Patagónia (compuesto por todos los aglomerados pertenecientes a las provincias de La Pampa, Neuquén, Río Negro, Chubut, Santa Cruz y Tierra del Fuego).
A continuación, se detallan los pasos implementados para la elaboración, a partir del insumo original (bases de datos enviadas por la consultora), de los siguientes productos:
- bases en formato .
sav
y .csv
, que sirven de insumos para los procesamiento de datos enR
para el armado de la base de microdatos y la base de trabajo mensual. - Informes trimestrales (en .
pdf
) - Actualización mensual del reporte trimestral de la EVyTH ( .
htlm
)
1.3.1 Armado de la Base de microdatos en rstudio
Las bases de datos de la EVyTH son subidas por la consultora a un espacio compartido en la nube que comparte con el Ministerio de Turismo y Deportes de la Nación mensualmente dentro de los primeros 20 días de cada mes.
Se levantan en r las bases acumulada de viajes y hogares. Se verifica si hubo alguna actualización en el repositorio y se corre el script “TABLERO_DE_CONTROL
,” con el que cada mes, se carga el paquete{evyth}
y se ejecuta la función crear_base_trabajo(), que arma una base en …..; cada trimestre se ejecuta la función crear_base_microdato(), que arma una base en formato .sav
, .csv
, .txt
, .dta
,
xlsx
y se corre el script 01_control_calidad.R
, que genera el reporte de consistencias.
El detalle de los pasos implementados en este apartado se encuentra en el siguiente repositorio.
1.3.2 Generación de recursos de la EVyTH
En esta etapa (que utiliza como insumo la base de la EVyTH en formato .rds
) se generan una serie de recursos en formato .csv
que sirven para:
- Nutrir el dataset del relavamiento en el sitio de SINTA
- Generar el informe trimestral de la EVyTH
- Actualizar el reporte de la EVyTH
El detalle de los pasos implementados en este apartado se encuentra en el siguiente repositorio.
1.3.3 Generación del informe y actualización del tablero
El informe trimestral de la EVyTH elaborado por la Dirección Nacional de Mercados y Estadística presenta información referida a la evolución de los viajes, visitas, pernoctes, gasto en Argentina desagregada por región de origen y destino del viaje, motivo del viaje, tipo de alojamiento, tipo de transporte, utilización de paquete turístico, actividades turísticas realizadas por los visitantes. También se presenta el perfil de los turistas que viajaron con motivo ocio, del se presenta información relacionada a la organización de sus viajes: los aspectos que los llevaron a escoger el destino visitado, el uso de internet para la organización del viaje, el tiempo de anticipación para la organización de los viajes y la evaluación de los servicios turísticos utilizados en sus viajes.
Mientras que el tablero de la EVyTH dispone de la misma información que el informe trimestral, con la diferencia que las tablas y datos presentados se encuentran en formato .html
(lo cual habilita, en algunos casos, la interactividad de los mismos).
El detalle de los pasos implementados en este apartado se encuentra en los siguientes repositorios:
- https://github.com/d4t4tur/informes_pdf.git (para el informe)
- https://github.com/dnme-minturdep/dnme_apps.git (para el tablero).
Hasta mediados de 2023 las tres bases estaban en Access. Pasar las de no residentes a csv., además de agilizar el proceso, hace que puedan levantarse desde r o spss y correr scripts reproducibles.↩︎