ARIMA – Índice de precio de vivienda nueva

Esta página muestra los procedimientos mínimos para análisis univariado de series de tiempo. El ejercicio utiliza información del índice de precio de vivienda nueva en Colombia (ver descripción de los datos). El alcance del ejercicio es el análisis gráfico de la información hasta un modelo ARIMA y pronóstico.

La secuencia de pasos sugeridos para realizar el ejercicio puede ser:

Llevar datos a Stata.


Los datos ofrecidos acá están en un archivo que delimita las información con el caracter coma.

El comando para traer la base de datos es:

import delimited http://rodrigotaborda.com/ads/datos/ipvn/ipvn_am.csv, delimiters(",")

aunque el comando identifica automaticamente el delimitador, la opción delimiters ilustra el caso para datos separados por coma y puede ser manipulado para cualquier otro caracter separador.

Caracterización de datos como serie de tiempo.


Al ser una serie de tiempo del índice de precio de vivienda nueva tiene dos variables que dan cuenta de la variación: year (año) y q (trimestre). El primer comando genera una nueva variable que resume la variación en el tiempo. El segundo comando da el formato apropiado de la nueva variable tiempo. El tercer comando determina que la variable tiempo define el tiempo en los datos.

gen tiempo = yq(year,q) 
format tiempo %tq
tsset tiempo

Generar nuevas variables y etiquetas.


La información distingue el IPVN para Colombia (total) y ciudades. En este ejemplo se analiza la variable para Colombia. El comando label genera una etiqueta a la variable para distinguir su manipulación y resultados.

label var total "IPVN Colombia"

El análisis de un número índice no ofrece información valiosa. En este caso es correcto analizar la tasa de cambio anual del índice que ofrece la inflación del precio de vivienda nueva.

gen total_gr_annual = total/l4.total - 1
label var total_gr_annual "IPVN Tasa de crecimiento anual"

Examen visual de datos.


El análisis de series de tiempo se fundamenta fuertemente en el examen de las características de los datos. El comando genera la gráfica de la variable de interés.

tsline total_gr_annual

La figura sugiere la presencia de diferntes ciclos en la evoución de los precios de la vivienda nueva en Colombia. Igualmente una tendencia creciente a lo largo del tiempo. Igualmente es probable que haya algún efecto estacional.

Metodología Box-Jenkins de análisis de serie de tiempo.


El análisis básico de serie de tiempo para formular un modelo ARIMA se ha estandarizado alrededor de la metodología Box-Jenkins. Los pasos mínimos son la inspección visual de los datos (sección anterior) y análisis de la función de autocorrelación (AC) y función de autocorrelación parcial (PAC).

La función de autocorrelación sugiere que la serie de tiempo es estacionaria. Los valores de las autocorrelaciones decaen rápidamente, después del rezago 3, no es posible afirmar que la autocorrelación sea diferente de cero, según los intervalos de confianza sombreados en color gris.

pac total_gr_annual

La función de autocorrelación parcial tiene dos valores (equivalentes al coeficiente de regresión de la variable correspondiente al rezago) estadísticamente significativos.

ac total_gr_annual

Ambas piezas de información sugieren que un modelo ARIMA apropiado para caracterizar el comportamiento del índice de precios de vivienda nueva en Colombia es ARIMA(2,0,0). Esta conjetura debe complementarse con la estimación de este modelo y otros modelos similares en términos de rezagos cercanos. Adicionalmente en la inspección de la serie de tiempo se observó una tendencia creciente, de manera que el modelo inicial puede mejorarse al incluir la tendencia de tiempo. La selección final de un modelo puede hacerse mediante la inspección de los criterios de selección de modelos: AIC y Schwarz.

Modelo ARIMA(2,0,0)

arima total_gr_annual, arima(2,0,0)
estat ic

Un paso adicional para examinar que tan apropiado es el modelo propuesto es examinar los residuos del modelo, para ser comparados posteriormente.

predict total_gr_annual_arima200_res, residuals

Modelo ARIMA(2,0,0) + tendencia temporal

arima total_gr_annual tiempo, arima(2,0,0)
estat ic

Modelo ARIMA(3,0,0)

arima total_gr_annual, arima(3,0,0)
estat ic

Modelo ARIMA(3,0,0) + tendencia temporal

arima total_gr_annual tiempo, arima(3,0,0)
estat ic

Modelo ARIMA(1,0,0) + tendencia temporal

arima total_gr_annual tiempo, arima(1,0,0)
estat ic

La comparación de los tres modelos según los criterios de selección sugieren que las estimaciones ARIMA(2,0,0) y ARIMA(3,0,0) sin tendencia temporal son las mas apropiadas (AIC y BIC mas pequeños). Sin embargo la significancia estadística del tercer rezago en ARIMA(3,0,0) es baja, y sugiere dudas respecto a la validez de examinar ese rezago. En esta oportunidad ambos modelos pueden ser usados para caracterizar la evolución del índice de precios a la vivienda nueva.

Un examen del residuo de cada modelo puede ayudar a respaldar la decisión de seleccionar estos dos como las mejores opciones.

La figura de los residuos muestra las diferencias en los ajustes de cada modelo. Es fácil ver como el modelo ARIMA(1,0,0) y el modelo ARIMA(3,0,0)+T en diferentes momentos tienen errores relativamente mayores. De otra parte es dificil encontrar diferencias entre los modelos ARIMA(2,0,0) y ARIMA(3,0,0).