Metodología de Box-Jenkins

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En el análisis de series de tiempo, la metodología de Box-Jenkins, nombrada así en honor a los estadísticos George Box y Gwilym Jenkins[1] , se aplica a los modelos autorregresivos de media móvil ARMA o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.[2] [3]

Enfoque del metódo[editar]

El metódo original utiliza un enfoque de modelado iterativo en tres etapas, usando datos que de un horno de gas. Estos datos son bien conocidos como datos de Box-Jenkins del horno de gas para la evaluación comparativa de los modelos de predicción. Las tres etapas del modelado iterativo son los siguiente:

  1. Identificación y selecciòn del modelo: asegurarse de que las variables son estacionarias, la identificación de la estacionalidad de la serie dependiente (diferenciando en temporada si es necesario), y el uso de los graficos de las funciones de autocorrelación y de autocorrelación parcial de la serie de tiempo dependiente para decidir cuál componente (si es el caso) se debe utilizar en el modelo, el promedio autorregresivo o un promedio móvil.
  2. Estimación de parámetros usando algoritmos de cálculo para tener coeficientes que mejor se ajustan al modelo ARIMA seleccionado. Los métodos más comunes usan estimación de máxima verosimilitud o mínimos cuadrados no lineales.
  3. Comprobar el modelo mediante el ensayo, si el modelo estimado se ajusta a las especificaciones de un proceso univariado estacionario. En particular, los residuos deben ser independientes el uno del otro y la media y la varianza constantes en el tiempo. (Graficando la media y la varianza de los residuos a través del tiempo y la realización de una prueba de Ljung-Box o el trazado de autocorrelación y autocorrelación parcial de los residuos son útiles para identificar los errores de especificación.) Si la estimación es suficiente, tenemos que volver al paso uno y el intento de construir un modelo mejor.

Identificación del modelo Box-Jenkins[editar]

Estacionariedad y estacionalidad[editar]

El primer paso en el desarrollo de un modelo de Box-Jenkins esdeterminar si la serie de tiempo es estacionaria y si hay alguna estacionalidad significativa que necesite ser modelada.

Detección estacionariedad[editar]

La estacionariedad puede evaluarse a partir de una secuencia de largo plazo. La secuencia ejecutada debe mostrar ubicación y escala constante. También se puede detectar a partir de una secuencia de autocorrelación. En concreto, la no estacionariedad se indica a menudo por un gráfico de autocorrelación con una caída muy lenta.

Detección estacionalidad[editar]

La Estacionalidad (o periodicidad) generalmente se puede evaluar a partir de un diagrama de autocorrelación, una subserie de una temporada, o una trama espectral.

Diferenciación para lograr estacionariedad[editar]

Box y Jenkins recomiendan el enfoque de diferenciación para lograr estacionariedad. Sin embargo, ajustando una curva y restando los valores ajustados de los datos originales también se puede utilizar en el contexto de los modelos de Box-Jenkins.

Diferenciación estacional[editar]

En la fase de identificación del modelo, el objetivo es detectar la estacionalidad, si existe, y para identificar el orden de los términos autorregresivos y de media móvil estacional de temporada. Para muchas series, el período es conocido y un solo término estacionalidad es suficiente. Por ejemplo, para los datos mensuales que uno suele incluir un término de temporada AR 12 o un término de temporada MA 12. Para los modelos de Box-Jenkins, uno no elimina explícitamente estacionalidad antes de ajustar el modelo. En su lugar, se incluye la orden de los términos estacionales en la especificación del modelo a la ARIMA software de estimación. Sin embargo, puede ser útil aplicar una diferencia estacional a los datos y regenerar la autocorrelación y autocorrelación parcial parcelas. Esto puede ayudar en la identificación del modelo del componente no estacional del modelo. En algunos casos, la diferenciación estacional puede eliminar la mayor parte o la totalidad del efecto de la estacionalidad.

Identificar p y q[editar]

Una vez que se han abordado estacionalidad y temporalidad, el siguiente paso es identificar el orden (es decir, la p y q) de los términos autorregresivo y de media móvil. Diferentes autores tienen diferentes enfoques para la identificación de p y q. Brockwell y Davis (1991, p. 273) afirman "nuestro principal criterio para la selección del modelo de [entre ARMA (p, q) los modelos] será la AICC", es decir, el criterio de información Akaike con corrección.

Otros autores utilizan el argumento de autocorrelación y autocorrelación parcial de la parcela.

Autocorrelación y autocorrelación parcial[editar]

La muestra autocorrelación trama y la muestra gráfica de autocorrelación parcial se comparan con el comportamiento teórico de estas parcelas cuando el pedido es conocido.

Específicamente, para un (1) AR proceso, la función de autocorrelación de la muestra debe tener una apariencia de forma exponencial decreciente. Sin embargo, los procesos AR de orden superior son a menudo una mezcla de forma exponencial decreciente y amortiguado componentes sinusoidales.

Para procesos autorregresivos de orden superior, la autocorrelación de la muestra tiene que ser complementado con una parcela de autocorrelación parcial. La autocorrelación parcial de un AR (p) el proceso se convierte en cero al retardo p + 1, y mayor, por lo que examinar la función de autocorrelación parcial de la muestra para ver si hay evidencia de una desviación de cero. Esto generalmente se determina mediante la colocación de un 95% intervalo de confianza de la muestra gráfica de autocorrelación parcial (la mayoría de los programas de software que generan muestras parcelas autocorrelación también trazar este intervalo de confianza). Si el programa de software no genera la banda de confianza, que es de aproximadamente \pm 2/\sqrt{N}, con N que denota el tamaño de la muestra.

La función de autocorrelación de un MA (q) el proceso se convierte en cero al retardo q + 1, y mayor, por lo que examinar la función de ejemplo de autocorrelación para ver donde esencialmente se convierte en cero. Hacemos esto mediante la colocación de un intervalo de confianza del 95% para la función de ejemplo de autocorrelación en la parcela de muestreo de autocorrelación. La mayoría del software que genera el diagrama de autocorrelación también puede generar este intervalo de confianza.

La función de autocorrelación parcial de la muestra en general, no es útil para identificar el orden del proceso de media móvil.

La siguiente tabla resume cómo se puede utilizar el ejemplo de la función de autocorrelación para la identificación del modelo.

Shape Indicated Model
Exponencial, limitando a cero Autoregressive model. Use the partial autocorrelation plot to identify the order of the autoregressive model.
Alternating positive and negative, decaying to zero Autoregressive model. Use the partial autocorrelation plot to help identify the order.
One or more spikes, rest are essentially zero Moving average model, order identified by where plot becomes zero.
Decay, starting after a few lags Mixed autoregressive and moving average (ARMA) model.
All zero or close to zero Data are essentially random.
High values at fixed intervals Include seasonal autoregressive term.
No decay to zero Series is not stationary.

En la práctica, la autocorrelación de la muestra y las funciones de autocorrelación parcial son variables aleatorias y no dar la misma imagen que las funciones teóricas. Esto hace que el modelo de identificación más difícil. En particular, los modelos mixtos pueden ser particularmente difíciles de identificar. Aunque la experiencia es de gran ayuda, el desarrollo de buenos modelos que utilizan estas parcelas se implica mucho ensayo y error.

Modelo de estimación de Box-Jenkins[editar]

La estimación de los parámetros de los modelos de Box-Jenkins es un problema de estimación no lineal bastante complicado. Por esta razón, la estimación de parámetros debe dejarse a un programa de software de alta calidad que se ajuste a los modelos de Box-Jenkins. Afortunadamente, muchos programas de software estadístico ahora encajan modelos Box-Jenkins.

Los principales enfoques de los modelos de Box-Jenkins montaje son mínimos cuadrados no lineales y la estimación de máxima verosimilitud. Estimación de máxima verosimilitud es generalmente la técnica preferida. Las ecuaciones de verosimilitud para el modelo completo de Box-Jenkins son complicados y no se incluyen aquí. Ver (Brockwell y Davis, 1991) para los detalles matemáticos. El diagnóstico de modelos Box-Jenkins Supuestos para un proceso univariado estable

Diagnósticos modelo para los modelos de Box-Jenkins es similar al modelo de validación de mínimos cuadrados no lineales de montaje.

Es decir, el término de error Una t se supone que sigue los supuestos para un proceso univariado estacionaria. Los residuos deben ser ruido blanco (o independientes cuando sus distribuciones son normales) dibujos a partir de una distribución fija con una media constante y varianza. Si el modelo de Box-Jenkins es un buen modelo para los datos, los residuos deben satisfacer estos supuestos.

Si estos supuestos no se cumplen, hay que adaptarse a un modelo más apropiado. Es decir, volver a la etapa de identificación del modelo y tratar de desarrollar un modelo mejor. Esperemos que el análisis de los residuos puede dar algunas pistas en cuanto a un modelo más apropiado.

Una forma de evaluar si los residuos del modelo de Box-Jenkins siguen las hipótesis es la de generar gráficos estadísticos (incluyendo una parcela de autocorrelación) de los residuales. También se podría mirar el valor del estadístico Box-Ljung .

Referencias[editar]

  1. Box, G. E. P., & Jenkins, G. M. (1973). Some comments on a paper by Chatfield and Prothero and on a review by Kendall. Journal of the Royal Statistical Society. Series A (General), 136(3), 337-352.
  2. VANDAELE, W. Applied Time Series and Box-Jenkins Models. Ed. Academic Press. Bibliografía indexada: Última modificación: 22/09/2005 SIN CLASIFICAR ... www.uva.es/consultas/guia.php?menu=completo&ano_academico=0607&codigo_plan=247&codigo_asignatura=43595&grupo=1
  3. Harvey, A. C., & Todd, P. H. J. (1983). Forecasting economic time series with structural and Box-Jenkins models: A case study. Journal of Business & Economic Statistics, 1(4), 299-307.