Modelo autorregresivo de media móvil

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, los modelos autorregresivos de media móvil (en inglés AutoRegressive Moving Average models, abreviados ARMA), también llamados Modelos Box-Jenkins, se aplican a series temporales de datos.

Dada una serie temporal de datos Xt, el modelo ARMA es una herramienta para entender y, aún más, para predecir futuros valores de la serie. El modelo está formado por dos partes, una parte autorregresiva (AR) y otra de media móvil (MA). El modelo se conoce con el nombre de modelo ARMA (p,q), donde p es el orden de la parte autorregresiva y q es el orden de la parte de media móvil.

Modelo autorregresivo[editar]

La notación AR(p) se refiere a un modelo autorregresivo de orden p. Un modelo AR(p) puede escribirse como:

 X_t = c + \sum_{i=1}^p \phi_i X_{t-i}+ \epsilon_t .\,

donde \phi_1, \ldots \phi_p son los parámetros del modelo, c es una constante y \epsilon_t es un término de error. Muchos autores omiten el término constante, para fines de simplificación.

Un modelo autorregresivo es esencialmente un filtro de respuesta infinita al impulso IIR, con determinada interpretación adicional.

Se debe tener en cuenta que es necesario imponer ciertas restricciones a los valores de los parámetros de este modelo para que funcione correctamente (proceso estacionario). Por ejemplo, en un modelo AR(1), si |φ1| > 1 el modelo no tendrá un buen comportamiento.

Ejemplo: Un proceso AR(1)[editar]

Un proceso AR(1) está dado por:

X_t = c + \phi X_{t-1}+\epsilon_t,\,

donde \epsilon_t es un proceso de ruido blanco con media cero y varianza \sigma^2. (Nota: El subíndice en \phi_1 se omitió.) El proceso es de covarianza estacionaria si |\phi|<1. Si \phi=1, entonces X_t tiene una raíz unitaria. El cálculo de la esperanza de X_t es directo. Asumiendo la covarianza estacionaria, tenemos:

\mbox{E}(X_t)=\mbox{E}(c)+\phi\mbox{E}(X_{t-1})+\mbox{E}(\epsilon_t)\Rightarrow \mu=c+\phi\mu+0.

entonces:

\mu=\frac{c}{1-\phi},

donde \mu es la media. La varianza es:

\textrm{var}(X_t)=E(X_t^2)-\mu^2=\frac{\sigma^2}{1-\phi^2}

La función de autocorrelación viene dada por:

B_n=E(X_{t+n}X_t)-\mu^2=\frac{\sigma^2}{1-\phi^2}\,\,\phi^{|n|}

Se puede ver que la función de autocorrelación decrece con un intervalo de decrecimiento de \tau=-1/\ln(\phi).

La función de densidad espectral es la transformada de Fourier de la función de autocorrelación. En términos discretos, ésta sería la transformada de Fourier de tiempo discreto:

\Phi(\omega)=
\frac{1}{\sqrt{2\pi}}\,\sum_{n=-\infty}^\infty B_n e^{-i\omega n}
=\frac{1}{\sqrt{2\pi}}\,\left(\frac{\sigma^2}{1+\phi^2-2\phi\cos(\omega)}\right)

Esta expresión contiene aliasing debido a la naturaleza discreta de X_j. Si asumimos que el intervalo de la muestra es mucho menor que el intervalo de decrecimiento (\tau\ll 1), entonces podemos utilizar una aproximación continua a B_n:

B(t)\approx \frac{\sigma^2}{1-\phi^2}\,\,\phi^{|t|}

que da un perfil Lorentzian para la densidad espectral:

\Phi(\omega)=
=\frac{1}{\sqrt{2\pi}}\,\frac{\sigma^2}{1-\phi^2}\,\frac{\gamma}{\pi(\gamma^2+\omega^2)}

donde \gamma=1/\tau es la frecuencia angular asociada con el intervalo de decrecimiento \tau.

Una expresión alternativa para X_t se puede obtener substituyendo primero c+\phi X_{t-2}+\epsilon_{t-1} por X_{t-1} en la ecuación de definición.

Continuando este proceso N veces, obtenemos:

X_t=c\sum_{k=0}^{N-1}\phi^k+\phi^NX_{t-N}+\sum_{k=0}^{N-1}\phi^k\epsilon_{t-k}

Cuando N tiende a infinito, \phi^N tiende a cero y:

X_t=\frac{c}{1-\phi}+\sum_{k=0}^\infty\phi^k\epsilon_{t-k}

Véase que X_t es ruido blanco convolucionado con \phi^k más la constante de la media. Por el teorema del límite central, X_t será distribuido normalmente como cualquier muestra de X_t, que es más grande que el intervalo de decrecimiento de la función de autocorrelación.

Modelo de medias móviles[editar]

La notación MA(q) se refiere a un modelo de media móvil de orden q.

 X_t = \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i}\,

donde θ1, ..., θq son los parámetros del modelo y εt, εt-1,... son, de nuevo, los términos de error.

Un modelo de medias móviles es esencialmente un filtro de respuesta finita al impulso FIR, con cierta interpretación adicional.

Modelo autorregresivo de media móvil[editar]

La notación ARMA(p, q) se refiere a un modelo con p términos autorregresivos y q términos de media móvil. Este modelo combina los modelos AR e MA:

 X_t = \varepsilon_t +  \sum_{i=1}^p \phi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,

Nota sobre los términos de error[editar]

Habitualmente se asume que los términos de error εt son variables aleatorias independientes idénticamente distribuidas, tomadas de una muestra con distribución normal de media cero: εt ~ N(0,σ2), donde σ2 es la varianza. Estas suposiciones pueden ser frágiles y, si no se cumplen, pueden cambiar las propiedades del modelo. De hecho, un cambio en la suposición de independencia y distribución idéntica podría dar lugar a una diferencia considerable.

Especificación en términos del operador retardo (lag operator)[editar]

En algunos textos los modelos se especifican en términos del operador retardo L. En estos términos, el modelo AR(p) viene dado por:

 \varepsilon_t = \left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t =  \phi X_t\,

donde φ representa el polinomio

 \phi = 1 - \sum_{i=1}^p \phi_i L^i.\,

Un modelo MA(q) viene dado por:

 X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t = \theta \varepsilon_t\,

donde θ representa el polinomio

 \theta= 1 + \sum_{i=1}^q \theta_i L^i.\,

Por último, el modelo combinatorio ARMA viene dado por

 \left(1 - \sum_{i=1}^p \phi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t\,

o, de forma más concisa,

 \phi X_t = \theta \varepsilon_t.\,

Modelos de ajuste (fitting models)[editar]

En general, tras seleccionar p y q, los modelos ARMA pueden ajustarse mediante regresión de mínimos cuadrados para encontrar los valores de los parámetros que minimizan el término de error. Se considera generalmente una buena práctica encontrar los valores menores de p y q que proporcionan un ajuste aceptable a los datos. Para un modelo puro AR, deben utilizarse las ecuaciones Yule-Walker para proporcionar un ajuste.

Generalizaciones[editar]

La dependencia de Xt de valores pasados y en los términos de error εt se asume que es lineal, salvo que se especifique lo contrario. Si la dependencia no es lineal, entonces el modelo se llama específicamente modelo de media móvil no lineal (NMA), modelo autorregresivo no lineal (NAR) o modelo autorregresivo de media móvil no lineal (NARMA).

Los modelos autorregresivos de media móvil pueden generalizarse con otros métodos. Véanse también los modelos ARCH (modelos de heterocedasticidad condicional autorregresivos) y los modelos autorregresivos integrados de medias móviles ARIMA (modelos autorregresivos integrados de medias móviles). Si tenemos que ajustar múltiples series temporales, entonces se puede ajustar un modelo vectorial ARIMA (VARIMA). Si las series temporales en cuestión muestran una memoria lejana, entonces es apropiado un modelo ARIMA fraccional (FARIMA, a veces denominado ARFIMA). De pensar que los datos presentan estacionalidad, entonces debe usarse un modelo SARIMA.

Referencias[editar]

  • Box, George E.P. 1976: and F.M. Jenkins. Time Series Analysis: Forecasting and Control, 2nd. ed. Oakland, CA: Holden-Day.