Expansiones de Edgeworth

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La Serie de Gram–Charlier A (nombrada en honor a Jørgen Pedersen Gram y Carl Charlier), y la serie de Edgeworth (en honor a Francis Ysidro Edgeworth) son series que aproximan una distribución de probabilidad en términos de sus cumulantes. Las series son la misma, pero el orden de sus términos varían (y por consiguiente su exactitud para truncar la serie).

Serie de Gram–Charlier A[editar]

La idea fundamental de estas expansiones es escribir una función característica con función de densidad de probabilidad que se aproxime en términos de la función característica de una función de una distribución con propiedades conocidas y recuperar la función inical mediante la inversa de la transformada de Fourier.

Seaf la función característica de la distribución cuya función de densidad es F, y κr sus cumulantes. Se expande en términos de una distribución conocida con densidad de probabilidad \Psi, función característica \psi y cumulantes estándarγr. Es común escoger la distribución normal como \Psi, pero también es posible escoger otras. Por definición de los cumulantes se tiene la siguiente identidad:

f(t)=\exp\left[\sum_{r=1}^\infty(\kappa_r-\gamma_r)\frac{(it)^r}{r!}\right]\psi(t)\,.

Por las propiedades de la transformada de Fourier, (it)rψ(t) es la transformada de Fourier de (−1)r Dr \Psi(x), donde D es el operador diferencial respecto a x. Por tanto, se obtiene para F la expansión

F(x) = \exp\left[\sum_{r=1}^\infty(\kappa_r - \gamma_r)\frac{(-D)^r}{r!}\right]\Psi(x)\,.

Si se elige \Psi como la normal con media y varianza dadas por F, es decir, media μ = κ1 y varianza σ2 = κ2, entonces la expansión es


F(x) = \exp\left[\sum_{r=3}^\infty\kappa_r\frac{(-D)^r}{r!}\right]\frac{1}{\sqrt{2\pi}\sigma}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right]\,.

Al expandir el exponencial y agrupando lo términos según el orden de las derivadas se obtiene la serie de Gram–Charlier A. Al incluir solo primeros dos términos de corrección de la normal se obtiene

 F(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right]\left[1+\frac{\kappa_3}{3!\sigma^3}H_3\left(\frac{x-\mu}{\sigma}\right)+\frac{\kappa_4}{4!\sigma^4}H_4\left(\frac{x-\mu}{\sigma}\right)\right]\,,

con H3(x) = x3 − 3x y H4(x) = x4 − 6x2 + 3 (Polinomios de Hermite).

Nótese que esta expresión no es necesariamente positiva y por lo tanto, no es una distribución de probabilidad válida. La serie de Gram–Charlier A diverge en muchos casos. La serie converge solo si F(x) decrece más rápido que exp(−x2/4) hacia infinito (Cramér 1957). Cuando no converge, la serie no puede ser una serie asintótica porque no es posible estimar el error de la expansión. por esta razón, la serie de Edgeworth se prefiere a la de Gram–Charlier A.

Serie de Edgeworth[editar]

Edgeworth desarrolló una expansión similar a partir del teorema del límite central. La ventaja de la serie de Edgeworth es que se controla el error, siendo así una verdadera serie asintótica.

Sea {Xi} una secuencia de variables aleatorias independiente e idénticamente distribuidas de media μ y varianza σ2, y sea Yn su suma estandarizada:


    Y_n = \frac{1}{\sqrt{n}} \sum_{i=1}^n \frac{X_i - \mu}{\sigma}.

Sea Fn la función de distribución acumulada de las variables Yn. Entonces por el teorema del límite central,


    \lim_{n\to\infty} F_n(x) = \Phi(x) \equiv \int_{-\infty}^x \tfrac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}q^2}dq

para todo x, siempre que la media y la varianza sean finitas.

Ahora asuma que las variables aleatorias Xi tienen media μ, varianza σ2 y cumulantes de mayor orden κrrλr. Expandiendo en términos de la distribución normal estándar

\Psi(x)=\frac{1}{\sqrt{2\pi}}\exp(-\tfrac{1}{2}x^2)

Entonces las diferencias entre cumulantes en la expresión de la función característica fn(t) de Fn son

 \kappa^{F(n)}_1-\gamma_1 = 0\,,
 \kappa^{F(n)}_2-\gamma_2 = 0\,,
 \kappa^{F(n)}_r-\gamma_r = \frac{\kappa_r}{\sigma^rn^{r/2-1}} = \frac{\lambda_r}{n^{r/2-1}}; \quad r\geq 3\,.

La serie de Edgeworth se desarrolla de manera similar a la de Gram–Charlier A series, solo que ahora los términos se asocian según la potencia de n. Así,

 f_n(t)=\left[1+\sum_{j=1}^\infty \frac{P_j(it)}{n^{j/2}}\right] \exp(-t^2/2)\,,

donde Pj(x) es un polinomio de grado 3j. Nuevamente, luego de invertir la transformada de Fourier, la función de distribución Fn es

 F_n(x) = \Phi(x) + \sum_{j=1}^\infty \frac{P_j(-D)}{n^{j/2}} \Phi(x)\,.

Los primeros cinco términos de la expansión son[1]

\begin{align}
    F_n(x) =
      & \Phi(x) \\
      & - \frac{1}{n^{1/2}}\bigg( \tfrac{1}{6}\lambda_3\,\Phi^{(3)}(x) \bigg) \\
      & + \frac{1}{n}\bigg( \tfrac{1}{24}\lambda_4\,\Phi^{(4)}(x) + \tfrac{1}{72}\lambda_3^2\,\Phi^{(6)}(x) \bigg) \\
      & - \frac{1}{n^{3/2}}\bigg( \tfrac{1}{120}\lambda_5\,\Phi^{(5)}(x) + \tfrac{1}{144}\lambda_3\lambda_4\,\Phi^{(7)}(x) + \tfrac{1}{1296}\lambda_3^3\,\Phi^{(9)}(x)\bigg) \\
      & + \frac{1}{n^2}\bigg( \tfrac{1}{720}\lambda_6\,\Phi^{(6)}(x) + \big(\tfrac{1}{1152}\lambda_4^2 + \tfrac{1}{720}\lambda_3\lambda_5\big)\Phi^{(8)}(x) \\
      &\qquad\quad + \tfrac{1}{1728}\lambda_3^2\lambda_4\,\Phi^{(10)}(x) + \tfrac{1}{31104}\lambda_3^4\,\Phi^{(12)}(x) \bigg) \\
      & + O(n^{-5/2})\,.
  \end{align}

Acá Φ(j)(x) es la j-ésima derivada de Φ(·) en x. Blinnikov y Moessner (1998) dieron un algoritmo sencillo para calcular los términos de mayor orden de la expansión.

Notas[editar]

Bibliografía[editar]

  • H. Cramér. (1957). Mathematical Methods of Statistics. Princeton University Press, Princeton.
  • D. L. Wallace. (1958). "Asymptotic approximations to distributions". Annals of Mathematical Statistics, 29: 635–654.
  • M. Kendall & A. Stuart. (1977), The advanced theory of statistics, Vol 1: Distribution theory, 4th Edition, Macmillan, New York.
  • P. McCullagh (1987). Tensor Methods in Statistics. Chapman and Hall, London.
  • D. R. Cox and O. E. Barndorff-Nielsen (1989). Asymptotic Techniques for Use in Statistics. Chapman and Hall, London.
  • P. Hall (1992). The Bootstrap and Edgeworth Expansion. Springer, New York.
  • S. Blinnikov and R. Moessner (1998). Expansions for nearly Gaussian distributions. Astronomy and astrophysics Supplement series, 130: 193–205.
  • J. E. Kolassa (2006). Series Approximation Methods in Statistics (3rd ed.). (Lecture Notes in Statistics #88). Springer, New York.