Teorema de Karhunen-Loève

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En la teoría de procesos estocásticos, el Teorema de Karhunen-Loève (así llamado debido a Kari Karhunen y Michel Loève) es una representación de un proceso estocástico como una combinación lineal infinita de funciones ortogonales. Esta representación es análoga a la representación en series de Fourier de una función definida en un intervalo acotado de números reales. A diferencia de una serie de Fourier, en la cual los coeficientes son números reales y la base de expansión está compuesta por funciones senoidales (es decir, funciones seno y coseno), los coeficientes del teorema de Karhunen-Loève son variables aleatorias y la base de expansión depende del proceso. De hecho, la base de funciones ortogonales que se usa para la representación queda determinada por la función de covarianza del proceso. Si vemos un proceso estocástico como una función aleatoria F, es decir, una en la que el valor aleatorio es una función en un intervalo [a, b], entonces este teorema puede considerarse como una expansión ortonormal aleatoria de F.

En el caso de un proceso estocástico centrado {Xt} t ∈ [a, b] (donde centrado se refiere a que los valores esperados E(Xt) están definidos y son iguales a 0 para todo t), el satisfacer una condición de continuidad técnica, admite la descomposición

 \mathbf{X}_t = \sum_{k=1}^\infty \mathbf{Z}_k e_k(t).

donde Zk son variables aleatorias no correlacionadas de a pares y las funciones ek son funciones reales continuas en [a, b], ortogonales de a pares en L2[a, b]. El caso general de un proceso no centrado puede representarse expandiendo la función de expectación (que es un función no-aleatoria) en la base ek.

Aún más, si el proceso es Gaussiano, entonces las variables aleatorias Zk son Gaussianas y estocásticamente independientes. Este resultado generaliza la transformada de Karhunen-Loève. Un ejemplo importante de un proceso estocástico real centrado en [0,1] es el proceso de Wiener y el teorema de Karhunen-Loève permite obtener una representación ortogonal canónica de éste. En este caso, la expansión consiste de funciones senoidales.

A la expansión anterior en variables aleatorias no correlacionadas se la conoce también como la expansión de Karhunen-Loève.

Formulación del teorema[editar]

Formulamos el teorema en el caso que las variables aleatorias sean reales, aunque el teorema es válido aún para funciones con valores vectoriales.

Si X and Y son variables aleatorias, el producto interno está definido por

 \langle \mathbf{X}|\mathbf{Y} \rangle = \operatorname{E}(\mathbf{X}\mathbf{Y})

El producto interno está bien definido en caso que X e Y tengan momentos de segunda orden finitos, es decir, que X e Y sean de cuadrado integrable. El producto interno tiene estrecha relación con la covariancia y la correlación. Por ejemplo, para variables aleatorias cuyo valor esperado es nulo, la covariancia y el producto interno son idénticos. Si {Xt}t es un proceso centrado, la función de covariancia de {Xt}t es

 \operatorname{Cov}_{\mathbf{X}}(t,s) = \langle \mathbf{X}_t | \mathbf{X}_s \rangle = \operatorname{Cov}( \mathbf{X}_t,\mathbf{X}_s).

Nótese que si {Xt}t es un proceso centrado y t1, ≤ t2, ..., ≤ tN son puntos en el intervalo [a, b], entonces

 \sum_{k,\ell} \operatorname{Cov}_{\mathbf{X}}(t_k,t_\ell) = \operatorname{Var}\left(\sum_{k=1}^N \mathbf{X}_k\right) \geq 0.

Teorema. Consideremos un proceso estocástico {Xt}t en que el índice t recorre el intervalo [a, b], y con función de covariancia CovX. Supongamos además que la función CovX(t,s) sea conjuntamente continua en las variables t, s. Entonces CovX puede ser considerado como un núcleo positivo definido. Por el Teorema de Mercer, el operador integral T correspondiente que actúa en L2[a,b] (relativo a la medida de Lebesgue en [a,b]) tiene una base ortonormal de vectores propios. Sea {ei}i la secuencia de los vectores propios de T correspondientes a los valores propios no nulos y definamos:

 \mathbf{Z}_i = \int_a^b \mathbf{X}_t e_i(t) dt.

Entonces Zi son variables aleatorias centradas y ortogonales y

 \mathbf{X}_t = \sum_{i=1}^\infty e_i(t) \mathbf{Z}_i

donde la convergencia es en media cuadrática y uniforme en t. Además

 \operatorname{Var}(\mathbf{Z}_i) = \operatorname{E}(\mathbf{Z}_i^2) = \lambda_i.

adonde λi es el valor propio correspondiente al vector propio ei.

En el enunciado del teorema, la integral que define Zi puede ser definida como el límite en la media de sumas de Cauchy de variables aleatorias:

 \sum_{k=0}^{\ell-1} \mathbf{X}_{\xi_k} e_i(\xi_k) (t_{k+1} - t_k),

donde

 a = t_0 \leq \xi_0 \leq t_1 \leq \cdots \leq \xi_{\ell-1} \leq t_n = b

Dado que el límite en la media de variables aleatorias Gaussianas conjuntas es Gaussiana conjunta, y dado que las variables aleatorias Gaussiana conjuntas (centradas) son independientes si y solo si son ortogonales, podemos concluir que:

Teorema. Las variables Zi tienen una distribución Gaussiana conjunta y son estocásticamente independientes si el proceso original {Xt}t es Gaussiano.

En el caso Gaussiano, dado que las variables Zi son independientes, podemos agregar:

 \lim_{N \rightarrow \infty} \sum_{i=1}^N e_i(t) \mathbf{Z}_i(\omega) = \mathbf{X}_t(\omega)

casi seguramente.

Nótese que al generalizar el teorema de Mercer, podemos reemplazar el intervalos [a, b] con otros espacios compactos C y la medida de Lebesgue en [a, b] con una medida de Borel que tenga soporte en C.

El proceso de Wiener[editar]

Existen varias caracterizaciones equivalentes al proceso de Wiener, que es una formalización matemática de movimiento browniano. Aquí lo veremos cómo el proceso Gaussiano centrado {Bt} con función de covarianza

 \operatorname{Cov}_{\mathbf{B}}(t,s) =\min (s,t).

Es sencillo determinar los vectores propios del núcleo de la covarianza. Ellos son

 e_k(t) = \sqrt{2} \sin \left(k - \frac{1}{2}\right) \pi t

con los siguientes valores propios correspondientes:

 \lambda_k = \frac{4}{(2 k -1)^2 \pi^2}.

Esto nos da la siguiente representación del proceso de Wiener:

Teorema. Existe una secuencia {Wi}i de variables aleatorias Gaussianas independientes con media nula y varianza unitaria tal que:

 \mathbf{B}_t = \sqrt{2} \sum_{k=1}^\infty \mathbf{W}_k \frac{\sin \left(k - \frac{1}{2}\right) \pi t}{ \left(k - \frac{1}{2}\right) \pi}.

La convergencia es uniforme en t y en la norma L2, es decir

 \operatorname{E}\left(\mathbf{B}_t - \sqrt{2} \sum_{k=1}^n \mathbf{W}_k \frac{\sin \left(k - \frac{1}{2}\right) \pi t}{ \left(k - \frac{1}{2}\right) \pi} \right)^2 \rightarrow 0

uniformemente en t.

Referencias[editar]

  • I. Guikhman, A. Skorokhod, Introduction a la Théorie des Processus Aléatoires, Éditions MIR, 1977
  • B. Simon, Functional Integration and Quantum Physics, Academic Press, 1979