Covarianza

De Wikipedia, la enciclopedia libre

En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas.

[editar] Definición

La covarianza S(X,Y) de dos variables aleatorias X e Y se define como:

S_{xy} = \frac 1n \sum_{i=1}^n { (x_i - \overline{x})(y_i - \overline{y})} = {1 \over n} \sum_{i,j}^n {x_{i.}y_{.j}n_{ij}} - \overline{x} \overline{y}
  • Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y.
  • Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.
  • Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores de y.

La matriz de covarianza ΣXY de dos variables aleatorias n-dimensionales expresadas como vectores columna X=(X_1,\ldots,X_n)^t e Y=(Y_1,\ldots,Y_n)^t se define como:

S_{XY}={\operatorname{E}([X - \operatorname{E}(X)][Y - \operatorname{E}(Y)]^t)}

donde \operatorname{E}(\cdot) es el operador esperanza.

[editar] Propiedades

  1. Si a todos los valores de la variable x, les sumamos una constante k y a todos los valores de la variable y, les sumamos una constante k’, la covarianza no varía.
  2. Si a todos los valores de una variable x los multiplicamos por una constante k y a todos los valores de la variable y, los multiplicamos por una constante k’, su covarianza queda multiplicada por el producto de las constantes.
  3. A partir de las anteriores: si tenemos dos variables x, y con la covarianza Sxy, y transformaciones lineales de las variables de la forma z=ax+b, y t=cy+d, la nueva covarianza se relaciona con la anterior de la forma: Szt = acSxy.
  4. Cov(x,y) = Cov(y,x)

[editar] Véase también

Herramientas personales
Crear un libro