Varianza

En teoría de probabilidad, la varianza o variancia (que suele representarse como $\sigma ^{2}$ ) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada positiva de la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.^[1]

A continuación se hará un repaso de las fórmulas, hay que tener en cuenta que la fórmula de la varianza para una población (σ²) difiere de la fórmula de la varianza para una muestra (s²).

Definición

Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente forma:

\sigma _{n}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\overline {X}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}x_{i}^{2}\right)-{\overline {X}}^{2}={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j>i}\left(x_{i}-x_{j}\right)^{2}

Siendo:

$x_{i}$ : cada dato
${\overline {X}}$ :media de los datos
$n$ : número de datos

Variable aleatoria

Aplicando este concepto a una variable aleatoria con media $\mu =\mathbb {E} (X)$ , se define su varianza, $V(X)$ (también representada como $Var(X)$ , $\sigma _{X}^{2}$ o, simplemente $\sigma ^{2}$ ), como

\sigma _{X}^{2}=\operatorname {E} [(X-\mu )^{2}].\,

Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):

{\begin{aligned}\sigma _{X}^{2}&=\operatorname {E} [(X-\mu )^{2}]\\&=\operatorname {E} [(X^{2}-2X\mu +\mu ^{2})]\\&=\operatorname {E} [X^{2}]-2\mu \operatorname {E} [X]+\mu ^{2}\\&=\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}\\&=\operatorname {E} [X^{2}]-\mu ^{2}\\&=\operatorname {E} [X^{2}]-\operatorname {E} [X]^{2}.\end{aligned}}

Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice $k$ satisface $1<k\leq 2$ .

Caso continuo

Si la variable aleatoria X es continua con función de densidad f(x), entonces

\sigma _{X}^{2}=\int (x-\mu )^{2}\,f(x)\,dx\,,

donde

\mu =\int x\,f(x)\,dx\,,

y las integrales están definidas sobre el rango de X.

Caso discreto

Si la variable aleatoria X es discreta con pesos x₁ ↦ p₁, ..., x_n ↦ p_n y n es la cantidad total de datos, entonces tenemos:

\sigma _{X}^{2}=\left(\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2}\right)

donde

\mu =\left(\sum _{i=1}^{n}p_{i}\cdot x_{i}\right)

.

Ejemplos

Distribución exponencial

La distribución exponencial de parámetro λ es una distribución continua con soporte en el intervalo [0,∞) y función de densidad

f(x)=\lambda e^{-\lambda x}1_{[0,\infty )}(x),\,

Tiene media μ = λ⁻¹. Por lo tanto, su varianza es:

\int _{0}^{\infty }f(x)(x-\mu )^{2}\,dx=\int _{0}^{\infty }\lambda e^{-\lambda x}(x-\lambda ^{-1})^{2}\,dx=\lambda ^{-2}.\,

Es decir, σ² = μ².

Dado perfecto

Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a ¹/₆. El valor esperado es (1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

\sum _{i=1}^{6}{\tfrac {1}{6}}(i-3,5)^{2}={\tfrac {1}{6}}\left((-2,5)^{2}{+}(-1,5)^{2}{+}(-0,5)^{2}{+}0,5^{2}{+}1,5^{2}{+}2,5^{2}\right)={\tfrac {1}{6}}\cdot 17,50={\tfrac {35}{12}}\approx 2,92\,.

Propiedades de la varianza

Algunas propiedades de la varianza son:

$V(X)\geq 0\,\!$
$V(aX+b)=a^{2}V(X)\,\!$ siendo a y b números reales cualesquiera. De esta propiedad se deduce que la varianza de una constante es cero, es decir, $V(b)=0\,\!$

$V(X-Y)=V(X)+V(Y)-2Cov(X,Y)\,\!$ , donde Cov(X,Y) es la covarianza de X e Y. (En el caso que sean independiente, no se considera la covarianza)
$V(X+Y)=V(X)+V(Y)+2Cov(X,Y)\,\!$ , donde Cov(X,Y) es la covarianza de X e Y. (En el caso que sean independiente, no se considera la covarianza)
$V(Y)=E(V(Y|X))+V(E(Y|X))\,\!$ , cálculo de la Varianza por Pitágoras, dónde Y|X es la variable aleatoria condicional "Y" dado "X".

Varianza muestral

En muchas situaciones es preciso estimar la varianza de una población a partir de una muestra. Si se toma una muestra con reemplazo $(y_{1},\dots ,y_{n})$ de n valores de ella, de entre todos los estimadores posibles de la varianza de la población de partida, existen dos de uso corriente:

s_{n}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(y_{i}-{\overline {y}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}y_{i}^{2}\right)-{\overline {y}}^{2}

cuya demostración es:

{\begin{aligned}s_{n}^{2}&={\frac {1}{n}}\sum _{i=1}^{n}\left(y_{i}-{\overline {y}}\right)^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(y_{i}^{2}-2y_{i}{\overline {y}}+{\overline {y}}^{2}\right)={\frac {1}{n}}\sum _{i=1}^{n}y_{i}^{2}-2{\overline {y}}{\frac {1}{n}}\sum _{i=1}^{n}y_{i}+{\overline {y}}^{2}{\frac {1}{n}}\sum _{i=1}^{n}1\\&={\frac {1}{n}}\sum _{i=1}^{n}y_{i}^{2}-2{\overline {y}}^{2}+{\overline {y}}^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}y_{i}^{2}\right)-{\overline {y}}^{2}\end{aligned}}

y

s^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}\left(y_{i}-{\overline {y}}\right)^{2}={\frac {\sum _{i=1}^{n}y_{i}^{2}-n{\overline {y}}^{2}}{n-1}}

cuya demostración es:

{\begin{aligned}s^{2}&={\frac {1}{n-1}}\sum _{i=1}^{n}\left(y_{i}-{\overline {y}}\right)^{2}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}\left(y_{i}^{2}-2y_{i}{\overline {y}}+{\overline {y}}^{2}\right)\\&={\frac {1}{n-1}}\sum _{i=1}^{n}y_{i}^{2}-{\frac {2{\overline {y}}}{n-1}}\sum _{i=1}^{n}y_{i}+{\frac {{\overline {y}}^{2}}{n-1}}\sum _{i=1}^{n}1\\&={\frac {1}{n-1}}\sum _{i=1}^{n}y_{i}^{2}-{\frac {2{\overline {y}}n}{n-1}}{\frac {1}{n}}\sum _{i=1}^{n}y_{i}+{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}y_{i}^{2}-{\frac {2{\overline {y}}^{2}n}{n-1}}+{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}y_{i}^{2}-{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {\sum _{i=1}^{n}y_{i}^{2}-n{\overline {y}}^{2}}{n-1}}\end{aligned}}

Cuando los datos están agrupados:

$s_{n}^{2}={\frac {1}{n}}\sum _{i=1}^{n}f_{i}\left(y_{i}-{\overline {y}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}^{2}\right)-{\overline {y}}^{2}$

cuya demostración es:

{\begin{aligned}s_{n}^{2}&={\frac {1}{n}}\sum _{i=1}^{n}f_{i}\left(y_{i}-{\overline {y}}\right)^{2}={\frac {1}{n}}\sum _{i=1}^{n}f_{i}\left(y_{i}^{2}-2y_{i}{\overline {y}}+{\overline {y}}^{2}\right)={\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-2{\overline {y}}{\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}+{\overline {y}}^{2}{\frac {1}{n}}\sum _{i=1}^{n}f_{i}\\&={\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-2{\overline {y}}^{2}+{\overline {y}}^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}^{2}\right)-{\overline {y}}^{2}\end{aligned}}

y

s^{2}={\frac {\sum _{i=1}^{n}f_{i}\left(y_{i}-{\overline {y}}\right)^{2}}{n-1}}={\frac {\sum _{i=1}^{n}f_{i}y_{i}^{2}-n{\overline {y}}^{2}}{n-1}}

cuya demostración es:

{\begin{aligned}s^{2}&={\frac {\sum _{i=1}^{n}f_{i}\left(y_{i}-{\overline {y}}\right)^{2}}{n-1}}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}f_{i}\left(y_{i}^{2}-2y_{i}{\overline {y}}+{\overline {y}}^{2}\right)\\&={\frac {1}{n-1}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-{\frac {2{\overline {y}}}{n-1}}\sum _{i=1}^{n}f_{i}y_{i}+{\frac {{\overline {y}}^{2}}{n-1}}\sum _{i=1}^{n}f_{i}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-{\frac {2{\overline {y}}n}{n-1}}{\frac {1}{n}}\sum _{i=1}^{n}f_{i}y_{i}+{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-{\frac {2{\overline {y}}^{2}n}{n-1}}+{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {1}{n-1}}\sum _{i=1}^{n}f_{i}y_{i}^{2}-{\frac {{\overline {y}}^{2}n}{n-1}}\\&={\frac {\sum _{i=1}^{n}f_{i}y_{i}^{2}-n{\overline {y}}^{2}}{n-1}}\end{aligned}}

A los dos (cuando está dividido por n y cuando lo está por n-1) se los denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la población y el segundo es un estimador insesgado de la varianza de la población. De hecho,

{\begin{aligned}\operatorname {E} [s^{2}]&=\operatorname {E} \left[{\frac {1}{n-1}}\sum _{i=1}^{n}Y_{i}^{2}~-~{\frac {n}{n-1}}{\overline {Y}}^{2}\right]\\&={\frac {1}{n-1}}\left(\sum \operatorname {E} [Y_{i}^{2}]~-~n\operatorname {E} [{\overline {Y}}^{2}]\right)\\&={\frac {1}{n-1}}\left(n\operatorname {E} [Y_{1}^{2}]~-~n\operatorname {E} [{\overline {Y}}^{2}]\right)\\&={\frac {n}{n-1}}\left(\operatorname {Var} (Y_{1})+\operatorname {E} [Y_{1}]^{2}~-~\operatorname {Var} ({\overline {Y}})-\operatorname {E} [{\overline {Y}}]^{2}\right)\\&={\frac {n}{n-1}}\left(\operatorname {Var} (Y_{1})+\mu ^{2}~-~{\frac {1}{n}}\operatorname {Var} (Y_{1})-\mu ^{2}\right)\\&={\frac {n}{n-1}}\left({\frac {n-1}{n}}~\operatorname {Var} (Y_{1})\right)\\&=\operatorname {Var} (Y_{1})\\&=\sigma ^{2}\end{aligned}}

mientras que

E[s_{n}^{2}]={\frac {n-1}{n}}\sigma ^{2}

Propiedades de la varianza muestral

Como consecuencia de la igualdad $\operatorname {E} (s^{2})=\sigma ^{2}$ , s² es un estadístico insesgado de $\sigma ^{2}$ . Además, si se cumplen las condiciones necesarias para la ley de los grandes números, s² es un estimador consistente de $\sigma ^{2}$ .

Más aún, cuando las muestras siguen una distribución normal, por el teorema de Cochran, $s^{2}$ tiene la distribución chi-cuadrado:

n{\frac {s^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}.

Interpretaciones de la varianza muestral

Dejamos tres fórmulas equivalentes para el cálculo de la varianza muestral $s_{n}$

s_{n}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(y_{i}-{\overline {y}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}y_{i}^{2}\right)-{\overline {y}}^{2}={\frac {1}{n^{2}}}\sum _{i<j}\left(y_{i}-y_{j}\right)^{2}

(Demostración geométrica en http://www.solin.16mb.com/estadistica_js/MediayDesviacion.htm)

Esta última igualdad tiene interés para interpretar los estimadores $s^{2}$ y $s_{n}^{2}$ , pues si se quiere evaluar la desviación de unos datos o sus diferencias, se puede optar por calcular el promedio de los cuadrados de las diferencias de cada par de datos:

2s_{n}^{2}={\frac {\sum _{\left(i\leqslant n,j\leqslant n\right)}\left(y_{i}-y_{j}\right)^{2}}{n^{2}}}

. Nótese que el número de sumandos es

n^{2}

.

O se puede considerar el promedio de los cuadrados de las diferencias de cada par de datos sin tener en cuenta cada dato consigo mismo, ahora el número de sumandos es $n\left(n-1\right)$ .

2s^{2}={\frac {\sum _{i\neq j}\left(y_{i}-y_{j}\right)^{2}}{n\left(n-1\right)}}

Véase también

Referencias

↑ Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition of Mendelian Inheritance» Transactions of the Royal Society of Edinburgh Vol. 52, 02, pp 399-433.

Enlaces externos

[1] Simulación de la varianza de una variable discreta con R (lenguaje de programación)
[www.solin.16mb.com/estadistica_js/MediayDesviacion.htm] Un triángulo rectángulo.

Datos: Q175199
Multimedia: Variance / Q175199

[1] Fisher, R. A. (1919). «The Correlation Between Relatives on the Supposition of Mendelian Inheritance» Transactions of the Royal Society of Edinburgh Vol. 52, 02, pp 399-433.

[1]