Grado de libertad (estadística)

En estadística, grados de libertad, expresión introducida por Ronald Fisher, dice que, de un conjunto de observaciones, los grados de libertad están dados por el número de valores que pueden ser asignados de forma arbitraria, antes de que el resto de las variables tomen un valor automáticamente, producto de establecerse las que son libres; esto, con el fin de compensar e igualar un resultado el cual se ha conocido previamente. Se encuentran mediante la fórmula $n-r$ , donde n es el número de sujetos en la muestra que pueden tomar un valor y r es el número de sujetos cuyo valor dependerá del que tomen los miembros de la muestra que son libres. También pueden ser representados por $k-r$ , donde $k$ = número de grupos; esto, cuando se realizan operaciones con grupos y no con sujetos individuales.

Cuando se trata de eliminar los estadísticos con un conjunto de datos, los residuos —expresados en forma de vector— se encuentran, habitualmente en un espacio de menor dimensión que aquel en el que se encontraban los datos originales. Los grados de libertad del error los determina, precisamente, el valor de esta menor dimensión.

Un ejemplo aclara el concepto. Supongamos que $X_{1},\dots ,X_{n}\,$ son variables aleatorias, cada una de ellas con media $\mu$ , y que ${\overline {X}}_{n}={X_{1}+\cdots +X_{n} \over n}$ es la media muestral.

Entonces las cantidades $X_{i}-{\overline {X}}_{n}\,$ son los residuos, que pueden ser considerados estimaciones de los errores $X_{i}-\mu$ . La suma de los residuos (a diferencia de la suma de los errores, que no es conocida) es necesariamente 0,

\sum _{i=1}^{n}({X_{i}}-{\overline {X}}_{n})=\sum _{i=1}^{n}{X_{i}}-n{\overline {X}}_{n}=\sum _{i=1}^{n}{X_{i}}-\sum _{i=1}^{n}{X_{i}}=0

,

ya que existen variables con valores superiores e inferiores a la media muestral.

Esto también significa que los residuos están restringidos a encontrarse en un espacio de dimensión $n-1$ (en este ejemplo, en el caso general a $n-r$ ) ya que, si se conoce el valor de $n-1$ de estos residuos, la determinación del valor del residuo restante es inmediata. Así, se dice que «el error tiene $n-1$ grados de libertad» (el error tiene $n-r$ grados de libertad general).

Datos: Q3253731