Distribución T² de Hotelling

De Wikipedia, la enciclopedia libre
Función de densidad de probabilidad.Parámetros:p - dimensión de las variables aleatorias.m - relacionado con el tamaño de la muestra.

En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.

La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1]​ como una generalización de la distribución t de Student.

Definición[editar]

Si el vector tiene distribución normal multivariada con media cero y matriz de covarianza unitaria y es una matriz de tamaño con matriz unitaria escalada y los grados de libertad con distribución de Wishart entonces la forma cuadrática tiene distribución de Hotelling con parámetros y :

Si la variable aleatoria tiene distribución T-cuadrado de Hotelling con parámetros y , , entonces

donde es la distribución F con parámetros y .

Estadística T-cuadrado de Hotelling[editar]

La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]

Sea , que denota una distribución normal p-variada con vector de medias y covarianza . Sean

variables aleatorias independientes, las cuales pueden representarse como un vector columna de orden de números reales. Defínase

como la media muestral. Puede demostrarse que

donde es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que y entonces, al derivar la función característica de la variable aleatoria

Sin embargo, es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias .

Defínase

como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que es una matriz definida positiva y sigue una distribución Wishart p-variada con n−1 grados de libertad.[2]​ La estadística T-cuadrado de Hotelling se define entonces como

porque se demuestra que [cita requerida]

es decir

donde es una distribución con parámetros y . Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución .

Referencias[editar]

  1. a b Hotelling, H. (1931). «The generalization of Student's ratio». Annals of Mathematical Statistics 2 (3): 360-378. doi:10.1214/aoms/1177732979. 
  2. K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.