Distribución T² de Hotelling

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Warning: Display title "Hotelling's <i>T</i>-squared distribution" was ignored since it is not equivalent to the page's actual title.

En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.

La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1] como una generalización de la distribución t de Student.

La distribución[editar]

Si la notación es usada para denotar una variable aleatoria distribución T-cuadrado de Hotelling con parámetros p ym, entonces, si una variable aleatoria X distribución T-cuadrado de Hotelling,

entonces[1]

donde es una distribución F con parámetros p y m−p+1.

Estadística T-cuadrado de Hotelling[editar]

La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]

Sea , que denota una distribución normal p-variada con vector de medias y covarianza . Sean

n variables aletorias independientes, las cuales pueden representarse como un vector columna de orden de números reales. Defínase

como la media muestral. Puede demostrarse que

donde es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que y entonces, al derivar la función característica de la variable aletoria . Esto se hizo bajo,

Sin embargo, es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias .

Defínase

como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que es una matriz definida positiva y sigue una distribución Wishart p-variada con n−1 grados de libertad.[2] La estadística T-cudrado de Hotelling se define entonces como

porque se demuestra que [cita requerida]

es decir

donde es una distribución F con parámetros p y n−p. Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución F.

Estadística T-cuadrado de Hotelling para dos muestras[editar]

Si y , con the samples independently drawn from two independent multivariate normal distributions con la misma media y covarianza, y definimos

como las medias muestrales, y

como el estinador de la matriz de covarianza pooled insesgado the unbiased pooled covariance matrix estimate, then Hotelling's two-sample T-squared statistic is

and it can be related to the F-distribution by[2]

The non-null distribution of this statistic is the noncentral F-distribution (the ratio of a non-central Chi-squared random variable and an independent central Chi-squared random variable)

with

where is the difference vector between the population means.

Véase también[editar]

Referencias[editar]

  1. a b c Hotelling, H. (1931). «The generalization of Student's ratio». Annals of Mathematical Statistics 2 (3): 360–378. doi:10.1214/aoms/1177732979. 
  2. a b K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.

Enlaces externos[editar]

Plantilla:ProbDistributions Plantilla:Common univariate probability distributions