Test de Shapiro–Wilk

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, el Test de Shapiro–Wilk se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hipótesis nula que una muestra x1, ..., xn proviene de una población normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk.[1] Se considera uno de los test más potentes para el contraste de normalidad, sobre todo para muestras pequeñas (n<30).

El estadístico del test es:

W = {\left(\sum_{i=1}^n a_i x_{(i)}\right)^2 \over \sum_{i=1}^n (x_i-\overline{x})^2}

donde

  • x(i) (con el subíndice i entre paréntesis) es el número que ocupa la i-ésima posición en la muestra;
  • \bar{x} = (x1 + ... + xn) / n es la media muestral;
  • las variables ai se calculan[2]
(a_1,\dots,a_n) = {m^\top V^{-1} \over (m^\top V^{-1}V^{-1}m)^{1/2}}
donde
m = (m_1,\dots,m_n)^\top\,
siendo m1, ..., mn son los valores medios del estadístico ordenado, de variables aleatorias independientes e identicamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadístico de orden.

La hipótesis nula se rechazará si W es demasiado pequeño.[3]


Interpretación: Siendo la hipótesis nula que la población está distribuida normalmente, si el p-valor es menor a alfa (nivel de confianza) entonces la hipótesis nula es rechazada (se concluye que los datos no vienen de una distribución normal). Si el p-valor es mayor a alfa, no se rechaza la hipótesis y se concluye que los datos siguen una distribución normal.


Véase[editar]

Referencias[editar]

  1. Shapiro, S. S. (1965). «An analysis of variance test for normality (complete samples)». Biometrika 52 (3-4):  pp. 591–611. doi:10.1093/biomet/52.3-4.591. JSTOR 2333709 MR 205384. 
  2. op cit p. 593
  3. op cit p. 605

Enlaces externos[editar]