Prueba de Kruskal-Wallis

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías. Es una extensión de la prueba de la U de Mann-Whitney para 3 o más grupos.

Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume normalidad en los datos, en oposición al tradicional ANOVA. Sí asume, bajo la hipótesis nula, que los datos vienen de la misma distribución. Una forma común en que se viola este supuesto es con datos heterocedásticos.

Método[editar]

  1. El estadístico está dado por: K = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2}, donde:
    • n_{i} es el número de observaciones en el grupo i
    • r_{ij} es el rango (entre todas las observaciones) de la observación j en el grupo i
    • N es el número total de observaciones entre todos los grupos
    • \bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i},
    • \bar{r} =(N+1)/2 es el promedio de r_{ij}.
      Note que el denominador de la expresión para K es exactamente \frac{(N-1)N(N+1)}{12}. Luego K = \frac{12}{N(N+1)}\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2.
  2. Se puede realizar una corrección para los valores repetidos dividiendo K por 1 - \frac{\sum_{i=1}^G (t_{i}^3 - t_{i})}{N^3-N}, donde G es el número de grupos de diferentes rangos repetidos, y t_{i} es el número de observaciones repetidas dentro del grupo i que tiene observaciones repetidas para un determinado valor. Esta corrección hace cambiar a K muy poco al menos que existan un gran número de observaciones repetidas.
  3. Finalmente, el p-value es aproximado por \Pr(\chi^2_{g-1} \ge K). Si algún n_{i} es pequeño (<5) la distribución de K puede ser distinta de la chi-cuadrado.

Véase también[editar]

Referencias[editar]

Artículo adaptado de la Wikipedia en inglés.

  • William H. Kruskal and W. Allen Wallis. Use of ranks in one-criterion variance analysis. Journal of the American Statistical Association 47 (260): 583–621, December 1952.
  • Sidney Siegel and N. John Castellan, Jr. (1988). Nonparametric Statistics for the Behavioral Sciences (second edition). New York: McGraw-Hill.