Valor atípico

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, tales como muestras estratificadas, un valor atípico (en inglés outlier) es una observación que es numéricamente distante del resto de los datos. Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán frecuentemente engañosas. Por ejemplo, en el cálculo de la temperatura media de 10 objetos en una habitación, si la mayoría tienen entre 20 y 25 ºC, pero hay un horno a 350 °C, la mediana de los datos puede ser 23, pero la temperatura media será 55. En este caso, la mediana refleja mejor la temperatura de la muestra al azar de un objeto que la media. Los valores atípicos pueden ser indicativos de datos que pertenecen a una población diferente del resto de la muestra establecida.

Tomando como referencia la diferencia entre el primer cuartil (Q_1) y el tercer cuartil Q_3, o valor intercuartil, en un diagrama de caja se considera un valor atípico el que se encuentra 1,5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia (atípico extremo).

Valor atípico leve[editar]

Siendo Q_1 y Q_3 el primer y tercer cuartil, y IQR el rango intercuartil (Q_3-Q_1), un valor atípico leve será aquel que:

< Q_1 - 1.5\cdot \mathrm{IQR},

o

> Q_3 + 1.5\cdot \mathrm{IQR}.

Q_1 y Q_3 determinan, pues, los llamados limites interiores, a partir de los cuales la observación se considera un atípico leve.

Valor atípico extremo[editar]

Los atípicos extremos son observaciones más allá de los límites externos:

< Q_1 - 3\cdot \mathrm{IQR},

o

> Q_3 + 3\cdot \mathrm{IQR}.