Media truncada

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Se denomina media truncada a una medida de tendencia central estadística, similar a un promedio y una mediana. Para el cálculo del promedio en este caso previamente se descartan porciones de la distribución de probabilidad o muestra en el extremo inferior y superior, típicamente se descarta igual cantidad en ambos extremos.

Para la mayoría de los usos en estadística se elimina entre el 5 al 25% de los elementos de la muestra en los extremos. En algunas regiones de Europa Central a veces se lo denomina promedio Windsor, pero no se debe confundir este nombre con un promedio Winsorizado: en este último, las observaciones que han sido descartadas son reemplazadas por el más grande o el más pequeño de los valores que restan.

Notación[editar]

El índice de la media es una indicación del procentaje de datos eliminados en ambos extremos. Por ejemplo, si se fuera a truncar en un 12,5% una muestra con 8 datos al calcular la media truncada, se deben descartar el valor más pequeño y el más grande de la muestra.

Interpolación[editar]

Cuando se debe determinar la media truncada de una muestra, pero no es posible hacerlo en forma precisa, lo mejor es calcular las dos medias truncadas más próximas, y luego interpolar (por lo general en forma lineal). Por ejemplo, si se debe calcular la media truncada al 15% de una muestra conteniendo diez elementos, primero se calcula la media truncada al 10% (eliminando un elemento en cada extremo de la muestra), luego se calcula la media truncada al 20% (eliminando dos datos en cada extremo), y finalmente se interpola para calcular la media truncada al 15%.

Ventajas[editar]

La media truncada es un estimador útil porque es menos sensible a valores atípicos que el promedio y aún así da un razonable estimador de la tendencia central o promedio para numerosos modelos estadísticos. En este sentido es reconocido por ser un estimador robusto.

Un caso en el cual puede ser ventajoso utilizar la media truncada es al estimar el parámetro de ubicación de una distribución de Cauchy, una distribución de probabilidad con forma de campana con colas más prominente que la distribución normal. Es posible demostrar que la media truncada de la muestra truncada al 24% order statistics (es decir, truncando la muestra al 38%) produce un estimador del parámetro de ubicación de la población que es más eficiente que utilizar la mediana de la muestra o el promedio de toda la muestra.[1] [2] Sin embargo, a causa de las colas gruesas de la distribución de Cauchy, la eficiencia del estimador decrece ya que una mayor cantidad de la muestra es utilizada para realizar la estimación.[1] [2] Es de destacar que en el caso de la distribución de Cauchy, ni la media truncada, ni el promedio de toda la muestra o la media de la muestra constituyen un estimador de máxima verosimilitud, ni tampoco es ninguno de ellos eficiente de forma asintotica como estimador de máxima verosimilitud; sin embargo, dado que el estimador de máxima verosimilitud es difícil de calcular, con lo cual la media truncada es una alternativa útil.[2] [3]

Desventajas[editar]

La media truncada utiliza más información de la distribución o muestra que la mediana, por lo que a menos que la distribución subyacente sea simétrica, la media truncada de una muestra es poco probable que permita obtener un estimador no sesgado de la media o de la mediana.

Ejemplos[editar]

Los métodos de otorgar puntaje en numerosos deportes que son evaluados por un panel de jueces utilizan una media truncada: se descartan el valor más bajo y el valor más alto; y se calcula el puntaje promedio utilizando las otras puntuaciones. El promedio intercuartil es otro ejemplo en el que se descartan el 25% inferior y el 25% superior de los puntos, y se calcula el promedio del resto de los puntajes.

Referencias[editar]

  1. a b Rothenberg, Thomas J.; Fisher, Franklin, M.; Tilanus, C.B. (1966). «A note on estimation from a cauchy sample». Journal of the American Statistical Association 59:  pp. 460–463. 
  2. a b c Bloch, Daniel (1966). «A note on the estimation of the location parameters of the Cauchy distribution». Journal of the American Statistical Association 61 (316):  pp. 852–855. http://www.jstor.org/pss/2282794. 
  3. Ferguson, Thomas S. (1978). «Maximum Likelihood Estimates of the Parameters of the Cauchy Distribution for Samples of Size 3 and 4». Journal of the American Statistical Association 73 (361):  p. 211. http://www.jstor.org/pss/2286549.