Diferencia entre revisiones de «Mediana»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Diegusjaimes (discusión · contribs.)
m Revertidos los cambios de 187.139.55.60 a la última edición de Diegusjaimes
Línea 5: Línea 5:
* '''[[Mediana (tráfico)]]''', es la separación que impide el paso entre los [[carril]]es de dirección contraria en una [[calzada]].
* '''[[Mediana (tráfico)]]''', es la separación que impide el paso entre los [[carril]]es de dirección contraria en una [[calzada]].


== Enlaces externos ==
MEDIANA
{{wikcionario}}
Artículo principal: Mediana (estadística)


{{desambiguación}}
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.[25] Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:


[[ast:Mediana]]
\underbrace{1,\ 1,\ 1,\ 1,\ 1,\ 1, }_{Mitad \; inferior} \; \underbrace{\color{Red} 2, }_{Mediana \;} \; \underbrace{2,\ 2,\ 2,\ 3,\ 3,\ 4}_{Mitad \; superior}
[[en:Median (disambiguation)]]

[[eo:Mediano]]
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:
[[fr:Médiane]]

[[gl:Mediana]]
\underbrace{1,\ 1,\ 1,\ 1,\ 1, }_{Valores \; inferiores} \; \underbrace{\color{Red} 1,\ 2, }_{Valores \; intermedios} \; \underbrace{2,\ 2,\ 3,\ 3,\ 4}_{Valores \; superiores}
[[it:Mediana]]

[[nl:Mediaan]]
Se toma como mediana 1,5 = \frac{{\color{Red}1}+{\color{Red}2}}{2}
[[pt:Mediana]]
En este ejemplo basado en una tabla real de percentiles usada en pediatría, puede comprobarse que una niña de 24 meses con un peso de 13 kg estaría en el percentil 75º, esto es, su peso es superior al 75% de las niñas de su edad. La mediana correspondería, aproximadamente, a 12 kg (intersección de la línea curva más oscura con la línea horizontal correspondiente al valor 12 en el eje vertical, para esa misma edad).
[[ru:Медиана]]

[[sq:Mediana]]
Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolación.

Propiedades de la mediana como parámetro estadístico:[26]

* Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
* Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
* No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la media aritmética.
Medidas de posición no central [editar]
Artículo principal: Medidas de posición no central

Directamente relacionados con la anterior, se encuentran las medidas de posición no central, también conocidas como cuantiles. Se trata de valores de la variable estadística que dejan por debajo de sí determinada cantidad de los datos. Son, en definitiva, una generalización del concepto de la mediana. Mientras que ésta deja por debajo de sí al 50% de la distribución, los cuantiles pueden hacerlo con cualquier otro porcentaje.[27] Se denominan medidas de posición porque informan, precisamente, de la posición que ocupa un valor dentro de la distribución de datos.

Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en cuatro partes antes de proceder al cálculo de los valores que ocupan cada posición; deciles, si se divide los datos en diez partes; o percentiles, que dividen la población en cien partes.

Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el percentil 75, ello supone que el 75% de la población tiene un cociente intelectual con un valor inferior al de esa persona. Este criterio se usa por las asociaciones de superdotados, que limitan su conjunto de miembros a aquellas que alcanzan determinado percentil (igual o superior a 98 en la mayoría de los casos).

El ejemplo que se muestra en la imagen de la derecha es el correspondiente al cálculo inverso, esto es, cuando se desea conocer el percentil correspondiente a un valor de la variable, en lugar del valor que corresponde a un determinado percentil.

Otras medidas de posición central son la media geométrica y la media armónica que, aunque tienen determinadas propiedades algebraicas que podrían hacerlas útiles en determinadas circunstancias, su interpretación no es tan intuitiva como la de los parámetros anteriores.[28]
Comentarios sobre las medidas de posición [editar]

Este tipo de parámetros no tienen por qué coincidir con un valor exacto de la variable y, por tanto, tampoco pueden usarse con carácter general para hacer pronósticos. Por ejemplo, si se dice que la media aritmética de los hijos de las familias de un país es de 1,2, no es posible encontrar familias con ese valor en concreto. Un segundo ejemplo: a ninguna fábrica de zapatos se le ocurriría fabricar los suyos con tallas únicamente correspondientes al valor promedio, ni siquiera tienen por qué ser estas tallas las más fabricadas, pues en tal caso sería más apropiado atender a la moda de la distribución de tallas de los eventuales clientes.

La elección de uno u otro parámetro dependerá de cada caso particular, de los valores de la variable y de los propósitos del estudio. Su uso indiscriminado puede ser deliberadamente tendencioso o involuntariamente sesgado, convirtiéndose, de hecho, en un abuso.[10] Puede pensarse, por ejemplo, en la siguiente situación: un empresario publica que el salario medio en su empresa es de 1.600 €. A este dato, que en determinadas circunstancias podría considerarse muy bueno, podría llegarse si la empresa tuviese cuatro empleados con salarios de 1.000 € mensuales y el salario del jefe, incluido en la media, fuese de 4.000 € al mes:[29]

\bar{x} = \frac{1000+1000+1000+1000+4000}{5} = 1600

Con carácter general y a modo de resumen podría decirse que la media aritmética es un parámetro representativo cuando la población sigue una distribución normal o es bastante homogénea; en otras situaciones de fuerte dispersión, habría que decantarse por la mediana. La moda es el último recurso (y el único) cuando de describir variables cualitativas se trata.
Medidas de dispersión [editar]
Artículo principal: Dispersión (matemática)
Diagrama de caja que muestra la dispersión gráficamente, usando los cuartiles como referencia. Entre Q1 y Q3 (rango intercuartílico) se encuentran el 50% de las observaciones.

Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican excesivamente la información. Estas medidas adquieren verdadero significado cuando van acompañadas de otras que informen sobre la heterogeneidad de los datos. Los parámetros de dispersión miden eso precisamente, generalmente, calculando en qué medida los datos se agrupan entorno a un valor central. Indican, de un modo bien definido, lo homogéneos que estos datos son. Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación típica o la desviación media, aunque también existen otras menos utilizadas como los recorridos o la meda; y medidas de dispersión relativas, como el coeficiente de variación, el coeficiente de apertura o los recorridos relativos. En muchas ocasiones las medidas de dispersión se ofrecen acompañando a un parámetro de posición central para indicar en qué medida los datos se agrupan en torno de él.[30]
Medidas de dispersión absolutas [editar]
Recorridos [editar]

El recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor valor que toma la misma. Es la medida de dispersión más sencilla de calcular, aunque es algo burda porque sólo toma en consideración un par de observaciones. Basta con que uno de estos dos datos varíe para que el parámetro también lo haga, aunque el resto de la distribución siga siendo, esencialmente, la misma.

Existen otros parámetros dentro de esta categoría, como los recorridos o rangos intercuantílicos, que tienen en cuenta más datos y, por tanto, permiten afinar en la dispersión. Entre los más usados está el rango intercuartílico, que se define como la diferencia entre el cuartil tercero y el cuartil primero. En ese rango están, por la propia definición de los cuartiles, el 50% de las observaciones. Este tipo de medidas también se usa para determinar valores atípicos. En el diagrama de caja que aparece a la derecha se marcan como valores atípicos todos aquellos que caen fuera del intervalo [Li, Ls] = [Q1 - 1,5·Rs, Q3 + 1,5·Rs], donde Q1 y Q3 son los cuartiles 1º y 3º, respectivamente, y Rs representa la mitad del recorrido o rango intercuartílico, también conocido como recorrido semiintercuartílico.[31]
Desviaciones medias [editar]
Artículo principal: Desviación media

Dada una variable estadística X y un parámetro de tendencia central, c, se llama desviación de un valor de la variable, xi, respecto de c, al número |xi - c|. Este número mide lo lejos que está cada dato del valor central c, por lo que una media de esas medidas podría resumir el conjunto de desviaciones de todos los datos.

Así pues, se denomina desviación media de la variable X respecto de c a la media aritmética de las desviaciones de los valores de la variable respecto de c, esto es, si

X = {x_1, \, x_2, \, ...,\, x_n}, entonces DM_c = \frac{\sum_{i=1}^n \left| x_i - c \right|}{n}

De este modo se definen la desviación media respecto de la media (c = \overline{x}) o la desviación media respecto de la mediana (c = \overline{Me}), cuya interpretación es sencilla en virtud del significado de la media aritmética.[30]

Sin embargo, el uso de valores absolutos impide determinados cálculos algebraicos que obligan a desechar estos parámetros, a pesar de su clara interpretación, en favor de los siguientes.
Varianza y desviación típica [editar]
Artículos principales: Varianza y desviación típica
Conjunto de datos estadísticos de media aritmética 50 (línea azul) y desviación típica 20 (líneas rojas).

Como se vio más arriba, la suma de todas las desviaciones respecto al parámetro más utilizado, la media aritmética, es cero. Por tanto si se desea una medida de la dispersión sin los inconvenientes para el cálculo que tienen las desviaciones medias, una solución es elevar al cuadrado tales desviaciones antes de calcular el promedio. Así, se define la varianza como:[32]

{\sigma^2} = \frac{ \sum\limits_{i=1}^n \left( x_i - \overline{x} \right) ^ 2 }{n},

o sea, la media de las desviaciones respecto de la media, al cuadrado.

La desviación típica, σ, se define como la raíz cuadrada de la varianza, esto es,

{\sigma} = \sqrt{\sigma ^2}

Para variables agrupadas en intervalos, se usan las marcas de clase (un valor apropiado del interior de cada intervalo) en estos cálculos.

Propiedades:[32]

* Ambos parámetros no se alteran con los cambios de origen.
* Si todos los valores de la variable se multiplican por una constante, b, la varianza queda multiplicada por b2.
* En el intervalo (\overline{x} - k\sigma, \, \overline{x} + k\sigma) se encuentran, al menos, el 100(1-\frac{1}{k^2})% de las observaciones (véase Desigualdad de Tchebyschev).[33]

Esta última propiedad muestra la potencia del uso conjunto de la media y la desviación típica como parámetros estadísticos, ya que para valores de k iguales a 1 y 2, respectivamente, se obtiene que:

* En el intervalo (\overline{x} - \sigma, \, \overline{x} + \sigma) están, al menos, el 75% de los datos.
* En el intervalo (\overline{x} - 2\sigma, \, \overline{x} + 2\sigma) están, al menos, el 89% de los datos.

Se cumple la siguiente relación entre los parámetros de dispersión:

D_{Me} \leq D_{\overline{x}} \leq \sigma

donde D_{Me}, \, D_{\overline{x}}, y σ son, respectivamente, la desviación media respecto de la mediana, la desviación media respecto de la media y la desviación típica (véase Desviación media).

Revisión del 00:02 22 ene 2010

El término mediana puede referirse a:

Enlaces externos