Diferencia entre revisiones de «Diagrama de caja»
Sin resumen de edición |
m Revertidos los cambios de 186.28.116.205 a la última edición de Fca1970 |
||
Línea 3: | Línea 3: | ||
Un '''diagrama de caja''' es un gráfico, basado en [[Cuartil#Cuartiles|cuartiles]], mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes. |
Un '''diagrama de caja''' es un gráfico, basado en [[Cuartil#Cuartiles|cuartiles]], mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes. |
||
Es un gráfico |
Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o [[Mediana (estadística)|mediana]] y Q3, y sobre la existencia de valores atípicos y simetría de la distribución. |
||
==Como dibujarlo== |
==Como dibujarlo== |
Revisión del 16:34 23 may 2009
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes.
Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y simetría de la distribución.
Como dibujarlo
+-----+-+ * o |-------| | |---| +-----+-+ +---+---+---+---+---+---+---+---+---+---+---+---+ 0 1 2 3 4 5 6 7 8 9 10 11 12
- Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango intercuartil (IQR)
En el ejemplo: Valor 7: es el Q1 (25% de los datos) Valor 8.5: es el Q2 o mediana (el 50% de los datos) Valor 9: es el Q3 (75% de los datos) Rango intercuartil IQR (Q3-Q1)=2
- Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.
- Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Para ello se calcula cuando se consideran atípicos los valores. Son aquellos inferiores a Q1-1.5*IQR o superiores a Q3+1.5*IQR. En el ejemplo: inferior: 7-1.5*2=4 superior: 9+1.5*2=12 Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos de los bigotes. En el ejemplo: 5 y 10
- Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 3.5 Pero además se pueden considerar valores extremadamente atípicos a los que exceden Q1-3*IQR o Q3+3*IQR. De tal modo que, en el ejemplo: inferior: 7-3*2=1 superior: 9+3*2=15 El valor 0.5 seria atípico extremo y 3.5 sería atípico
Utilidades
- Proporcionan una visión general de la simetría de la distribución de los datos, si la media no está en el centro del rectángulo, la distribución no es simétrica.
- Son útiles para ver la presencia de valores atípicos.