Matriz de confusión

De Wikipedia, la enciclopedia libre

En el campo de la inteligencia artificial y en especial en el problema de la clasificación estadística, una matriz de confusión es una herramienta que permite la visualización del desempeño de un algoritmo que se emplea en aprendizaje supervisado. Cada columna de la matriz representa el número de predicciones de cada clase, mientras que cada fila representa a las instancias en la clase real. Uno de los beneficios de las matrices de confusión es que facilitan ver si el sistema está confundiendo dos clases.

Si en los datos de entrada el número de muestras de clases diferentes cambia mucho, la tasa de error del clasificador no será representativa de lo bien que el clasificador realiza la tarea. Si, por ejemplo, hay 990 muestras de la clase 1 y sólo 10 de la clase 2, el clasificador puede tener fácilmente un sesgo hacia la clase 1. Si el clasificador clasifica todas las muestras como clase 1 su precisión será del 99%. Sin embargo, esto no significa que sea un buen clasificador, pues tuvo un 100% de error en la clasificación de las muestras de la clase 2.

En la matriz ejemplo que aparece a continuación, de 8 gatos reales, el sistema predijo que tres eran perros y de seis perros predijo que uno era un conejo y dos eran gatos. A partir de la matriz se puede ver que el sistema tiene problemas distinguiendo entre gatos y perros, pero que puede distinguir razonablemente bien entre conejos y otros animales.

Valor Predicho
Gato Perro Conejo
Valor real Gato 5 3 0
Perro 2 3 1
Conejo 0 2 11

Ejemplo de matriz de confusión

Enlaces externos[editar]