Verdad Terreno

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda


Dentro del campo de la evaluación de clasificadores, el término verdad terreno determina la exactitud en el proceso de clasificación a partir de un conjunto de entrenamiento, realizado durante las técnicas de aprendizaje supervisado y validación. Esta se utiliza para probar o por el contrario refutar, modelos estadísticos de investigación. El proceso de recopilación de datos objetivos adecuados para el testeo del clasificador se llama verificación sobre el terreno.

El filtro Bayesiano de spam, es un ejemplo común de aprendizaje supervisado que utiliza la verificación sobre el terreno. En este sistema, el algoritmo se enseña manualmente las diferencias entre lo considerado como spam y no spam extrayendo varias características o descriptores de los correos que servirán como verdad terreno. El aprendizaje dependerá de los mensajes utilizados para entrenar el algoritmo. Por lo tanto si se encuentran inexactitudes en la verdad terreno, obtendremos imprecisiones en el correo resultante, determinando como spam correo que en realidad no lo era.

Verdad Terreno en Clasificación Supervisada[editar]

La verdad terreno es esencial en la clasificación supervisada. Cuando, por ejemplo, la identidad y la ubicación de unos tipos de cobertura del suelo en cartografía se conocen a través de una combinación de trabajo de campo, mapas, y la experiencia personal, las imágenes correspondientes a estas áreas se conocen como imágenes de entrenamiento supervisado. Las características espectrales de estas imágenes y sus descriptores se utilizan para entrenar el software de detección remota fijando así la verdad terreno y seguidamente se obtienen reglas de decisión basadas en los descriptores de las imágenes de entrenamiento para clasificar el resto de las imágenes. Estas reglas de decisión tales como la clasificación de máxima probabilidad, clasificación paralelepípedo, clasificación de mínima distancia o Support Vector Machines (SVM) ofrecen diferentes técnicas para clasificar una imagen. Esto también es útil en la corrección de imágenes obtenidas a partir de satélites ya que tras el paso de las mismas por la atmosfera pueden padecer distorsiones y de esta manera podremos apreciar mejor los objetos.

Matriz de confusión

Matrices de Confusión[editar]

Las matrices de confusión se utilizan a la hora de calcular los parámetros de precisión y recall de un clasificador y la verdad terreno constituye una pieza clave de éstas. Éstas son tablas en las cuales se cruza la verdad terreno con el resultado de la clasificación y se obtienen los positivos ciertos, los positivos falsos, los negativos ciertos y los negativos falsos, parámetros de gran relevancia para la validación de clasificadores.

Extracción de descriptores para la verificación terreno de una imagen satélite

Aplicación en la Detección Remota[editar]

La verdad terreno es muy utilizada en detección remota (teledetección). Esta se refiere a la información recogida localmente. La verdad terreno permite que las imágenes obtenidas se correspondan con las características y materiales reales del terreno registrado. La recogida de datos de verdad terreno permite la calibración de los datos enviados de forma remota y además añade el análisis de lo que está siendo detectado. Esto se utiliza por ejemplo en cartografía, meteorología, análisis de fotografías aéreas, imágenes por satélite y otras técnicas en las que se recopilan los datos a distancia. La verdad terreno es específicamente un proceso de comparativa entre, por ejemplo, un pixel de una imagen de satélite y el que corresponde con la realidad (en la actualidad) con el fin de verificar el contenido del pixel de dicha imagen. En el caso de una imagen clasificada, permite en la clasificación supervisada determinar la exactitud de la clasificación realizada por el software de detección a distancia y, por lo tanto, minimizar los errores en la clasificación tanto los de comisión como los errores de omisión.

Parámetros de error[editar]

Existen dos tipos de errores en los que la verdad terreno entra en juego:

Errores por comisión[editar]

Un ejemplo de un error por comisión es cuando un píxel informa de la presencia de una característica en una imagen (por ejemplo, árboles) mientras que en la realidad no se da esta característica (no hay árboles en ese píxel de la imagen). La verdad terreno se asegura de que las matrices de error tienen un porcentaje de mayor precisión, en comparación con una evaluación de pixeles sin verdad terreno.

Errores por omisión[editar]

Un ejemplo de un error por omisión es cuando los píxeles de una sección determinada, por ejemplo, las personas en una foto de unen evento, no están clasificados como personas. El proceso de verdad terreno ayuda a asegurar que el píxel se clasifica correctamente y las matrices de error son más precisas.