Diferencia entre revisiones de «Clasificador (matemáticas)»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Davidrr (discusión · contribs.)
Sin resumen de edición
Davidrr (discusión · contribs.)
Deshecha la edición 31768631 de Davidrr (disc.)
Línea 1: Línea 1:
{{referencias}}
{{referencias}}


Un '''clasificador''' es un elemento que proporciona una clase etiquetada a partir de un conjunto de características tomadas como entradas.
Un '''clasificador''' es un elemento que proporciona como salida una clase etiquetada a partir de un conjunto de características tomadas como entradas.
Una manera de construir un '''clasificador''' es coger un conjunto de ejemplos etiquetados y tratar de definir una regla que pueda asignar una etiqueta a cualquier otro dato de entrada.
Una manera de construir un '''clasificador''' es coger un conjunto de ejemplos etiquetados y tratar de definir una regla que pueda asignar una etiqueta a cualquier otro dato de entrada.



Revisión del 17:37 26 nov 2009

Un clasificador es un elemento que proporciona como salida una clase etiquetada a partir de un conjunto de características tomadas como entradas. Una manera de construir un clasificador es coger un conjunto de ejemplos etiquetados y tratar de definir una regla que pueda asignar una etiqueta a cualquier otro dato de entrada.

Introducción

Debido al gran aumento del tamaño de los dispositivos de almacenamiento digital y los avances producidos a nivel informático y de las telecomunicaciones, los archivos digitales de contenido multimedia están creciendo muy rápidamente. Esto hace necesario la búsqueda de métodos eficientes capaces de recuperar con rapidez la información de interés. Actualmente, la información audiovisual es una de las más demandadas en este sentido.

Aprendizaje y Minería de datos

Tanto la Minería de datos como el Aprendizaje automático son técnicas relacionadas con el tratamiento de grandes cantidades de datos.

La técnica de Minería de datos, intenta obtener patrones o modelos a partir de los datos recopilados.

El Aprendizaje automático es la parte básica que tienen en común los diferentes tipos de clasificadores que existen. La idea básica del aprendizaje consiste en utilizar las percepciones no sólo para actuar, sino también para mejorar la habilidad de un agente para actuar en el futuro.

Existen diferentes tipos de técnicas de aprendizaje:

Aprendizaje supervisado

El aprendizaje supervisado consiste en aprender una función, a partir de ejemplos etiquetados anteriormente, que establezca una correspondencia entre las entradas y las salidas deseadas del sistema. No siempre es posible hacer este tipo de entrenamiento ya que tenemos que disponer de la salida esperada en la función de entrada. El sistema de aprendizaje trata de etiquetar (clasificación) una serie de vectores utilizando una entre varias categorías (clases).

Aprendizaje no supervisado

El aprendizaje no supervisado consiste en aprender a partir de patrones de entradas, para los cuales no se especifican los valores de sus salidas.

Aprendizaje por refuerzo

El aprendizaje por refuerzo consiste en aprender observando el mundo que te rodea.

La idea del aprendizaje consiste en construir una función que tenga el comportamiento observado en sus datos de entrada y de salida. Los métodos de aprendizaje se pueden entender como la búsqueda de un espacio de hipótesis para encontrar la función adecuada.

Tipos de clasificadores

Existen diferentes tipos de clasificadores:

Clasificador Bayesiano

Un Clasificador bayesiano es un clasificador de patrones basado en teorías estadísticas de aprendizaje. El aprendizaje bayesiano calcula la probabilidad de cada hipótesis de los datos y realiza predicciones sobre estas bases. Es un aprendizaje casi óptimo, pero requiere grandes cantidades de cálculo debido a que el espacio de hipótesis es normalmente muy grande, o incluso puede ser infinito.

Clasificador Parzen

Este clasificador está basado en el histograma de los datos. Estima las densidades de cada clase.

Clasificador Backpropagation

En algunos problemas el uso de modelos simples de densidad paramétrica o el uso de modelos de histogramas no dan los resultados deseados. En estos casos se buscan modelos de densidad más sofisticados. Las redes neuronales son una técnica de aproximación paramétrica útil para construir modelos de densidad. El modelo de red neuronal habitual que utiliza este algoritmo consiste en una red con una capa de entrada con tantos nodos como entradas tengan, una capa oculta con un número de nodos variable que dependerá de las características del problema, y una capa de salida con tantos nodos como posibles salidas tenga.

Clasificador con PCA

En el método PCA (Principal Component Analysis), las nuevas características son funciones de las viejas. Se toma un conjunto de datos y construimos un subespacio lineal de menor dimensión.

Máquinas de vectores de soporte (Support vector machine)

Las Máquinas de vectores de soporte (SVM) son unas técnicas sencillas y de gran aplicación cuando se pretende construir un clasificador utilizando ejemplos. A diferencia de las redes neuronales que intentan construir un modelo a posteriori, las SVM’s tratan de obtener la frontera de decisión. Una de sus ventajas es su facilidad ya que únicamente hay que codificar la geometría de la frontera.

Aplicaciones

Las aplicaciones de los clasificadores son muy amplios. Su uso se extiende en medicina (análisis de prueba de drogas, análisis de datos de resonancia magnética), teléfonos móviles (descodificación de la señal, corrección de errores), la visión por computador (reconocimiento facial, seguimiento de objetivos), reconocimiento de voz, minería de datos (análisis de compras en supermercados, análisis de clientes al por menor) entre otras áreas diferentes.

Un ejemplo es un clasificador que acepta datos de sueldos de una persona, edad, estado civil, dirección e historial de crédito y clasifica a la persona como aceptables o inaceptables para recibir una nueva tarjeta de crédito o préstamo.

Véase también