Clasificación de documentos

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Se define como la tarea de asignar valores booleanos a cada par pertenecientes a , donde es el dominio de los documentos y es una colección de categorías predefinidas. T (verdadero) indica archivar un documento bajo , mientras F (falso) indica no archivar bajo .

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de e-mail (spam / no spam)

Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.[1]

Referencias[editar]

  1. «Evaluación de Modelos: Clasificación Multi-Etiqueta, Precisión y Cobertura». Aprendizage Automático (Machine Learning) en la Práctica. 19 de octubre de 2016. Consultado el 20 de octubre de 2016. 

Enlaces externos[editar]

Publicaciones:

  • Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [1]