Diferencia entre revisiones de «Clasificación de documentos»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
m Deshecha la edición 34150492 de 190.186.124.122 (disc.)
Línea 6: Línea 6:


Publicaciones:
Publicaciones:
* jorge parada cuellar tu papi. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [http://dienst.isti.cnr.it/Dienst/UI/2.0/Describe/ercim.cnr.iei/1999-B4-31-12?tiposearch=cnr]
* Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [http://dienst.isti.cnr.it/Dienst/UI/2.0/Describe/ercim.cnr.iei/1999-B4-31-12?tiposearch=cnr]





Revisión del 14:49 5 abr 2010

Se define como la tarea de asignar variables Booleanas a cada par pertenecientes a , donde es el dominio de los documentos y es una colección de categorías predefinidas. T indica archivar un documento bajo , mientras F indica no archivar bajo .

Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de e-mail (spam / no spam)

Enlaces externos

Publicaciones:

  • Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [1]