Diferencia entre revisiones de «Algoritmo de agrupamiento»

← Ir a diferencia anterior Ir a siguiente diferencia →

Contenido eliminado Contenido añadido

En renglón

Revisión del 01:24 18 nov 2009

Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores de acuerdo con un criterio de cercanía. Esta cercanía se define en términos de una determinada función de distancia, como la euclídea, aunque existen otras más robustas o que permiten extenderla a variables discretas.

Generalmente, los vectores de un mismo grupo (o clústers) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripción sintética de un conjunto de datos multidimensional complejo. De ahí su uso en minería de datos. Esta descripción sintética se consigue sustituyendo la descripción de todos los elementos de un grupo por la de un representante característico del mismo.

En algunos contextos, como el de la minería de datos, se lo considera una técnica de aprendizaje no supervisada puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo.

Aplicaciones

Las técnicas de agrupamiento encuentran aplicación en diversos ámbitos.

En teoría de la señal pueden servir para eliminar ruidos.
En mercadotecnia se utilizan para segmentar bases de datos de clientes.

Algoritmos

Existen diversas técnicas de agrupamiento. Se dividen en dos grandes categorías:

Jerárquicas, que construyen una jerarquía de grupos escindiéndolos iterativamente.
De particionamiento, en los que el número de grupos se determina de antemano y las observaciones se van asignando a los grupos en función de su cercanía.

Existen diversas implementaciones de algoritmos concretos. Por ejemplo, el de las k-medias, de particionamiento. Es uno de los más antiguos pero uso extendido a pesar de sus carencias y falta de robustez.

El paquete cluster de R-lenguaje ^[1] implementa una serie de algoritmos de particionamiento como agnes, mona y diana, jerárquicos, y pam, clara y fanny, de particionamiento.

Referencias

↑ Rousseeuw, P.J.; Kaufman, L. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.

Enlaces externos

Wikimedia Commons alberga una galería multimedia sobre Algoritmo de agrupamiento.

[1] Rousseeuw, P.J.; Kaufman, L. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.

[1]

@@ Línea 59: / Línea 59: @@
 [[vi:Phân nhóm dữ liệu]]
 [[zh:数据聚类]]
-AGRUPAR ES: ASER O CREAR UN GRUPO DE ALGO POR EJEMPLO: YO AGRUPE A LOS MUSICOS DE DIFERENTES ISTRUMENTOS)  YO AGRUPE ANIMALES)
-Y
-DESAGRUPAR ES: DESASER GRUPOS DE ALGO O NO ASER GRUPOS DE ALGO: POR EJEMPLO
-SE DESAGRUPARON LOS MUSICOS) EN ESTA ORACION DISE QUE SE (DESICIERON) LOS MUSICOS