Coeficiente de agrupamiento

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Ejemplo de coeficiente de agrupamiento en un grafo no dirigido en el que se considera el nodo sombreado on an undirected graph for the shaded node i. Los segmentos de líneas negras son enlaces que conectan vecinos de i, y los segmentos punteados son enlaces inexistentes.

El coeficiente de agrupamiento (mencionado en la literatura también como clustering coefficient) de un vértice en un grafo cuantifica qué tanto está de agrupado (o interconectado) con sus vecinos. Se puede decir que si el vértice está agrupado como un clique (grafo completo) su valor es máximo, mientras que un valor pequeño indica un vértice poco agrupado en la red. Duncan J. Watts y Steven Strogatz fueron los primeros en idear este coeficiente, en 1998[1] para determinar si un grafo es una red de mundo pequeño. Se suele representar formalmente como C_i. En algunas ocasiones dentro del mundo de la teoría de redes se denomina a este coeficiente también como transitividad.

Definición Formal[editar]

Un grafo G=(V,E) formalmente consiste en un conjunto de vértices V y en un conjunto de enlaces E entre ellos. Un enlace e_{ij} conecta dos vértices i y j. La vecindad de vértices N para un vértice v_i se define como aquellos vértices inmediatamente conectados de tal forma que:

N_i = \{v_j\} : e_{ij} \in E \or e_{ji} \in E.

El grado, que se representa como k_i de un vértice, es definido como el número de vértices enlazados con uno dado. En esta expresión además se tiene que |N_i|.

El coeficiente de agrupamiento C_i para un vértice v_i está dado por la proporción entre los enlaces conectados con sus vecinos dividido entre el número de enlaces existentes en un clique en el que la conectividad es máxima. Para un grafo dirigido, e_{ij} es distinto de e_{ji}, y por lo tanto para cada vecino N_i hay k_i(k_i-1) enlaces que podrían existir entre los vértices de la vecindad (k_i es el grado del vértice i para el total (entrantes + salientes)). De esta forma el grado de agrupamiento en los grafos dirigidos está dado por:

C_i = \frac{|\{e_{jk}\}|}{k_i(k_i-1)} : v_j,v_k \in N_i, e_{jk} \in E.

Un grafo no dirigido tiene la propiedad de que tanto los enlaces e_{ij} y e_{ji} son considerados idénticos. Por lo tanto, si un vértice v_i posee k_i vecinos, entonces existirían \frac{k_i(k_i-1)}{2} enlaces entre los vértices de su vecindad. De esta forma el coeficiente de agrupamiento de grafos no dirigidos pueden ser definidos como:

C_i = \frac{2|\{e_{jk}\}|}{k_i(k_i-1)} : v_j,v_k \in N_i, e_{jk} \in E.

Sea \lambda_G(v) el número de triángulos en v \in V(G) para un grafo no dirigido G. Esto es, \lambda_G(v) es el número de sub-grafos de G con tres enlaces y tres vértices, uno de los cuales es v. Sea \tau_G(v) el número de tripletes en v \in G. Esto es, \tau_G(v) es núemro de sub-grafos (no necesariamente inducidos) con dos enlaces y 3 vértices, uno de los cuales es v y tal que v es incidente a ambos enlaces. De esta forma se puede definir también el coeficiente de agrupamiento como

C_i = \frac{\lambda_G(v)}{\tau_G(v)}.

Es muy simple mostar que de las dos definiciones precedentes son similares, ya que:

\tau_G(v) = C({k_i},2) = \frac{1}{2}k_i(k_i-1).

Esta medida es igual a 1 si cada vecino está conectado a v_i está conectada igualmente a cada uno de los otros vértices en la vecindad, y 0 si no hay vértices que están conectados a v_i que conectan a otro vértice que es conectado a v_i. El coeficiente de agrupamiento de la red se calcula mediante Watts y Strogatz como la media de los coeficientes de agrupamiento de todos los vértices de la red:

\bar{C} = \frac{1}{n}\sum_{i=1}^{n} C_i.

Un grafo se considera como mundo pequeño si el coeficiente de agrupamiento de la red \bar{C} es significantemente mayor que el que pueda ofrecer un grafo aleatorio construido con el mismo conjunto de vértices, y si al mismo tiempo posee una distancia media de pequeño valor.

Empleos[editar]

Se suele emplear el coeficiente de agrupamiento en la detección automática de tópicos.

Véase también[editar]

Referencias[editar]