Algoritmo HITS

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

El algoritmo HITS (acrónimo del inglés Hypertext Induced Topic Selection) es un algoritmo diseñado por Jon Kleinberg para valorar, y de paso clasificar, la importancia de una página web.

HITS usa dos indicadores para hacer esta valoración, definiendo recursivamente cada uno a partir del otro:

  1. el authority, que valora cuán buena es la página como recurso de información; para su cálculo se usa una suma ponderada de valores hub de los enlaces que apuntan hacia esta página.
  2. el hub, que dice cuán buena es la información que se consigue siguiendo los enlaces que tiene a otras páginas; se calcula como una suma ponderada de valores authority de las páginas a las que apunta ésta. Algunas implementaciones del algoritmo también consideran cuánta es la relevancia de las páginas enlazadas.


Pseudocódigo

1 S := semilla de páginas inicial
2 para cada página p en S haga
3   p.aut = 1 // p.aut es el puntaje de autoridad de la página p
4   p.hub = 1 // p.hub es el puntaje de hub de la página p
5 función HubsYAutoridades(S)
6   para iteración 1 a k haga// ejecuta el algoritmo k veces
7     para cada página p en S haga // actualiza todos los valores de autoridad primero
8       para cada página q en p.vecinosQueLlegan haga// p.vecinosQueLlegan es el grupo de páginas que están vinculadas a p
9         p.aut += q.hub
10     para cada página p en S haga // ahora se actualizan los valores de hub
11       para cada página r en p.vecinosQueSalen haga // p.vecinosQueSalen es el grupo de páginas que están vinculadas desde p
12         p.hub += r.aut

(fuente: Wikipedia inglés)

Este procedimiento se repite cierto número de veces recalculando S para obtener un S' a partir de los vínculos de salida de S

Véase también[editar]

Enlaces externos[editar]