Hubs y authorities
El concepto de 'hubs' y 'authorities' fue adoptado por Jon Kleinberg en 1999
para intentar clasificar, mediante un algoritmo denominado
HITS, la importancia de un documento web.
Este algoritmo se basa en la existencia de dos tipos importantes de sitios web,
que ayudan a calcular mejor la relevancia de una página web. El primero de ellos
es el 'hub', que agrupa a todos esos sitios web que, recibiendo muchos links, también
enlazan a páginas web que consideran relevantes, por lo que el algoritmo confía
en los 'hubs' para determinar la importancia. Los grandes directorios, como
DMOZ o
Yahoo!, serían
los grandes exponentes de este tipo de sitios.
El segundo tipo es el 'authority', que agrupa a los sitios web que reciben una gran
cantidad de links, porque otras páginas web estiman que son la referencia en un tema
en concreto, y además disponen de muy pocos enlaces salientes. El
algoritmo se basa en los 'authorities' para buscar la información dentro
de ellos.
A diferencia del algoritmo
PageRank,
que asigna una puntación a cada página web en función de los enlaces que recibe y
el valor de éstos, el algoritmo HITS puntúa cada documento con dos valores: el
'hub' y el 'authority'. El primero determina cómo de buena es una página como
"recurso de enlaces" y el segundo valora a una página como "recurso de información".
Aunque el modelo de clasificación de relevancia de páginas web de Google está
basado principalmente en PageRank, se sospecha que está teniendo en cuenta el enfoque
de HITS para valorar en mayor o menor medida el peso de cada uno de los enlaces.
Más información:
:: Authoritative
Sources in a Hyperlinked Environment, Kleinberg, 1999.
:: Puntajes
usando algoritmos de análisis de enlaces, Ricardo Baeza.
:: Finding Authorities and Hubs From Link Structures on the World Wide Web.
Borodin, Roberts, Rosenthal, Tsaparas, 2001.
:: Network Theory
(hubs and authorities) (presentación). Alexandru Cocora, 2004
Este es un tutorial de posicionamiento web proporcionado por
google.dirson.com. NO tiene ningún tipo de relación con Google Inc.,
firma propietaria del buscador Google y de las diversas
marcas comerciales y logotipos relacionados con él.