PageRank distinto en función de cada URL
e razón Enrique.
Si Google realmente quisiera mostrar un producto realmente bueno para clasificar
la importancia de una página web, el PageRank
de ésta no debería ser función de la URL, sino de la página en sí.
En este momento, por ejemplo el PageRank de 'www.elmundo.es' (PR=8) no es el mismo que
el de 'elmundo.es' (PR=5). A pesar de tener diferente URL (dirección web),
son la misma página en el mismo servidor.
Lo que hace Google es calcular el valor del PageRank tomando como parámetro fundamental
el número de enlaces que recibe cada página web. Esto significa que si alguien -por error-
enlaza por ejemplo a 'elmundo.es' está dando -a efectos de cálculo del PageRank-
su voto a éste último y no a 'www.elmundo.es'. El que enlaza quizá no lo sepa,
pero Google está haciendo diferentes cálculos de los que cabría esperar.
Lo mismo le pasa a Enrique. Su blog tiene tres URLs: 'edans.blogspot.com' (PR=5),
'www.enriquedans.com' (PR=4) y 'enriquedans.com' (PR=0). Tres direcciones, y una
misma página web, albergada precisamente en los servidores de Google en California
('Blogpsot-Blogger' es propiedad de Google). El
administrador del servidor Apache de Blogger ha hecho que cuando se realizan 'peticiones
www' con cualquiera de las tres URLs, éstas respondan con la misma página web.
Este problema se ha debatido alguna vez en nuestros foros ([1]
y [2]). Si tenemos
acceso a la configuración de nuestro servidor (Apache o no), podríamos redireccionar
los dominios que no nos interesan que aparezcan en Google (por ejemplo, los
que no tienen 'www'), mediante una redirección
301 (el enlace también se transmite), hacia los que sí que nos interesan. También podríamos informar a los que
nos enlazan 'mal' para que corrijan el link.
Cuando Sergey Brin y Larry Page desarrollaron el algoritmo del PageRank en 1997, quizá no
se percataron de este detalle, o quizá prefirieron seguir adelante obviándolo. Enrique
tiene razón en cuanto a que, con los cientos de científicos que trabajan para Google,
aún no se haya solucionado este punto, y se detecte qué páginas son o no las mismas.
Hasta que llegue ese día, deberemos estar atentos si queremos optimizar nuestro
posicionamiento.
Publicado el 21 de julio de 2004 | Categoría: pagerank
|