Ejemplo de penalización por contenidos duplicados: plugin de WordPress
ogle no le gusta que dentro del índice de su buscador exista más de un documento
web con diferente URL, pero con los mismos contenidos. Puede ocurrir que un usuario busque varias veces una
determinada información y se encuentre repetidas veces con los mismos datos, con lo que la experiencia
con el buscador puede verse afectada.
Este fenómeno, conocido como "contenidos duplicados", es frecuente verlo entre páginas de diferentes sitios
web (por ejemplo, cuando se copian literalmente los textos), pero también dentro del mismo sitio. Este último
caso puede deberse a una intención del webmaster de realizar 'spam', pero también por descuidos con la
construcción de las páginas.
Esto es lo que le ha pasado a Manuel (MangasVerdes.es) que
nos
cuenta que ha estado utilizando este plugin de WordPress para implementar encuestas en su blog, y que ha visto cómo
paulatinamente su PageRank se veía perjudicado.
Como cuentan en este
otro blog, este plugin inserta en las URLs del blog algunos parámetros adicionales como
"jal_no_js=true&poll_id=6", que no aportan nada a los contenidos de la página. Si nos fijamos en
esta búsqueda, vemos
como Google sigue teniendo indexadas varias páginas de 'MangasVerdes.es' con URLs de este tipo, y
descubrimos
cómo tiene más de un documento web con los mismos contenidos, pero con URL diferente (que varía solamente
en el añadido de parámetros que comentamos).
Llevar a cabo estas prácticas (bien consciente o inconscientemente) está
penalizado por Google, cuyo buscador
puede disminuir el posicionamiento de nuestras páginas dentro de los resultados, o realizar peores (menos
profundas) indexaciones de nuestro sitio.
Realizando esta búsqueda en Google, vemos
que Manuel no es el único cuyo blog está siendo perjudicado por este fallo del plugin de WordPress, y una
recomendación podría ser utilizar
comodines en 'robots.txt'. Con la siguiente regla nos
aseguraríamos que el robot de Google no indexa las páginas construidas con el URL mencionado y que, por
lo tanto, no existirían contenidos duplicados. De todas maneras, os recomendamos utilizar la herramienta
de 'Google Sitemaps' específica para comprobar si
el robot respetaría el 'robots.txt' creado.
User-agent: Googlebot
Disallow: /*?jal_no_js=true&poll_id=*
Publicado el 19 de septiembre de 2006 | Categoría: trucos
Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.
|