No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es RSS?

 acerca de google
 o acciones de Google
 o faq google
 o navegador web Google Chrome
 o historia de google
 o otros google's
 o la competencia
 o pagerankTM
 o tecnología
 o google & linux
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o AdSenseTM
 o países
 o hispanoamérica
 o google spain
 o google toolbar
 o Google Maps
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web



¿Cómo funciona el robot de Google que rastrea feeds de blogs?

ACTUALIZADO: Feedfetcher NO es el robot de 'Google Blog Search'.

Como os comentábamos en el anterior post, Google está obteniendo la información para su buscador de blogs a través de los feeds de los blogs que rastrea. Ahora, en esta página, nos informa sobre cuál es el funcionamiento del bautizado como 'Google Feedfetcher', el robot rastreador de feeds:

:: Accede a la mayoría de los feeds como máximo una vez cada hora, aunque los blogs que se actualizan con mucha frecuencia pueden verse rastreados en más ocasiones.

:: Rastrea feeds que siguen los estándares RSS o Atom, y lo solo almacena lo que estos ficheros contienen. Sería necesario que otro robot (o el mismo, modificado) accedería a la página HTML del post para indexar la totalidad de los contenidos. Como dice Rogelio, muchos usuarios así lo desearían.

:: Feedfetcher no sigue las reglas de cualquier fichero 'robots.txt' que tengamos en nuestro web (al contrario que el robot clásico de Google). La razón para ello es que Feedfetcher "ha sido diseñado para que rastree feeds a petición del usuario" (una pista más para sospechar de que Google esté diseñando una herramienta al estilo de Bloglines). Si queremos que no se rastree un feed concreto, deberemos escribir a esta dirección de correo.

:: El 'user-agent' del robot es "Feedfetcher-Google", por lo que podremos identificarlo en los logs de nuestro servidor web.

:: La información que rastrea Feedfetcher solo es utilizada para 'Google Blog Search', y no para el buscador web clásico.

ACTUALIZADO: Como nos comenta JM, existe una discrepancia entre los mensajes que proporciona Google. En este afirma que el robot Feedfetcher IGNORA los ficheros 'robots.txt', y en este otro que 'Google Blog Search' RESPETA este tipo de archivos.

Publicado el 15 de septiembre de 2005 | Categoría: buscador-blogs |

¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Embeber un vídeo de YouTube empezando en un segundo concreto
:: Google pierde dos juicios en Alemania tras considerarse que los thumbnails de 'Google images' son ilegales
:: Dependencia de Google: fallo en el buscador hace que precio de acciones descienda casi un 30%
:: Google Apps le quita 38.000 licencias a Microsoft Office en Washington DC
:: YouTube emitirá gratis capítulos completos de Star Trek, MacGyver y Beverly Hills 90210

Últimos posts en el foro

:: Hola a todos, soy nuevo en esto y tengo dudas sobre mi blog
:: Google agrega variables en la url
:: ¿Es bueno esto?
:: Intercambio con sitios de Marketing
:: Vendo 3 enlaces PR 4 muy baratos
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]