Google comienza a rastrear los contenidos tras los formularios web
Hasta la fecha, el robot de Google solamente rastreaba e indexaba aquellos documentos que son enlazados desde páginas web o que son sugeridos a través de 'Google Sitemaps' (aunque algunos aseguran también que lo hace también con las páginas que se visitan con la 'Google Toolbar' instalada). Sin embargo, muchos sitios disponen de documentos web con multitud de información que, debido a que no cumplen las anteriores condiciones, nunca aparecen en el buscador web.
Es lo que se denomina la "Internet invisible", y es un porcentaje de la WWW que Google quiere rastrear e indexar. Por ello, según se asegura en este post oficial, el robot de Google está comenzando a realizar pruebas para hacerse con los contenidos que existen detrás de los formularios web que nos encontramos muchas veces en los sitios web, y que generan páginas web con información realmente útil.
Cuando el robot de Google localice un formulario en sitios web "de alta calidad", se realizarán varias consultas de prueba, insertando de manera automatizada palabras con cierto sentido en las cajas de texto, y realizando selecciones en los menús desplegables, radio buttons o check boxes. En caso de que la información que devuelva el formulario sea inédita para Google y "de interés", pasará a formar parte del índice de su buscador web.
Eso sí, desde Google se quiere subrayar que en todo momento se respetarán las reglas 'robots.txt' que se indiquen para cada sitio web, y que nunca se rastrearán formularios que incluyan campos de información personal (como passwords, nombre de usuario, contactos, etc.). Además, se asegura que la nueva información no afectará al posicionamiento del resto de las páginas de un sitio web.
pronetpc.com, el 13 de abril de 2008 a las 09:52h ( CET), dijo:
en las busquedas de google de nuestra web aparecen ultimamente rastreos raros
Como una busqueda de la palabra pul
http://www.google.es/url?sa=t&ct=res&cd=2&url=http%3A%2F%2Fwww.pronetpc.com%2Findex.php%3FItemid%3D27%26option%3Dcom_search%26searchword%3Dpul&ei=6cgBSLWjKKWwwQHV9_T6CA&usg=AFQjCNFnAfKjY9ajC3Ub2FZeXnQewD7KOA&sig2=pmHYGcW0G_dN8xH_DD_jrQ
no creo que ningun usuario la haya realizado y linkado desde su web, asi que supongo que sera a eso a lo que os referis
Ivan de la Jara, el 14 de abril de 2008 a las 19:11h ( CET), dijo:
Si bueno eso de que no rastrea contraseñas no se lo creen ni ellos. Ya miran dentro de las sesiones y con las barras esas miran los resultados de los formularios... asi que no se para que tienen que hacer pruebas como las que hacen los spammers. No me gusta nada ese "rollo" que esta cogiendo Google...
 Amanda, el 15 de abril de 2008 a las 10:35h ( CET), dijo:
Ya pero, mucha de esta información "invisible" está detrás de bases de datos de pago, ¿qué pasaría con esta información?, ¿nos la mostrarían con la posibilidad de pagarla?¿nos llevarían a la página de consulta de esa base de datos?
Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.
|