No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
Tutorial de Posicionamiento | Último tema en el foro: Sobre el cuadro de busqueda
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es RSS?

 acerca de google
 o acciones de Google
 o faq google
 o historia de google
 o otros google's
 o la competencia
 o pagerankTM
 o tecnología
 o google & linux
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o AdSenseTM
 o países
 o hispanoamérica
 o google spain
 o google toolbar
 o Google Maps
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web

Google comienza a rastrear los contenidos tras los formularios web

Hasta la fecha, el robot de Google solamente rastreaba e indexaba aquellos documentos que son enlazados desde páginas web o que son sugeridos a través de 'Google Sitemaps' (aunque algunos aseguran también que lo hace también con las páginas que se visitan con la 'Google Toolbar' instalada). Sin embargo, muchos sitios disponen de documentos web con multitud de información que, debido a que no cumplen las anteriores condiciones, nunca aparecen en el buscador web.

Es lo que se denomina la "Internet invisible", y es un porcentaje de la WWW que Google quiere rastrear e indexar. Por ello, según se asegura en este post oficial, el robot de Google está comenzando a realizar pruebas para hacerse con los contenidos que existen detrás de los formularios web que nos encontramos muchas veces en los sitios web, y que generan páginas web con información realmente útil.

Cuando el robot de Google localice un formulario en sitios web "de alta calidad", se realizarán varias consultas de prueba, insertando de manera automatizada palabras con cierto sentido en las cajas de texto, y realizando selecciones en los menús desplegables, radio buttons o check boxes. En caso de que la información que devuelva el formulario sea inédita para Google y "de interés", pasará a formar parte del índice de su buscador web.

Eso sí, desde Google se quiere subrayar que en todo momento se respetarán las reglas 'robots.txt' que se indiquen para cada sitio web, y que nunca se rastrearán formularios que incluyan campos de información personal (como passwords, nombre de usuario, contactos, etc.). Además, se asegura que la nueva información no afectará al posicionamiento del resto de las páginas de un sitio web.

Publicado el 12 de abril de 2008 | [permalink] |

Posicionamiento en 'Google News': algunas verdades y mentiras

Algunos periódicos digitales y medios de comunicación online, los que han conseguido que sus noticias aparezcan en el servicio 'Google News' (ver formulario para pedirlo), ven cómo consiguen un importante porcentaje de su tráfico web a través de los resultados de este buscador de noticias.

Hay poca literatura sobre cómo conseguir un buen posicionamiento de los artículos de noticias en 'Google News', y este post oficial es uno de los pocos textos que incluyen verdades y mentiras sobre cómo este servicio valora la relevancia de una noticia frente a otras para situarla en diferente posición dentro de la página de resultados.

Os recomendamos una lectura del post, pero aquí va un resumen de lo que en él se explica:

:: Tener una imagen junto al texto del artículo mejora su posicionamiento ... Mentira
:: Actualizar el texto del artículo después de que haya sido publicado crea problemas con 'Google News' ... Verdad (esto es debido a que el robot de este buscador solamente rastrea una vez cada noticia)
:: Publicación en el momento adecuado el artículo mejora su posicionamiento ... Mentira (no por publicarlo antes el artículo aparece en mejores posiciones. Sin embargo, si te limitas a copiar los contenidos de otros, puedes verte penalizado y hay que recordar que se eliminan noticias duplicadas)
:: Artículos que no incluyan texto, y solo muestren fotografías y vídeos no serán incluidos ... Verdad (Recuerda que 'Google News' es por ahora un buscador de textos)
:: No hay manera de ver por qué los artículos no fueron incluidos en 'Google News' ... Mentira (Se menciona Sitemaps para 'Google News' para darte más control sobre cómo se procesa el rastreo de tus artículos)
:: Si se incluye publicidad de AdSense en las páginas de los artículos, su posicionamiento mejora ... Mentira
:: Un diseño adecuado de un sitio web puede afectar a su posicionamiento en 'Google News' ... Verdad

Para este último punto se recomiendan varias páginas oficiales que pueden ayudar a adoptar un diseño óptimo:

:: Requisitos técnicos (sobre incluir marcos, tener varios idiomas, enlaces con JavaScript, ...)
:: Cambios a realizar en una página web

A pesar de todo esto, a veces se ha sospechado que 'Google News' quizá esté favoreciendo, dentro de los resultados de este buscador, a las noticias de Associated Press (AP) y France-Presse (AFP) puesto que están alojadas en sus propios servidores.

Publicado el 03 de abril de 2008 | [permalink] |

Documento oficial de Google para detectar spam en el buscador

En junio de 2005 se comenzaron a tener las primeras noticias del laboratorio de evaluación de búsquedas, en el que personas de todo el mundo (incluidos países como España) contratadas por Google está realizando tareas de evaluación de la calidad de las búsquedas web, y de esta manera entrenar a los nuevos algoritmos que está continuamente creando la compañía para mejorar la calidad del buscador y, entre otras cosas, luchar contra el spam. Estas personas acceden a 'google.com/evaluation' (conocido como 'EWOQ'), en donde tienen un panel de control (ver vídeo) desde el cual realizan las valoraciones de determinadas consultas.

Estos días, en algunos blogs y foros (beussery.com, searchenginewatch.com) se ha tenido acceso a un documento oficial en el cual Google explica a estos colaboradores cómo funciona el panel de control de 'EWOQ', cómo se deben realizar las evaluaciones de las búsquedas, o cómo se deben marcar los sitios web que realizan spam en el buscador web. El documento estuvo disponible esta semana en este enlace, pero ha sido eliminado y durante unas horas lo podréis leer en este link de la caché de Google.

De su lectura, podemos descubrir que los evaluadores de calidad de Google deben entender primero la temática de cada búsqueda y posteriormente calificar cada uno de los enlaces que aparecen en la página de resultados, asignando a cada uno de ellos un valor del siguiente baremo: 'vital' (por ejemplo, es la página oficial de un determinado término buscado), 'useful' (páginas web con contenidos de alta calidad y exhaustivos), 'relevant' (páginas web menos exhaustivas que las 'useful', o que cubran solamente un determinado aspecto de la búsqueda), 'not relevant' (páginas web que, a pesar de que sí tienen que ver con la búsqueda realizada, no son útiles porque por ejemplo tienen información no actualizada), 'off topic' (páginas web que tienen muy poco que ver con la búsqueda realizada).

Además, en caso de que existan problemas técnicos con la página web enlazada, también deben comunicarlo a través de 'EWOQ', calificando el error como 'Page not found' (cuando accedemos a un error 404), 'Site Unavailable' (por ejemplo, el servidor caído), 'Blank page' (páginas completamente vacías), '403 Access Error' (acceso prohibido por ejemplo), 'Login Required' (cuando se nos pide registrarnos en el sitio web para acceder a la información), 'Encoding Error' (problemas con los juegos de caracteres), 'XML / HTML pages' (cuando solamente se ve el código HTML) o 'Server internal error' (cuando, por ejemplo, no funciona la Base de Datos).

Así mismo, los evaluadores deben comunicar a Google cuando se encuentren con páginas, dentro de los resultados, que están practicando spam para intentar engañar al buscador. De esta manera, deberán calificar a cada enlace como 'Not Spam', 'Maybe Spam' (el evaluador tiene sospechas) o 'Spam' (es un claro ejemplo de spam en Google). Para ayudar a estos colaboradores a detectar el spam, el documento oficial incluye en su capítulo 4 una detallada información para identificarlo.

Así, Google asegura que los webmasters que intentan engañar al buscador quieren conseguir tráfico web para de esta manera ganar dinero con la publicidad 'Pay-Per-Click' (PPC) o con programas de afiliados, aunque advierte de que muchos sitios web tienen estos sistemas de ingresos económicos, pero aportan información útil al usuario. Y hace una clasificación de 8 tipos de spam:

:: Páginas PPC. Simplemente se limitan a insertar anuncios de pago por click, pero sin aportar nada de información original al usuario. Pone como ejemplo páginas con búsquedas pero sin resultados (link-ejemplo), los blogs farsa (ver post sobre el tema), o los sitios web que copian literalmente las páginas de la Wikipedia o DMOZ acompañadas de anuncios.

:: Dominios aparcados. No todos, sino solamente aquellos que compran el dominio de un sitio web que en su momento tuvo enlaces de relevancia, que ha conseguido un buen posicionamiento en Google, pero que ahora no aporta nada de información y solamente se limita a mostrar publicidad, en muchas ocasiones con el propio programa de Google "AdSense en dominios 'aparcados'". Se recomienda a los evaluadores utilizar, para saber qué hubo antes en ese dominio, la famosa herramienta 'WayBackMachine'.

:: Meros afiliados. Se trata de sitios web que no ofrecen información original sobre productos, y simplemente son una pasarela para que el usuario pase al sitio web del fabricante del producto, y que copian la información creada por éste. Son generalmente afiliados de sitios populares como Amazon o eBay, aunque se recuerda que los sitios de comparación de precios no pueden ser considerados como spam porque ofrecen información útil. Una búsqueda en la que suelen aparecer muchos sitios web llevando a cabo este tipo de spam es 'oscommerce templates', en la que solamente unos pocos ofrecen plantillas de OsCommerce originales, y el resto se limita a copiar y enlazar.

:: Textos y enlaces ocultos. Es una táctica muy vieja (ver capítulo 'penalizaciones' de nuestro tutorial) y fácilmente detectada por los sistemas automatizados de Google. Sin embargo, se le recomienda a los evaluadores utilizar las opción "Ver código fuente" y "Deshabilitar JavaScript" del navegador web para encontrarlos.

:: Redirecciones JavaScript (también conocido como 'páginas doorway') son también viejos conocidos de los responsables del buscador web de Google.

:: Abuso de palabras clave, con las que el webmaster intenta engañar al buscador insertando keywords que no tienen nada que ver con la temática de la página web. Al evaluador se le recuerda que estas palabras clave excesivas pueden estar ocultas, y que también las puede encontrar en las URLs de las páginas.

:: 100% frame. Son páginas web en las que la totalidad de los contenidos que ve el usuario están insertados dentro de un frame, el cual no es reconocido por Google. De esta manera, Google indexa (y devuelve en sus búsquedas) una determinada información (optimizada para buscadores) y el usuario ve otra.

:: Redirecciones solapadas, que llevan al usuario de un dominio a otro, mostrándole una información diferente de la que ha indexado Google.

Publicado el 15 de marzo de 2008 | [permalink] |

   Siguientes noticias >>>

¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Otra inversión de Google en energía solar
:: Fotografía de la flota de coches de Google Street View que llegan a España
:: Primer láser: 48 aniversario del nacimiento de esta tecnología
:: Google Street View comienza a poner borrosas las caras de los transeúntes
:: Google Friend Connect ya está aquí, y utiliza tecnologías abiertas

Últimos posts en el foro

:: Sobre el cuadro de busqueda
:: Intercambio de Enlaces (Web p/ Adultos PR2)
:: Alguien conoce NeverblueAds?
:: Nuevo directorio: Sin recíproco, gratuito y altas rápidas
:: Posicion en google
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]