No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
Tutorial de Posicionamiento | Último tema en el foro: AÑADIR PALABRAS DE BÚSQUEDA
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es un feed RSS?

 acerca de google
 o acciones de Google
 o faq google
 o navegador Google Chrome
 o historia de google
 o pagerankTM
 o tecnología
 o traductor de google
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o Google Earth
 o AdSenseTM
 o google toolbar
 o Google Maps
 o Street View
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o buscador de blogs
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol
 o HTC Magic

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web



Google es más duro de lo que parece

Nelson Minar, ingeniero de Google, participó el pasado miércoles 11 de febrero en la Conferencia 'Emerging Technology', organizada por la prestigiosa editorial O'Reilly.

Nelson ofreció una charla de casi una hora titulada 'Google is harder than it looks' ('Google es más duro de lo que parece'), en la que intentó explicar a los asistentes el funcionamiento de este popular buscador.

Cory Doctorow acudió al evento, y tomó unas cuantas notas sobre lo dicho. Entre los puntos que se expusieron caben destacar:
:: Google indexa más de 3 mil millones de páginas web [esta cifra ha sido actualizada recientemente], aunque ofrecen más resultados gracias a los 'rastreos profundos'.
:: Hay varios 'rastreadores': el general (una vez al mes), que busca en la mayoría de la WWW; el 'Fresh', que rastrea en las páginas que se actualizan frecuentemente; y el de noticias, que rastrea cada 10 minutos.
:: El servidor web que utilizan es uno personalizado, llamado 'Google Web Server - GWS' [se sospecha que se trata del servidor Apache modificado]. Actualmente existe la versión 2.1.
:: Google analiza más de 100 factores para determinar la relevancia de una página web. Entre ellos, destacan el texto del enlace (el 'anchor text'), el tamaño de la fuente y la proximidad.
:: Para calcular el valor del PageRank, Google utiliza la teoría de grafos, mediante una matriz de 30 billones de nodos. Cada uno de estos nodos tiene 10 arcos (o aristas) diferentes.
:: Hay 4 tipos de servidores en el clúster de Google, situados en paralelo del servidor web:
  - Los servidores índice: están divididos en fragmentos (por ejemplo, uno apunta a todo lo que comienza con la letra 'a'), y devuelve al servidor web una lista con las id's de documentos donde aparece una determinada palabra.
  - Los servidores de documentos: contienen las copias caché de las páginas web que se rastrean.
  - Los servidores correctores de deletreo: son los que nos muestran el mensaje "Quiso decir: ...".
  - Los servidores AdWords: nos muestran los enlaces patrocinados.

Si quieres saber algo más sobre la arquitectura de Google, puedes consultar este documento PDF: "The Google Cluster Architecture".

Publicado el 09 de marzo de 2004 | Categoría: tecnologia

¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Mover y arrastrar correos en Gmail para la convivencia entre etiquetas y carpetas
:: Google actualiza algunas de sus herramientas coincidiendo con los incidentes en Irán
:: Rumor: Google reserva un millón de números de teléfono para Google Voice. ¿Próxima apertura masiva del servicio?
:: Rumor: Google estaría construyendo un buscador de 'twitteos'
:: Buscando en Google contenidos con licencia 'Creative Commons'

Últimos posts en el foro

:: AÑADIR PALABRAS DE BÚSQUEDA
:: Mi problemilla
:: Utilizar Google Adsense con Wordpress
:: Links salientes
:: Intercambio Links / Humor / PR0 Indexado
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]