No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es un feed RSS?

 acerca de google
 o acciones de Google
 o faq google
 o navegador Google Chrome
 o historia de google
 o pagerankTM
 o tecnología
 o traductor de google
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o Google Earth
 o AdSenseTM
 o google toolbar
 o Google Maps
 o Street View
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o buscador de blogs
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol
 o HTC Magic

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web



Google distribuirá 6 DVDs con un billón de palabras rastreadas de la WWW

hemos comentado varias veces, Google dispone de una selección de los mejores científicos del mundo en el campo del Procesamiento del Lenguaje Natural, gracias a los cuales pretende desarrollar mejores herramientas para organizar y acceder a la información mundial, como la recientemente presentada tecnología de traducción automática.

La mayoría de estos desarrollos se basan en el análisis de los textos que Google va rastreando de diversas fuentes de información, desde los millones de páginas web de la WWW hasta la contenida en los libros impresos.

Ahora, según aseguran en este post dos componentes del equipo de I+D de la compañía, Google pretende compartir con todo el mundo los textos rastreados de la WWW, para que la comunidad científica pueda seguir desarrollando nuevos proyectos con esta valiosa información.

Afirman que será en forma de seis DVDs, que contendrán 1.011.582.453.213 palabras (más de un billón), dentro de ellas hay más de mil millones de secuencias de cinco vocablos que se repiten más de 40 veces (de gran utilidad para los analistas del lenguaje humano), y existen más de 13 millones de palabras únicas.

Publicado el 08 de agosto de 2006 | Categoría: tecnologia

Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.

Tu nombre (*):
Esto será lo que aparecerá como el autor del comentario

Tu URL (opcional):
We use JavaScript redirections and 'rel=nofollow', so links are not considered by Google.

Tu email (*):
No lo haremos público. Además, con tu email puedes utilizar Gravatar para mostrar tu avatar personalizado.

Tu comentario (*):

We remove HTML tags.

Escribe las palabras que ves a continuación en este Captcha (queremos saber si eres un humano. Más info sobre Captcha en este link):


¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Mover y arrastrar correos en Gmail para la convivencia entre etiquetas y carpetas
:: Google actualiza algunas de sus herramientas coincidiendo con los incidentes en Irán
:: Rumor: Google reserva un millón de números de teléfono para Google Voice. ¿Próxima apertura masiva del servicio?
:: Rumor: Google estaría construyendo un buscador de 'twitteos'
:: Buscando en Google contenidos con licencia 'Creative Commons'

Últimos posts en el foro

:: Banner no se ve en portada (y si en páginas interiores)
:: Intercambio PR3 o más
:: Intercambio PR3 o más
:: intercambio enlaces pr 3 x otro pr 3
:: Posicionamiento e intercambio de enlaces
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]