No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
Tutorial de Posicionamiento | Último tema en el foro: Intercambio de LINKS . tengo 8 webs
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es un feed RSS?

 acerca de google
 o acciones de Google
 o faq google
 o navegador Google Chrome
 o sistema operativo Google
 o historia de google
 o pagerankTM
 o tecnología
 o traductor de google
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o Google Earth
 o AdSenseTM
 o google toolbar
 o Google Maps
 o Street View
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o buscador de blogs
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol
 o HTC Magic
 o SEO

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web



Google indexa con tecnología OCR contenidos de documentos PDF de textos escaneados

La mayoría de los documentos con textos en formato PDF que hay en la WWW son generados a partir editores de texto, con lo que cualquiera (un usuario con un programa como 'Adobe Reader' o Evince, o el propio robot de Google) puede extraer de manera muy fácil los contenidos.

Pero un porcentaje de estos ficheros PDF son imágenes escaneadas de otros documentos, con lo que ya no podemos extraer el texto con nuestro lector PDF. Pero el robot de Google, gracias a su tecnología OCR propia, ya es capaz de convertir estas imágenes en textos, e indexarlos para incorporarlos al buscador web.

Así por ejemplo, el primer resultado de esta búsqueda es un enlace a esta imagen escaneada en formato PDF, la cual está en formato texto en este link del caché de Google.

Tenéis más información en este post oficial.

Publicado el 31 de octubre de 2008 | Categoría: nuevas | Comentarios

Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.

Tu nombre (*):
Esto será lo que aparecerá como el autor del comentario

Tu URL (opcional):
We use JavaScript redirections and 'rel=nofollow', so links are not considered by Google.

Tu email (*):
No lo haremos público. Además, con tu email puedes utilizar Gravatar para mostrar tu avatar personalizado.

Tu comentario (*):

We remove HTML tags.

Escribe las palabras que ves a continuación en este Captcha (queremos saber si eres un humano. Más info sobre Captcha en este link):


¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Nexus One: presentado oficialmente el teléfono móvil de Google
:: Tarjetas Eye-Fi gratis con Picasa: comparte tus fotos directamente desde tu cámara digital
:: Resultados de Google "en tiempo real"
:: Aniversario del nacimiento de Elzie Crisler Segar, creador de Popeye
:: Google personaliza tus búsquedas (y las almacena) a todos los usuarios, incluso los no registrados

Últimos posts en el foro

:: Intercambio de LINKS . tengo 8 webs
:: Controlar enlaces de un intercambio (herramienta)
:: Evolución ingresos en estos meses
:: Intercambio enlaces PR3 www.imagenesdecorazones.net
:: Busco intercambio de enlaces
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]