No logo - Only favicon google.dirson.com
  <noticias de google en español>
Google
 
 RSS - Sindicación
Feed Icon
feed RSS
 o Suscríbete al feed
 o ¿Qué es un feed RSS?

 acerca de google
 o acciones de Google
 o faq google
 o navegador Google Chrome
 o sistema operativo Google
 o historia de google
 o pagerankTM
 o tecnología
 o traductor de google
 o logos de google
 o curiosidades
 o googlebot
 o Google Talk
 o AdWordsTM
 o Google Earth
 o AdSenseTM
 o google toolbar
 o Google Maps
 o Street View
 o YouTube
 o Google en español
 o Googel
 o teléfono móvil
 o buscador de blogs
 o Google Phone
 o Google Mobile OS
 o OpenSocial
 o Google Knol
 o HTC Magic
 o SEO

 buscar en este blog

 email de google
 o Gmail
 o impresiones
 o trucos
 o utilidades

 herramientas
 o fresh machine
 o buscador
 o dirección IP
 o diccionario
 o google bombing
 o Google API
 o Buscador de vídeos

 webmasters
 o posicionamiento

 trucos
 o trucos para buscar
 o caché de google
 o google hacks

 discusiones
 o foro de Google
 o foro AdSense
 o foro posicionamiento
 o lista de correo

 sobre dirson
 o categorías
 o noticias en tu web
 o mapa web



Google relanza un software OCR con licencia Open Source

os contábamos las críticas que estaba recibiendo la calidad de los documentos PDF de 'Google Books', los cuales no permiten acceder a los textos, y solamente podemos ver las páginas de los libros en forma de imágenes.

Estas imágenes proceden del escaneo de las obras a través de una tecnología propia, con la cual Google accede a los libros de diversas bibliotecas (en las cuales están las obras que ya no disponen de copyright) y, mediante un software OCR (Reconocimento Óptico de Caracteres), extrae los textos para que los usuarios podamos localizar cualquier término a través de las búsquedas en 'Google Books'.

Ahora, según se anuncia en este post, Google ha liberado, con licencia 'Open Source', parte de la tecnología OCR que utilizan dentro de la compañía. Se trata de 'Tesserat OCR', y son unas librerías C/C++ de desarrollo, creadas originalmente por HP entre 1985 y 1995, y que fueron abandonadas hasta que Google y la Universidad de Nevada Las Vegas han retomado el proyecto.

'Tesserat OCR' es utilizado por diversos organismos, y por ejemplo la Universidad japonesa de Tohoku ofrece esta página con la cual podemos enviar cualquier imagen escaneada y obtener los textos a través de este software. Nosotros lo hemos probado con con esta página obtenida de un libro de Shakespeare de 'Google Books' y nos ha devuelto este texto con algunos fallos de reconocimiento.

Publicado el 31 de agosto de 2006 | Categoría: google-print

Marco Marco, el 03 de de 2008 a las 8:39h (CET), dijo:
Muy bueno

M.Muñoz M.Muñoz, el 03 de de 2008 a las 21:42h (CET), dijo:
La noticia es fabulosa, donde consigo el software para probarlos

Hector Castro Hector Castro, el 18 de marzo de 2009 a las 15:20h (CET), dijo:
Es excelente noticia, ya que proyectos como este no pueden ser abandonados

Andres Andres, el 29 de abril de 2009 a las 24:21h (CET), dijo:
M.Muñoz, no leiste la noticia? Dice claramente donde probar el soft. ¬¬

Darío Darío, el 26 de julio de 2009 a las 04:17h (CET), dijo:
Tesseract no es muy bueno, hay otro soft GNU de EXELENTE calidad, se llamaba Cuneiorm, ahora se llama OpenOCR y a mi parecer, supera al software de ABBYY, la url es http://en.openocr.org/

Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.

Tu nombre (*):
Esto será lo que aparecerá como el autor del comentario

Tu URL (opcional):
We use JavaScript redirections and 'rel=nofollow', so links are not considered by Google.

Tu email (*):
No lo haremos público. Además, con tu email puedes utilizar Gravatar para mostrar tu avatar personalizado.

Tu comentario (*):

We remove HTML tags.

Escribe las palabras que ves a continuación en este Captcha (queremos saber si eres un humano. Más info sobre Captcha en este link):


¿Tienes alguna noticia sobre Google para enviarnos? Puedes contactar con nosotros


Webmaster: ¿Quieres incluir en tu sitio web nuestras noticias y contenidos?


Últimas noticias

:: Nexus One: presentado oficialmente el teléfono móvil de Google
:: Tarjetas Eye-Fi gratis con Picasa: comparte tus fotos directamente desde tu cámara digital
:: Resultados de Google "en tiempo real"
:: Aniversario del nacimiento de Elzie Crisler Segar, creador de Popeye
:: Google personaliza tus búsquedas (y las almacena) a todos los usuarios, incluso los no registrados

Últimos posts en el foro

:: Intercambio links,mínimo PR3 para empresas y/o sindicatos.
:: Intercambio de LINKS . tengo 8 webs
:: Controlar enlaces de un intercambio (herramienta)
:: Evolución ingresos en estos meses
:: Intercambio enlaces PR3 www.imagenesdecorazones.net
::

IMPORTANTE: Este sitio web NO tiene ninguna afiliación ni relación con Google Inc. Todos los logotipos, marcas comerciales e imágenes son propiedad de Google Inc (Mountain View, CA 94043, USA). [Más información]