La nueva tecnología de traducción automática de Google, online
Si buscamos 'machine translation'
en Google o 'Vibhu Mittal' (el nombre de uno de los mayores
expertos en el Tratamiento del Lenguaje Natural, que trabaja en Google) vemos cómo aparecen sendos enlaces patrocinados
en los que se muestran enlaces de ofertas de empleo de Google en las que están buscando a investigadores interesados
en el campo de la traducción automatizada entre idiomas y el procesamiento del Lenguaje Natural (ver imagen).
Y es que la compañía está dedicando grandes esfuerzos en estos campos, y un buen ejemplo de ello es el
anuncio de este viernes de un
nuevo idioma, el árabe, dentro del traductor de Google. La
novedad incluida con esta lengua está en que, en lugar de haber creado un diccionario de palabras y estructuras gramaticales
utilizado la ayuda de lingüistas, se ha diseñado un sistema informático que, basado en técnicas de Inteligencia
Artificial, ha sido entrenado analizando estadísticamente miles de textos (insertados tanto en árabe como en inglés,
traducidos por humanos) y ahora es capaz de traducir otros nuevos textos que el usuario escriba,
tanto del árabe al inglés como viceversa. Podéis ver por ejemplo la trauducción de la web de 'Al Jazeera'.
Este nuevo idioma está online ahora, pero hace casi un año fue presentado en el
'Google Factory Tour' por el mismo investigador
(Franz Josef Och) que ayer lo anunció en el blog de Google. Philipp Lenssen escribió un post sobre aquella intervención, y nos contaba que los resultados de este
novedoso traductor eran "impresionantes", mencionando que frases que eran traducidas a otras sin lógica con otros métodos ahora se convertían en expresiones llenas de sentido.
Se aseguraba que el sistema de traducción está desarrollado por investigadores que no tienen ni idea del idioma
que se traduce, y es que la tecnología trata de la misma manera a cada uno de los idiomas: no se crean diccionarios ni reglas gramaticales, pero se entrena al sistema a partir de traducciones ya realizadas por humanos. Y para el entrenamiento de estas redes neuronales nada mejor que una de las mayores colecciones de textos que existen: Google ha utilizado la documentación que genera las Naciones Unidas, 20.000 millones de palabras traducidas a decenas de idiomas de todo el planeta.
¿Y para qué quiere Google esta tecnología que está desarrollando? El objetivo de la compañía no es ofrecer a los usuarios una herramienta para que éstos traduzcan sus textos o sus páginas web (aunque sirve para ello), sino utilizarla
para analizar toda la información que pueda rastrear (de la WWW, de los libros, o de otros soportes). A partir de ella
se pueden crear sistemas expertos que devuelvan datos a las búsquedas de los usuarios no solamente basados en la
concordancia textual, como se hace hasta ahora, sino información más inteligente.
Por ejemplo, si buscamos "población de hannover", ¿por qué nos ha de devolver Google solamente información en español (además con las palabras "población", "de" y "hannover") en lugar de ofrecernos datos en cualquier idioma (traducidos al nuestro) que nos aporte algo sobre la población de Hannover? En julio de 2005, Yahoo! ya lanzó el prototipo de un producto similar, devolviendo en alemán resultados de páginas web escritas en varios idiomas.
Los esfuerzos que Google destina al desarrollo de estas tecnologías de traducción automatizada entre idiomas y, en general, el procesamiento del Lenguaje Natural son los que le permitirán en unos años marcar una diferencia con otros buscadores ya existentes y por venir. En su plantilla dispone de varios de los mejores expertos en estos campos, como Peter Norvig, Vibhu Mittal, Mehran Sahami, Franz Josef Och o Deepak Ravichandran.
Publicado el 29 de abril de 2006 | Categoría: tecnologia
Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.
|