|
El traductor de Google fue elegido en noviembre de 2006
como la mejor tecnología de
traducción automatizada existente en el mundo, y la herramienta ha seguido mejorando gracias al entrenamiento
que realiza mediante el escaneo de documentación de Naciones Unidas
o las aportaciones
realizadas por los usuarios.
Ahora, ha dado un paso más, y desde hace unos días en su
página web podéis ver, además de una interfaz renovada, la inclusión de nuevos idiomas desde y a los que traducir.
Así por ejemplo, podemos realizar traducciones directas del español al croata sin necesidad de hacer el paso intermedio
de traducir al inglés.
Estas mejoras coinciden además en el tiempo con la presentación de una nueva funcionalidad de la
API de traducción de idiomas que, aunque
inicialmente solamente era posible acceder vía Ajax, ahora es posible utilizarlo mediante el método 'REST' para hacer
llamadas sin utilizar JavaScript. Tenéis más información en
este enlace.
Algunas herramientas, como por ejemplo algunos teléfonos móviles, incluyen una funcionalidad que, gracias a un diccionario
de palabras comunes del idioma, es capaz de ayudar al usuario a escribir las palabras a partir de las primeras letras
que ha escrito.
En este post de su
blog personal, Chris DiBona (responsable de proyectos 'Open Source' de Google) nos cuenta cómo dentro de la compañía
se está trabajando en un prototipo de una funcionalidad parecida que, tras teclear tres letras, nos muestra una lista
de palabras que comienzan con las letras escritas (ver
captura).
Este sistema predictivo, reconoce DiBona, todavía está en pañales y por ejemplo el sistema para ordenar la relevancia
de la palabras listadas no está todavía bien definido. Para mejorarlo, asegura, se podría utilizar la
colección de más de un billón de palabras
que Google ha ido coleccionando de lo rastreado en la WWW, que contienen las frecuencias de uso de todas ellas,
y que en agosto de 2006 la compañía comenzó a distribuir de manera pública. También se podría utilizar las palabras más
utilizadas por los usuarios tanto en las búsquedas que realizan en las diferentes herramientas de Google como en
las de gestión de información personal.
Este sistema predictivo podría ser utilizado, por ejemplo, para ayudar al usuario a escribir dentro de herramientas como
'Google Docs',
Gmail o
Google Talk.
Hasta la fecha, el buscador de imágenes de Google y el resto de herramientas similares devuelven resultados en función de los textos y las palabras que rodean a las imágenes (nombres de los ficheros, etiquetas 'ALT' o 'TITLE', tags insertados por el creador, textos de la página donde se inserta, palabras en los enlaces, ...).
Desde hace muchos años, los desarrolladores de estos servicios están intentando que, si el usuario escribe 'elefante' en el buscador, se le devuelva fotos en las que se ha detectado que existe un elefante dentro, sin que nadie haya escrito la palabra "elefante" previamente. Gracias a la Inteligencia Artificial, se están consiguiendo bastantes avances, como por ejemplo el reconocimiento facial dentro del buscador de imágenes de Google. Además, desde Google quieren que ayudemos a sus sistemas a entrenarse, con herramientas como por ejemplo 'Google Image Labeler'.
Ahora, Shumeet Baluja, uno de los responsables en Google en Inteligencia Artificial aplicada a procesamiento de imágenes ha presentado este paper en el cual describe brevemente cómo dentro de la compañía han creado un algoritmo que combina la tecnología de reconocimiento de fotografías con técnicas para asignar una relevancia a las imágenes que representan el mismo concepto. De esta manera, se pretende que las consultas que realizan los usuarios dentro del buscador de imágenes devuelvan resultados con elementos de relevancia.
El paper se titula "PageRank for Product Image Search" y asegura que, mediante el mismo proceso seguido con PageRank para las páginas web, este algoritmo asigna a cada imagen un peso en forma de valor numérico que representa la importancia relativa que imágenes parecidas deben tener. Así por ejemplo, si se ha determinado que una fotografía tiene bastante relevancia para una determinada búsqueda, es lógico suponer que también lo tendrán las imágenes que son muy parecidas a la primera, y que tendrá mayor importancia aquella que más se parece al resto.
Con este nuevo enfoque de la manera de clasificar la relevancia de las imágenes para ciertas búsquedas, se asegura, se ha conseguido mejorar la calidad de los resultados del buscador de imágenes. Además, se han conseguido crear diagramas de enlaces entre fotografías similares (ver captura), en la que la imagen con mayor tamaño es la que mayor relevancia tiene para una determinada búsqueda.
Según este artículo del 'New York Times', los ingenieros de Google han bautizado a esta tecnología como 'VisualRank'. Shumeet Baluja, además, dispone de documentos explicando otras tecnologías de reconocimiento de imágenes, como esta para determinar si una persona es hombre o mujer, a partir de una fotografía de su rostro. Baluja fue así mismo el responsable de esta tecnología de Google que, en colaboración con una organización que defiende los derechos de los menores, detecta automáticamente imágenes y vídeos con pornografía infantil dentro de la WWW a partir de miles de ficheros rastreados.
Siguientes noticias >>>
|