VisualRank: la tecnología mejorada de Google para realizar búsquedas de imágenes
Hasta la fecha, el buscador de imágenes de Google y el resto de herramientas similares devuelven resultados en función de los textos y las palabras que rodean a las imágenes (nombres de los ficheros, etiquetas 'ALT' o 'TITLE', tags insertados por el creador, textos de la página donde se inserta, palabras en los enlaces, ...).
Desde hace muchos años, los desarrolladores de estos servicios están intentando que, si el usuario escribe 'elefante' en el buscador, se le devuelva fotos en las que se ha detectado que existe un elefante dentro, sin que nadie haya escrito la palabra "elefante" previamente. Gracias a la Inteligencia Artificial, se están consiguiendo bastantes avances, como por ejemplo el reconocimiento facial dentro del buscador de imágenes de Google. Además, desde Google quieren que ayudemos a sus sistemas a entrenarse, con herramientas como por ejemplo 'Google Image Labeler'.
Ahora, Shumeet Baluja, uno de los responsables en Google en Inteligencia Artificial aplicada a procesamiento de imágenes ha presentado este paper en el cual describe brevemente cómo dentro de la compañía han creado un algoritmo que combina la tecnología de reconocimiento de fotografías con técnicas para asignar una relevancia a las imágenes que representan el mismo concepto. De esta manera, se pretende que las consultas que realizan los usuarios dentro del buscador de imágenes devuelvan resultados con elementos de relevancia.
El paper se titula "PageRank for Product Image Search" y asegura que, mediante el mismo proceso seguido con PageRank para las páginas web, este algoritmo asigna a cada imagen un peso en forma de valor numérico que representa la importancia relativa que imágenes parecidas deben tener. Así por ejemplo, si se ha determinado que una fotografía tiene bastante relevancia para una determinada búsqueda, es lógico suponer que también lo tendrán las imágenes que son muy parecidas a la primera, y que tendrá mayor importancia aquella que más se parece al resto.
Con este nuevo enfoque de la manera de clasificar la relevancia de las imágenes para ciertas búsquedas, se asegura, se ha conseguido mejorar la calidad de los resultados del buscador de imágenes. Además, se han conseguido crear diagramas de enlaces entre fotografías similares (ver captura), en la que la imagen con mayor tamaño es la que mayor relevancia tiene para una determinada búsqueda.
Según este artículo del 'New York Times', los ingenieros de Google han bautizado a esta tecnología como 'VisualRank'. Shumeet Baluja, además, dispone de documentos explicando otras tecnologías de reconocimiento de imágenes, como esta para determinar si una persona es hombre o mujer, a partir de una fotografía de su rostro. Baluja fue así mismo el responsable de esta tecnología de Google que, en colaboración con una organización que defiende los derechos de los menores, detecta automáticamente imágenes y vídeos con pornografía infantil dentro de la WWW a partir de miles de ficheros rastreados.
 anonimo131, el 29 de abril de 2008 a las 9:50h ( CET), dijo:
Entiendo que la ausenciua de links externos y más a los servicios de los que se habla en el articulo es por conseguir mejores posiciones en los pageranks y resultados de busquedas.
Se que hay algunos links externos en el articulo, pero cada vez que leo un articulo en tu web, caigo en la misma trampa, y es uno de los motivos por los que cada vez visito menos. Y no es que sea por los contenidos, al contrario, pero tal vez este afan por conseguir mejores resultados hace bajar la calidad de la semantica y la web acaba por parecer un bucle sin fin.
Mas o menos como los periodicos online (lease elpais.es, etc.) que parecen esperar a que el cielo se congele para hacer uso correcto del HTML y enlazar una palabra (Google) a su destino en vez de dejarla vacia o linkarla a la propia web.
No pretendo vacilar ni nada de eso, mis disculpas si sienta mal, pero es una reflexión en voz alta que queria compartir contigo y tus lectores, con todo mi respeto por tu trabajo, y con ganas de ver este bucle abrirse a la red de redes.
saludos
 skinner, el 29 de abril de 2008 a las 11:41h ( CET), dijo:
Estoy de acuerdo con anonimo131. Con el tiempo me he acostumbrado a lidiar con estos links internos, pero es algo que se puede mejorar. Simplemente, si se hace referencia a un hecho o noticia reciente, está bien enlazar con este mismo sitio, ya que hay pocas páginas en Internet que puedan ofrecer más noticias sobre Google, y si la noticia viene de otra fuente, ya se verá en la otra página. Pero cuando encuentras un enlace como el de este mismo post en el que pone "Google Image Labeler", uno espera que le lleve directamente a la herramienta, sin tener que hacer un paso intermedio.
Puede que sea por cuestiones de SEO, pero a lo mejor está hecho con la mejor intención de mostrar al usuario una explicación detallada del producto. Aún así, pienso que un enlace que tenga sólo el nombre de un producto de Google debe enlazar siempre a ese producto. Si se quiere ofrecer la información extra de dirson.com se podría poner al final de cada noticia una sección "Noticias relacionadas" o "Más información", con todos esos enlaces. Creo que sería la forma más correcta de hacerlo.
 muca, el 29 de abril de 2008 a las 11:47h ( CET), dijo:
Yo secundo la moción de los enlaces internos, y vuelvo a pedir que incluyas el texto completo en los feeds RSS; si lo que intentas es que pinchemos para llegar a leer el texto completo, estás consiguiendo que pase de las noticias que no logro entender en el resumen del feed. No quiero tener que entrar para leerte completo y ya casi nunca lo hago.
Freddy, el 29 de abril de 2008 a las 13:16h ( CET), dijo:
Lo de los enlaces a información de la misma página, no me molesta en lo absoluto. Porque por ejemplo, cuando enlaza a "Google image labeler" una página del mismo sitio, me parece estupendo, pues yo no tengo idea qués es Google image labeler, y siendo Google dirson una página que informa sobre Google, no veo cuál es el problema. Además, si quisiera ir a cualquier producto de Google, no vendría hasta acá para encontrar el link, de hecho, se llega a esta página buscando información de los productos de Google ¿no?.
Lo que sí me molesta, es lo que plantea muca: es un fastidio tener que visitar la página para poder ver el texto completo. Además, uno pierde interés cuando no se logra entender el pedazo de texto que aparece que ni siquiera es un resumen (creo, honestamente, que sería menos molesto si fuera un resumen)
Buen blog, muy bueno en verdad. Saludos
 Hernan, el 29 de abril de 2008 a las 13:33h ( CET), dijo:
De acuerdo con ambos comentarios. Cada vez entro menos al blog, en una epoca leia todas las noticias, pero ahora ya no, solo si me llama mucho la atencion. En realidad este es el unico feed que sigo leyendo que no muestra las noticias completas. Cuando encuentro un sitio que me interesa y no muestra el feed completo, no lo cargo en el lector. Dirson sigue solo por ¿costumbre? pero la realidad que asi no lo leo.
 grapa, el 02 de mayo de 2008 a las 07:02h ( CET), dijo:
hola,
gracias a Dirson he aprendido muchísimo de Google.
Si hacer clic en el lector de feeds para leer el artículo completo os resulta incómodo, imaginad lo cómodo que le resulta a él informarse ampliamente para luego informarnos a nosotros.
Gracias Dirson!!!
lakil essady, el 06 de mayo de 2008 a las 21:17h ( CET), dijo:
evidentemente faltarán muchos datos para una buena comprensión de esta tecnología puesto que no les interesa entrar en más detalles, pero en este caso se habla solo de clasificación de resultados mediante un ranking similar al pagerank, por tanto la asociación de imagenes con palabras clave seguirá siendo la de siempre no? alt, title, palabras anteriores o posteriores a la imagen..
El Abuelo, el 28 de mayo de 2008 a las 16:19h ( CET), dijo:
De acuerdo con algunos de los anteriores intervinientes en que se debería ofrecer el texto completo de la entrada directamente en nuestros agregadores a partir del feed.
Puedes dejar un comentario sobre la noticia del post rellenando y enviando el siguiente formulario. Los campos marcados con asterisco (*) son obligatorios.
|