|
El formato Unicode es un estándar que intenta ofrecer al usuario un juego de caracteres universal que sea capaz de transmitir textos escritos en cualquier alfabeto del planeta, cosa que no consiguen otros formatos como ASCII o Latin-1. Lo que pretende Unicode es asignar a cada caracter de cada alfabeto un único número, independientemente de la plataforma en la que sea escrito o leído dicho caracter. En este enlace tenéis una prueba de página web.
La primera especificación de Unicode (la 1.0) fue presentada en 1991, y poco a poco han ido surgiendo nuevas versiones que han ido cubriendo más alfabetos. Hace unos días, el Consorcio Unicode presentó la versión 5.1, soportando 1.624 nuevos caracteres, como por ejemplo la mayúscula de la famosa 'Eszett' del alfabeto alemán, a la cual se le ha asignado el código 'U+1E9E'.
Google está muy interesado en que los documentos de texto que se publican en la WWW estén codificados siguiendo un estándar único, como lo es Unicode. Por ello, ha sido uno de los mayores impulsores de este formato, y en este post oficial anuncia que además de rastrear páginas web genreadoras con Unicode, el buscador web también lo soporta a la hora de realizar búsquedas. Además, en este gráfico se muestra, a partir de los miles de millones de páginas rastreadas por Google, la evolución de los diferentes juegos de caracteres. Así por ejemplo, vemos como ASCII y Latin-1 pierden terreno progresivamente a favor del estándar Unicode, y más en concreto de su versión UTF-8.
En octubre de 2005 os comenzamos a hablar de BigTable, el sistema que comenzó a desarrollar Google en el año 2004 con el objetivo de poder almacenar sus enormes cantidades de información de una forma semi-estructurada. Con esta tecnología, servicios como 'Google Analytics puede almacenar los registros de las visitas, 'Google Finance' sus millones de registros de valores bursátiles, 'Google Earth' puede guardar las imágenes de satélite de todo el planeta, o el buscador web puede almacenar los contenidos históricos de las páginas web y de los links entre ellas. Google procesa diariamente varios millones de Gigabytes, utilizando BigTable sobre servidores Linux instalados en 'commodity hardware' (simples PCs de bajo precio).
Ahora, cuenta como rumor Mark Hendrickson en TechCrunch, Google estaría a punto de anunciar el lanzamiento de BigTable como un servicio de pago para empresas, para poder así ofrecer un añadido más al largo catálogo de productos que, como 'Google Apps', pretenden obtener ingresos diferentes a los de la publicidad a través de servicios empresariales de pago.
Con BigTable para empresas, éstas podrían desarrollar esas aplicaciones que requieran de una infraestructura potente y fiable para almacenar y consultar enormes cantidades de datos. Las consultas se realizarían a través de APIs, sin necesidad de utilizar bases de datos relacionales (la información se guardaría en la 'nube' de BigTable), y la empresa pagaría por número de consultas, por transferencia o por espacio utilizado. Sería un servicio muy similar al que lleva ofreciendo desde hace unos meses 'Amazon SimpleDB'.
Al igual que en estos momentos muchas empresas utilizan 'Google Apps' para guardar la información que los empleados generan a través de documentos, con 'BigTable como servicio' sus desarrolladores podrían creas sus propias herramientas sabiendo que están utilizando la misma tecnología que usa el buscador web de Google, y con la garantía de que ya hay creadas varios (y exitosos) productos sobre ella. Además de los servicios públicos que ya hemos comentado, por ejemplo el sistema interno de almacenamiento y revisión de código de programación ('Google Mondrian') fue creado sobre la tecnología de BigTable.
Existe, desde hace unas semanas, un software Open Source llamado 'Hypertable', que trata de implementar mediante C la tecnología de BigTable para almacenar y procesar importantes cantidades de información.
Tenéis más información sobre BigTable en este paper y en este vídeo.
De igual manera que en los resultados del buscador web de Google vemos fragmentos de noticias cuando buscamos
asuntos de actualidad, vemos vídeos incrustados de YouTube (ejemplo 'chiki
chiki') o imágenes (ejemplo 'amanecer'), también podemos
encontrarnos fragmentos de código cuando realizamos consultas de términos muy relacionados con la programación
informática.
Así, cuando buscamos por ejemplo 'metaphone' (un algoritmo
fonético), Google nos devuelve (ver captura)
fragmentos de implementaciones de este algoritmo a algunos lenguajes de programación, como C.
Los resultados provienen del buscador
de código de programación de Google, lanzado en octubre de 2006. De hecho, en los mismos resultados se incluye
este enlace a dicho servicio.
En inglés también lo podemos encontrar (ver captura) con el texto "Code snippets for metaphone".
Siguientes noticias >>>
|