agosto 09, 2006 at miércoles, agosto 09, 2006
Google distribuirá 6 DVDs con un billón de palabras rastreadas de la WWW

Según comentan tanto Ricardo Galli como en el blog Dirson, ayer se produjo un relevante comunicado por parte de Google Research, en el que se anuncia que donarán a la comunidad una importante colección de registros, procedentes de las búsquedas que los usuarios efectúan en el popular buscador.

El conocimiento será liberado, tal y como comentan en Dirson, en forma de seis DVDs, que contendrán 1.011.582.453.213 palabras (más de un billón), dentro de ellas hay más de mil millones de secuencias de cinco vocablos que se repiten más de 40 veces (de gran utilidad para los analistas del lenguaje humano), y existen más de 13 millones de palabras únicas.

Los filólogos y los eruditos del lenguage estarán hoy, sin lugar a dudas, de enhorabuena. Y es que somos muy distintos no sólo hablando y escribiendo, sino buscando.

IORedixs Blog | Powered by Blogger | Entries (RSS) | Comments (RSS) | Designed by MB Web Design | XML Coded By Cahayabiru.com