martes, agosto 08, 2006

Google distribuirá 6 DVDs con un billón de palabras rastreadas de su buscador


Según una nota publicada hoy por el Official Google Research que se titula: "All Our N-gram are Belong to You", o lo que es lo mismo, "Todos nuestros N-Gram te pertenecen", informa que van a poner a disposición en 6 DVD un paquete de palabras y asociaciones de palabras con el que sus investigadores del lenguaje llevan trabajando para que a partir de ahí puedan desarrollarse nuevas aplicaciones.

En la nota cuentan que están procesando más de 1 billón de palabras, exactamente 1.011.582.453.213, de las cuales, 1.146.580.664 son agrupaciones de 5 palabras que han aparecido al menos 40 veces. Asimismo hay 13.653.070 palabras únicas después de descartar aquellas que aparecen menos de 200 veces.

Esto es todo un acontecimiento ya que esta información puede generar un valor incalculable no solo para el análisis de los anunciantes y Agencias Interactivas para diseñar las campañas de Adwords de sus clientes, sinopara el desarrollo de aplicaciones relacionadas no solo con las búsquedas como hace Google sino con como manejamos el lenguaje en Internet, y de ahí poder entender mejor la forma en que piensa el internauta al navegar por cadea página, como comprende mejor los conceptos, y muchas otras cosas más.


Technorati Comentarios sobre este post en otros weblogs