
De inicio, tal y como se puede ver en la página inicial de Cuil (se pruncia como la palabra 'cool', es decir 'kül'), este buscador parte con más de 121.000 millones de páginas web indexadas, lo que ofrece una idea de la potencia de este nuevo proyecto. El pasado día 25 de julio os contábamos cómo Google había anunciado que su buscador tenía 'procesadas' un billón de URLs. Si fuesen cifras que representan el mismo concepto, Google tendría 8.26 veces maś que Cuil. Pero, como os comentábamos, cada página web indexada puede representar por ejemplo a unas 10 URLs procesadas que ofrecen el contenido duplicado.
Por ello, no sería descabellado pensar que Cuil dispondría de un número parecido a Google en cuanto a páginas indexadas, y que Google escribiese el post del 25 de julio hablando de URLs procesadas y no de páginas web indexadas, sabiendo que el nuevo buscador iba a ser lanzado con una muy importante cifra de páginas dentro del índice. En los logs de 'google.dirson.com' hemos encontrado una actividad frenética del robot rastreador, pero es que los responsables de Cuil aseguran que esta cifra de 121.000 millones de páginas web indexadas es 'tres veces mayor' que la de cualquier otro
En estos momentos, debido a la elevada carga que están sufriendo los servidores de Cuil durante este día de lanzamiento, las páginas de resultados de Cuil suelen fallar frecuentemente, pero en algunas ocasiones (ver ejemplo) vemos cómo la calidad de los resultados puede mejorarse, pero también cómo se han incorporado algunas funcionalidades que no tienen otros buscadores como Google, como la de organizar los resultados por categorías, lo que permite que, por ejemplo, si buscamos la palabra 'apache' nos distinga entre el páginas relacionadas con el popular servidor web, o con la tribu india americana.
Para ofrecer la relevancia de las páginas web que muestra como resultados, Cuil no utiliza un algoritmo como PageRank que establece una 'popularidad' para cada documento, sino que analiza los contenidos de todas las páginas y, establece si una determinada página se adecúa a las palabras que escribió el usuario en el buscador.
Además, Cuil promete en esta página web que, cuando realizas una búsqueda en él, no se guarda ninguna información que pueda ser fácilmente indentificable. "No tenemos ni idea de quién realiza la búsqueda: ni su nombre, ni su dirección IP, ni sus cookies", aseguran. Esto, sin duda, será una gran baza de márketing de Cuild, frente a un Google sí que guarda parte de esta información, y que en alguna ocasión ha defendido el almacenamiento de direcciones IP de los usuarios alegando que "no se trata de un dato personal".
via: google.dirson.com
Realmente interesante el hecho de que no guarde ningún dato nuestro.
ResponderSuprimir