Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Una aguja en un pajar

2004-05-22 01:00 La empresa holandesa OneStat ha publicado un estudio sobre el número de palabras usadas en las búsquedas en Google (visto en la columna de Francis Pisani en el Ciberpaís). Resulta que la mayoría de la gente usa más de una palabra en las búsquedas, y de esos, la mayoría usa dos palabras.
Es lógico, Pero hace tiempo no sucedía así. La mayoría usaba una palabra. Y el porcentaje seguirá incrementándose con el tiempo: la mayoría usarán tres, cuatro palabras, y así sucesivamente.
¿Por qué sucede esto? La explicación más simple que se me ocurre es porque no se encuentra lo que se busca. Habitualmente se incluye una palabra de búsqueda (por ejemplo Atalaya); si no hay suerte, se usa una segunda, y así sucesivamente, hasta que uno encuentra lo que busca. A veces, el proceso es mucho más complejo: uno no recuerda exactamente lo que busca, sino una frase aproximada, por lo cual, en aproximaciones sucesivas, vas encontrando documentos que hablan de documentos que hablan, finalmente, del documento que estás buscando. También depende de lo que busques: aquél artículo que viste sobre un tema determinado, o bien, las páginas más interesantes que hablen sobre algo. En cualquier caso, de lo que se trata es de encontrar, en el primer pantallazo si es posible, lo que uno busca.
Lo que ocurre es que, según se van añadiendo más páginas y más páginas a internet, la proporción de resultados devueltos en la primera pantalla con respecto a la cantidad total de páginas que incluyen esos términos o que son descritas en esos términos, es cada vez menor. Buscar "redes neuronales" da 24500 resultados; en la primera pantalla habrá uno entre 2500 documentos. Mañana, habrá uno entre cinco mil; pasado mañana, uno entre diez mil, y así sucesivamente.
Cuando la proporción de documentos visibles relevantes disminuye, tiene que aumentar el número de términos de búsqueda; o bien, aumentar el número de búsquedas; al final, es simplemente una cuestión de tiempo: cuantos más documentos hay, más tiempo tienes que invertir en encontrar los resultados relevantes. Y según vaya aumentando ese tiempo, puede llegar un momento en que ya no sea rentable usar un buscador. ¿Estaríamos dispuestos a buscar un artículo durante un minuto? ¿Cinco? ¿Diez minutos? ¿Una hora?
Una vez más, un problema de escala. Y que tiene una solución complicada. O quizás ninguna solución.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/18821

Comentarios

1
De: Cek Fecha: 2004-05-22 21:24

Siempre queda mejorar los buscadores :)
Tú que tanto sabes de algoritmos genéticos y de redes neuronales ponte a diseñar el hypermegabuscador, seguro que te forras :)



2
De: JJ Fecha: 2004-05-23 10:29

Hombre, no te digo yo que no... pero mejorarlos, ¿como?



3
De: Rafael Merelo Fecha: 2004-05-24 10:10

Lo mejor es darle a "voy a tener suerte" ;-)



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia