Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Ecosistemas de buscadores

2004-10-01 01:00 El hecho de que los buscadores sean cada vez más inútiles (por ejemplo el buscador de noticias de Google) ha abierto el mercado a un montón de buscadores especializados, sea en algún tipo de red, o algún tipo de formato; por ejemplo, ResearchIndex es un buscador gratuito de publicaciones científicas, o Feedster, un buscador especializado en feeds RSS. Todos esos buscadores se caracterizan por tener un conocimiento del dominio donde trabajan; los trabajos científicos tienen todos la misma estructura, por ejemplo: título, autores, resumen, trabajo y finalmente, referencias. Los demás, o bien usan un formato especializado, o bien lo crean a partir de un análisis de los documentos, tal como el anterior o los buscadores de noticias. Por supuesto, si hablamos de otras redes que no sean la web, el problema es mayor todavía: cada red tiene sus propios buscadores, algunos exhaustivos, otros no, sus propios formatos...
En cualquier caso, resulta que esos buscadores habitualmente son mucho más completos y exhaustivos que el propio Google (o, para el caso, cualquier buscador especializado), aparte de que devuelven la información de forma más estructurada. Y de ahí viene la competencia, y los problemas del usuario, que tiene que buscar en dos o tres sitios, y cada vez en más, si quiere encontrar lo que busca. Y a veces ni así: la porción de la web (por no mencionar redes P2P y demás) no cubierta por los buscadores es cada vez mayor.
El problema es la arquitectura de los buscadores en sí: son buscadores centralizados, con base de datos propia. Sin embargo, dado que cada buscador ocupa un nicho, y lo ocupa con bastante eficiencia, ¿por qué no hacer que unos buscadores usen a otros? Eso en parte ya se hace hoy: cuando buscas en Google, a la vez se lanza una búsqueda en el servidor de noticias. Pero ¿sería posible que Google y Feedster, por poner un ejemplo, se entendieran y fueran capaces de lanzar cada uno búsquedas en el otro?
Lo que ocurre es que no veo la forma de hacer esto bien: hay problemas de escala (si Google lanza una búsqueda en Feedster por cada búsqueda suya, lo echa abajo); sin embargo, debería haber alguna forma de describir el entorno de búsqueda de cada buscador (¿usando ontologías, por ejemplo?) de forma que sólo se lanzaran búsquedas en algunos casos.
En fin, espero que saquéis algún sentido, o podáis aportar algo, a esta parida de viernes.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/21825

Comentarios

Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia