2004-10-01 01:00
El hecho de que los buscadores sean cada vez más inútiles (por ejemplo
el buscador de noticias de Google) ha abierto el mercado a un montón de buscadores especializados, sea en algún tipo de red, o algún tipo de formato; por ejemplo,
ResearchIndex es un buscador gratuito de publicaciones científicas, o
Feedster, un buscador especializado en feeds
RSS. Todos esos buscadores se caracterizan por tener un conocimiento del dominio donde trabajan; los trabajos científicos tienen todos la misma estructura, por ejemplo: título, autores, resumen, trabajo y finalmente, referencias. Los demás, o bien usan un formato especializado, o bien lo crean a partir de un análisis de los documentos, tal como el anterior o los buscadores de noticias. Por supuesto, si hablamos de otras redes que no sean la web, el problema es mayor todavía: cada red tiene sus propios buscadores, algunos exhaustivos, otros no, sus propios formatos...
En cualquier caso, resulta que esos buscadores habitualmente son mucho más completos y exhaustivos que el propio Google (o, para el caso, cualquier buscador especializado), aparte de que devuelven la información de forma más estructurada. Y de ahí viene la competencia, y los problemas del usuario, que tiene que buscar en dos o tres sitios, y cada vez en más, si quiere encontrar lo que busca. Y a veces ni así: la porción de la web (por no mencionar redes P2P y demás) no cubierta por los buscadores es cada vez mayor.
El problema es la arquitectura de los buscadores en sí: son buscadores centralizados, con base de datos propia. Sin embargo, dado que cada buscador ocupa un nicho, y lo ocupa con bastante eficiencia, ¿por qué no hacer que unos buscadores usen a otros? Eso en parte ya se hace hoy: cuando buscas en Google, a la vez se lanza una búsqueda en el servidor de noticias. Pero ¿sería posible que Google y Feedster, por poner un ejemplo, se entendieran y fueran capaces de lanzar cada uno búsquedas en el otro?
Lo que ocurre es que no veo la forma de hacer esto bien: hay problemas de escala (si Google lanza una búsqueda en Feedster por cada búsqueda suya, lo echa abajo); sin embargo, debería haber alguna forma de
describir el entorno de búsqueda de cada buscador (¿usando
ontologías, por ejemplo?) de forma que sólo se lanzaran búsquedas en algunos casos.
En fin, espero que saquéis algún sentido, o podáis aportar algo, a esta parida de viernes.