2003-11-25 20:12
Aunque no tengas ni idea de que se trata, necesitas la
web semántica. Y si no la necesitas, al menos te vendría bastante bien.
La necesitas para encontrar lo que buscas en la web. Por ejemplo, supongamos que buscas
Granada en Google. El buscador busca fielmente la cadena
granada
(sin tener en cuenta mayúsculas y minúsculas), y te devuelve páginas web sobre la Universidad de nuestros pecados, una compañía televisiva inglesa, la ciudad de Granada, la
diputación de Granada. Si lo que buscabas era
granada-es-una-fruta
, hay un poco de
más suerte, se encuentra un artículo que la menciona, y nos aclara que se trata de una planta de la familia de las mirtáceas. Caray ya sabemos que
granada-es-una-fruta-es-una-mirtácea
. Si queremos volver a buscar mirtáceas, a ver si hay algún otro fruto similar, pero que manche menos, tenemos que volver a introducir la palabra en el buscador, y así sucesivamente. Somos nosotros los que tenemos que reducir la búsqueda a algo manejable por un navegador, y
comprender lo que leermos para seguir encontrando lo que nos interesa.
La web semántica trata de hacer eso mucho más simple: trasladar parte de la comprensión de los datos en Internet al propio ordenador. Que el ordenador sea capaz de distinguir
granada-es-una-fruta
de
granada-es-una-universidad
de
granada-es-una-cosa-que-explota
, y sea capaz de darte, en cualquier caso, lo más adecuado a la búsqueda. Aunque hablar de búsquedas de información, en realidad, es un poco restrictivo, porque la web semántica trata de recursos (que puede ser un documento o un servicio, o incluso un producto, tal como un libro).
La web semántica todavía no está hay, hay que recorrer un cierto camino para llegar hacia ella. Y ese camino pasa por los llamados
metadatos; metadatos son afirmaciones sobre un recurso formateadas de forma que un programa sea capaz de entenderla. Es muy normal, por ejemplo, encontrar en lo alto de los fuentes de una página web algo así como
<meta name='author' content='Juan J. Merelo Guervós' />
que dice que el autor de esta página es un tal JJ, es decir [JJ Merelo Guervós] es-autor-de [http://atalaya.blogalia.com]. El sujeto es
[JJ Merelo Guervós], el verbo
es-autor-de y el predicado
[http://atalaya.blogalia.com] (todo esto quedaría más chulo con las hojas de estilo esas que ponen rayitas discontinuas y eso, pero no voy ahora a ponerme a buscar como hacerlo...). En principio, se pueden hacer afirmaciones de esas sobre cualquier cosa: una página, un pedazo de página, un formulario dentro de esa página, o un servicio que ofrezca esa página (búsqueda dentro de los contenidos del sitio, por ejemplo). Esos metadatos permiten, por ejemplo, y en teoría, buscar todas los recursos cuyo autor sea servidor de ustedes. No hay ningún buscador que lo haga, pero en teoría, podría hacerse.
Aparte de las afirmaciones que uno pueda hacer sobre un sitio, hay otras afirmaciones más o menos generales. Por ejemplo, que los pájaros son
mamíferosaves, que
los mamíferoslas aves son animales, que los animales son seres vivos, y todo eso que enseñan en el cole. O que una universidad está dividida en departamentos, que los departamentos tienen un director; en fin, afirmaciones generales que se pueden aplicar a muchos dominios. A este grupo de afirmaciones se les llama
ontologías.
¿Os habéis perdido? Volvamos al ejemplo del principio, la granada. Supongamos, que es mucho suponer, que las páginas web tuvieran metadatos sobre, al menos, su título, su autor, y de lo que está hablando. Un buscador
semántico trataría de encajar la palabra de búsqueda en una ontologí; por ejemplo,
Wordnet sabe que Granada es una ciudad. Si se encuentra en diferentes ontologías, se presentaría al usuario con diferentes opciones; si no, directamente, se buscan recursos que hablen de [granada] es-una [fruta], y, a su vez, se podría aumentar el universo de búsqueda con otros datos: como una granada-es-una-mirtácea, se podrían presentar también resultados sobre mirtáceas.
No siempre se pueden hacer afirmaciones claras sobre recursos; esas afirmaciones pueden ser contradictorias, y, además, en muchos casos, son discutibles. Por eso hay
críticas a la web semántica, que dicen básicamente que el mundo no se puede expresar a base de silogismos, y que, además, añadir metadatos a todo lo que se mueva es un
coñazolatazo. Y es más o menos cierto; si cada vez que uno escriba un texto tiene que andar buscando ontologías como si fuera un bibliotecario, y añadirle metadatos al texto en sí del tipo autor, fecha, tema, palabras clave, etc, etc, para eso lo escribe en un postit y lo pega en la puerta del supermercado.
Pero claro, de lo que se trata es que todo ese proceso sea automático. Según se va escribiendo un texto, o a la hora de publicarlo, automáticamente se le añaden los metadatos pertinentes, y se le enganchan también las ontologías pertinentes. ¿Por qué querría alguien hacer eso? Pues en el caso de que se esté vendiendo algo, es esencial que se describa lo que se está vendiendo, para que motores automáticos de búsqueda lo encuentren, si es posible de forma unívoca.
¿Y a usted todo esto qué le importa? Pues probablemente poco. Las herramientas semánticas se irán incorporando poco a poco a los navegadores, buscadores y servidores, y lo único que ocurrirá es que tendrán que estar más rato de cháchara antes de presentar una página. Nada a lo que no estemos ya acostumbrados.