Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Hacia la web semántica

2003-11-25 20:12 Aunque no tengas ni idea de que se trata, necesitas la web semántica. Y si no la necesitas, al menos te vendría bastante bien.
La necesitas para encontrar lo que buscas en la web. Por ejemplo, supongamos que buscas Granada en Google. El buscador busca fielmente la cadena granada (sin tener en cuenta mayúsculas y minúsculas), y te devuelve páginas web sobre la Universidad de nuestros pecados, una compañía televisiva inglesa, la ciudad de Granada, la diputación de Granada. Si lo que buscabas era granada-es-una-fruta, hay un poco de más suerte, se encuentra un artículo que la menciona, y nos aclara que se trata de una planta de la familia de las mirtáceas. Caray ya sabemos que granada-es-una-fruta-es-una-mirtácea. Si queremos volver a buscar mirtáceas, a ver si hay algún otro fruto similar, pero que manche menos, tenemos que volver a introducir la palabra en el buscador, y así sucesivamente. Somos nosotros los que tenemos que reducir la búsqueda a algo manejable por un navegador, y comprender lo que leermos para seguir encontrando lo que nos interesa.
La web semántica trata de hacer eso mucho más simple: trasladar parte de la comprensión de los datos en Internet al propio ordenador. Que el ordenador sea capaz de distinguir granada-es-una-fruta de granada-es-una-universidad de granada-es-una-cosa-que-explota, y sea capaz de darte, en cualquier caso, lo más adecuado a la búsqueda. Aunque hablar de búsquedas de información, en realidad, es un poco restrictivo, porque la web semántica trata de recursos (que puede ser un documento o un servicio, o incluso un producto, tal como un libro).
La web semántica todavía no está hay, hay que recorrer un cierto camino para llegar hacia ella. Y ese camino pasa por los llamados metadatos; metadatos son afirmaciones sobre un recurso formateadas de forma que un programa sea capaz de entenderla. Es muy normal, por ejemplo, encontrar en lo alto de los fuentes de una página web algo así como
<meta name='author' content='Juan J. Merelo Guervós' />

que dice que el autor de esta página es un tal JJ, es decir [JJ Merelo Guervós] es-autor-de [http://atalaya.blogalia.com]. El sujeto es [JJ Merelo Guervós], el verbo es-autor-de y el predicado [http://atalaya.blogalia.com] (todo esto quedaría más chulo con las hojas de estilo esas que ponen rayitas discontinuas y eso, pero no voy ahora a ponerme a buscar como hacerlo...). En principio, se pueden hacer afirmaciones de esas sobre cualquier cosa: una página, un pedazo de página, un formulario dentro de esa página, o un servicio que ofrezca esa página (búsqueda dentro de los contenidos del sitio, por ejemplo). Esos metadatos permiten, por ejemplo, y en teoría, buscar todas los recursos cuyo autor sea servidor de ustedes. No hay ningún buscador que lo haga, pero en teoría, podría hacerse.
Aparte de las afirmaciones que uno pueda hacer sobre un sitio, hay otras afirmaciones más o menos generales. Por ejemplo, que los pájaros son mamíferosaves, que los mamíferoslas aves son animales, que los animales son seres vivos, y todo eso que enseñan en el cole. O que una universidad está dividida en departamentos, que los departamentos tienen un director; en fin, afirmaciones generales que se pueden aplicar a muchos dominios. A este grupo de afirmaciones se les llama ontologías.
¿Os habéis perdido? Volvamos al ejemplo del principio, la granada. Supongamos, que es mucho suponer, que las páginas web tuvieran metadatos sobre, al menos, su título, su autor, y de lo que está hablando. Un buscador semántico trataría de encajar la palabra de búsqueda en una ontologí; por ejemplo, Wordnet sabe que Granada es una ciudad. Si se encuentra en diferentes ontologías, se presentaría al usuario con diferentes opciones; si no, directamente, se buscan recursos que hablen de [granada] es-una [fruta], y, a su vez, se podría aumentar el universo de búsqueda con otros datos: como una granada-es-una-mirtácea, se podrían presentar también resultados sobre mirtáceas.
No siempre se pueden hacer afirmaciones claras sobre recursos; esas afirmaciones pueden ser contradictorias, y, además, en muchos casos, son discutibles. Por eso hay críticas a la web semántica, que dicen básicamente que el mundo no se puede expresar a base de silogismos, y que, además, añadir metadatos a todo lo que se mueva es un coñazolatazo. Y es más o menos cierto; si cada vez que uno escriba un texto tiene que andar buscando ontologías como si fuera un bibliotecario, y añadirle metadatos al texto en sí del tipo autor, fecha, tema, palabras clave, etc, etc, para eso lo escribe en un postit y lo pega en la puerta del supermercado.
Pero claro, de lo que se trata es que todo ese proceso sea automático. Según se va escribiendo un texto, o a la hora de publicarlo, automáticamente se le añaden los metadatos pertinentes, y se le enganchan también las ontologías pertinentes. ¿Por qué querría alguien hacer eso? Pues en el caso de que se esté vendiendo algo, es esencial que se describa lo que se está vendiendo, para que motores automáticos de búsqueda lo encuentren, si es posible de forma unívoca.
¿Y a usted todo esto qué le importa? Pues probablemente poco. Las herramientas semánticas se irán incorporando poco a poco a los navegadores, buscadores y servidores, y lo único que ocurrirá es que tendrán que estar más rato de cháchara antes de presentar una página. Nada a lo que no estemos ya acostumbrados.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/13338

Comentarios

1
De: fernand0 Fecha: 2003-11-25 20:21

Que ricas las granadas.



2
De: JJ Fecha: 2003-11-25 20:22

granada-es-una-fruta o granada-es-de-mano? :-)



3
De: fernand0 Fecha: 2003-11-25 20:22

grandada-es-fruta-que-mancha-las-manos



4
De: eledhwen Fecha: 2003-11-25 20:32

Hombre, JJ, de poner ejemplos, no pongas uno como el de los pájaros son mamíferos, que aún habrá gente que se lo crea.



5
De: JJ Fecha: 2003-11-25 20:35

Huy, perdón, en qué estaría yo pensando. Corregido, y muchas gracias.



6
De: Guillermo López Fecha: 2003-11-25 20:41

Excelente visión de lo que es, y lo que puede ser, la web semántica. Mi pregunta (que en realidad creo recordar que ya hice a JJ y Fernand0 cuando nos conocimos en Pamplona): ¿Qué posibilidades le véis a utilizar la web semántica para superar las deficiencias de los selectores de información tipo news.google? Es decir, esbozar preferencias, criterios, y definiciones de cada medio, o artículo, mediante los metadatos, de manera que el lector encuentre fácilmente aquello que corresponda a sus búsquedas o intereses.



7
De: JJ Fecha: 2003-11-25 20:45

Siempre que los que suministran información la etiqueten adecuadamente, que es mucho suponer, y haya ontologías adecuadas para diferentes dominios (deportes, negocios, política, internacional), sería relativamente fácil eliminar ambigüedades y saber si se está hablando de España-el-país o España-el-equipo de fútbol o Puerto-España de Haití. En ese sentido, puede ayudar bastante; pero dudo que los suministradores tradicionales de información lo hagan, salvo que les vaya la vida en ello. Hoy en día ni siquiera aportan información básica en forma de RSS (al menos la gran mayoría), que permite añadir metadatos sobre autores, fechas, y cosas básicas.



8
De: fernand0 Fecha: 2003-11-25 20:51

Yo no creo en la web semántica, por lo menos tal como la suelen contar, lo siento.

Mientras no sea automático (y trabajo hay en la línea de encontrar-crear las ontologías 'ortomáticamente'), no vamos a avanzar por allí porque somos esencialmente vagos.

Lo próximo podría ser un SemaGoogle o algo así que utilice diferentes fuentes de información para 'semantizar' la web. He dicho. ;)



9
De: JJ Fecha: 2003-11-25 20:54

¿Qué, currándote lo del premio, eh?
Hombre, es de cajón que tiene que ser automático, si no, nadie lo usará. Y los buscadores tendrán que incluir un motor de inferencias, como los programas de IA de antiguamente. Si hasta que habrá que volver a aprender Prolog...



10
De: fernand0 Fecha: 2003-11-25 20:56

Qué premio ?

bitacorero anti- ?



11
De: eva-lamaga Fecha: 2003-11-26 02:36

Reconozco, JJ, que yo no sé vivir sin mi diccionario ideológico Casares. Me encanta triscar entre campos semánticos. Y supongo que me seguirá gustando por muy virtuales que éstos sean.



12
De: JJ Fecha: 2003-11-26 02:46

No lo conozco. Pero tengo el María Moliner en CD-ROM!
Supongo que es un poco la idea. Una ontología es, en realidad, como un diccionario de sinónimos-antónimos-hipérnimos y muchas más cosas, todo junto y enlazado.



13
De: Granada Fecha: 2003-11-26 03:51

Estoy granada, y la transparencia se abre paso dentro de mi cuerpo, cristal líquido que es lo contrario de un coágulo ontológico.



14
De: mini-d Fecha: 2003-11-26 19:38

Te aplaudo JJ. Sinceramente. La web semántica creo yo es uno de los ejemplos más dificiles de llevar a cabo, dado que debemos ponernos todos de acuerdo, o lo que yo trato de hacer es "engañar" a la gente.

A ver, hago una herramienta que escupe texto semantizado... y todos contentos... no he tenido tiempo, pero ya estoy terminando un texto sobre como escribe la gente en blogalia, y como podría cambiar toda la información si se hicieran cambios notables, algo que de hecho si se aplicara, sería la polla de los CMS...



15
De: rvr Fecha: 2003-11-26 19:46

mini-d: Esperando estamos :)



16
De: JJ Fecha: 2003-11-26 19:47

Gracias, mini-d... a ver lo que sale.



17
De: Catuxa Fecha: 2003-11-26 20:19

Realmente desde que se hablaba de la web semantica, hasta que llegué a comprender que demonios era eso, paso un tiempo considerable. Te felicito por esta explicación, que junto con la del libro "La experiencia del usuario" son las más claras que he leido.



18
De: JJ Fecha: 2003-11-26 21:06

Gracias!
No conozco ese libro. ¿Alguna referencia más?



19
De: Catuxa Fecha: 2003-11-26 21:49

El libro es más conocido como El libro del pie" porque en la portada hay una imagen de esta parte del cuerpo ;).
Te doy la referencia completa:
LA EXPERIENCIA DEL USUARIO
Autor: ALBERTO KNAPP BJERÉN
Autor: LUIS MONTERO MONTERO
Autor: FELIPE ROMERO MARTÍN
Editorial: ANAYA MULTIMEDIA
Fecha de publicación: 01/2003.
Edición: 1ª.
Número de páginas: 372.
ISBN: 8441514798.

Aquí puedes leer alguna opinión: http://www.terremoto.net/x/archivos/000048.html

Y gracias a ti, por ese explicación de la web semantica.



20
De: vanesa Fecha: 2003-11-27 00:09

yo tengo guardada la referencia a este libro que ha salido recientemente:
http://webode.dia.fi.upm.es/ontologicalengineering/
No lo he leido (muy caro pa mi bolsillo) pero parece muy completo
saluos :)



21
De: JJ Fecha: 2003-11-27 00:52

Un poco avanzado, pero tiene buena pinta. Gracias por ambas referencias.



22
De: fenanda Fecha: 2005-09-07 03:11

sabes bastante de web semantica que tal si me das unas bases para poder realizar un software que divida el texto de tal forma que quede mucho mas facil para realizar un grafo de orden o mapa conceptuel de este



23
De: JJ Fecha: 2005-09-30 09:12

Si, es muy fácil. Usa esto



24
De: maria Fecha: 2005-11-14 16:21

quiero saber como es la forma de la telaaraña de la araña embuda.contestarme pronto por favor.



25
De: JJ Fecha: 2005-11-14 16:53

Es muy bonita. Tiene forma de telaraña.



26
De: José Díaz Fecha: 2005-11-14 18:04

Para introducirse en la Web semántica recomiendo el libro La Web del futuro, que está disponible en esta dirección. Está muy bien y me ha servido de mucho. Hay una reseña aquí.



27
De: carmen Fecha: 2006-01-15 21:23

Hola,llevo un tiempo mirando aquí y allá cosas sobre la w.semántica. Me interesa, especialmente, alguna página, libro...que explique cómo desarrollar ontologías. Me podéis ayudar? muchas muchas gracias



28
De: JJ Fecha: 2006-01-15 23:25

Mira el comentario anterior.



29
De: coyr Fecha: 2006-05-23 06:12

Umm, este escrito si ha dado de que hablar. Ya 3 años despues y sigue llegando gente (y yo de ejemplo)por aquí. Deberias sacar una segunda parte, seria genial. Gracias por el aporte!! ;) (y)



30
De: Jose María Fecha: 2009-01-07 16:08

En http://www.javahispano.org/tutorials.item.action?id=55 me he encontrado un libro de Miguel angel abian sobre estos temas tan interesantes de la web semantica.
Saludos.



31
De: JJ Fecha: 2009-01-07 16:52

Gracias por el enlace.



32
De: Zent Fecha: 2009-05-11 20:52

Bueno, en si es una gran explicacion, y se aclaran muchas cosas, todas relacinadas con la clase de español de primaria, en fin, es muy bueno el articulo y si desglosa varias dudas que se tienen, mas que nada para entender lo que es una ontologia, que muchos confunden con una simple base de datos, pero bueno, la informatica sigue avanzando y asi sea 100 años despues este articulo recordara de donde venimos y hacia donde nos dirigimos



33
De: Anónimo Fecha: 2009-08-29 17:41

gracias por la información



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia