Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

El fracaso de las noticias de Google

2004-08-06 01:00 Si uno busca Granada, asi, con mayúsculas, en Google, el primer resultado es algo razonable: la página del Ayuntamiento de Granada. Sin embargo, si haces la misma búsqueda, o te habla de una tal Julieta Granada o de un señor con una granada de mano.
El problema es que cuando Google busca en las noticias, solo usa la palabra de búsqueda (y sin tener en cuenta mayúsculas y minúsculas, que ya le vale); no puede hacer uso de su célebre PageRank a la hora de aumentar la posición de una página basándose en los enlaces entrantes o salientes, simplemente porque enlaces salientes suele haber pocos, y entrantes ninguno.
Los periódicos tienen la mala costumbre de no enlazarse, ni siquiera internamente, así que malamente se puede usar PageRank. Sin embargo, Google tiene la solución al alcance de la mano desde que Google compró blogger. Nada más fácil que poner un botoncito Blog this! al lado de cada noticia, de forma que todos los usuarios de Blogger puedan incluirlo fácilmente en su bitácora; así se puede clasificar mejor y tenerlo en cuenta a la hora de ordenar las noticias en la página. Para que sea rápido, se pueden incluso enviar alertas a los usuarios, para que sin perder un minuto hablen sobre las noticias.
Una solución mejor pasaría por usar ontologías. Pero esa es otra historia.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/20665

Comentarios

1
De: Cek Fecha: 2004-08-06 09:27

La mejor forma de resumir la Web Semántica es esta frase:

"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James



2
De: Alvy Fecha: 2004-08-06 09:32

Aunque ingeniosa, la solución que propones a lo mejor no funcionaría. Mañana entra un loco en un restaurante con una granada de mano y mata a 50 -- todo el mundo escribe y bloguea sobre ello. Tu vas a Google News, escribes "granada" y las noticias sobre tu ciudad salen las últimas. Mmm...

Supongo que León le pasa lo mismo, por cierto.

En fin, puestos a dar ideas a lo mejor era más fácil que propongas al ayuntamiento cambiar el nombre de la ciudad de Granada por otro menos confuso ;-))))



3
De: nuncanada Fecha: 2004-08-06 09:46

No estaría mal esto del link "blog this", pero con el aprecio que tienen los medios tradicionales a los electrónicos independientes, me parece que no les gustaría demasiado la idea.



4
De: SegFault Fecha: 2004-08-06 10:25

Wordpress tiene un sistema de "Press it" que añade un bookmarklet al navegador y hace lo que pides, y para Mozilla/Firefox hay algunas extensiones.

De todas formas, quizás Google tenga que replantearse algunas cosas de su motor de búsqueda o esperar que otro buscador enfoque el problema de otra forma.

--
SegFault



5
De: El Artisca Fecha: 2004-08-06 16:40


Ya hemos hablado de esto en otras vidas...

Una cosa es lo semántico y otra lo sintáctico. La mayoría de estas herramientas (en mi opinión) no pasan de la semántica por lo tanto: nada de contexto. No olvide que la información está codificada y se accede a ella mediante los "tokens" de un lenguaje, en este caso, el que llamamos natural. Pero nada más. En otra ocasión ya lo dije, ¿y si resulta que quermos acceder a la noticia de una canción? (¿la canto?) claro que si tecleo la letra..., ¿y si no me la sé? ¿y si es instrumental? Ya sé ya sé, busco por autor, ¿y si es popular? ...

La IA hace años que solucionó esto con los marcos e inventos parecidos.

Con respecto a los buscadores, no se me ocurre nada mejor... y eso que muchas veces cuando busco algo primero tengo que pensar (si no es algo habitual) en que palabras habrá usado un tipo o habria usado yo para que mi búsqueda sea más acertada.

A seguir bien :-)



6
De: JJ Fecha: 2004-08-07 08:52

Cek: sí, pero tampoco hace falta que sea totalmente semántica, basta con que sea un poquitín semántica
nuncanada: para empezar, ya no les gusta las noticias de Google, así que eso sería seguramente un palo.
Segfault: como sea otro el que lo encuentre, estamos apañados. Especialmente si es Microsoft.
Alvy: funcionaría más o menos como funciona el pagerank actual, aunque posiblemente fuera un tanto más volátil. Lo de Granada... sí, una campaña de imagen. Podíamos llamarnos "El juego del millón", como la ciudad americana que cambió su nombre por "Truth or consequences", que era un concurso.
Artista: ahora las noticias ni son semánticas ni sintácticas, sino puramente léxicas... el resto, lo que mencionas, aún está bastante en mantillas.



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia