Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Andalucía 24 Horas en RSS

2006-04-23 19:36 Andalucía 24 horas es una de las webs más útiles a nivel local, porque clasifica correctamente las noticias por municipios y provincias (y no como Yahoo, por ejemplo, que sólo busca cadenas).
Pero no tiene un canal RSS. Lo que me hubiera venido bien para el Planet Úbeda, así que he aprovechado esta tarde de domingo para hacer un programa de scraping que transforme en RSS las noticias correspondientes. Un problema: las noticias en la página no tienen fecha, y me parecía un abuso bajármelas sólo para calcular la fecha.
En todo caso, va así. Para conseguir el canal RSS de un pueblo tal como 'Baeza', introducid en vuestro agregador el URL siguiente:
http://geneura.ugr.es/~jmerelo/RSS/a24h2rss.cgi?Baeza
Como es habitual, cualquier sugerencia o petición será bien recibida.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/39346

1
De: Caspa.tv Fecha: 2006-04-26 00:15

Los medios y la cultura de la remezcla: «Mientras escuchaba a Phil hablar de las características de Live.com, no dejaba de recordar la declaraciones del presidente de la...»



Comentarios

1
De: Angel Fecha: 2006-04-23 21:31

Muchas gracias JJ, de esta manera también consigo las de mi pueblo, Pegalajar.

Salu2.



2
De: Eduardo Fecha: 2006-04-23 22:09

Conoces Feed43? Tal vez te sea util :)

Feed43 engine converts free-form HTML or XML documents to valid RSS feeds by extracting snippets of text or HTML by means of applying search patterns, and then joining these snippets together using output templates to form user-friendly content of feed's items. The principle of extracting specific data from source documents is also known as “HTML scraping”.



3
De: JFTGEJE Fecha: 2006-04-24 01:37

HUY



4
De: JJ Fecha: 2006-04-24 08:49

Pues no lo conocía... está también el módulo WWW::Mechanize, pero me da la impresión de que al final, va a ser el mismo trabajo. Lo miraré de todas formas, gracias.



5
De: Landahlauts Fecha: 2007-03-14 21:36

Funciona con Granada. Gracias!



Nombre
Correo-e
URL
Dirección IP: 54.227.48.147 (1f7d7683e7)
Comentario
¿Cuánto es: mil + uno?

Se comenta en...

  • kiyahi en La internet invisible
  • lapita hotel dubai en La internet invisible
  • booklet printing en La internet invisible
  • mrycogwls en La internet invisible
  • kite en [Libro #21] Birchwood, de John Banville
  • kiyahi en [Libro #21] Birchwood, de John Banville
  • Term Paper Writing en [Libro #29] El guardián invisible, de Dolores Redondo
  • kiyahi en La internet invisible
  • kiyahi en La internet invisible
  • جستجوی وکیل en La internet invisible
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia