Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Andalucía 24 Horas en RSS

2006-04-23 19:36 Andalucía 24 horas es una de las webs más útiles a nivel local, porque clasifica correctamente las noticias por municipios y provincias (y no como Yahoo, por ejemplo, que sólo busca cadenas).
Pero no tiene un canal RSS. Lo que me hubiera venido bien para el Planet Úbeda, así que he aprovechado esta tarde de domingo para hacer un programa de scraping que transforme en RSS las noticias correspondientes. Un problema: las noticias en la página no tienen fecha, y me parecía un abuso bajármelas sólo para calcular la fecha.
En todo caso, va así. Para conseguir el canal RSS de un pueblo tal como 'Baeza', introducid en vuestro agregador el URL siguiente:
http://geneura.ugr.es/~jmerelo/RSS/a24h2rss.cgi?Baeza
Como es habitual, cualquier sugerencia o petición será bien recibida.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/39346

1
De: Caspa.tv Fecha: 2006-04-26 00:15

Los medios y la cultura de la remezcla: «Mientras escuchaba a Phil hablar de las características de Live.com, no dejaba de recordar la declaraciones del presidente de la...»



Comentarios

1
De: Angel Fecha: 2006-04-23 21:31

Muchas gracias JJ, de esta manera también consigo las de mi pueblo, Pegalajar.

Salu2.



2
De: Eduardo Fecha: 2006-04-23 22:09

Conoces Feed43? Tal vez te sea util :)

Feed43 engine converts free-form HTML or XML documents to valid RSS feeds by extracting snippets of text or HTML by means of applying search patterns, and then joining these snippets together using output templates to form user-friendly content of feed's items. The principle of extracting specific data from source documents is also known as “HTML scraping”.



3
De: JFTGEJE Fecha: 2006-04-24 01:37

HUY



4
De: JJ Fecha: 2006-04-24 08:49

Pues no lo conocía... está también el módulo WWW::Mechanize, pero me da la impresión de que al final, va a ser el mismo trabajo. Lo miraré de todas formas, gracias.



5
De: Landahlauts Fecha: 2007-03-14 21:36

Funciona con Granada. Gracias!



Nombre
Correo-e
URL
Dirección IP: 54.198.210.67 (77461d298f)
Comentario
¿Cuánto es: mil + uno?

Se comenta en...

  • uali20 en [Libro #21] Birchwood, de John Banville
  • George Windsor en Vuelven los buenos tiempos
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Anónima en [Libro #11] Prisoners of Geography, de Tim Marshall
  • JJ en [Libro #3] A Christmas Carol, de Charles Dickens
  • PABLO PASCUAL LÓPEZ en [Libro #3] A Christmas Carol, de Charles Dickens
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia