Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

robots.txt de webs oficiales: Junta de Andalucía

2003-11-13 01:34 Robot molónDespués del revuelo por el fichero robots.txt del sitio web de la Casa Blanca, me he decidido comprobar por mí mismo como está la situación de los ficheros susodichos a este lado de los Pirineos. Aclaración: este fichero se usa de forma convencional por los bots de búsqueda de los buscadores para no buscar las partes del sitio que el usuario no quiera. Solo es una sugerencia, y sólo para los robots de búsqueda. Las páginas pueden verse sin ningún problema, y algunos robots de búsqueda se las saltan.
Empecé por La Moncloa, esperando ver alguna referencia a las lecciones de catalán de nuestro presidente, o algo por el estilo. Pero simplemente no existe. Así que me vine más cerca, a la web de la Junta de Andalucía. Y resulta que sí tiene el curioso ficherillo. Aquí lo tenéis:
User-agent: *
Disallow: /visualBoja
Disallow: /PJA
Disallow: /GuiaFyS
Disallow: /educacion
Disallow: /economYempresas
Disallow: /turismo
Disallow: /SociedadSalud
Disallow: /verBojaCache
Disallow: /cabBojaCache
Disallow: /cuerpoBojaCache
Disallow: /verBoja
Disallow: /cabBoja
Disallow: /cuerpoBoja

Muchas cosas relacionadas con el Boletín Oficial de la Junta de Andalucía (¿no querrán que se indexen licitaciones, ofertas de empleo y cosas por el estilo?), tres consejerías y alguna que otra cosa, que no sé muy bien de qué va. Pardiez, la Junta está restringiendo el asezo, perdón, acceso, a la información.
Pero no todo está perdido: me fui metiendo en el sitio susodicho, y después de que me abriera ventanas por toda la pantalla, me di cuenta que la mayor parte de esos directorios, en realidad, no existen. Al parecer, ha habido una reorganización del sitio, y, por ejemplo, Turismo y Deporte no está en el subdirectorio turismo, sino /turismoydeporte. El BOJA está en SP/AJ/CDA/Secciones/Boja/visualBoja/.
Lo raro es que, de hecho, si buscas en Google alguna cosa de tal consejería (llevada por Antonio Ortega, del Partido Andalucista), no aparece absolutamente nada. ¿Conspiración? ¿Despiste? ¿Restricción del acceso a la información? ¡Exigimos explicaciones!

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/12962

1
De: Atalaya: desde la tela de araña Fecha: 2005-10-27 10:10

Spamdexing en la página de La Moncloa: «Spamdexing es una práctica que consiste en repetir palabras en las meta-tags de una página, sobre todo con el objetivo de conseguir una buena posición en los buscadores. Hoy, buscando el enlace al PDF de la consti europea en vale»



Comentarios

1
De: Ctugha Fecha: 2003-11-13 02:52

Claro, para que nadie se entere de los plazos de las becas de la junta. Si es evidente :P



2
De: JJ Fecha: 2003-11-13 03:03

Pos eso será. O seriese, porque los directorios no son los que son.



3
De: Rafael Merelo Fecha: 2003-11-13 18:16

¿Seguro que no aparece? ¿Has mirado los 940 resultados?



4
De: JJ Fecha: 2003-11-13 18:18

Hombre, los 940 no, pero no aparece entre los primeros, que es donde debería aparecer.
Igual es que como /turismo forma parte del nombre, google interpreta que no debe indexar nada que comience por esa cadena.



5
De: fernand0 Fecha: 2003-11-13 18:26

Fenomenal pero ...
¿qué tal alguno más, aparte del de La Moncloa?

Echarle un ojo al de la Casa Real, el Congreso, el PP, el PSOE,...



6
De: JJ Fecha: 2003-11-13 18:29

Hala, pues sí... tú mándame trabajo.
He mirado administracion.es, que tampoco tiene. Y algún ministerio, creo recordar.
Es un trabajazo, de por sí. Si hubiera algún interés por parte de la gente, lo podría hacer, pero vamos, que lo puede hacer cualquiera: que apunten su navegador a http://www.pp.es/robots.txt



7
De: fernand0 Fecha: 2003-11-13 18:29

Ale piriodistas... de esto sale un artículillo para el ciberp@is o alguno similar, seguro ;P



8
De: JJ Fecha: 2003-11-13 18:31

Lo saldría si lo dijera otra persona, pero aquí ya somos conscientes de nuestras propias limitaciones. En todo caso, ahí va esa perla de la Generalitat.
A lo más que aspiramos es que dentro de un día, o dos, o tres, o una semana, alguien se le ocurra hacer lo mismo y no nos cite, pero, por lo menos, confirmará que no era una idea demasiado descabellada.



9
De: JJ Fecha: 2003-11-13 18:35

Je, y el gobierno vasco. Ya estoy viendo el titular "Las comunidades autónomas restringen el acceso a la información en sus páginas web"



10
De: fernand0 Fecha: 2003-11-13 18:35

"Aquesta pàgina ha canviat d'adreça"

Me han dicho que es una forma de eliminar de Google las páginas que ya no existen, para que no manden visitas a enlacess que ya no funcionan, pero no podría afirmarlo con seguridad.



11
De: JJ Fecha: 2003-11-13 18:40

Eso es desinformación! Están tratando de engañar al público! :-)
Si no existen, digo yo que el robot de google se dará cuenta, no?



12
De: El Artista Fecha: 2003-11-15 04:17


El procedimiento para borrar la cache de Google pasa por crear el fichero y decirle que lo vea. Así se consigue un borrado rápido, no hay que esperar a la siguiente visita del robot. Claro que después se podría quitar...



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia