Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Los 100 de Atalaya van a estar jodidos este año

2006-01-15 18:06 Iba a ser el tercer año que publicara ya el ránking de los 100 blogs más enlazados según technorati, y me acabo de poner al tema, pero lo veo complicado. Usando el API de technorati me devuelve resultados que no sólo no son demasiado fiables, sino que no coinciden con los que da el propio web de Technorati (por ejemplo, para Microsiervos devuelve 2475 desde la web y 2448 desde el API; para esta Atalaya la diferencia es todavía mayor). También están mal las fechas que devuelve la petición del API. Este año pensaba usarla para filtrar a aquellos que no hubieran actualizado en el mes de diciembre; pero resulta que las fechas de la petición del API las devuelve al buen tuntún.
Otra opción sería usar la página web para el número de enlaces, y quizás no sea mala solución, pero me da la impresión de que tampoco va muy fino. Aunque cambie el número de enlaces que aparecen en la página, el conteo total de enlaces en lo alto no cambia; lo he venido observando durante cierto tiempo.
He estado mirando Blogsearch, pero el principal problema es que no elimina los autoenlaces, y habría que filtrarlos bajándose todas las páginas para un blog determinado, un coñazo.
De hecho, la búsqueda Technorati sucks devuelve más de 200 resultados, empezando por Kottke y siguiendo por Calacanis.
Además, hay buenos ránkings por ahí. Elija el suyo preferido.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/36571

Comentarios

1
De: Juanjo Fecha: 2006-01-15 18:43

Se me ocurre que puede ser consecuencia del problema que tienen para mantener el alto número de peticiones que reciben. Emplean un sistema con proxy inverso (SQUID), así que puede que los datos del API sean más de fiar que los que se obtienen de la web, que pueden variar según el caché que te toque.

Pero claro, si el API tampoco da pie con bola en el tema fechas, pues la teoría parece que pierde peso :D



2
De: JJ Fecha: 2006-01-15 18:54

Tampoco los RSS van muy finos; rara vez coinciden con lo que aparece en la página web. De todas formas, es que da la impresión de que hacen cada cosa por su lado.



3
De: Alvy Fecha: 2006-01-15 20:40

Muchos datos no coinciden porque actualizan unos más a menudo que otros por los problemas de estabilidad y rendimiento. Probablemente los de la API son reales y los que ves en la web, cacheados (y con cierta antiguedad). Sucede sobre todo con los webs de arriba de la lista, donde calcular el número de enlaces totales y ordenarlos es más complicado, De hecho los fallos en las peticiones son comunes ahí, mientras que para otros blogs funciona más o menos bien. Sucede también si estás registrado que a veces en tu propia cuenta ves un número de enlaces, luego en una búsqueda aparece otro total y si miras la lista del Top 100 es otro diferente. Yo me fiaría de la API más que de lo que se ve en la web que tiene pinta de estar cacheado. Al menos cambia cada 24h, como máximo 48h, antes a veces tardaba dos o tres semanas. (El Top 100 tampoco es tiempo real, sólo lo actualizan cada 24h más o menos.)



4
De: JJ Fecha: 2006-01-15 23:27

Hay una discrepancia muy grande... de hecho, para Atalaya da la misma cantidad que el año pasado. O quizás de la fecha de actualización que sale. Concluyendo, datos poco fiables.



5
De: Cek Fecha: 2006-01-16 09:08

Una lástima. Si es que...cuando las cosas crecen sirven para algunas cosas pero no para otras :)))))))



6
De: Allan Psicobyte Fecha: 2006-01-16 09:14

Precisamente andaba yo ahora metido con la API de technorati, para sacar mi egonet, y me he encontrado con lo mismo. Pensaba que era yo el que estaba accediendo mal o haciendo algo raro...



7
De: JJ Fecha: 2006-01-16 09:16

Hay una librería de Perl, no sé si la has visto, Webservice::Technorati. Está algo incompleta, pero supongo que no será difícil parchearla.
Aparte, usándola me daba un error, que no salía haciendo las llamadas a pelo... en fin.



8
De: Allan Psicobyte Fecha: 2006-01-16 12:19

Empecé usando una que hay para PHP (Si, lo sé, soy un traidor al Camello) que tenía también un bug bastante tonto (nombres de variables equivocados, supingo que en alguna actualización). Lo encontré e informé al autor, pero parece que está "discontiunada" desde agosto pasado. Al final, como veía cosas raras, me decidí a hacerlo yo mismo...

Pero el problema es que, haciendo las llamadas a pelo, me daba datos inconsistentes (Al solicitar el cosmos de una página, el número de resultados en cabecera no coincide con los resultado que da en realidad al paginar, si haces una petición sobre páginas superiores a las reales, te dá a veces resultados que no deberían aparecer, me dá una ultima actiualización de hace meses y, como tú dices, los resultados no me coinciden con los de la página).

Además, con lo pequeña que tengo la egonet, mejor desisto y la hago a mano con un boli, que es más rápido.



9
De: JJ Fecha: 2006-01-16 12:32

Puedes intentar hacerlo con blogsearch; el único problema es la paginación, y eliminar autoenlaces, pero siendo una sola, puedes hacerlo fácilmente.



10
De: FerN Fecha: 2006-01-16 16:09

O sea que no la haces porque tú pierdes posiciones ...

Pues bien hecho.

(al final he tenido que ser yo el que meta el dedo en la llaga)



11
De: lightme Fecha: 2006-01-16 16:20

Los 100 de Atalaya van a estar jodidos este año...

Ujuuuuuuuuuuuu jejejje, bueno pero y que importaba igual la lista es subjetiva, publicala pues :D



12
De: JJ Fecha: 2006-01-16 17:39

Si, la haré a voleo...
FerN: si hay que hacerla, se hace... pero hacerla por hacerla... ¿qué número cojo? ¿El del API? ¿El otro? No sé si perdería posiciones, supongo que si, porque estos jovenzuelos vienen con mucha fuerza... malditos, no respetan la edad, coff, coff....



13
De: Enigmas Express Fecha: 2006-01-16 18:01

Que broma!
Publica el de technorati como has venido haciéndolo para no perder la saga y sencillamente haces la advertencia de rigor. Y luego que cada quien haga los comentarios correspondientes y arreglamos las cosas en el camino. Pero tienes que publicar la lista ;)porque ha agarrado fama la cosa.
Saludos.



14
De: JJ Fecha: 2006-01-16 18:12

Hombre, si os ponéis así... es cuestión de tirar la araña, y sacar lo que salga. Los programas están ya hechos.



15
De: Vuarnet Fecha: 2006-01-16 18:24

A rajarse a su pueblo.. Ahora la publicas aunque sea al puro tanteo... ;)



16
De: JJ Fecha: 2006-01-16 18:26

Venga, va... Que si



17
De: Allan Psicobyte Fecha: 2006-01-17 13:59

Si este año me sacas entre los cien primeros, te invito a una cerveza.



18
De: JJ Fecha: 2006-01-17 14:02

Poca invitación es esa para un galardón de tanto prestigio y tradición.
Anda, pareado!



19
De: Allan Psicobyte Fecha: 2006-01-17 17:40

¡Cachis!

No, si el soborno no va en proporción al valor del galardon sobornable, si no a la capacidad sobornadora del aspirante a sobornador...



20
De: JJ Fecha: 2006-01-17 17:43

No me vale como respuesta, no rima.



21
De: Allan Psicobyte Fecha: 2006-01-17 17:59

JJ me comenta
negando con la cabeza
que mi soborno no acepta
por una simple cerveza.

Que mas vale el galardón
que una birra puñetera.
Y agrega por condición
que la cosa rime entera.

Yo respondo compungido
que soy pobre como rata,
que el premio así recibido
no es una cosa barata.

En copla y con decisión
le respondo (algo ofuscado)
que si es mala mi canción
peor es su pareado



22
De: JJ Fecha: 2006-01-17 18:26

:-D
Hasta en asonante y todo!



23
De: Anónima Fecha: 2006-01-17 18:31

:DDD



24
De: Anónima Fecha: 2006-01-17 18:34

Está más claro que el agua: en romance paladín, nada menos.



25
De: Allan Psicobyte Fecha: 2006-01-18 13:09

Jejejejje.

Y porque no me he querido meter en quintetos de arte mayor, que si no...



26
De: FerN Fecha: 2006-01-19 09:43

En consonante, JJ, consonante.

Publica la lista, me he quedado con la mosca detrás de la oreja. ¿Si te dejara mi colección de libros de poesía francesa del XIX, me pondrías en la lista?

Conste que si eso no cuela, voy a por el arte mayor!!



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia