Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

¿Cuántas bitácoras en español hay?

2005-08-11 09:50 No, venga, en serio, ¿cuántas hay?
Desde el millón de blogs que se supone que hay en MSN (y que es posible que haya, lo que ocurre es que la mayoría serán privadas; visto también en eCuaderno que entrevista a fernand0, el propio fernand0 planteándose si el blogómetro está obsoleto y Mangas Verdes), hasta las ciento y pico mil que hay en el blogómetro, cualquier otra estimación vale, por encima o por debajo.
Sin embargo, el millón no está comprobado por nadie más, y está claro que el blogómetro no tiene en cuenta muchas de las nuevas bitácoras que se crean, y algunas de las antiguas.
Así pues, ¿cuántas hay?
Vamos a hacer un experimento simple: buscar en un sitio de alojamiento de bitácoras (por ejemplo Blogspot alguna frase o palabra en español (por ejemplo zapatero presidente). Tomamos los URLs que encontremos, y lo comparamos con la base de datos del blogómetro, a ver cuántos se quedan fuera. Y lo repetimos para varias frases. Todo eso, claro está, usando el API de Google.
Todo esto nos dará una estimación, que forzosamente será un límite inferior, y que además, estará sobre muestreado en las bitácoras que ya están en el blogómetro (que serán las primeras que aparezcan en la búsqueda). Pero al menos, nos permitirá estimar al alza el número de bitácoras que hay, usando como base las que hay en el blogómetro.
Cortando el rollo, ahí está la lista de bitácoras halladas, y si están en el blogómetro o no. Aproximadamente el 37% de las bitácoras están. Puede oscilar arriba o abajo, pero, si acaso, habrá menos bitácoras. Si nos atenemos a lo que sale, y suponemos que el resto de las bitácoras está subrepresentada en el blogómetro de la misma forma, habría unas 270000 bitácoras en español.
Si somos un poco menos atrevidos, y simplemente proyectamos las bitácoras que tenemos en blogspot, habría unas 11000 bitácoras en español en blogspot, en vez de las cuatro mil y pico que figuran.
Sería cuestión de repetir sistemáticamente esto con los otros sitios de alojamiento: Xanga, Blogsome... pero en fin, yo creo que lo que queda más o menos claro es que, a ojo de buen cubero, sólo una proporción de las bitácoras españolas están representadas en el blogómetro, y esa proporción podría ser un tercio; por lo menos ahora ya tenemos algún dato que nos permita afirmar eso.
Ahora, ¿cuántas bitácoras activas hay? Eso tendrá que esperar a otro día.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/32241

1
De: Atalaya: desde la tela de araña Fecha: 2005-08-11 18:37

¿Cuántas bitácoras en español hay? II: «Vamos a hacer una segunda estimación (la primera la hice esta mañana). Tomemos una lista de bitácoras cualesquiera, por ejemplo, la lista de bitácoras en nedstat, y vamos a ver cuántas hay en el blogómetro. L»



2
De: Las penas del Agente Smith Fecha: 2005-08-11 19:55

¿Cuántas bitácoras hay en español?: « Pues la respuesta sigue siendo no lo sabemos, pero JJ hace unos cuantos números con Blogspot y el Blogómetro en Atalaya: desde la tela de araña - ¿Cuántas bitácoras en español hay?. Actualización: No había terminado de publicar el artículo casi cua»



Comentarios

1
De: Enrique Dans Fecha: 2005-08-11 10:29

A lo mejor si buscas otra frase... ;-)



2
De: JJ Fecha: 2005-08-11 10:57

He buscado varias: incendio Guadalajara, venganza de los sith, tonterias, cumpleaños. Se trata de buscar frases o combinaciones de frases que sólo se den en español; al final han salido unas doscientas y pico bitácoras, de las cuales sólo 100 estaban en el blogómetro.



3
De: Elías Fecha: 2005-08-11 11:33

Joder, la mía no está :( ¿Cómo tengo que darla de alta?



4
De: Elías Fecha: 2005-08-11 11:33

Por cierto, el Blogómetro no funciona sin las 'www' ¬_¬ por lo menos en mi Firefox...



5
De: JJ Fecha: 2005-08-11 11:39

Voy a corregirlo. Para darlo de alta, mail a fernand0.



6
De: SegFault Fecha: 2005-08-11 11:51

Vaya... me ha parecido muy interesante.

Respecto a MSN Spaces, creo que la única que puede dar datos (a parte de los ISP analizando el tráfico, pero dudo que sea legal :) ) es MSN, pero a ojo de buen cubero diría que hay un montón enorme. Gente que me rodea y que hasta ahora habían visto la web como algo read-only de repente están utilizando los MSN Spaces. Una compañera acaba de poner Internet en su casa para la hija, y lo primero que están haciendo es crearse un Space cada uno (privados, claro)... utilizando como datos el microcosmos que me rodea, me parece increible la capacidad de llamada que tiene MSN.

--
SegFault



7
De: JJ Fecha: 2005-08-11 11:57

Si, es cierto. Yo también he visto bastante gente que crea espacios de esos privados.
La cuestión sería si considerar a esos espacios parte de la "blogosfera". Por ser privados, supongo que forman pequeñas blogosferitas privadas, con un grado de separación sólo.



8
De: Times Fecha: 2005-08-11 12:47

Ya sabes lo que me agobio de ver tanta cosa junta. ¿no te parece que la RSS se podría mejorar bastante?. Yo sería mu felí si se pusieran más etiquetas personales, para describir a la persona, y en fin para todo. Etiquetas libres aunque puestas en un directorio para que no se repitieran. Yo sería: G=Male. Stat=Enable para mocitas. student etc etc. Si se introduce la etiqueta friki en el protocolo pues yo por ejemplo friki=8. Y luego una cosa que lo deben de sacar ya pardiez sobre el contenido, l=es, news=0, comentarios de noticias para arreglar el mundo=0, detalles sobre la vida cotidiana=0, relatos ci-fi=1, poesia=0, divagaciones sobre la naturaleza humana=8. Con 5 o pocas más mi blog está descrito y de ahí no voy a salir (por eso esto lo pongo en el tuyo jua jua). Poniendo lo que puede que se trate y lo que seguro que no se va a tratar se describe fácil. Si en el fondo muchos somos iguales. Esto seguro que se ha intentado otras veces pero yo además le ofrezco lo mismo pero pintado en rojo. Le vendo la idea y además por el mismo precio otra idea más de que hacer con esas visitas inesperadas del verano.



9
De: JJ Fecha: 2005-08-11 13:03

Creo que me he perdido, o no tiene mucho que ver con la historia. Pero bueno, lo que dices está, creo, en la última versión de RSS; lo de categorías y eso se puede meter.



10
De: Elías Fecha: 2005-08-11 13:18

Gracias JJ, ya está enviado el correo. Saludazos.



11
De: Times Fecha: 2005-08-11 17:46

Lo decía pq las RSS parecen un buen sitio para poner más información todavía, que se pueda usar para esas estadísticas que haces (y para mis paranoias ciberdemocráticas). Cuando se usen esas etiquetas estándar que dices será más fácil enviar información a sitios grandes independientes, como los pins estos que se hacen para decir que has actualizado tu blog.



12
De: JJ Fecha: 2005-08-11 17:53

Bueno, el RSS se usa para eso, precisamente; pero también se pueden usar las etiquetas de Technorati y las de del.icio.us, de una forma más colaborativa.



13
De: Times Fecha: 2005-08-11 18:02

Hay que vé lo que son las cosas. he leído mi primer comentario otra vez y parece que puse todo lo que estaba yo pensando para mis adentros y nada de lo que medio iba a cuento. Es chocante la cosa. A la de tres voy y me lo miro.



14
De: JJ Fecha: 2005-08-11 18:09

Don't worry, tío. Para eso son los comentarios.



15
De: FerN Fecha: 2005-08-11 18:55

La verdad es que dándole vueltas, se me ha ocurrido preguntarle a David Siffry, cuántas bitácoras tiene en español. Ahora que tiene la búsqueda por idiomas en beta, seguro que no le sería difícil darnos el número.
A ver si dice algo.



16
De: JJ Fecha: 2005-08-11 19:01

Venga, pregúntale. A ver qué se cuenta. Otra cosa es que nos cuente cómo identifica a las que están en español; esa es otra historia.



17
De: FerN Fecha: 2005-08-11 19:40

De todas formas, y aunque Siffry no lo diga, podría ser "relativamente" sencillo hacerlo por cuenta propia directamente buscando en Technorati expresiones en diferentes idiomas (como por ejemplo, hola, en cada idioma), y anotando los resultados.

Por ejemplo, hay 4M de posts sobre la búsqueda Hello, y de ellos, Technorati dice que 1,3M son en inglés.
Y con Hola, hay 262.000 posts, de los cuales dice que 153 son en español.

Lo haces con todos los idiomas (con los 20 principales, por ejemplo), y luego extrapolas los porcentajes para intentar estimar los idiomas de los 14,7 mill de blogs que dicen que tienen a día de hoy, y ya está.

Y con eso tenemos un número aproximado (+-20% error) del total de blogs en español que rastrea Technorati (que podría no ser ni el 50% del total de blogs en español).
Vamos una cifra MUY válida.

Jeje.



18
De: JJ Fecha: 2005-08-11 19:54

Es más o menos lo que estoy haciendo. Sólo que uso Google, en vez de technorati. Lo que me cuentas de hola me demuestra que el algoritmo que usa debe ser muy simplista: nombre de dominio, y poco más.
Pero en fin, vamos a intentarlo. A ver qué pasa.



19
De: JJ Fecha: 2005-08-11 19:58

Um, parece que no es tan simple: amiguetes devuelve casi las 2/3 partes en español (aunque yo creo que deberían ser todos...). Pero bueno, por lo menos da un límite inferior.



20
De: FerN Fecha: 2005-08-12 10:42

Sí, que esa búsqueda devuelva sólo 2/3 pone en cuestión su criterio.



21
De: JJ Fecha: 2005-08-12 10:55

De todas formas, si suponemos que technorati tiene la mayoría de las bitácoras en español, no sería difícil hacer búsquedas de enlaces, por ejemplo, y evaluar cada bitácora a ver si está en español o no.



22
De: Luis Fecha: 2005-08-12 18:01

Todo esto es interesantísimo, pero ¿cual es la conclusión? ¿cuantas bitácoras hay aproximadamente en español?



23
De: JJ Fecha: 2005-08-12 18:03

Jolines, pues lo dicho. Entre 250 y 300 mil.



24
De: fernand0 Fecha: 2005-08-14 00:11

blogspot está sub-representado y lo sabemos. Y muchos de los que nombras todavía más sub-representados. Pero blogia, acelblog, ya.com están perfectamente contados, porque los administradores colaboran con nosotros.



25
De: carsal Fecha: 2005-12-05 17:29

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa



Nombre
Correo-e
URL
Dirección IP: 23.20.166.68 (b21808c858)
Comentario

Se comenta en...

  • curso manipulador alimentos homologado en [libro #20] Trunk Music, de Michael Connelly
  • Google Adsense en 10 razones (o por ahí) por las que cada vez ganas menos dinero con AdSense
  • Jabon casero en [libro #14] Bad Monkey, de Carl Hiaasen
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Anónima en [Libro #11] Prisoners of Geography, de Tim Marshall
  • JJ en [Libro #3] A Christmas Carol, de Charles Dickens
  • PABLO PASCUAL LÓPEZ en [Libro #3] A Christmas Carol, de Charles Dickens
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Anónima en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia