Atalaya: desde la tela de araña

Cultura en la red, reflexiones, relatos, tutoriales y paridas diversas

Envenenando los filtros

2005-08-23 09:02 El otro día hice una pequeña broma sobre los filtros anti-correo basura. De hecho, es al contrario. Los filtros antispam alcanzan un funcionamiento óptimo un poco después de comenzar a funcionar. Al cabo de cierto tiempo, salvo lo muy obvio, son capaces de filtrar cada vez menos mensajes.
Y es que algunos mensajes, aparte del fin obvio, que es engañar al ignorante, también incluyen ciertos términos para envenenar los filtros: o bien que incluyan en los filtros muchas palabras, de forma que esconden las "verdaderas", o bien simplemente que incrementen la cantidad de falsos positivos de tal forma que al final haya que desactivar el filtro.
La cuestión es que no es tan fácil decidir qué es spam o no; y sólo un humano, que tenga en cuenta el mensaje, todo su contexto, la historia y la conjunción de los planetas puede averiguar lo que realmente es un correo basura. A falta de eso, o por simple imposibilidad física, nos conformamos con los filtros bayesianos.
Pero una mejor solución, sobre todo en sitios de correo web tales como GMail o Yahoo, sería implementar un filtro social: por ejemplo, si se reciben 10000 emails, y pongamos 10 los marcan como spam, pues se marca como spam para todo el mundo. Por eso, no me explico como los filtros de correo de Yahoo pueden funcionar tan terriblemente mal. Los de GMail también están por lo que valen.

Referencias (TrackBacks)

URL de trackback de esta historia http://atalaya.blogalia.com//trackbacks/32442

Comentarios

1
De: Epaminondas Pantulis Fecha: 2005-08-23 09:22

¿Eso de "estar por lo que vale" es granaíno...?



2
De: JJ Fecha: 2005-08-23 09:30

No sé. Supongo que si. ¿No lo habías oido?



3
De: Epaminondas Pantulis Fecha: 2005-08-23 09:47

Bueno, sí, a mi familia política granaína.



4
De: enhiro Fecha: 2005-08-23 10:22

La expresión "estar por lo que vale" tambien la he oido por aquí, aunque no lo suficiente como para considerarla expresión de aquí. En cualquier caso, por el significado que se le suele dar, no entiendo la frase, porque me da a mí que es el contrario del que se quiere dar en el texto de JJ.

En cuanto a los filtros sociales, creo que Gmail usa ese sistema que comentas. Me explico, estoy suscrito a algunas listas donde inmediatamente después de que un miembro caiga en desgracia (normalmente por méritos propios) y muchos decidan filtrarlo o considerarlo SPAM, y supongo que muchos otros en la sombra decidan hacerlo tambien aunque no lo digan, los mensajes del individuo en cuestión empiezan a caer en la carpeta SPAM.



5
De: JJ Fecha: 2005-08-23 10:23

"está por lo que vale" viene a decir que no sirve para nada.
GMail puede que lo use, pero me sigue viniendo spam, y eso que es una dirección que no tengo publicada en casi ningún sitio. Me llega espám en turco, además.



6
De: enhiro Fecha: 2005-08-23 10:35

Efectivamente, era justo al contrario.



7
De: Cek Fecha: 2005-08-23 11:07

Al principio no se me colaba ni uno en GMail, pero ya entran como chinches. ¿habrán cambiado el filtro?



8
De: Anónima Fecha: 2005-08-23 13:12

He leido bastante sobre filtros sociales pero aplicados a ayudar a alguien a seleccionar algo, en vez de para evitar algo. Es un tema muy de moda entre las patentes de software americanas des de hace unos (pocos) años: intentan ayudar a elegir programas de TV por cable, libros, cualquier cosa en realidad. Por ejemplo en esta se trata de ayudar a elegir un servicio turístico desde el teléfono móvil. La recomendación llega basándose en los intereses comunes con otras personas relacionads con el usario y en las elecciones y valoraciones de esas personas. Todo se basa en manejo de bases de datos y en algoritmos para valorar las relaciones entre usuarios y la probabilidad de que un servicio sea el más adecuado para responder a las necesidades del usuario que hizo la consulta.

Así que ya se pueden andar con ojo los de Gmail para evitar que alguno de los titulares de estas patentes les demande si siguen la sugerencia de usar filtros sociales para el spam ;-)



9
De: lady_rushmore Fecha: 2005-08-23 13:40

Anda, jeje... pues yo tampoco había entendido la expresión "están por lo que valen". Inicialmente ---hará como un año--- yo me olvidé del spam en mi cuenta de Gmail; pasados unos meses, empezó poco a poco a aparecer, hasta llegar a dos o tres mails diarios. Sin embargo, de dos meses a esta parte, algo han debido hacer, porque de nuevo se ha reducido: a uno o dos a la semana, más o menos.

Qué cosas.



10
De: Yusef Fecha: 2005-08-23 15:41

Los filtros de Yahoo y Gmail no me parecen tan malos. Además, ambos utilizan filtrado social.

Su peor funcionamiento muchas veces está motivado por "comportamientos anómalos" en los usuarios. Por ejemplo, preferir marcar como spam mensajes de listas de correo o boletines de suscripción en vez de darse de baja. (lo que, por el mismo concepto de filtrado social, termina afectando a otros usuarios).

Por razones como ésta quizá los algoritmos deban ponderar de diferente forma que un usuario determine que "algo no es spam" frente a que "algo es spam".



11
De: JJ Fecha: 2005-08-23 16:17

Pues conmigo el de Yahoo no da ni una; el de GMail, más o menos. Por supuesto, que un filtrado más fino no estaría mal.



12
De: Netito Fecha: 2005-08-23 17:09

Tentgo entendido que el fltro de Hotmail (y creo que el de GMail) funciona precisamente así, tomando como spam lo que n usuarios marcan como tal.



13
De: JJ Fecha: 2005-08-23 17:22

Será entonces que nadie recibe spam turco como yo...



14
De: Jenri Txarriere Fecha: 2005-08-24 09:24

En la revista Computer de la IEEE Computer Society de hace un par de meses venía un artículo precisamente sobre esta idea que mencionas. Si te interesa y no consigues la referencia me avisas y lo miro porque tengo la revista en papel.



15
De: JJ Fecha: 2005-08-24 09:25

Gracias, ya lo busco; tenemos acceso online en la universidad.



16
De: JJ Fecha: 2005-08-24 09:43

Ya lo he encontrado. Gracias!



Se comenta en...

  • JJ en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • Anonima en [Libro #1] Harry Potter and the Cursed Child, de JK Rowling, John Tiffany y Jack Thorne
  • JJ en [Libro #29] El guardián invisible, de Dolores Redondo
  • Jorge en [Libro #29] El guardián invisible, de Dolores Redondo
  • JJ en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • rvr en [Libro #30] Code simplicity, de Max Kanat-Alexander
  • JJ en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • Palimp en [Libro #22] Fantasía, de Emilia Pardo Bazán
  • marta en [Libro #21] Birchwood, de John Banville
  • JJ en [Libro #10] The son, de Jo Nesbo
  • Sobre Atalaya

    Esta es la bitácora o blog de Juan Julián Merelo. Si quieres contactar con el autor, usa su correo electrónico jjmerelo (arroba) gmail.com, o simplemente deja un comentario. Y si quieres leer alguna cosa más de las que escribe, prueba esta novela

    Listas de deseos

    A veces leo

    Otras veces escribo en

    Blogalia Blogalia