2006-07-02 17:24
La Fuerza Aérea Americana (cuál si no) va a invertir en un proyecto de investigación que usa minería de datos y ontologías para extraer información creible de weblogs (via
Boing Boing). Al fin y al cabo, qué es la verdad sino estadística, y qué mejor forma que buscarla que machacando cantidades masivas de información para encontrarla. Previo pago de 450000 machacantes a una empresa privada.
El científico jefe de esa empresa es Brian Ulicny, que tiene, por ejemplo,
este trabajo sobre descubrimiento de metadatos en recuperación de información y
este error de búsqueda en la base de datos de la ACM como trabajo adicional (¿estarán eliminando ya todo rastro de su trabajo?). Lo que no me dice gran cosa, y mucho menos las declaraciones de los autores en el artículo: la siguiente:
Blog entries have a different structure,” Ulicny said. “They are typically short and are about something external to the blog posting itself , such as a news event. It’s not uncommon for a blogger to simply state, ‘I can’t believe this happened,’ and then link to a news story.”
Es de una obviedad que me hace dudar sobre el acierto de los señores de la Fuerza Aérea en conceder tal cantidad de pasta, o bien sobre su voluntad de contar realmente de qué va el tema.
Al final, a uno le queda la idea de que lo que quieren hacer es algo parecido al
algoritmo de Kleinberg de detección de interés sobre un tema determinado, es decir, usar referencias en blogs para establecer el grado de certeza de determinadas noticias, combinándolo quizás con análisis léxico y ontologías para asignar ese grado de certeza.
En fin, una investigación interesante, al final. Esperemos que con el tiempo dé resultados, y que los publiquen, aunque esto último lo dudo, sinceramente.