2004-01-07 16:42
El
lenguaje XML (eXtensible Markup Language, lenguaje de etiquetas extensible) surgió en el año 1996, como un sustituto del HTML, aunque en realidad es muy parecido al SGML, que se estandarizó en 1986. Han pasado desde entonces unos siete años, y todavía su presunto predecesor sigue bastante pujante. ¿Qué es lo que ha pasado?
No es que el XML no se use, se usa a mogollón. Pero se usa sobre todo en el servidor, como formato de intercambio entre aplicaciones (lo usa, por ejemplo, AbiWord, OpenOffice, incluso el propio Word), para ficheros de configuración (la herramienta
Ant, que sirve para configurar la compilación e instalación de una aplicación en Java lo usa), y, por supuesto, como base del
XHTML, el actual estándar del HTML, que no todo el mundo respeta. También está por debajo de los móviles multimedia (usan el formato
SMIL), y, en fin, en múltiples sitios. De hecho, también está en el cliente; todos los navegadores lo entienden, pueden analizarlo para ver si es correcto o no, e incluso presentarlo, aplicando hojas CSS (que siguen la misma sintaxis que para el XHTML) y transformándolo usando hojas XSLT. ¿Porqué no se usa más?
Primero habría que plantearse porqué diablos habría de usarse. El XHTML tiene todo lo necesario para presentar páginas muy chanchipirulis, ¿no?. Hombre, pues sí, pero no. Los enlaces de XML, que están en el estándar
XLINK, son mucho más potentes que los pobreticos del XHTML. Se puede enlazar a fragmentos de un documento; se puede especificar lo que se hace con lo enlazado: incluirlo, saltar, o incluso ejecutar una aplicación antes de ir al enlace correspondiente.
Añadir metadatos es mucho más fácil también, o mezclar documentos de diferente procedencia. Por ejemplo, se podrían crear documentos XML que incluyeran RDF (para añadir metadatos), SVG (para gráficos vectoriales), y cosas como XBRL (XML Business Reporting Language, que está empezando a ser estándar para informes comerciales).
Y, en caso de que se use algún tipo de XML estándar, la indexación es mucho más fácil, porque se sabe cuál es el papel de cada elemento dentro del documento, e incluso su significado. E incluso se puede indexar por fragmentos, no solo documentos completos.
¿Cuál es, entonces, el problema?