¿Es XML el "idioma esperanto" de las TI?
Elimina el punto débil de HTML en el intercambio de datos en Internet
El dilema de las aplicaciones Internet se manifiesta en las aplicaciones más grandes que existen actualmente en el Web, es decir, los motores de búsqueda. Aunque éstos indexan el texto de documentos Internet, las marcas o “tags” del Hypertext Markup Language o HTML no permiten determinar el contexto apropiado del concepto o argumento de búsqueda en cuestión, de manera que se devuelven innumerables vínculos o “links” inutilizables. Esto se debe a que HTML únicamente describe el layout y no es posible utilizar, por ejemplo, una entrada o “tag” <Autor>Bill Clinton</Autor>, que describa explícitamente el contexto de la autoría. Esto se deber al repertorio de tags o “tag set” fijo de HTML y al direccionamiento o enfoque de la presentación en el navegador. La información que falta en los documentos HTML dificulta especialmente las aplicaciones B2B (business to business) en la Web pues es ahí donde están casi siempre los datos de los vendedores, estructurados en bases de datos, como los de un catálogo de productos.
En el recorrido a través de la Internet, estos datos se comprimen en estructuras HTML planas y exclusivamente orientadas a la distribución, que en el lado del receptor no pueden ser post-procesadas simplemente de manera automática. Dicho simplemente: HTML convierte datos estructurados a píxeles, lo cual desde el punto de vista de las aplicaciones da lugar a problemas elementales de integración.
Por otra parte, en los sistemas de proceso de datos clásicos, las estructuras de datos y las aplicaciones se representan de manera exacta, con lo que se dificulta la integración de documentos, hiper-vínculos y elementos multimedia en las aplicaciones. Cualquiera que haya intentado acoplar aplicaciones a un sistema groupware orientado a documentos habrá conocido estas difíciles experiencias. Además, para un sistema de gestión del conocimiento es elemental poder integrar o vincular dentro de un interfaz de aplicación o API unificado y común diversas fuentes de información como bases de datos, gestión de documentos e Internet. Aquí falta la flexibilidad de las tecnologías web, que han tenido su origen en el intercambio de documentos.
El carácter abierto como característica fundamental
El objetivo de XML es eliminar los extremos o diferencias entre datos estructurados (residentes en el back-end) y datos no estructurados situados en documentos HTML (en la Web). XML no distingue entre documentos y datos. Los documentos son datos con una estructura específica. Este carácter abierto es una de las características fundamentales de XML. Este lenguaje describe mediante el mismo mecanismo un documento de proceso de texto, una página web, una entrada de base de datos o un registro de datos EDI.
La característica más importante de XML es que el contenido, la estructura y la presentación están separados. Y aunque esta separación explícita podría parecer algo nuevo a los grupos y organizaciones que utilizan la Internet, en el proceso de datos clásico las estructuras a tres niveles, o concepto controlador de modo visión, son conocidas ya desde hace tiempo en la programación orientada a objetos, lo cual demuestra que la idea o concepto de XML rebasa el ámbito de la Internet. A causa de los problemas de HTML arriba descritos y con el fin de hacer frente a la incompatibilidad creciente entre los navegadores, la organización World Wide Web Consortium (W3C) definió en Febrero de 1998 el estándar XML (Extensible Markup Language). Aunque XML suele ser relacionado frecuentemente con la Internet, sus raíces se extienden a muchas áreas del proceso de la información y del proceso de documentos, lo cual demuestra que es una tecnología de integración que va más allá de la propia Internet. Así, encuentra aplicación en las áreas de edición o autoedición (SGML, TeX, propuestas de formatos), modelización de datos (Diagramas ER), intercambio de datos entre empresas (EDI), tecnologías de objetos (Concepto Model-View-Controller, Business Objects), Bases de Datos (Views) o aplicaciones cliente-servidor.
Esta gran variedad de aplicaciones resulta ventajosa, ya que es posible enseñar fácilmente la tecnología XML a los empleados de esas diversas áreas, reduciendo así el esfuerzo de formación en la organización TI.
Por otra parte, aunque XML no aporta muchas cosas totalmente nuevas desde el punto de vista conceptual, su ventaja está en la capacidad de agrupar lo mejor de múltiples tecnologías de eficacia demostrada. Esto es similar a lo que sucede con Java, que también agrupa múltiples conceptos diferentes. Además, XML está siendo ya integrado en diversos productos. Por ejemplo, el Resource Definition Format se utiliza en el navegador Netscape, y el Channel Definition Format en el Internet Explorer de Microsoft, mientras que el Synchronized Media Integration Language (SMIL) es utilizado en el Streaming Player de Real Networks.
Además de los documentos web, el espectro de utilización de XML abarca también la integración de aplicaciones a nivel de empresa, el comercio electrónico y la gestión de información estructurada. XML se convertirá de esta forma en el formato de datos universal tanto dentro de las empresas como entre empresas, como una suerte de idioma esperanto o universal del sector informático. Muchos grandes fabricantes de productos informáticos están enfocando ya sus productos a XML. Entre ellos, el líder en ofrecer un amplio apoyo a XML es Microsoft.
Preparado para la guerra de los navegadores
Una cuestión que se plantea es si XML puede ser instalado en las empresas incluso cuando no todos los usuarios tienen navegadores con capacidad XML. La solución aquí es el Server Side XML. En este caso, los datos XML son convertidos ya a documentos HTML y transferidos al navegador. Esto resulta conveniente para todas las aplicaciones que van a ser instaladas originalmente en la Internet.
Afortunadamente, la práctica demuestra que los sistemas antiguos o “legacy systems” ya existentes en el lado del servidor tienen establecidas ya estructuras de datos muy claramente definidas, por lo que la migración a XML resulta muy fácil en ese caso.
La guerra de los navegadores, la colocación de tags específicos de fabricante en los navegadores de Microsoft y de Netscape, ha dado lugar a grandes problemas de incompatibilidad en el desarrollo de aplicaciones en la Internet. El requisito “escribe una vez y pruébalo donde sea” que se ha hecho necesario como consecuencia de ello no es una metodología de desarrollo adecuada para el futuro. Los tags XML, por el contrario, definen siempre un determinado dialecto de aplicación. Afortunadamente, existen ya muchos trabajos preliminares en el desarrollo de aplicaciones comerciales, en especial a través de EDI, donde ya se han definido dialectos sectoriales estandarizados para el intercambio electrónico de datos, que deberán ser también trasladados a XML.
Al mismo tiempo, existe una g