Datamarts, la alternativa a los almacenes de datos
Informe de Forrester Research
Los almacenes de datos centralizados son presentados hoy en día como la solución definitiva para las corporaciones. En cambio, la consultora Forrester Research propone un modelo alternativo: los "datamarts", grupos de datos de gran flexibilidad que se adaptan a las necesidades específicas de cada departamento empresarial. Los datamarts facilitan el trabajo de los usuarios finales con la información corporativa y se adaptan mejor que los almacenes de datos al cambiante entorno empresarial.
Las grandes corporaciones invierten importantes cantidades de sus presupuestos en la búsqueda de la forma más efectiva y rentable de tratar, almacenar y recuperar sus datos. Los departamentos de sistemas de la información tienen ante sí varias posibilidades para conseguir estos objetivos. ¿Qué es lo que se debe hacer? Según la consultora Forrester Research, los DSI (Directores de Sistemas de la Información) deberían dejar de lado el modelo de data warehouse (almacenes de datos) y apostar fuerte por los "datamarts" (grupos de datos).
Entre los DSI se creía que los almacenes de datos globales y centralizados iban a ser la solución al problema de la información corporativa. Pues bien, según Forrester Research, la experiencia de estos últimos años ha demostrado lo erróneo de esta concepción.
Data warehouses: desvanes de datos
Los almacenes de datos centralizados con frecuencia se convierten en una especie de "desvanes de datos" ignorados a los que no accede el usuario final. Simplemente proporcionan grandes y costosos montones de datos homogeneizados sin clasificar, entre los que es sumamente complicado navegar.
Para Forrester Research, proporcionar accceso a la información corporativa no depende tanto de cómo se guardan los datos, sino de cómo se responde a los grandes problemas corporativos que afectan a los usuarios finales. El objetivo es que se pueda acceder a los datos de la forma más adecuada a los requerimientos particulares de cada usuario.
La solución que se presenta es la de los datamarts clasificados. Estos grupos de datos se adaptan a las necesidades específicas de los usuarios finales. Además, la flexibilidad es muy alta puesto que pueden ser modificados para acoplarse a las nuevas demandas corporativas.
Por otra parte, los DSI también deben crear otro tipo de datamarts en los que se almacene una amplia variedad de datos internos y externos. Los usuarios finales que acceden a estos grupos de datos necesitan tanto sumarios específicos como extractos con los detalles de todas las transacciones que se han realizado.
Según la consultora Forrester Research, para mantener a estos usuarios hambrientos de datos bien alimentados, los DSI deben desarrollar los datamarts en dos fases. En primer lugar, tienen que construir datamarts para ayudar a los usuarios finales a moverse en su propio entorno empresarial. Además, deben trabajar en estos datamarts para que respondan a los continuos cambios corporativos.
Desarrollar datamarts
La construcción de datamarts requiere, en primer lugar, trabajar en la infraestructura básica mediante el desarrollo de canales de datos y la instalación de filtros de conversión de datos que permitan a los usuarios finales acceder de forma eficaz a la información.
Este trabajo tiene que ser planificado y dirigido por los responsables de sistemas de la información de cada corporación. Uno de los puntos clave radica en la integración de la gran variedad de fuentes de datos que los usuarios finales demandan: bases de datos mainframes, servidores LAN, aplicaciones corporativas, datos desktop, Lotus Notes, etc. En la construcción de datamarts es conveniente seguir cuatro pasos, sin olvidar en ningún momento las necesidades del usuario final. Antes de desarrollar un datamart, los responsables de los sistemas de la información deben conocer a fondo las necesidades de los usuarios potenciales.
Cuando se ha cubierto este objetivo, es fundamental preparar los datos. Normalmente, estos se ocultan en almacenes diseñados para facilitar la actualización más que para dar soporte a la toma de decisiones. Los DSI deben extraer los datos fuente y transformarlos en los múltiples formatos que requieren los diversos grupos de usuarios finales.
Esta "reconstrucción" conduce al desarrollo de diferentes datamarts: unos estructurados para satisfacer el requerimiento de datos operacionales y otros "amorfos" destinados específicamente a los usuarios que necesitan explorar allí donde nadie ha accedido con anterioridad.
En tercer lugar, los DSI deben usar sistemas de replicación para mantener "al día" los contenidos de los datamarts. Por último, es fundamental dar al usuario final las herramientas adecuadas y la formación necesaria para poder acceder a estos datamarts.
Con estos cuatro pasos se pude dar por concluida la primera fase en la construcción de estos nuevos grupos de datos. Tras este proceso de implementación queda una segunda área de trabajo, que es fundamental para obtener el máximo rendimiento de los datamarts.
Soporte a la toma de decisiones
Con la primera fase sólo se consigue implementar modelos estáticos de flujos de datos y procesos de negocios que no reflejan la naturaleza dinámica del mundo real. Los DSI deben adaptar sus datamarts a un entorno empresarial que se encuentra en un continuo cambio. De ahí la necesidad de que sean flexibles, para poder adecuarse a la evolución de los sistemas de producción. Es responsabilidad de los deparamentos de informática mantener actualizados los datamarts e incluso crear nuevos grupos de datos que se adapten a las necesidades de la empresa.
Los DSI pueden usar tres tecnologías para conseguir esta adecuación de los datamarts a los procesos de negocio. En primer lugar, tienen a su disposición browsers que facilitan las vías de acceso a los datos que se buscan. Estas herramientas están basadas en información de diccionarios de producción de datos que simplifican la navegación del usuario final entre la información corporativa.
También es fundamental contar con buenos repositorios que faciliten los ciclos de desarrollo. Los datamarts serán una clave en la construcción de futuras aplicaciones, y los repositorios basados en tecnología CASE pueden ayudar a los DSI en este aspecto.
Por último, es conveniente crear registros globales que integren browsers y repositorios. Según los analistas de Forrester Research, dentro de dos años los DSI comenzarán a utilizar un nuevo tipo de repositorio que se podría denominar "registro de información global". Esta herramienta extiende un puente entre los sistemas operacionales y los datamarts mediante el uso de modelos de desarrollo que transforman automáticamente las peticiones de información de los usuarios finales en datos concretos.
Estas tres tecnologías ayudan al DSI a entender cómo funcionan los procesos de negocio. Además, facilitan a los responsables de sistemas de la información la actualización de los datamarts. También son útiles porque permiten seguir la pista de datos específicos y de su evolución dentro del entorno corporativo. Por último, permiten interpretar los datos correctamente en el contexto empresarial y según las necesidades de los usuarios finales.
Costes de implementación
Llegado este punto, cualquier DSI se preguntará cuáles son los costes de la implementación de este modelo de datamarts. La consultora Forrester Research realiza en su estudio un análisis de la inversión necesaria para construir datamarts.
El coste básico inicial se sitúa, según esta consultora, en unos 300.000 dólares. El desglose de gastos en licencias de software e implementación para un datamart basado en tecnología Informix para 25 usuarios sería el siguiente: 25.000 dólares en instrucciones de datos; 50.000 dólares en una base de datos servidor y 20