Data Warehouse
Una apuesta de futuro obligada
Las empresas y organizaciones se encuentran bajo una enorme presión para ofrecer una información de mejor calidad en apoyo de la toma de decisiones, en formas que resulte fácil el acceso y manipulación de la misma. Los usuarios comerciales están reaccionando a sus propias necesidades críticas de mejor información, debido a que los mercados cambian cada vez más rápidamente, y son cada vez más volátiles y competitivos, mientras que los ciclos de vida de los productos son cada vez más cortos.
Un estudio realizado en 1994 por la consultora Meta Group entre directores de Sistemas de Información de las principales empresas del mundo indicó que más de un 90% de ellas tenían previsto implementar almacenes de datos entre 1994 y 1996. Como consecuencia de la disminución de los presupuestos de informática en un gran número de empresas, el impulso para implementar un almacén de datos procede en muchos casos de la Dirección de línea-de-negocio, que están patrocinando estos sistemas de soporte de decisiones de nueva generación, o bien de los departamentos de informática que piensan que la inversión ofrecerá beneficios demostrables a corto plazo. Meta Group considera que se trata de ambas cosas.
¿Por qué la tendencia a los almacenes de datos o data warehouses es una de las de mayor actualidad del sector? Dicho simplemente, las empresas deben hacerse más competitivas y acercarse más a sus clientes, para sobrevivir. Desafortunadamente, muchos de los datos mantenidos por las empresas sobre sus clientes están bloqueados en "cárceles" de datos; es decir, bases de datos que han evolucionado como subsistemas independientes. Estas bases de datos son incapaces de ofrecer a la empresa una visión consolidada de quién es el cliente, o incluso de qué productos y servicios están inter-relacionados en la base de clientes.
El almacén de datos es una mezcla de tecnologías, incluyendo análisis relacional y multidimensional, arquitectura cliente /servidor, interfaces gráficos de usuario (GUIs), potente modelización de meta-datos, y otras cosas. Estas tecnologías se combinan entre sí para permitir la integración de múltiples bases de datos operacionales, formando una única base de datos diseñada específicamente para proceso analítico, como por ejemplo el soporte de decisiones. La "base-de-datos-orientada-a-temas-específicos" resultante está diseñada pensando en el acceso a la misma por parte del usuario final.
El valor comercial de los almacenes de datos puede resumirse como sigue:
- Menor coste en la toma de decisiones. La eliminación de personal y recursos informáticos necesarios para soportar consultas e informes ad hoc utilizando bases de datos operacionales/de producción ofrece ahorros significativos. Esto elimina también el que se conoce como factor de "succionamiento de MIPs" al ejecutar consultas de datos largas y complejas con bases de datos diseñadas específicamente para transacciones cortas y sencillas. Además, se obtiene el beneficio de disponer de un análisis de rentabilidad, al poder correlacionar combinaciones de productos y servicios con iniciativas de mercado y bases de datos demográficas comerciales online externas.
- Mejor inteligencia comercial. Se obtiene una mejor calidad y flexibilidad del análisis de mercado, como consecuencia de las múltiples estructuras de datos, que pueden ir desde el nivel de detalle, pasando por el nivel transaccional, hasta el resumen de alto nivel. Esto permite pasar por alto las bases de datos específicas de aplicación, que promueven la desconfianza a causa de sus versiones diferentes de la verdad. La capacidad de determinar "cuántos" de "qué productos" se venden realmente a una dirección de comprador específica, es de importancia clave para identificar oportunidades que surgen en múltiples mercados.
- Mejor servicio al cliente. Cuando toda la información está relacionada entre sí a través de un único almacén de datos, puede establecerse una relación total con el cliente.
- Mejor gestión de activos /obligaciones. Los agentes de compra y otros directores financieros se beneficiarían en gran medida si pudieran obtener una imagen global de los esquemas y tendencias de compras e inventario a nivel de toda la empresa. Al hacerlo así, los directores financieros descubren con frecuencia la posibilidad de ahorros en costes ocultos en inventario redundante, así como oportunidades para descuentos en volumen previamente desconocidas.
- Reingeniería de procesos comerciales. Ofrecer a los usuarios comerciales un análisis ilimitado de su información comercial permite con frecuencia obtener una visión en profundidad de los procesos comerciales propiamente dichos, lo que a su vez permite obtener ideas renovadoras para la reingeniería de esos procesos comerciales.
- Alineamiento con objetivos de downsizing en la empresa. La capacidad de decisiones distribuidas es cada vez más necesaria para el rightsizing en las empresas, al distribuirse cada vez más la responsabilidad en la toma de decisiones como consecuencia de la reestructuración organizacional.
Los analistas del Meta Group consideran que durante 1996 la mayoría de las empresas realizarán la reingeniería de los sistemas mediante arquitecturas e iniciativas de almacenes de datos, en combinación con bases de datos relacionales y proceso analítico multidimensional online. Tanto si lo que ofrecen es una visión en profundidad de la actividad de marketing, oportunidades para ahorros en los costes o descuentos en volumen, los almacenes de datos suministran un componente que es cada vez más crítico para soportar el ritmo de la competencia comercial.
Los componentes de un data warehouse
Los usuarios finales necesitan actualmente poder acceder con facilidad y analizar los datos de la empresa, para poder adoptar las necesarias decisiones comerciales. Un método que está ganando una aceptación creciente con este fin consiste en utilizar un sistema de data warehouse en el que los usuarios comerciales tienen acceso a una base de datos informacional integrada que actúa como dicho almacén. Este sistema de almacenamiento de datos se crea extrayendo e integrando datos de sistemas operacionales existentes, así como de proveedores de información externos.
Para tener éxito, un sistema de almacenamiento de datos debe ser fácil de establecer, gestionar y utilizar. Es importante por lo tanto comprender sus objetivos, requerimientos y necesidades, y determinar en qué medida los productos de los vendedores satisfacen las necesidades de los diseñadores, administradores y usuarios comerciales del almacén de datos.
Los componentes clave de un sistema de almacenamiento de datos son los siguientes:
- Componente de definición, para definir y establecer el entorno de almacén de datos.
- Componente de adquisición de datos, para copiar datos de ficheros y bases de datos fuente a bases de datos de data warehouse.
- Componente de gestión, para administrar las operaciones del data warehouse.
- Componente de distribución de datos, exporta datos de data warehouse a sistemas externos.
- Componente de directorio de información, para suministrar información sobre los datos almacenados en bases de datos de data warehouse.
- Componente SGBD, para gestionar, mantener y acceder a los datos del data warehouse.
- Componente de acceso y análisis de datos, para suministrar a los usuarios finales comerciales las herramientas que necesitan para acceder al data warehouse y analizar los datos.
Componente de definición
El componente de definición es utilizado por los diseñadores y administradores de bases de datos para: a) diseñar y definir las bases de datos del data warehouse; b) definir las fuentes de datos de las que serán obtenidos los datos del data warehouse; y c) especificar las reglas que definen la clarificación y mejora de d