Data mining: beneficios tangibles

Del dato a la información

Se afirma con frecuencia que el data mining es el paso que sigue al proceso analítico online (OLAP), para consultar data warehouses. Sin embargo, en el data mining, en lugar de buscar relaciones conocidas -como por ejemplo una lista de todos los clientes de un catálogo que han cambiado de domicilio recientemente- se buscan relaciones desconocidas en los datos, como una relación previamente insospechada entre compras de productos para gourmets y propietarios de motocicletas.

Si se pregunta: ¿cuántos de estos productos vendimos en la primavera de 1996 y en la región de ventas A?, se trata de OLAP. Sin embargo, Si se dice: ¿Qué factores han impulsado a estas personas a comprar estos productos de mi catálogo?, se trata de data mining. Ahora bien, ¿es el data mining una técnica poco probada y con exceso de publicidad? ¿O está teniendo más éxito de lo que se reconoce generalmente y es silenciada porque podría ofrecer a los usuarios una ventaja competitiva?

La consultora Meta Group piensa que es algo de ambas cosas. Aunque el valor del data mining está probado, sigue siendo difícil de utilizar. El data mining es un arma profunda, oscura y secreta dentro de las empresas, que está proporcionando una ventaja competitiva tan importante que no quieren que el mundo sepa lo que están haciendo, pero las herramientas no son aún fáciles de utilizar para la mayoría de las empresas.

Microminas

En la mayoría de las empresas, el data mining tradicional basado en servidores sigue estando principalmente en manos de los profesionales informáticos, mientras que el data mining basado en clientes, en la que se analiza un subconjunto de un data warehouse, y cuya facilidad de uso suele comentarse favorablemente, es una cosa nueva y aún no se ha determinado su efectividad. Entre los principales proveedores de data mining están IBM, Pilot Software, Business Objects, SAS Institute y Cognos.

El data mining se está convirtiendo rápidamente en una necesidad, y quienes no lo adopten quedarán tirados en el camino. El data mining es una de las pocas actividades de software que lleva asociado un beneficio sobre la inversión constatable, y tanto el sector bancario como el de las ventas por catálogo están alcanzando actualmente en gran volumen esos beneficios.

Las compañías pueden practicar con mayor facilidad el data mining si han invertido previamente en un data warehouse, aunque podrían actuar sin uno si están dispuestas a recoger datos de varias fuentes de base de datos. De acuerdo con los útlimso datos ofrecidos por diferentes consultoras, el data mining está adquiriendo impulso, aunque no en todos los sectores del mercado; donde están encontrando valor muchos clientes es en desarrollar modelos del comportamiento de compras de los clientes. En particular, puede observarse una aceptación inicial del data mining en las áreas de seguros, financiera, de ventas al detalle y de las compañías telefónicas. Estos sectores tienen muchos clientes, productos y transacciones, y necesitan un sistema que les ayude a comprender el valor contenido en la información. Algo que en última instancia redundará en un significativo aumento en su cifra de negocio.

Comportamiento

Los bancos, por ejemplo, pueden utilizar el data mining para identificar los clientes más rentables para tarjetas de crédito, o cuáles son los solicitantes de préstamos de máximo riesgo. También pueden intentar evitar el fraude aplicando una técnica de data mining conocida como "detección de desviación": en lugar de encontrar las relaciones entre diferentes grupos de registros de datos, se localizan aquellos eventos que se apartan de las normas y que podrían ser indicativos de actividades fraudulentas.

Las compañías que realizan data mining para estudiar a sus clientes concentran generalmente su esfuerzo en la forma de conservarlos, distinguir los clientes rentables de los no rentables, detectar fraudes, vender nuevos productos a los clientes existentes, y comprender por qué algunos clientes dejan de serlo. Utilizando el data mining puede establecerse un modelo para determinar qué clientes producen mayores beneficios. Después, podrá realizarse un análisis OLAP más tradicional de ese subconjunto de datos con el objetivo de determinar cuál sería el impacto si se perdieran esos clientes, y cómo ello afectaría a la cuenta de resultados.

Ahora bien, ¿en qué medida es exacto el data mining? Cuando se trata de analizar datos es bastante preciso; sin embargo, cuando la herramienta tiene que realizar una predicción en base a ese conjunto de datos, aparecen problemas de exactitud.

En otras palabras, no hay garantía de que todos los consumidores de alimentos para gourmets deseen comprar motocicletas simplemente porque lo desearon así los del grupo de datos que se está manejando; también la frase de "si se introducen datos inútiles se obtienen datos inútiles" es aplicable al data mining.

El data mining desktop en un PC se enfrenta a los tres obstáculos principales que impiden una adopción más amplia del data mining: la idea que tienen los clientes de que es demasiado difícil, demasiado caro y conceptualmente difícil de comprender (y por lo tanto, difícil que crean en el los responsables de las decisiones de gestión). Por ejemplo, aunque un fabricante de automóviles dispone probablemente de una aplicación de data mining grande y basada en servidor, sus diversos distribuidores pueden necesitar data mining desktop para analizar los esquemas o tendencias de compra de sus propios clientes y, en consecuencia, esa minería desktop complementará más que sustituirá a el data mining basado en servidor y ofrecerá unos precios mucho más bajos para promover su adopción.

Datos limpios

En general, en el data mining tiene lugar un refinamiento u optimización de los datos, de forma que utiliza las mismas variables y busca después esquemas o tendencias en los datos utilizando modelos de software estadísticos. Según informes de usuarios, la preparación de los datos para la minería constituye frecuentemente un 80 por ciento del trabajo. Entre las diversas técnicas de data mining están las "redes neuronales" (programas que imitan la capacidad del cerebro para aprender de sus propios errores), "análisis de series de tiempo" (comparaciones de año-a-año) y "modelos basados en árbol" (sistemas de bifurcación que muestran relaciones en forma de una jerarquía, como el gráfico de una empresa u organización).

Aunque los bancos, servicios financieros y compañías de marketing directo han estado realizando algo similar a el data mining durante los últimos 15 a 20 años, muchos han tenido que recurrir a compañías de servicio de datos para obtener modelos estadísticos predictivos. Ahora, el nuevo software de data mining permite a esas empresas realizar el trabajo por sí mismas combinando técnicas estadísticas tradicionales con tecnologías del sector software, como las redes neuronales y los árboles de decisión.

Ejemplos de la utilización eficaz del data mining pueden encontrarse en muchas empresas. En el Mellon Bank, por ejemplo, se está utilizando el Intelligent Miner de IBM con servidores S/390 y RS/6000 y bases de datos DB2 para analizar hasta 10 Gigabytes de información sobre clientes del banco, con la intención de conservar a los más rentables. El banco intenta predecir, en base a datos históricos, qué clientes producirán beneficios en el futuro, y utiliza también el data mining para predecir qué clientes cambiarán probablemente de una tarjeta de crédito Mellon a la de otro banco, basándose para ello en tendencias históricas de utilización. El banco realiza un seguimiento de amplias categorías de compras por tarjeta de crédito, como por ejemplo si se han realizado en una tienda de comestibles, o en una estación de servicio.

Aunque bancos como el Mellon han estado utilizando modelos estadísticos durante

Whitepaper emc-cio-it-as-a-service-wp Whitepapers