La minería de datos "excava" en la información crítica

El sector financiero, pionero en su implantación

El postulado “la información es poder” tiene especial sentido si hablamos de Data Mining. Sin embargo, los datos por sí solos no aportan mucho si no están interrelacionados con otros, equiparados con factores exógenos o del pasado, es decir, si no se puede extraer conclusiones que resulten críticas para la toma de decisiones que mejoren el modelo de negocio de una compañía.

La minería de datos supone la exploración y análisis, ya sea a través de medios automáticos o semiautomáticos, de grandes cantidades de datos con el propósito de descubrir reglas y patrones significativos.
En realidad, este concepto surgió a principios de la década de los noventa como una combinación entre estadística, inteligencia artificial y tecnología de almacenamiento de datos. Según expone José Yáñez, director de desarrollo de negocio de SPSS Iberia, “surgió como respuesta al crecimiento de volúmenes de datos que se estaba experimentando. Las organizaciones reconocían que la cantidad de datos disponibles se multiplicaba año tras año, con lo cual necesitaban técnicas científicas avanzadas para descubrir los patrones ocultos en estos datos y así obtener mayor información relevante”. En definitiva, el progresivo incremento del volumen de datos generados y la necesidad de “sacarle partido” ha provocado que las técnicas de minería de datos hayan madurado a lo largo de los noventa y ahora estén disponibles en aplicaciones desarrolladas que proporcionan valor añadido a los usuarios de negocio en sus procesos de negocio, marketing, ventas o servicios, entre otros.
Convendría hacer una separación en cuanto a conceptos que pueden tener significados similares, pero que, según especifica Emilio Gondar, fundador de Data Mining Institute, “no son lo mismo”. Por un lado, hablamos de Data Mining que se refiere a la aplicación de algoritmos para la extracción de patrones utilizando los datos disponibles y por otro, destaca KDD (Knowledge Discovery in Databases), es decir, el descubrimiento de conocimiento en bases de datos, que responde a la extracción no trivial de información implícita, previamente desconocida y potencialmente útil. En resumen, “busca descubrir asociaciones notables, no reconocidas, entre ítems de datos en una base de datos existente”, en palabras de Gondar.
Una vez efectuadas las aclaraciones pertinente, vale la pena ahondar en una tecnología que aúna una serie de técnicas, cuyos resultados pueden repercutir de forma positiva en la toma de decisiones corporativas. Así, lo explica Yánez que subraya: “la finalidad de este proceso no es otro que desencadenar acciones de valor, ya sea en el ámbito empresarial como en el sector público”.

“Construir modelos” tiene ventajas
En primer lugar, hay que partir de la base de que la minería de datos es una herramienta explorativa, no explicativa, es decir, generar hipótesis que, sin embargo, deben ser refutadas y que no tienen porque ser aceptadas como explicaciones o relaciones causa-efecto.
Asimismo, las técnicas utilizadas se basan en el llamado “modelado”, es decir, en la construción de modelos en base a una situación en la que se conoce la respuesta a la hipótesis y luego se aplica a otra situación, en la cual se desconoce la respuesta. Gondar expone un ejemplo: “si se busca un galeón español hundido en los mares lo primero que se podría hacer es investigar otros tesoros españoles que ya fueron encontrados en el pasado. Así, se percibiría que esos barcos frecuentemente fueron encontrados fuera de las costas de Bermuda y que hay ciertas características respecto de las corrientes oceánicas y ciertas rutas que probablemente tomara el capitán del barco en esa época. En base a ello, se diseña un modelo que incluye dichas características comunes y, con un poco de esperanza, probablemente se encontrará el tesoro”.
En definitiva, Data Mining permite automatizar el proceso de encontrar información predecible en grandes bases de datos. Preguntas que tradicionalmente requerían un intenso análisis manual, ahora pueden ser contestadas directa y rápidamente desde los datos. Carlos de Pablos, responsable del área analítica de SAS coincide en este punto, añadiendo: “nos permite transformar crecientes cantidades de datos “brutos” en información estratégica, clave para identificar las áreas de mejora de la compañía y las oportunidades que ofrece el mercado”. Por su parte, Yánez incluye un factor añadido: “además de mejorar las cuentas de resultados, simultáneamente se adquiere una mejor comprensión y definición de las interacciones con los clientes a través de todos los canales”.

Cuando la privacidad entra en tela de juicio
Si bien hace no pocos años, la minería de datos aportó muchas promesas, su paulatino desarrollo ha generado la aparición de algunos elementos desincentivadores. Y es que a las dificultades propias que pueden surgir a la hora de diseñar patrones o modelos y a los problemas a la hora de resolver aspectos técnicos, hay que sumarle la reacción de algunos sectores ante lo que se puede considerar uso indiscriminados de datos personales, con el consiguiente riesgo para la privacidad que ello conlleva.
El responsable del desarrollo de negocio de SPSS estructura un orden de preferencias que influirá en el desarrollo mismo de la minería de datos. “Los requisitos fundamentales son dos: que las empresas perciban la necesidad de implantar estas tecnologías y que dispongan de una estrategia en torno al uso de las mismas. Superado éste, hay otras cuestiones como disponer de un modelo de datos adecuados, usuarios capacitados y una buena integración en los procesos operacionales del negocio, pero son de orden menor”.
En cuanto a las pautas a seguir, De Pablos considera que entre las principales claves para el éxito de una solución de data mining está contar con una concepción clara, por parte de los usuarios, del tipo de información que se va a generar y cómo ésta debe ser utilizada para maximizar sus resultados”. Asimismo, la solución ha de tener las funcionalidades y capacidades analíticas necesarias para la construcción de modelos de alta calidad orientados a la resolución de todo tipo de necesidades del negocio.
Finalmente, Gondar expone un futuro a medio plazo en el que “para que el data mining fructifique” será necesario “nuevas consultorías del data mining, nuevas empresas de data mining y nuevas ciencias del data mining”.

España, a metros de profundidad
De “compleja” califica Gondar la actual situación del data mining en nuestro país, mientras que Yánez considera que “el momento actual es de madurez del mercado”. Y es que las empresas conocen las posibilidades y límites de la minería de datos, gracias a la experiencia de los “precursores”. Si estudiamos los mercados en los que se ha dado una mayor implantación de herramientas y soluciones de minería de datos, podemos evidenciar que el sector financiero (banca, seguros y otros servicios financieros) ha sido pionero en la implantación de las técnicas más avanzadas, gracias también al impulso de algunas organizaciones, como la Fundación Cotec, que sigue sensibili

Whitepaper emc-cio-it-as-a-service-wp Whitepapers