Calculando el método correcto
El análisis predictivo sirve de motor de decisiones empresariales
En primer lugar, se necesita una definición en base a la cual sea posible trabajar. El significado del término “análisis predictivo”, utilizado típicamente en el sector del marketing, continúa mutando de forma bastante rápida. Sin embargo, en esencia, es una frase equivalente a “minería de datos”, y podría definirse aproximadamente como “aplicaciones de aprendizaje automático y/o análisis estadístico para decisiones de negocio”.
En la mayoría de las aplicaciones, tanto actuales como de un futuro próximo, una decisión de negocios consiste en alguna forma de marketing para pequeños grupos. En el caso ideal, el grupo consiste en una sola persona, y el análisis predictivo se utiliza para realizar ofertas de marketing totalmente individualizadas.
Las cuestiones a las que intenta responder el análisis predictivo son las siguientes:
- ¿Cuáles de mis clientes es más probable que abandonen?
- ¿Qué tipos de ofertas persuadirán a mis clientes a permanecer o a clientes nuevos a comprar? ¿El precio? ¿Opciones de servicio?
- ¿Qué clientes potenciales serán probablemente más rentables?
Las respuestas a estas cuestiones quedan entonces reflejadas en opciones específicas en scripts de centros de atención de llamadas, en sub-listas de correo directo, en la personalización de sitios Web y en cosas similares.
Los datos utilizados para responder a esas cuestiones pueden proceder de una variedad de fuentes. Naturalmente, existen datos de transacciones que registran lo que han comprado los clientes, cuánto han gastado y cosas parecidas. También hay otros contactos con clientes, como los datos registrados en centros de atención de llamadas, mensajes de e-mail entrantes (la minería de datos de textos es un tema de máxima actualidad), y diversas formas de encuestas que hayan completado. Algunos sectores con programas de fidelización de clientes, como las líneas aéreas y los juegos, poseen enormes cantidades de datos susceptibles de minería. Lo mismo sucede con las compañías cuyos sitios web producen listas de accesos realizados a los mismos. Finalmente, pueden añadirse al conjunto combinado de datos de análisis enormes cantidades de datos procedentes de otras empresas terceras. En realidad, las oficinas de crédito mantienen más de 1.000 columnas de datos sobre consumidores, que pueden ser alquiladas por cualquiera que esté planificando una campaña de marketing.
La verdadera complejidad está en las técnicas matemáticas utilizadas para responder a estas cuestiones de predicción. Generalmente, el problema queda formalizado como un problema de clasificación o agrupamiento en “clusters”. Por ejemplo, dividir los clientes potenciales en dos clases: los que probablemente cometerán fraude y los que es probable que no lo hagan. O bien, dividir los clientes en no más de 10 grupos, alineados de acuerdo con el tipo de promoción de marketing a la que será más probable que respondan. Más exactamente, una “respuesta” es un algoritmo que asignará a cada cliente o cliente potencial a uno de una cantidad limitada de apartados o buckets. La evidencia utilizada para construir este algoritmo consiste en datos sobre clientes y clientes potenciales anteriores. Esa evidencia podría incluir información que indicase en qué apartado encajan mejor cada uno de esos diversos clientes.
Obtener esos algoritmos es difícil, y va más allá de los métodos estadísticos normales. Entre las técnicas utilizadas están las redes neuronales, una versión perfeccionada de las redes neuronales conocida como “máquinas de soporte-vector”, y cierta álgebra lineal bastante sofisticada. Rara vez resulta obvio al principio qué algoritmo es mejor para un problema específico, y el mejor consiste con frecuencia en una jerarquía de algoritmos elementales que en sí mismos resultan difíciles de comprender. Hay dos proveedores que afirman que están a punto de aparecer algoritmos válidos-para-todo, pero de momento es cuestionable. En consecuencia, los profesionales de estadística casi siempre participan desde el comienzo en el proceso de clasificación.
Las buenas noticias son que una vez que estos profesionales han puesto en práctica su magia producen una “caja negra” que funciona para una tarea de clasificación específica: los datos entran por un lado, y las calificaciones/agrupamientos salen por el otro. Los directores de marketing con capacidades matemáticas pueden utilizar esto para probar hipótesis, planificar campañas, y cosas similares. Estos sistemas se utilizan cada vez más de forma interativa para planificar e implementar una campaña rápida, observar los resultados, re-evaluar y re-calibrar las conclusiones, e intentarlo de nuevo. Y además funcionan lo suficientemente bien para ser utilizados en tiempo real con el fin de personalizar páginas web y scripts de centros de atención de llamadas.
La XI Conferencia Internacional ComputerWorld sobre Tecnologías de la Información se celebrará del 20 al 22 del próximo mes de junio en Calviá (Mallorca), bajo el lema “La Tecnología, un factor de convergencia”. La Conferencia, que cuenta con el patrocinio de EMC, Microsoft, Nortel Networks, Secuware y Unisys, se constituye en un foro de encuentro e intercambio de información para los principales directivos de Tecnologías de la Información de las mayores empresas y organismos públicos españoles y centra sus contenidos en los aspectos ligados a la gestión de las TI.