Superordenadores: de los procesos de I+D a la cuenta de pérdidas y ganancias

Los ordenadores de alto rendimiento no son sólo para trabajos triviales, como crear modelos del Universo. Hoy se están utilizando en tareas importantes, como analizar riesgos en hipotecas o fraudes en el uso de tarjetas de crédito.

Últimamente, la utilización de los superordenadores se está extendiendo a los áreas más inesperadas, como el análisis de riesgos en los préstamos bancarios, deteccción de posible fraudes en tarjetas de crédito o realización de cómputos intensivos para localizar fallos en unidades de discos.
Aunque los científicos que trabajan en el Centro de Cálculo de Alto Rendimiento ARSC (Artic Region Supercomputing Center), en las afueras de Fairbanks, Alaska, emplean la mayor parte de su tiempo creando modelos de los cambios climáticos a nivel mundial, cuando un maestro local quiso ofrecer a sus alumnos una visión de cerca de los hábitos migratorios de los lobos de la región, el centro ARSC cedió algunos de los ciclos de cálculo de su ordenador Cray para recoger datos de telemetría de un collar instalado en el lobo jefe de la manada. Después visualizó los datos para ofrecer a los alumnos una mejor idea de las grandes distancias que recorren los lobos durante el año.
El Cálculo de Alto Rendimiento o HPC (High Performance Computing) ya no está destinado exclusivamente a los científicos. En realidad, la opinión predominante hoy es que el desarrollo del Cálculo de Alto Rendimiento está siendo promovido más por las cuenta de Pérdidas y Ganancias en las empresas que por determinadas teorías e investigaciones de alto nivel. Esto se debe a que algunas tecnologías clave desarrolladas para sistemas HPC, en particular la “minería de datos” y la visualización de datos, aportan una ventaja competitiva a las compañías.
Según la empresa de investigaciones de mercado Smaby Group, en 1998 se invirtieron 3.100 millones de dólares en superordenadores para realizar aplicaciones científicas y de tecnología, mientras que las aplicaciones comerciales ascendieron a 6.600 millones de dólares. La firma analista pronostica asimismo que para el año 2002 la porción científica y técnica descenderá a aproximadamente una cuarta parte del total de ese mercado.
En la práctica la minería de datos es utilizada por compañías que basan su negocio en actividades muy diferentes. Por ejemplo, las empresas financieras utilizan la minería de datos para analizar el número de hipotecas pendientes, almacenando gran cantidad de Gbytes sobre bases de datos residentes en superordenadores, lo que les permite posteriormente crear diferentes modelos de pago para cada hipoteca individual, permitiendo que sea más fácil pronosticar cuándo una determinada persona pagará su préstamo, poniendo fin así a los pagos de intereses. Antes de la llegada de los sistemas HPC y de la minería de datos, el tamaño de los datos que manejan este tipo de organizaciones había sido prohibitivo, sin embrago, ahora la tecnología permite tomar en consideración a cada persona.
Otra ejemplo de las bondades de la minería de datos es su aplicación en multinacionales fabricantes de unidades de discos, que pueden llegar a producir hasta 100.000 unidades al día. Para cada unidad, se registran 1.000 piezas de información individuales. Estos datos se almacenan durante tres a cinco años, dependiendo de la garantía de la unidad en cuestión. En el pasado estas compañía analizaban las tendencias históricas de los beneficios de las unidades de discos con el fin de predecir las tasas de fallo. Esa información sería utilizada para producir las unidades adicionales necesarias en base a la previsión de ventas, para cubrir así las unidades “fallidas” devueltas a la compañía. Ahora, por el contrario, podemos plantear consultas y preguntas más inteligentes sobre los datos, como por ejemplo a dónde se envían los productos, para determinar si un aumento o disminución de la humedad afecta a las tasas de fallo. También es posible realizar análisis a niveles muy detallados y visualizar rápidamente de dónde proceden las unidades fallidas, qué línea de producción las fabricó o quién las probó.

Más variables
Un beneficio colateral de utilizar la minería de datos para reducir la cantidad de unidades de discos devueltas es la posibilidad de medir la precisión del operador del centro de llamadas para los diversos productos devueltos. Así se ha descubierto que las conocidas como unidades “muertas”, que se devolvían con frecuencia, funcionaban perfectamente y resultó que el problema estaba en que el personal del centro de servicio al cliente evaluaba incorrectamente el problema, aumentando innecesariamente los gastos y lo que es peor, no arreglando el sistema del usuario. Utilizando minería de datos se puede ahora determinar qué operadores de centro de llamadas necesitan recibir más formación. Además, esta tecnología ha contribuido a diseñar programas de bonificación a los empleados de los centros de llamadas que alcanzan altas tasas de precisión para la cantidad típica de llamadas.
Un experto profesor en minería de datos, ha observado en numerosas ocasiones cómo las aplicaciones comerciales de la minería de datos funcionan correctamente. Por ejemplo, puede ser una herramienta muy útil para detectar fraudes en tarjetas de crédito. Esta tecnología ha producido grandes ventajas y beneficios a compañías como Visa International y American Express.
Sin embargo, en el comercio electrónico, en el que se recogen muchos más datos en cada transacción de tarjeta de crédito, la introducción de la minería de datos ha tardado en adquirir importancia. Una de las cosas que hace posible que se detecten los fraudes es la abundancia de nuevas herramientas de visualización de datos utilizadas en la minería aplicada a enormes cantidades de datos almacenados.
La minería de datos se enfrenta a numerosos retos y uno de los más importantes es la facilidad de uso. No obstante, lo que realmente preocupa a los expertos es el exceso de facilidad de uso, más que la falta de ella. Los especialistas en estadística no quieren hacerla más fácil, porque ello iría en contra de la doctrina establecida, aseguran. Pero también se corre el riesgo de que personas poco informadas hagan cosas absurdas con los datos, como correlacionar ataques al corazón con las posiciones de las estrellas.

Superservidores Web
El comercio electrónico depende de los superordenadores, aunque sólo sea por la enorme potencia que estos ofrecen. Es habitual que las compañías utilicen hasta 2.000 sistemas IBM RS/6000 SP, pero sólo para manejar su software de servidores Netscape, ya que estos sistemas basados en Unix son adecuados para manejar millones de peticiones HTTP relativamente sencillas. Sin embargo, todas las transacciones de acciones y valores continúan realizándose en sus mainframes back-end IBM S/390.
Con pocas excepciones, el proceso de Cálculo de Alto Rendimiento  o HPC (High Performance Computing) no ha encontrado utilización en el lado del comercio electrónico correspondiente a las transacciones. Uno de los motivos de esto es que las aplicaciones de alto rendimiento requieren herramientas y conocimientos de programación especializados para poder aprovechar las capac

Whitepaper emc-cio-it-as-a-service-wp Whitepapers