El IAC y su apuesta por la virtualización
Desarrolla un proyecto conjunto de 'back-up' y archivado
Gracias a su incesante actividad investigadora desde 1961, el IAC ha participado en varias redes internacionales de investigación, además de participar en múltiples Proyectos Globales, tanto europeos como extracomunitarios. Este nivel de actividad exige al Instituto contar con una potente infraestructura tecnológica, capaz de soportar todos los procesos informáticos. En este sentido y desde el punto de vista del almacenamiento, el volumen de información es extraordinario y llegó un punto en el que el back-up de la misma comenzaba a ser un problema. Justo Luna, ingeniero del IAC, recuerda cómo “comenzamos hace tiempo con las librerías de cinta, que nos aportaban mucho nivel de almacenamiento pero que hacían que la gestión de las cintas resultara un tanto farragosa”. Fue entonces, indica, “cuando comenzamos buscar un sistema más eficiente”.
A principios de 2009, el Instituto fijó su mirada en las soluciones de Avamar para la creación de un entorno virtual y del software EMC Rainfinity para cubrir el área de archivado. En palabras de Luna, “se trataba de tener un menor gasto en el ámbito del back-up, pero que éste resultara al mismo tiempo más eficiente”. Tras evaluar ambas soluciones, el IAC terminó por adquirirlas en el último trimestre de 2009, consolidando la solución a lo largo de 2010. Veritas fue otra de las alternativas barajadas y aún se conserva para ciertos back-ups porque venía trabajándose con ello. Asimismo, Antonio Díaz, responsable de Sistemas y Comunicaciones, recuerda a “otro fabricante francés en las rondas de evaluación, que nos planteaba hacer un back-up remoto con sus máquinas”.
En el caso del archivado, la otra gran alternativa a Rainfinity fue Atempo. De hecho, Luna asegura que “el diseño de la solución era exactamente el mismo y al final nos movimos más por factores de costes”. Ni siquiera “se llegó a montar una maqueta con la solución para testear su rendimiento problemas de tiempo”, explica, “y nos fiamos de los datos que aportaba el propio fabricante”.
Fase de estudio
Francisco Orta, ingeniero del IAC, subraya la importancia que tuvo la fase de estudio en el global del proyecto. Según recuerda Orta, “en esta etapa avanzamos muchísimo hasta el punto de que antes de adquirir la solución por la que finalmente apostamos, ya habíamos diseñado el esquema de infraestructura que deseábamos”. Una vez decidida la apuesta por EMC se consultó este mismo esquema al fabricante de almacenamiento para que éste “comprobara que no existieran puntos negros que nos hubiéramos dejado en nuestro esquema”.
El responsable de Sistemas concluye que, “a pesar de que todos los diseños que se nos presentaron fueron más o menos similares, EMC era el que mejor encajaba con todo lo que teníamos”. En cuanto a las tecnologías de deduplicación, Díaz admite que “no conocíamos mucho y por ello apuntábamos hacia las librerías virtuales pero, dado el gran volumen de datos, no terminaba de compensar”.
Comprobar la capacidad de almacenamiento con la que arrancaron el proyecto –entre 60 y 70 TB– y ver la actual 120 TB da una idea clara, a pesar de aplicar intensivamente técnicas de virtualización, de las necesidades de almacenamiento del organismo. La implementación de las soluciones no supuso grandes complejidades para el equipo de Sistemas del IAC. Luna explica: “Comenzamos con una capacidad de máquinas virtuales de entre 7 y 8 TB con Avamar, para cubrir nuestras necesidades de archivado. Fue sencilla tanto su instalación como la realización de su correspondiente back-up”.
Virtualización imparable
El objetivo del IAC es renovar poco a poco toda la infraestructura y dar el salto definitivo a la virtualización, con especial atención a las tareas de back-up, sobre todo en lo que se refiere a imágenes completas virtuales. Hace cerca de dos años el IAC comenzó a trabajar con VMware, contando ya con 60 máquinas virtuales de un total de 150 servidores.
Díaz señala que la mecánica de migración viene marcada por las actualizaciones: “Cuando toda renovar hardware que se nos ha quedado obsoleto, lo virtualizamos”, ejecutando estas tareas con recursos propios, a pesar de que el grupo de Sistemas y Comunicaciones tan sólo se nutre de siete personas.
Los resultados obtenidos han sido muy satisfactorios, habiendo realizado ya pruebas de recuperaciones completas. En el caso de las recuperaciones de información, una ventaja del IAC es que no juega en su contra el factor tiempo. Según Díaz, “en el IAC el tiempo no juega un papel tan crítico”, por lo que velocidades de recuperación de 2/3 Gb por minuto son suficientes.
Desde el punto de vista de infraestructura, el grueso de ésta se basa en servidores Microsoft Windows, aunque cuentan con una pequeña parte que corre en Linux, principalmente Fedora y Red Hat. En cuanto al almacenamiento, las cabinas de disco EMC Clariion y los sistemas NAS EMC Celerra son los encargados de salvaguardar la información. Esto posibilita que ante una caída inesperada del sistema de archivados se pueda seguir teniendo acceso a los datos. Díaz explica que, además, “mantenemos una replicación en otra isla con archivado de EMC”.
Otro proyecto en el que se ha embarcado el IAC es en la implantación de SAP, sistema que también está virtualizando, estando ya el proyecto en producción.
El superordenador más occidental
------------------------------------------------
El superordenador LaPalma es uno de los siete nodos de la Red Española de Supercomputación (RES), que arrancó en 2008 con 512 procesadores para computación intensiva –256 servidores de dos vías–, sistema operativo Linux y una capacidad de procesamiento máxima de 4,5 teraflops, es decir, de 4,5 billones de operaciones por segundo.
Al estar ubicado en el Centro de Astronomía de La Palma (CALP), en Breña Baja, este superordenador se ha convertido en el más occidental de los nodos de la Red Española de Supercomputación, financiada por el Ministerio de Educación y Ciencia y coordinada desde el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC- CSN), donde opera el superordenador de IBM MareNostrum. En realidad, el nodo LaPalma es parte de los antiguos equipos de MareNostrum y cuenta con otros cuatro “nodos gemelos” en España. Los otros nodos de esta red están situados en el BSC-CNS, en la Universidad Politécnica de Madrid y en las universidades de Cantabria, Málaga, Valencia y Zaragoza. En cuanto a la administración del tiempo del cálculo y dado que el superordenador forma parte de una red, el IAC gestiona la quinta parte del tiempo.
Uno de los grandes hito