El CIPF confía en la bioinformática para sus investigaciones médicas

El centro está convirtiéndose en una referencia en bioinformática a nivel internacional

El Centro de Investigación Príncipe Felipe (CIPF) desarrolla su labor de investigación en el campo de la biología, prestando especial atención al estudio del genoma humano y orientando sus descubrimientos hacia la medicina regenerativa. Esta institución asienta los pilares de sus investigaciones en la bioinformática, que se ha convertido en una línea de investigación científica más. Los responsables del centro han confiado en SGI e IBM para resolver sus grandes necesidades de capacidad de almacenamiento y potencia de cálculo.

El Centro de Investigación Príncipe Felipe (CIPF), adscrito a la Fundación Valenciana de Investigaciones Biomédicas, es la mayor apuesta de la Generalitat Valenciana en los campos de la investigación biomédica, la medicina regenerativa y genómica. El centro nace en 2005 con dos objetivos principales: identificar nuevas dianas moleculares, es decir, partes de la célula capaces de reconocer un fármaco y reaccionar ante él; y sintetizar medicamentos que actúen frente a estas dianas.
Para alcanzar sus objetivos, el CIPF requiere hacer un uso computacional intensivo de modo que pueda analizar los datos genómicos y diseñar fármacos. La aplicación de la computación a los problemas biológicos (la actividad de los investigadores del CIPF) se denomina bioinformática. Una disciplina que los académicos están empezando a considerar una ciencia por sí misma y que cuenta entre sus logros la secuenciación del genoma humano. “Cualquier institución que trabaje en biomedicina actualmente tiene una dependencia crítica de la bioinformática –considera Joaquín Dopazo, director del departamento de bioinformática del CIPF–. Si esto no es así, muy probablemente se deba a que el tipo de investigación que realiza es obsoleto”. Para el responsable, la época de los clásicos cuadernos de laboratorio queda lejos: “La información de la que dispone el investigador se ha hecho muchísimo más compleja e infinitamente más abundante, por lo que cada vez son más necesarios equipos potentes para analizar datos y diseñar experimentos”.

Cálculo y almacenamiento
Junto a las necesidades de proceso, existen otras relativas al almacenamiento de datos. En este sentido, las metodologías de alto rendimiento que se utilizan (secuenciación, microarrays de ADN, análisis genético a gran escala) generan enormes volúmenes de datos a los que es necesario acceder con rapidez, fiabilidad y seguridad. Por ejemplo, obtener un mapa del ADN de un ser vivo involucra la fragmentación de todo el genoma en pequeños pedazos, que son analizados a través de láser. Después hay que reconstruir, por ordenador, el orden original del código genético. Esto es lo que se denomina secuenciación del ADN. Por otro lado, los microarrays o biochips, empleados para analizar comparativa y simultáneamente cómo se expresan cientos de genes en un sólo experimento, consisten en unas matrices de pequeño tamaño (de ahí microarrays) sobre las que se aplican minúsculas gotas de material genético. Tanto la aplicación de los genes sobre la matriz, como el análisis de las reacciones que se producen, se realizan mediante ordenador.
Por tanto, se requieren enormes tasas de memoria disponible en los discos duros y de capacidad de proceso para manejar los datos que producen los dos procesos descritos. Actualmente, el Centro Príncipe Felipe soluciona sus necesidades de almacenamiento con diez procesadores Itanium, provistos por SGI. Este equipo alberga la red SAN, donde residen las bases de datos y sus correspondientes motores y cuenta con una capacidad de almacenamiento total de 8 TB. Por otro lado, el equipo de cálculo es un cluster con CPUs AMD Opteron de 264 bits conectado a la red SAN.
“En el caso del sistema de almacenamiento no buscamos otro proveedor. Nuestra experiencia anterior con SGI había sido muy positiva y no había muchas soluciones alternativas”, explica Dopazo. Para el cálculo, según el responsable, sí se exploró la posibilidad de usar clónicos, “pero las diferencias de precio no eran significativas y la garantía de IBM nos convencía más”.
La arquitectura de 64 bits de los AMD Opteron, nueva en el momento de su adquisición, constituyó uno de los principales desafíos tecnológicos que el CIPF ha tenido que afrontar en su corta andadura. “Su instalación en una configuración en cluster como la que montamos nos causó problemas que ni siquiera el proveedor pudo solucionarnos. Finalmente, conseguimos resolverlos por nuestra cuenta”, detalla Dopazo. Posteriormente, ha surgido algún problema menor con la estabilidad de los sistemas de ficheros que se ha solucionado de forma interna.

Desarrollos propios
Los trabajadores del centro emplean los ordenadores para analizar datos en los programas desarrollados por el departamento de bioinformática que dirige Dopazo. Estos programas utilizan interfaces web para facilitar su trabajo con ellos a los usuarios finales. “Somos un grupo conocido a nivel internacional en el desarrollo de nuevas aplicaciones en el campo de la genómica funcional”, mantiene Dopazo, quien explica que la apuesta del CIPF por las TIC se enmarca dentro de una estrategia para obtener visibilidad a nivel global, algo que, según dice, ya han conseguido. “Nuestras herramientas bioinformáticas se usan a escala mundial, con una tasa media de 500 usuarios diarios y más de 150.000 usuarios en 2005”, recuerda.
Según explica el responsable, parte de las posibilidades de inversión en TIC del centro dependen de la concesión de subvenciones a proyectos de investigación, los que a su vez dependen de la producción científica. Dado que la producción está siendo “bastante razonable”, Dopazo confía en que esta inversión crezca y permita seguir incrementando la potencia de cálculo y la capacidad de almacenamiento del centro. Ya hay proyectos abiertos en este sentido, según adelanta: “Nuestro departamento incluirá en breve una nueva unidad de genómica estructural. Esto requerirá más espacio para almacenar bases de datos estructurales y más potencia de cálculo para modelar dichas estructuras”.

Viñeta publicada el 20 de febrero de 1870 en La Flaca n.º 35 Tendencias

ny2 ACTUALIDAD

ny2 Sociedad de la información

Día de la Movilidad y el BYOD Coffee Break