Hacia una potencia de proceso ilimitada

Grid Computing empieza a entrar en la empresa

La informática en red o “grid computing” está atrayendo una atención considerable, al haber comenzado las compañías a promover la idea de acceder a una potencia de proceso ilimitada desde cualquier parte del mundo con la misma facilidad con la que los usuarios se conectan actualmente a Internet. Aunque esto puede parecer revolucionario, lo cierto es que se trata de un paso más dentro de una larga historia de desarrollo. En realidad, empresas de todo tipo están utilizando ya una forma sencilla de computación en red dentro de sus cortafuegos para atender económicamente a sus necesidades de proceso.

Al igual que las redes de área de almacenamiento o SANs (Storage Area Networks) virtualizan las necesidades de almacenamiento de datos en las empresas, la informática grid virtualiza la potencia de proceso. En esta última, un proceso no tiene lugar en una CPU (unidad central del proceso) específicamente asignada en un ordenador determinado, sino que se realiza en cualquier procesador que esté disponible en la red. Así, una tarea pequeña utilizará una sola CPU, mientras que los trabajos más grandes se dividen y se ejecutan en múltiples CPUs simultáneamente. Los trabajos pueden ser asignados utilizando una estructura centralizada o bien una estructura de igual a igual o peer-to-peer. La informática grid, que estaba limitada a clusters o grupos de ordenadores en investigaciones universitarias, está penetrando en el sector comercial, ofreciendo un rendimiento extraordinario a precios de PC.
Según la consultora especializada en computación a gran escala Illuminata, es normal que exista cierta confusión respecto a este tipo de redes ya que la idea general que se tiene de grid es la de una red planetaria que conecta a millones de personas de todo el mundo. Sin embargo, esta idea es sólo una parte de grid y una hipótesis que tendrá lugar en el futuro.
En realidad, la informática grid sigue la misma línea de desarrollo que otras tecnologías, como la arquitectura CORBA (Common Object Request Broker Architecture) del Object Management Group, DCOM (Distributed Componente Object Model) de Microsoft, o DCE (Distributed Computing Environment) de Open Group. Recientemente, el proyecto Globus ha desarrollado estándares para realizar computación a gran escala vía Internet. De hecho, según Giga Group, aunque las empresas y organizaciones han estado realizando ya computación grid desde hace diez años, es ahora cuando se habla de ello debido a la posibilidad de la creación de una grid mundial.

Analizando las opciones
Hay tres tipos principales de redes grid: en cluster, de campus y global. Estas definiciones no son fijas ni inmutables, sino que representan divisiones aproximadas en función de las diversas formas en que las organizaciones pueden compartir potencia de proceso. Si bien, la red global es el proyecto futuro de contar con una grid planetaria de la que antes hablábamos, las redes en cluster pueden consistir en servidores y sistemas conectados entre sí o simplemente sistemas situados en una determinada localización que sirven a un mismo proyecto o unidad comercial. Además de permitir una utilización más eficiente de los recursos del servidor, un cluster así puede también capturar tiempo de CPU de estación de trabajo no utilizado, para realizar grandes ciclos de proceso.
Por su parte, las redes en campus permiten que varios proyectos o departamentos de una organización compartan recursos dispersos en diversas partes de un campus, es el paso siguiente después de los clusters. Por ejemplo, el departamento de contabilidad puede acceder a las CPUs de los servidores del departamento de personal para realizar una serie de previsiones financieras complejas, o el de ingeniería planificar la ejecución de sus trabajos grandes por la noche, utilizando la potencia de proceso de todas las estaciones de trabajo de la compañía para disponer de los resultados por la mañana. Las redes de campus utilizan la red de la organización para transferir datos entre recursos situados en diversas localizaciones. El establecimiento de una red de campus introduce cierta complejidad técnica, a causa de problemas de ancho de banda y de retrasos, además de otros retos de tipo organizacional. Además, pueden existir cuestiones financieras y de seguridad. Por ejemplo, si un departamento está utilizando los servidores de otro departamento, deberá quedar reflejado en los análisis de costes. Y si los requerimientos de seguridad varían entre los diversos departamentos, deberán establecerse normas o políticas para acomodar esa disparidad. A pesar de estos retos, algunas compañías han estado realizando cómputo en red durante años.

¿Válido para todos?
La informática grid está siendo aplicada con éxito en miles de empresas, lo que no significa que funcione bien para todo tipo de corporaciones. Aunque un análisis rápido de las estadísticas sobre utilización de CPU revela que en la mayoría de las empresas deja de utilizarse una cantidad enorme de potencia de proceso, no siempre es posible capturar esa potencia económicamente. Al final, el objetivo teóricamente absoluto de la computación en red – utilizar cualquiera de los recursos de proceso, en cualquier lugar y en cualquier momento – no es físicamente posible, ni es tampoco necesario. Por ejemplo, gastar el tiempo y el dinero necesarios para crear una red que ahorre unos pocos nanosegundos en un documento de proceso de textos no merece la pena. Sin embargo, las mega-aplicaciones de cómputo intensivo, que pueden ser divididas en pequeñas partes y funcionar en paralelo, que son altamente repetitivas y que requieren un mínimo de entrada/salida en disco, son ideales para la instalación de una grid. Además de las aplicaciones de biotecnología y de ingeniería, grid ofrece probablemente su máximo valor en campos como la prospección petrolífera, ciencias de materiales, simulaciones de choques y accidentes, modelización de mercados, efectos especiales de cine y pronósticos meteorológicos. De hecho, las empresas y organizaciones que lo están utilizando son las mismas que hace 15 años habrían estado utilizando superordenadores Cray, ya que adoptando un enfoque de proceso distribuido, obtienen la misma potencia de proceso a un coste más bajo.

Utilización comercial
Al proseguir la tendencia hacia una capacidad de almacenamiento cada vez mayor y una potencia de proceso cada vez más rápida, los científicos están pensando en experimentar con archivos de petabytes de datos dentro de pocos años. Algunas grandes empresas del sector como IBM, Microsoft, Oracle y Sun Microsystems se están apresurando a desarrollar estrategias grid. En concreto, están promoviendo el interés y el desarrollo de grid la gran difusión de la conectividad a través de Internet, el aumento extraordinario en el rendimiento de las redes y el desarrollo de herramientas de colaboración, y la aceptación de la colaboración como un medio de trabajo viable. Y es que gracias a la informática grid es posible coordinar recursos que no están sujetos a un control centralizado, utilizar protocolos e interfaces estándar, abiertos y de propósito general y ofrecer un servicio de calidad. El proyecto Globus y el Global Grid Forum siguen trabajando en definir los estándares y protocolos de grid y en desarrollar formas de aplicar conceptos de cómputo en red a cál

Viñeta publicada el 20 de febrero de 1870 en La Flaca n.º 35 Tendencias

ny2 ACTUALIDAD

ny2 Sociedad de la información

Día de la Movilidad y el BYOD Coffee Break