Del lexema al hipertexto

La Real Academia Española se adapta al tiempo Internet

Combinar letras con ciencias y, en concreto, con el código binario que sustenta la informática, es una tarea nada fácil en una institución como la Real Academia Española (RAE). Sin embargo, ésta, nacida en 1713 con el objeto de “fijar las voces y vocablos de la lengua castellana en su mayor propiedad, elegancia y pureza” ha tenido que modernizarse no sólo en su labor de velar para que los cambios de la lengua española no quiebren la unidad que mantiene en el ámbito hispánico, sino también en su adopción de las Tecnologías de la Información (TI), claves en la sociedad en la que estamos inmersos.

Juan Manuel Fernández Pacheco, marqués de Villena, fue el impulsor de su creación en 1713, aunque fue un año más tarde cuando Felipe V aprobó su constitución y la colocó bajo su “amparo y Real Protección”. Desde entonces, la Real Academia Española (RAE) es una institución que, debido a su antigüedad y su función como salvaguarda de nuestro idioma, ha debido enfrentarse a múltiples renovaciones, eso sí, cumpliendo siempre la misión de “velar por que los cambios que experimente la Lengua Española en su constante adaptación a las necesidades de sus hablantes no quiebren la esencial unidad que mantiene en todo el ámbito hispánico”.
Como es obvio, estos cambios también incluyen la necesaria adopción que la RAE ha tenido que hacer de las Tecnologías de la Información (TI). Como revela Octavio Pinillos, jefe del departamento de informática de la RAE: “En 1992, la institución se encontraba totalmente al margen de la modernidad informática. Sólo había dos PCs cuando se constituyó la dirección informática, lo que se hizo tras el nombramiento como presidente de la Academia de Fernando Lázaro Carreter”. Pinillos explica que el objetivo de la institución al incorporar este departamento fue agilizar determinados procesos, fundamentalmente dos: la confección de los diccionarios, para lo que se desarrollaron unos sistemas basados en bases de datos y sistemas de redacción que optimizan este proceso; e informatizar el fondo documental de la Academia, hasta entonces formado por un archivo en papel que incorporaba ejemplos del uso de las palabras, tanto léxicos como lexicográficos y compuesto por doce millones de fichas.
Para llevar a cabo la informatización de la creación del diccionario, la RAE tuvo que incorporar éste a una base de datos relacional DB2 (de IBM) con la que aún trabajan. “Ésta es de carácter relacional y tiene la capacidad de descomponer cada artículo en partes más elementales, así como controlar el metalenguaje del diccionario y las relaciones internas entre los artículos, pudiendo comprobar si se ha editado varias veces, etc.”. Actualmente, el diccionario permite generar formatos para cualquier soporte informático, como es el de Internet (HTML), así como XML, que facilita el intercambio de aplicaciones y la integración del diccionario en dispositivos como PDAs y dispositivos móviles.
Esta labor la realizaron con la colaboración de IBM y una inversión de 150 millones de las antiguas pesetas. “Normalmente, realizamos convenios de colaboración para el área informática, e IBM es la compañía con la que trabajamos desde hace más años, aunque también tenemos convenios con Microsoft y Telefónica”. Así, mientras IBM les suministra hardware, software, mantenimiento y formación; Microsoft es el proveedor de software y licencias; y Telefónica es uno de los proveedores de telecomunicaciones, proporcionándoles actualmente una línea Metrolan de 8 Mbps. “Otros proveedores con los que trabajamos son –asegura Julio Manzano, técnico de sistemas de la RAE– Antea, que nos suministra el hardware de comunicaciones y seguridad, con productos de Sonic­Wall, McAfee, Isurf y F5; Harrys Net, que nos brinda la electrónica de red (de Enterasys) y el cableado de todo el edificio; Memory Suministros Informáticos, que nos proporcionan ordenadores, impresoras, software y consumibles; AGS (Antivirus Global Services), que nos proporcionan el Antivirus McAfee ASAP para ordenadores personales; y Neo-Sky es nuestro otro proveedor de tecnología Internet dotándonos de una línea de 4Mbps.
La inversión media de la RAE en el área de tecnología (en equipos, excluyendo al coste de personal) es de 200.000 euros anuales.

Apoyo a la confección de diccionarios
La misión de la RAE, según Pinillos, es que “tanto el diccionario como los recursos de la Academia se lean cada vez con más profusión. Por ello, estamos haciendo mucho hincapié en los servicios web, para mejorar la lectura de los diccionarios en Internet”. Éste explica que uno de los proyectos del departamento se centra en publicar en la Red los nuevos diccionarios de dudas y de americanismos. Este último se encuentra ahora en redacción y se espera que se publique dentro de cuatro años y el de dudas se publicará esta primavera. Para ello, señala el responsable “estamos probando el uso del estándar de intercambio de contenidos XML”. También se está elaborando un nuevo diccionario para estudiantes, que incluye la prestación de servicios web, aunque “éste está menos avanzado en cuanto a informatización”.
Aunque la tarea habitual del departamento se centra en el desarrollo de herramientas de redacción que faciliten la creación del diccionario, la RAE también ha llevado a cabo proyectos de digitalización de contenidos, aunque esta vez de diccionarios antiguos. “Esta iniciativa surgió –apunta Pinillos– porque en la Real Academia tenemos el diccionario de la Historia de las Palabras, que es muy complejo de elaborar, y teníamos que integrar toda la documentación posible en soporte informático para así agilizar la labor del lexicógrafo”. Enmarcado en este proyecto se encuentra la digitalización del Corpus del Español (una recopilación de textos de diverso tipo que incorpora 350 millones de palabras). “Gracias a ello, cuando un redactor de la RAE necesita buscar documentación, lo hace en el Corpus digitalizado, donde encuentra la palabra deseada junto a ejemplos de su uso, etc. Esto le permite realizar seguimientos estadísticos de las palabras, viendo cómo han evolucionado éstas a través del tiempo, cuándo han estado de moda y cómo se asientan determinados términos en la sociedad”.
Claro que, no toda la documentación a la que pueden acceder los redactores de la RAE proviene del Corpus. También pueden acceder a otros diccionarios. “Por eso, decidimos digitalizar desde los antiguos hasta los más modernos. Dado que copiar los primeros suponía un proceso costoso y lento, decidimos digitalizarlos, que era mucho más rápido y ágil. Para ello, empleamos un sistema mixto de bases de datos, que mezclaba la visualización de imágenes (en concreto, de las páginas del diccionario) y una herramienta de búsqueda por palabras, de modo que el trabajador puede buscar la palabra y ver la página en la que se encuentra”. Para la creación de este sistema la RAE aprovechó la tecnología que IBM había desarrollado ya para el Archivo de Indias y, además, se aplicó a la lexicografía. En este momento, los sistemas documentales con los que cu

Whitepaper emc-cio-it-as-a-service-wp Whitepapers