La gestión de la documentación terminológica: el Servicio de Documentación de TERMCAT
Mercè Sallas Campmany
TERMCAT, Centre de Terminologia
 

En esta comunicación presentamos un ejemplo de centro de documentación terminológica: el Servicio de Documentación de TERMCAT. Desde la experiencia práctica del profesional de la documentación y a través de los trabajos realizados planteamos diferentes posibilidades de intercambio en el ámbito de la documentación dentro del marco de la cooperación terminológica en Europa.

Partimos de un centro de documentación que está al servicio de TERMCAT, organismo que se ocupa de la coordinación general de las actividades terminológicas relativas a la lengua catalana, de promover y elaborar recursos terminológicos y garantizar su disponibilidad, y de impulsar el desarrollo de productos de ingeniería lingüística en los que la terminología tiene una especial incidencia. Así pues, las tareas documentales están en relación con las funciones generales del centro y con las necesidades específicas de los proyectos terminológicos que se emprenden; el Servicio de Documentación también se ocupa de las tareas documentales pertinentes a TERMCAT como centro de referencia para la terminología catalana con la compilación y difusión de la bibliografía de los recursos terminológicos disponibles para esta lengua.

Desde el año 1985, cuando fue creado TERMCAT mediante un acuerdo entre el Departamento de Cultura de la Generalitat de Catalunya, autoridad competente en materia de política lingüística, y el Institut d'Estudis Catalans, autoridad académica de la lengua catalana, ya se destacó la importancia y la necesidad de disponer de toda la documentación y la información relativa al catalán. Se definió el Servicio de Documentación y se encargó la organización de la documentación especializada en terminología catalana a profesionales de la documentación.

Durante estos años, las tareas que han ocupado la actividad del Servicio han evolucionado en función de las necesidades del centro -y al compás de los diferentes proyectos terminológicos- pero también en función de la consolidación del mismo Servicio de Documentación. En primer lugar, se trabajó en colaboración con los terminólogos para definir el sistema de clasificación ad hoc que serviría para clasificar (e indizar) tanto los documentos como los términos y que, con el mantenimento correspondiente y las actualizaciones necesarias atendiendo a los cambios en la sociedad del conocimiento, se ha ido aplicando a los datos del banco documental y del banco terminológico del centro.

Una vez consolidado el Servicio de Documentación, se redefinió con la finalidad de dotarlo de una nueva base de datos que permitiera la adaptación a las necesidades específicas de la documentación terminológica del centro y que, a la vez, posibilitara el intercambio de datos con otros centros. Como veremos más adelante, uno de los criterios principales para la selección del sistema de gestión de los datos documentales fue la disponibilidad de importación y exportación de los datos bibliográficos.

Actualmente, y siguiendo con los mismos objetivos, estamos trabajando en la integración de los recursos electrónicos a la base de datos documental y en la difusión de los datos bibliográficos y documentales a través de las posibilidades que nos ofrece Internet.

A lo largo de la comunicación, comentaremos las distintas tareas que ocupan al Servicio de Documentación, desde la gestión hasta la difusión de la información, atendiendo especialmente aquellos aspectos que son susceptibles de ser compartidos a través del intercambio de información entre diferentes centros con documentación terminológica.

 

Gestión documental

Base de datos documental

En el Servicio de Documentación, desde el año 1991, utilizamos el programa CDS/ISIS de la UNESCO para la gestión de la base de datos documental BDOC. Los motivos de selección de este programa frente a otros fueron principalmente la posibilidad de llevar a cabo las dos opciones siguientes: que la base de datos fuera abierta, modificable y adaptable a un diseño con campos para las informaciones específicas de la documentación terminológica y que el intercambio de datos se pudiera realizar fácilmente, en nuestro caso mediante el formato ISO 2709.

Consideramos importante que cualquier centro de documentación terminológica que deba intercambiar datos disponga de un programa con el que los procesos de importación y exportación de los datos se puedan realizar fácilmente; y que, a la vez, permita todas las modificaciones necesarias para adaptarse a las necesidades que genera el intercambio con otras bases de datos. Además, es recomendable que el formato de intercambio sea reconocido y usado internacionalmente.

Asimismo, la base de datos que utilizamos es redefinible en función de nuevas necesidades que puedan surgir, tanto a nivel del centro como a nivel exterior para posibles intercambios con otras bases de datos de documentación semejante. Concretamente nos referimos a la posibilidad de incluir nuevos campos para la información específicamente terminológica, como por ejemplo el número de términos del documento, la inclusión de definiciones, información gramatical, conceptual, etc., que en nuestra base de datos ya estamos utilizando.

Tipos de documentación terminológica

Con un fondo documental de más de 6.000 monografías, más de 90 títulos de revistas especializadas, literatura gris, material de divulgación y material en soporte informático, las principales tipologías de documentación del centro pueden agruparse en:

- obras de teoría, especialmente de terminología pero también de otras disciplinas relacionadas como la traducción, la lexicología, la planificación lingüística, las industrias de la lengua, la informática, las telecomunicaciones y la documentación;

- obras terminológicas de todos los ámbitos del conocimiento, de manera exhaustiva en lengua catalana y selectiva en las otras lenguas de trabajo más habituales del centro: español, inglés y francés, y, en segundo lugar, italiano y alemán;

- obras lexicográficas monolingües y bilingües en las distintas lenguas de trabajo que hemos mencionado en el apartado anterior.

En la base de datos documental BDOC hemos ido incorporando paulatinamente los diferentes tipos de documentos; inicialmente, monografías, artículos de revistas, material de divulgación y normas en soporte papel y, más recientemente, material en soporte electrónico y recursos en línea.

Referente a la literatura gris, en el caso concreto de las tesis y las tesinas sobre terminología o que contienen terminología especializada, en el ámbito que representa TERMCAT, las depositarias son las bibliotecas de las diferentes universidades donde se presentan. Desde TERMCAT recuperamos este material a través del CCUC, el Catálogo Colectivo de Universidades de Cataluña accesible desde Internet, una herramienta muy útil para la consulta de todos los fondos bibliográficos universitarios del ámbito del catalán. Además, también contiene el catálogo de la Biblioteca nacional de Cataluña. Últimamente, se están incorporando a dicho catálogo los fondos de varias bibliotecas especializadas, como por ejemplo las de algunos departamentos del Gobierno catalán. En este sentido la colaboración entre universidades y centros de terminología es indispensable para compartir el acceso a los trabajos terminológicos del ámbito académico e institucional. Con la creación, entre instituciones y universidades europeas, de una base de datos que incluya tesis y tesinas facilitaríamos la recuperación de esta información tanto a los centros de carácter académico como a los de carácter institucional.

En el caso del material de vaciado, previamente a disponer de acceso a Internet, en el centro buscábamos y guardábamos este tipo de material que, a pesar de su existencia efímera, nos era muy útil como documento especializado para el proceso de vaciado de términos de los proyectos terminológicos. Nos referimos, por ejemplo, a documentos como catálogos de empresas fabricantes de maquinaria, de productores de alimentos, etc. que, actualmente, en la mayoría de los casos, podemos encontrar fácilmente en una página web específica en la red. Toda esta información, no propiamente terminológica pero sí de interés terminológico, también es susceptible de ser compartida entre los diferentes centros de documentación en terminología, especialmente aquel material que, aun cuando se dispone de herramientas de búsqueda muy potentes, sigue siendo de difícil acceso.

En la base de datos documental incorporamos los artículos de las revistas de terminología y de materias relacionadas que se reciben en el centro. En el marco de la cooperación europea en terminología la colaboración en este aspecto nos permitiría, a pesar de trabajar con distintas lenguas de indización, compartir la tarea de vaciado de los artículos de las revistas comunes de ámbito internacional e intercambiar los artículos vaciados de los títulos de revistas de ámbito local.

Igualmente, en el caso de las normas, en el fondo documental de TERMCAT disponemos de las principales normas sobre terminología publicadas por la ISO y por el organismo nacional de normalización en España (AENOR) y, en función de los diferentes proyectos que se van realizando en el centro, el fondo se amplía con las normas terminológicas específicas para el proyecto, tanto las ISO como las UNE, que publica AENOR. La cooperación entre los diferentes centros de documentación terminológica (CDT) permitiría disponer de la referencia de las normas de interés terminológico de los organismos de normalización de cada país, sin tener que disponer físicamente en cada centro de estas normas que, habitualmente, tienen un coste elevado.

La información disponible a través de Internet es cada vez mayor. Nos encontramos en una situación de sobreabundancia de información y el caso de la información terminológica no es una excepción. La organización de la documentación terminológica disponible en línea es imprescindible para una recuperación rápida y eficaz. En TERMCAT, la información disponible en Internet de interés terminológico que consideramos más estable por motivos diferentes -como por ejemplo, la fiabilidad del organismo que la publica- se integra en la base de datos como un recurso más, pero, en cambio, damos un tratamiento más simplificado a la información que consideramos más efímera. Estos datos los organizamos, clasificados en diferentes apartados temáticos, en un documento en formato HTML para facilitar un acceso rápido a la dirección electrónica correspondiente.

Es importante que nos planteemos las distintas posibilidades de tratamiento de la información electrónica y digital, que es, cada vez más, una de las principales fuentes de información para cualquier centro de documentación: la definición de una estructura concreta de referencia de los datos de identificación de este tipo de documentación, su organización en bases de datos y su difusión.

Sistema de clasificación

Para la clasificación de la documentación utilizamos distintos sistemas en función de la documentación que estamos tratando. El principal es una clasificación ad hoc definida desde el centro y que nos sirve a la vez para la clasificación de los documentos y de los términos. Es el sistema más conocido por los terminólogos e investigadores del centro y facilita la recuperación y ubicación de la información.

Para definir el sistema se consultaron varias clasificaciones de los ámbitos documental, académico y terminológico. La utilización de este sistema de clasificación propio nos permite que cualquier investigador o colaborador habitual del centro reconozca fácilmente los códigos de la clasificación, tanto en los documentos como en los términos. Asimismo, utilizar una clasificación ad hoc nos favorece la actualización y la adaptación constante a las necesidades específicas del centro, a fin de representar todos los ámbitos del conocimiento haciendo hincapié en la realidad de nuestro país. Conscientes de la individualidad de nuestro sistema de clasificación hemos optado por la utilización en paralelo de otros sistemas más universales como la Clasificación Decimal Universal y la clasificación de terminología de Infoterm TCL -aplicada solamente a las obras de teoría- para mantener abierta la posibilidad de cooperación y a pesar de no ser utilizadas por la mayoría de nuestros usuarios para la recuperación de la información.

De todos modos consideramos que estos dos sistemas no son suficientes. En vistas al intercambio de datos bibliográficos, es importante disponer de las herramientas básicas comunes de descripción, tanto para la catalogación como para la clasificación de las obras de terminología y disciplinas relacionadas. Podría ser el caso de un tesauro multilingüe y un sistema de clasificación común, elaborado entre los diferentes centros de documentación terminológica en Europa.

 

Búsqueda y difusión documental

Búsqueda documental

Otra de las actividades que ocupan al Servicio de Documentación de TERMCAT es la realización de búsquedas documentales y bibliográficas exhaustivas en la fase inicial de un proyecto terminológico. Para la realización de esta búsqueda hemos establecido unas directrices que definen el tipo de información que puede ser relevante y que, por tanto, debemos recopilar. Nos referimos a dos tipos de información: factual y bibliográfica. Obviamente, parte de la información resultante de la búsqueda será de carácter local y, normalmente, de interés exclusivo para el proyecto específico. Pero, paralelamente, se recupera información de carácter extranacional que puede ser útil para otros CDT y para compartir a través de acuerdos concretos de colaboración. Para intercambiar los datos de interés común deberíamos establecer unos criterios generales comunes, adaptables a cada proyecto, sobre la información interesante a recuperar en este tipo de búsquedas documentales. Y, a la vez, establecer un protocolo que definiera qué tipo de herramientas, especialmente las accesibles desde todos los centros a través de Internet, podemos consultar para buscar esta información.

De esta manera, además de facilitar el intercambio, agilizaríamos el proceso de búsqueda de documentación e información de cada centro y aseguraríamos, con bastante fiabilidad, que en el resultado de la búsqueda no se habrían creado vacíos (silencio documental) ni, por el contrario, ruido documental.

Difusión selectiva de información bibliográfica

Uno de los primeros objetivos del Servicio de Documentación, y que continúa siendo una de las principales tareas que tiene encomendadas, es la recopilación exhaustiva y difusión de la bibliografía de los recursos terminológicos disponibles en lengua catalana. Inicialmente, difundíamos esta bibliografía en soporte papel y, a partir del web de TERMCAT, se incluyó en los datos que se difunden a través de Internet. En primer lugar, se utilizó una versión en formato documento ordenada según el sistema de clasificación de TERMCAT; y, actualmente, estamos trabajando para presentarla en formato de base de datos documental con posibilidad de búsqueda desde distintos campos de información: autores, títulos, materias, lenguas.

Esta bibliografía incluye diccionarios, vocabularios y léxicos que contienen catalán publicados desde el año 1932, así como proyectos en curso de elaboración. Actualmente, estamos en fase de incorporar las publicaciones de teoría terminológica. La recopilación de la bibliografía correspondiente a la lengua de cada uno de los centros, como en nuestro caso el catalán, y la posterior compilación de todas ellas nos permitiría establecer la bibliografía de los recursos terminológicos y de los proyectos en curso disponibles en el marco de la Comunidad Europea y de todas las lenguas representadas por los CDT.

Criterios de citación bibliográfica

Para la identificación de los documentos, hemos definido los criterios de citación bibliográfica a partir de la norma internacional ISO 690. Teniendo en cuenta las características intrínsecas de la documentación terminológica, hemos adaptado la norma ISO incluyendo, además de la citación bibliográfica entendida como descripción del documento, los datos que consideramos básicos de la información específicamente terminológica de los diccionarios, vocabularios y léxicos: el número de términos, las lenguas de equivalencia, si contiene definiciones y en qué lenguas y si contiene ilustraciones. Estos criterios están disponibles en nuestro web para los terminólogos e investigadores del centro y para cualquier usuario de la terminología al que le puedan ser de interés.

En este aspecto, observamos la importancia de definir unos criterios comunes y consensuales de descripción de los documentos que nos faciliten, en primer lugar, la correcta identificación de los mismos documentos en diferentes CDT y, en segundo lugar, el intercambio de los datos bibliográficos.

Datos factuales

Los datos factuales reciben un tratamiento específico y diferenciado de los datos bibliográficos. Utilizamos una base de datos específica, definida en el programa Access, para los datos relativos a especialistas, organismos e usuarios de la terminología relacionados con nuestro centro. En el caso de los datos referentes a congresos, conferencias y otras efemérides, por su carácter caduco, los recopilamos en un documento y los difundimos directamente en formato HTML a través de las páginas del web del centro dedicadas específicamente a informar sobre las actividades en el ámbito de la terminología, tanto catalana como internacional. En este aspecto, con el intercambio o la compilación de los datos de los diferentes CDT europeos dispondríamos de la información de manera más exhaustiva y actualizada.

Internet y la documentación terminológica

Algunos aspectos que aporta Internet al trabajo documental los hemos ido comentando a lo largo de esta exposición. Como en tantos otros ámbitos, el uso habitual de Internet ha cambiado el sistema de trabajo en los CDT, tanto en el proceso de gestión como en el de búsqueda.

Hemos mencionado el caso concreto del tratamiento documental del material de vaciado: el proceso previo a disponer de acceso a Internet como fuente de información y el proceso actual, con la mayoría de este material disponible en algún servicio web de la red. También hemos comentado cómo a través de Internet accedemos a diferentes fuentes de información que nos facilitan la búsqueda de documentación terminológica.

En el Servicio de Documentación hemos experimentado la importancia de explotar correctamente las distintas posibilidades de búsqueda de información en Internet, a través de los motores de búsqueda y de los indizadores que la misma red nos ofrece. En función del tipo de información que buscamos debemos utilizar uno u otro sistema de búsqueda. A partir de la experiencia de los especialistas en documentación terminológica de cada centro, sería interesante establecer unos criterios de valoración, desde el punto de vista terminológico, de los principales motores de búsqueda que utilizan las lenguas de trabajo de cada uno de los CDT europeos, especialmente la información que contienen que es de nuestro interés y el tratamiento de los datos terminológicos.

El siguiente paso después de extraer la información de interés terminológico de Internet y de valorar las diferentes herramientas disponibles es el tratamiento documental de los datos obtenidos. Como hemos explicado anteriormente, en nuestro centro proponemos un tratamiento diferenciado de los datos según su origen y su fiabilidad.

Internet nos facilita no sólo el acceso a gran cantidad de información terminológica o de interés terminológico sino que es también el medio actual más potente de difusión de la información. En el web de TERMCAT difundimos la información terminológica del centro y entre ella la información referente a la documentación terminológica. Hemos citado anteriormente en esta comunicación la bibliografia de los recursos terminológicos en catalán y los criterios de citación bibliográfica, además de otras informaciones de referencia como la lista de normas ISO sobre terminología y los enlaces a otras páginas de interés terminológico y sobre lengua catalana.

 

Conclusiones

Existen infinidad de posibilidades de cooperación. El concretar los aspectos más prácticos y los detalles depende de cada centro y de la voluntad de colaboración. En el proyecto TDCNet, en el marco del programa MLIS (Multilingual Information Society), de la Comisión Europea, en el cual participa TERMCAT, ya se está trabajando para establecer unas directrices generales para la definición de los centros de documentación en terminología. Los centros que están empezando a organizarse actualmente pueden adaptarse más fácilmente a las directrices que se definirán; los centros en funcionamiento deberán readaptarse paulatinamente y, en cambio, podrán aportar su experiencia.

Los centros en activo que disponemos de la documentación en mayor o menor grado organizada estamos, en cierta manera, obligados a compartir nuestra experiencia y a expresar las ventajas y los inconvenientes que hemos observado en las diferentes tareas que realizamos.

Entendemos que la cooperación entre los diferentes CDT puede realizarse desde la construcción de un servidor común o bien desde acuerdos específicos entre los centros, aunque siguiendo unas pautas comunes. Queremos destacar la importancia de disponer de herramientas comunes y estandarizadas para facilitar el intercambio en el marco de la cooperación terminológica europea. Herramientas entendidas, por un lado, como infraestructuras a compartir y, por otro lado, como instrumentos básicos para el entendimiento. Hemos mencionado a lo largo de la comunicación un tesauro multilingüe y una clasificación de terminología según las distintas lenguas de los centros de documentación terminológica; un formato común de citación y descripción bibliográfica de los diferentes tipos de documentos; unos criterios unificados para la búsqueda documental de información terminológica; y la explotación compartida de las posibilidades que aporta Internet como fuente de recursos y como medio universal de difusión de la información.

 

 

_retour à la page principale_