pagina principal DTIL

 

 

INCORPORACION DE TERMINOS ESPECIALIZADOS A LOS DICCIONARIOS DE LA REAL ACADEMIA ESPAÑOLA (1982-1991)

 

Celia María Molina

Servicio Iberoamericano de Información sobre la Traducción (SIIT), Argentina

 

Resumen:

Descripción de una base de datos que contiene información tomada de los 4746 asientos de las "Enmiendas y adiciones a los Diccionarios de la Academia aprobados por la Corporación" aparecidos en el Boletín de la Real Academia Española (RAE) desde 1982 hasta 1991 (cuadernos 227 al 254). Al procesar la información se pudieron recuperar, del conjunto total de 4746 lemas, los términos señalados por la RAE como propios de algún campo específico del conocimiento y que, supuestamente, se han incorporado a la última edición del Diccionario de la Lengua Española (ed. 21 de 1992). Se hace una reseña de los criterios con los que se procesó la información. Se hace un análisis cuantitativo del conjunto de términos detectados dentro del total de lemas registrados. La base de datos fue creada utilizando el sistema MicroISIS de la UNESCO y la estructura de campos se definió utilizando el Formato Común para Registro de Terminología desarrollado por la autora con la colaboración de los integrantes del Taller Terminológico.

 

I - INTRODUCCION

En 1990 el Servicio Iberoamericano de Información sobre la Traducción (SIIT) decidió, por necesidades de trabajo, hacer un índice alfabético completo con todas las "Enmiendas y adiciones a los diccionarios de la Academia aprobadas por la Corporación" que iban apareciendo en el Boletín de la Real Academia Española (RAE) desde 1982, posteriores a la 20ª edición del Diccionario de la Lengua Española publicado en 1984. El objetivo era, simplemente, tener un acceso más rápido a los lemas que aparecían en cada fascículo del Boletín.

Al analizar el problema ví que los asientos del Boletín contenían, además del lema y la/s definición/es, otro tipo de información que podía ser de interés para realizar estudios del material lexicográfico que se iba a registrar: sublemas, sinónimos, lugares de origen, lenguas de origen, campos del conocimiento.

Habitualmente, en los diccionarios de lengua alfabéticos, esos datos no son puntos de acceso a la información como lo es el lema. Resolví, por lo tanto, registrar ese tipo de datos que acompañan a cada lema y no cargar, por el momento, definiciones ni datos gramaticales.

Para poder realizar el trabajo con las características planteadas diseñé la base de datos utilizando el sistema Micro Isis, de la UNESCO (ver Bibliografía citada). La base de datos fue diseñada, además, para permitir conocer los movimientos del diccionario (altas, bajas, modificaciones).

De hecho se convirtió en una base de datos para consulta, para control y también para posibles estudios ya que permite desplegar la información contenida en los asientos y agregar mayor información si se desea. La base de datos se denomina RAE.

 

II - CARACTERISTICAS DE LA BASE DE DATOS "RAE"

Tratamiento de la información

La base de datos contiene datos extraídos de los asientos aparecidos en el Boletín de la RAE desde febrero de 1982 (cuaderno 227) hasta diciembre de 1991 (cuaderno 254).

Se estructuró el registro maestro de la base de datos utilizando el Formato Común para Registro de Terminología, desarrollado por la autora con la colaboración de los integrantes del Taller Terminológico (ver Bibliografía citada). Se seleccionaron los campos necesarios para los objetivos del trabajo:

Campo para el LEMA, etimología y sinónimos

Campo para el/los SUBLEMA/S

Campo para las remisiones de extensión (vase además)

Campo para remitir a la forma aceptada (véase)

Campo para determinar el tipo de asiento (alta, baja, enmienda)

Campo para la región de uso (diatópico)

Campo para indicar el  área del conocimiento (diatécnico)

Campo para ubicar el asiento en los Boletines de la RAE

Campo para notas

Campo para la fecha de registro de los datos

Se procedió a la carga de datos obteniéndose 4746 registros que contienen datos tomados de los 4746 asientos aparecidos en los Boletines mencionados anteriormente.

Es necesario aclarar que cada uno de los datos cargados en cada campo, y en cada subcampo, es un punto de acceso al registro y puede recuperarse. Por ejemplo, en el campo de LEMA se consignan el lema propiamente dicho y, además, la lengua de origen y/o las formas sinónimas que figuren en el asiento del Boletín. Todos esos datos pueden recuperarse.

 

Posibilidades de recuperación de la información almacenada

La lengua de origen puede recuperarse permitiendo conocer todas las voces de origen, por ejemplo, latín, griego, catalán, sueco, etc. Para identificar las lenguas se utilizaron los códigos de lengua establecidos en la norma ISO/DIS 639-1987 (ver Bibliografía citada). Se detectaron etimologías de 25 lenguas.

Pueden recuperarse todas las formas sinónimas. De esta manera se asegura el acceso a todas las formas existentes en la base de datos aunque no sean la forma que encabeza cada asiento.

En los asientos que figuran en los Boletines de la RAE, aparecen frases donde el lema se muestra funcionando dentro de una frase. En esos casos se consigna dicha frase en el campo de SUBLEMA.

Al analizar los asientos se vio que aparecían distintos tipos de enmiendas y adiciones. Eran tan diversas que fue necesario codificarlas para poder realizar un análisis correcto de la información almacenada:

a = alta del asiento completo

aa = alta de acepción/es

ae = alta de etimología

as = alta de sublema/s

asi = alta de sinónimo/s

ag = alta geográfica

at = alta temática

b = baja del asiento completo

ba = baja de acepción/es

be = baja de etimología

bs = baja de sublema/s

bsi = baja de sinónimo/s

bg = baja geográfica

bt = baja temática

 

e = enmienda del asiento completo

ea = enmienda de acepción/es

ee = enmienda de etimología

es = enmienda de sublema/s

esi = enmienda de sinónimo/s

rv = remisión de "véase"

rva = remisión de "véase además"

En muchos casos aparecían en los asientos referencias geográficas (continentes, regiones, conjuntos de países, países, zonas dentro de países). Estos datos se cargaron en forma normalizada utilizando los códigos establecidos por la norma ISO 3166 (ver Bibliografía citada) para nombres de continentes y países.

Cuando el asiento indica la zona del país de donde proviene el lema, se consigna el código del país y entre paréntesis el nombre de la zona, ejemplo: ES (La Mancha). Se detectaron lemas provenientes de 21 países, 5 continentes y regiones y 18 zonas de España.

 

Aparición de diatécnicos = Aparición de términos

En los asientos del Boletín de la RAE aparecen lemas que llevan la abreviatura del campo del conocimiento especializado de donde proviene esa forma. Es, por lo tanto, terminología que proviene de distintos campos del saber que se incorpora a la lengua corriente.

Para el registro en la base de datos se utilizaron las mismas abreviaturas que se utilizan en el Boletín (ver en el anexo adjunto). Esto permite saber cuáles son los términos provenientes, por ejemplo, de la zoología que se han incorporado a la edición 21. del Diccionario de la Lengua Española.

Se identificaron, dentro de los 4746 registros de lemas, 911 registros de términos provenientes de 89 áreas del conocimiento.

En los 911 registros de términos se relevaron 960 acepciones temáticas. Es decir, acepciones correspondientes a más de un campo del conocimiento consignadas en un mismo registro.

En los 911 registros de términos se encuentran 324 registros que son altas. Es decir, registros de términos incorporados por primera vez al Diccionario.

En estos 324 nuevos registros de términos se encontraron 345 acepciones.

Todos los datos registrados pueden recuperarse y, a su vez, pueden combinarse en el momento de la búsqueda para afinar la recuperación. Por ejemplo, se puede pedir: términos de la electricidad que deriven del latín o bajas de términos de la zoología, etc. y, si los hay, se recuperan.

Resumiendo:

4746 lemas -> 911 términos -> 324 altas

| |

* *

960 acepciones 345 acepciones

III - ANALISIS CUANTITATIVO DE LA INFORMACION ALMACENADA

Como ya se ha dicho, se utilizaron las mismas abreviaturas usadas por la RAE para nombrar los campos del conocimiento. La aparición de cualquiera de esas abreviaturas señala al lector que ese lema, por una o todas sus acepciones, es, además, un término.

A continuación se presenta una lista alfabética de las abreviaturas registradas en la base de datos.

En la lista figura la abreviatura, la forma desarrollada entre paréntesis y, por último, la cantidad de acepciones correspondientes a ese campo del conocimiento y cuántas de ellas figuran en asientos que aparecen por primera vez, es decir, altas:

ABREV. DESARROLLO ACEP./ALTAS | ABREV. DESARROLLO ACEP./ALTAS

Acust. (acústica): 3/0; Aer. (aeronáutica): 4/1;

Albañ. (albañilería): 1/0; Alg. (álgebra): 1/0;

Anat. (anatomía): 22/7; Antrop. (antropología): 2/1;

Arit. (aritmética): 3/0; Arq. (Arquitectura): 7/1;

Arqueol. (Arqueología): 1/1; Astrol. (Astrología): 1/0;

Astron. (astronomía): 8/1; Automov. (automovilismo): 2/0;

Bact.(bacteriología): 2/1; Bioquím. (bioquímica): 8/6;

Biol. (biología): 105/53; Bot. (botánica): 60/22;

Cant. (cantería): 1/0; Carp. (carpintería): 1/0;

Cetr. (cetrería): 1/0; Cinem. (cinematografía): 23/5;

Cir. (cirugía): 4/2; Com. (comercio): 3/1;

Cosmogr. (cosmografía): 1/1; Cristal. (cristalografía): 1/0;

Dep. (deporte): 31/6; Der. (derecho): 11/3

Ecol. (ecología): 8/6; Econ. (economía): 13/0;

Electr. (electricidad): 12/5; Electrón. (electrónica): 5/2;

Embriol. (embriología): 3/2; Estad. (estadística): 2/1;

Farm. (farmacia): 4/4; Ferr. (ferrocarriles): 1/0;

Fil. (filosofía): 8/2; Filat. (filatelia): 1/0;

Filol. (filología): 1/0; Fís. (física): 57/13;

Fisiol. (fisiología): 7/3; Fon. (foniatría): 1/0;

Fort. (fortificaciones): 1/0; Fotogr. (fotografía): 4/2;

Geofís. (geofísica): 1/0; Geogr. (geografía): 11/5;

Geol. (geología): 13/5; Geom. (geometría): 15/0;

Geomorf. (geomorfología): 1/0; Gram. (gramát.): 13/0;

Hist. Nat. (hist. natural): 2/0; Impr.(imprenta): 5/4;

Inform. (informática): 15/4; Ing. (ingeniería): 1/0;

Ling. (lingüística): 15/10; Lit. (literatura): 2/0;

Lóg. (lógica): 3/2; Mar. (marina): 7/1;

Mat. (matemáticas): 21/1; Mec. (mecánica): 10/1;

Med. (medicina): 48/20; Metal. (metalurgia): 7/0;

Meteor. (meteorología): 20/7; Microb. (microbiología): 1/0;

Mil. (milicia): 11/0; Min. (minería): 1/1;

Mineral. (mineralogía): 3/1; Mit. (mitología): 2/1;

Mús. (música): 16/2; Náut. (náutica): 1/1;

Oceanogr. (oceanografía): 2/2; Opt. (óptica): 7/0;

Orf. (orfebrería): 1/0; Ortogr. (ortografía): 1/0;

Pat. (patología): 12/8; Pint. (pintura): 3/0;

Polít. (política): 1/1; Psicol. (psicología): 6/4;

Psiquiat. (psiquiatría): 2/1; Quím. (química): 102/61;

Radio. (radiofonía): 1/0; Rel. (religión): 1/1;

Ret. (retórica): 2/1; Sociol. (sociología): 2/2;

Taurom. (taurom): 16/4; Tecnol. (tecnología): 15/3;

Teol. (teología): 3/1; Terap. (terapia): 1/0;

Trigon. (trigonometría): 1/0; TV (televisión): 9/2;

Zool. (zoología).

 

Para poder realizar mejor este estudio se agruparon los campos del conocimiento en grandes áreas temáticas:

CIENCIAS EXACTAS: 98 acepciones temáticas que incluyen

14 altas de nuevos términos

 

CIENCIAS NATURALES: 444 acepciones temáticas que incluyen

209 altas de nuevos términos

CIENCIAS SOCIALES: 27 acepciones temáticas que incluyen

6 altas de nuevos términos

CIENCIAS DE LA SALUD: 102 acepciones temáticas que incluyen

45 altas de nuevos términos

HUMANIDADES Y ARTES: 73 acepciones temáticas que incluyen

22 altas de nuevos términos

TECNICA: 216 acepciones temáticas que incluyen

49 altas de nuevos términos

 

El porcentaje de aparición de registros de términos, incluyendo altas, bajas y modificaciones, sobre el total de 4746 registros fue del 20 % ya que aparecieron 911 registros de términos.

A su vez, en los 911 registros de términos se encuentran 960 acepciones temáticas (son altas, bajas y modificaciones). Estas acepciones se distribuyen de la siguiente manera:

10 % para las Ciencias Exactas

46 % para las Ciencias Naturales

3 % para las Ciencias Sociales

10 % para las Ciencias de la Salud

8 % para las Humanidades y Artes

23 % para la Tecnología

Si analizamos solamente las altas de acepciones temáticas veremos que en los 911 registros de términos, aparecen 325 que son altas, o sea, términos que se incorporan por primera vez a los Diccionarios. Esos 325 términos contienen 345 acepciones que se distribuyen de la siguiente forma:

14 % para las Ciencias Exactas

47 % para las Ciencias Naturales

22 % para las Ciencias Sociales

44 % para las Ciencias de la Salud

30 % para las Humanidades y Artes

23 % para la Tecnología

 

 

IV - OBSERVACIONES

No me atrevo a afirmar que este conjunto de términos dados de alta en las Enmiendas y Adiciones constituya una muestra representativa de la terminología incorporada al lenguaje corriente en los países de habla española. Por lo tanto no corresponde realizar inferencias.

De todas formas, de la simple comparación podemos señalar que llama la atención el volumen de términos provenientes de las ciencias naturales con respecto a los de las ciencias sociales que, aparentemente, tienen mayor impacto en el habla cotidiana a través de su temática y de la divulgación permanente que se hace a través del lenguaje de la prensa.

Se puede observar también que en las Enmiendas y Adiciones figuran muchos lemas que aparentemente son términos (por ejemplo, geomagnetismo) pero no fueron señalados como tales por lo que no han sido considerados en este relevamiento.

Se encuentran acepciones pertenecientes a distintos campos del conocimiento referidas a un mismo término y por lo tanto en un mismo asiento.

En un mismo asiento se encuentran, además, las definiciones correspondientes al nivel común de lengua y al nivel especializado.

VI - COMENTARIOS FINALES

Entiendo que este trabajo es solamente un primer paso, una forma de poner en orden y accesible el material de estudio. Quedan abiertas posibilidades de análisis, por ejemplo: cuál es el criterio con el que se determina que un lema es un término de alguna especialidad; cuál es el mecanismo que utiliza la RAE para registrar términos provenientes de distinas especialidades y que se incorporan al habla cotidiana; cuál es el tiempo de incorporación de los mismos desde su aparición en el habla cotidiana; por qué aparecen más términos de un área del conocimiento que de otras.

He realizado este trabajo desde mi especialidad que es el manejo de información. En este caso ha sido información lexicográfica. He aprendido mucho en lo que hace a la inestimable labor del lexicógrafo. Valoro su trabajo porque recorrí parte de su camino. No me corresponde avanzar más, pues lo que sigue corresponde a los especialistas del lenguaje que quieran realizar algún aporte a la RAE en su ímproba tarea, porque, como dice un poeta de mi patria: "no es para mal de ninguno sino para bien de todos".

 

VII - BIBLIOGRAFIA CITADA

BOLETIN / Real Academia Española (Madrid). Cuadernos 227-254, 1982-1991.

CDS/ISIS REFERENCE MANUAL / UNESCO. Division of Software Development and Application—Paris : UNESCO, 1989 -- 285 p.

LANGUAGE CODE AND AUTHORITY SYMBOLS / International Organization for Standardization—Switzerland : ISO, 1985 -- 45 h. (ISO/DIS 639-1987)

PROPUESTA DE FORMATO COMUN PARA REGISTRO DE TERMINOLOGIA / Celia Molina; Susana Dover; Elisa Bianchi; Angelina Bosch; Olga Alvarez—Buenos Aires, 1991 -- 11 h.

REGION AND COUNTRY CODES / International Organization for Standardization—Switzerland : ISO, 1974 -- 6 h. (ISO 3166)

 

pagina principal >