Enjeux
de la maîtrise de la terminologie
pour la production et la consultation de documents Henry Boccon-Gibod (EDF Division Recherche et Développement) Marie-Luce Picard (EDF Division Recherche et Développement) Didier Bourigault (Equipe de Recherche en Syntaxe et Sémantique, CNRS - Université Toulouse II) Daniela Garcia (EDF Division Recherche et Développement) |
|||
Contexte et problématique : Les installations de production d'électricité, en particulier les installations nucléaires, ont un long cycle de vie et sont décrites par des documentations très volumineuses, pour la conception, l'exploitation ou la maintenance [1]. Elles ont une grande exigence de sûreté ; cela nécessite de leur associer des documentations techniques de très grande qualité. De nombreux acteurs interviennent, de nombreuses sources d'informations aussi, sur des support variés : plans, schémas, textes. Depuis les années 70, jusqu'à nos jours, les technologies ont évolué : la mise en place de " systèmes d'informations " s'est substituée aux plans tracés à la main. Néanmoins, la plus grande partie de l'information demeure sous la forme de textes rédigés en " langue naturelle ", associés à des schémas (en deux dimensions) et des modèles (en trois dimensions) stockés dans des bases de données. Ainsi, la problématique de production et de consultation de ces documentations techniques reste entière, avec une dimension multilingue, puisqu'EDF vend maintenant son expérience et ses services sur des marchés internationaux d'ingénierie. Nous devons en particulier accentuer notre maîtrise de production interne de documents afin d'assurer : la cohérence au sein d'un même document, entre plusieurs documents, entre documents et données de référence (modèles, schémas, plans) ; la qualité ; la rapidité d'écriture ; les traductions. Nous devons aussi proposer des accès efficaces et intelligents au contenu d'un document. Enfin, nous devons intégrer poste auteur et système de consultation dans les systèmes d'informations techniques.
Cette problématique est générale et s'applique à tous les secteurs de métier : nous touchons là des soucis de productivité, d'efficacité, et de réduction des délais de mise sur le marché.
Une démarche et des outils pour exploiter efficacement les terminologies : Terminologies structurées et modèles de données Disposer d'une terminologie structurée permet d'unifier la représentation du contenu textuel des documents avec la représentation formelle des modèles auxquels ils sont sous-jacents. Ainsi les termes techniques utilisés doivent-ils correspondre de façon précise aux entités des modèles de données : cohérence assurée ! Les modèles de données fournissent également des points d'entrée (des index) pour la consultation des documentations techniques : efficacité assurée ! Constitution automatisée de terminologies : Nous disposons d'un certain nombre d'outils pour la constitution automatisée de terminologies structurées :
La structure de la terminologie est essentielle, et fortement liée à son utilisation ultérieure et au public à qui elle s'adresse [5]. Les liens nécessaires à l'aide à la production de documentations techniques sont les liens d'hyponymie/hyperonymie et de synonymie. Des outils issus de thèse nous fournissent des aides précieuses pour l'aide à la structuration : COATIS [6] en proposant des liens de cause à effet entre des "termes d'action" ; LEXICLASS [7] via la constitution de classes de termes avec une sémantique homogène. L'attribution de statuts aux différents termes est également fondamentale (invalidé, validé et autorisé, validé mais interdit ) pour une exploitation efficace du réseau terminologique. Poste auteur L'intégration de la terminologie dans le poste de l'auteur permet de contrôler à la source la qualité des documents :
En coopération avec XEROX, nous proposons un prototype de poste d'aide à la rédaction Merlin : un correcteur terminologique (Xerox TermChecker) est intégré au traitement de texte (à la manière d'un correcteur orthographique) et est associé à WORLDTREK pour la navigation graphique dans le réseau terminologique. Rédacteurs et lecteurs vérifient immédiatement (et dans leur contexte de travail habituel) le bon emploi d'un terme technique dans un contexte précis, ont directement accès à la traduction officielle d'un terme, et disposent facilement de la définition d'un terme particulier.
Conclusion : Disposer de terminologies structurées (et multilingues) est un enjeu fondamental pour la maîtrise de la documentation des entreprises. A l'aube de l'an 2000, nous disposons d'une démarche et d'outils pour les constituer et les exploiter efficacement. Néanmoins, la fonction de terminologue demeure : pour bien utiliser ces outils, aider les experts dans leur démarche de validation, mettre en forme des informations terminologiques. Nos remerciements à Yasmina Abbas, ingénieur terminologue travaillant pour EDF-DRD, Beate Lippold, François Cachard, Jean-Marc Coursimault et Cyril Chantrier de la société XEROX, et Eric Boudaillier de la société UNIFIX pour son travail sur WORLDTREK.
Bibliographie : [1] Henry Boccon-Gibod (1999), " Enjeux des outils terminologiques pour la conception, la production et la consultation des documents - Application à la documentation technique des installations de production d'électricité ", DocuWorld 1999, Paris [2] Marie-Luce Picard, Eric Boudaillier (1999), " Multilingual WorldTrek for authoring and comprehension ", IUI'99, Redondo Beach CA [3] D. Bourigault (1994), LEXTER, un Logiciel d'EXtraction de TERminologie. Application à l'acquisition de connaissances à partir de textes, Thèse de l'Ecole des Hautes Etudes en Sciences Sociales, Paris [4] C. Jacquemin (1997), Variation terminologique : reconnaissance et acquisition de termes et de leurs variantes en corpus, Habilitation à diriger des recherches, Université de Nantes [5] Y. Abbas (1999), La doctrine terminologique et la pratique terminographique, Mémoire de DESS Traductique et Gestion de l'Information, INALCO/CRIM [6] D. Garcia (1998), Analyse automatique de textes pour l'organisation causale des actions, réalisation du système informatique COATIS, Thèse de Doctorat en informatique, Université Paris 4 [7] H. Assadi (1998), Construction d'ontologies à partir de textes techniques ; application aux systèmes documentaires, Thèse de Doctorat, Université Paris 6
H.
Boccon-Gibod, ML Picard et D.Garcia sont ingénieurs chercheurs à la Division
Recherche et Développements (DRD) d'EDF, en charge de la définition et
de la mise en place d'outils d'applications de traitement de l'information
textuelle.
|
|||