WINTEZ
- L'exploitation et l'actualisation de la base de données Thésaurus CEI
sous une interface de travail Windows
P. Onica, Al. Timotin, F. T. Tanasescu |
![]() ![]() |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Le logiciel WINTEZ a été conçu pour introduire dans la banque de données du Thesaurus des concepts de la C.E.I (THCEI) les termes d'une nouvelle langue, dite additionnelle (l'allemand, le polonais ou le russe) à côté des termes français, anglais et roumains existants, qui correspondent aux concepts déjà introduits dans la banque à partir des publications sources de la C.E.I. Le logiciel a été réalisé dans le but de remplir le fichier des termes de la langue additionnelle choisie, en regardant sur l'écran les termes anglais et français. La source principale des termes de ces nouvelles langues sera le Dictionnaire Multilingue CEI - Electricité, Electronique et Télécommunications, Edition Elsevier, 1992, dont le premier volume permet de rechercher ces termes à partir des termes anglais ou français alphabétisés. Les autres sources sont les fascicules du Vocabulaire CEI et les autres publications de la CEI (normes, rapports, etc.). WINTEZ s'installe grâce à un kit d'installation qui s'exécute automatiquement dans un répertoire indépendant, créé auparavant sur le disque dur de l'ordinateur. Il faut copier la base de données (fichier tezaur.mdb) dans le répertoire DATA, qui se crée automatiquement avec l'assistant d'installation. Une fois installé, le lancement de WINTEZ sous Windows se fait en cliquant sur l'icône du programme exécutable, représentant un livre ouvert.
1. La fenêtre principale (l'écran des concepts) La première fenêtre qui apparaît immédiatement après le lancement du programme est la fenêtre principale, présentée ci-dessous : Fig.1. La fenêtre principale Dans la partie haute de l'écran, une barre permet de sélectionner les menus File, Tools, Language et Help. Pour le moment, seuls File, Tools et Language peuvent être activés. Le menu Language sélectionne les trois langues qui seront présentées sur l'écran. Dans cette version, les concepts sont en anglais et français, langues fixes. On ajoutera une troisième langue, le polonais, le russe ou l'allemand. Sous la barre des menus, une liste décrit toutes les caractéristiques du concept concerné, à savoir le code numérique interne, le domaine principal d'appartenance du concept, le sous-domaine, la catégorie, le type, 4 autres domaines secondaires d'appartenance du concept, le code de l'opérateur désigné par une petite lettre et la date a laquelle le concept à été introduit dans WINTEZ. Sous cette liste, un tableau "Main Descriptors" présente, sur trois lignes, les dénominations préférées (descripteurs) du concept considéré en anglais, en français et dans la langue additionnelle (pour le moment l'allemand). Au lancement du programme, ce concept est toujours celui dont le code numérique interne est le plus petit. A l'extrémité gauche de chaque ligne de ce tableau, un bouton "English", "French" ou "German", permet de choisir la langue de travail, à savoir celle dans laquelle les termes pourront être effacés, créés ou modifiés. Au dessous du tableau "Main Descriptors", 2 boutons "Add. Def. " et "Edit Def. " permettent d'introduire, d'effacer ou de modifier, dans la boîte de texte correspondante, le texte de la définition d'un concept, dans la langue choisie par l'utilisateur. Il faut introduire le code numérique de l'auteur de la définition, traité comme une publication source, dans le champ "Définition by". Les champs "Data" (date de l'opération sous la forme MM/JJ/AA) et "Operator" (symbole littéral de l'opérateur) seront automatiquement remplis. Cinq boutons "Del Term", "Add Term", "Edit Term", "New Pubs" et "Add. Rel" se trouvent sous le texte de la définition. Seul le bouton "Add Term" est actif au lancement de programme. Les boutons "Del Term", "Add Term" et "Edit Term" permettent d'effacer, d'ajouter ou de modifier un terme dans la langue de travail choisie, en ouvrant la fenêtre de traitement des termes et de leurs références - l'écran des termes (Voir fig. 7). En ouvrant l'écran des publications (Voir fig. 8) et en cliquant sur le bouton "New Pubs", on peut créer une nouvelle publication, dont le code sera automatiquement créé à partir du code de la dernière publication. En cliquant sur le bouton "Add Rel", on pourra consulter, créer ou modifier les relations sémantiques rattachées au concept (Voir fig. 9). Dans la partie inférieure de cet écran, il y a une fenêtre où les termes rattachés au concept dans la langue de travail sont automatiquement inscrits. Dans cette fenêtre, les descripteurs sont précédés du symbole @, les synonymes tolérés de la lettre T, les synonymes non recommandés de la lettre N, les abréviations de la lettre A, et les formes à renvoi unilatéral de la lettre S. La barre de contrôle, située en bas de la fenêtre principale, permet à l'utilisateur de parcourir la base de données en cliquant successivement sur la flèche ®, la consultation se faisant dans l'ordre croissant des codes de concepts. Chaque fois que l'utilisateur cliquera sur la flèche ¬½, il reviendra au premier concept, et dès qu'il cliquera sur la flèche ½® , il obtiendra le dernier concept de la base (ou d'une base restreinte, obtenue par sélection , Voir ci-dessous "Select concept").
2. Les opérations effectuées par WINTEZ La version actuelle du logiciel Wintez permet de réaliser les opérations suivantes :
2.1. Usage du menu "Tools" de la fenêtre principale Ce menu permet d'accéder à 4 options : "Go to concept", "Select concept", "Search term" et "Select all"
Fig.2. Fenêtre de recherche d'après le code du concept Dans l'espace libre, il faut entrer le code numérique du concept recherché. En cliquant sur OK, l'utilisateur reviendra à la fenêtre principale (Voir Fig.1) qui décrira toutes les caractéristiques du concept choisi. Les codes des concepts étant définis selon un algorithme compliqué, en cas d'erreur de frappe au moment de la saisie du code, le programme choisira automatiquement le code valable immédiatement supérieur au code erroné.
Fig.3. Fenêtre de sélection d'un concept Cette fenêtre "Concept Query" permet de trier les concepts de la base de données, selon les contraintes choisies à partir des sous-menus associés à une barre à 4 champs. Par exemple, si l'on sélectionne les concepts du domaine 20 et de type Q, il faudra suivre les opérations suivantes :
Cette fenêtre aura le contenu suivant : Fig.4. Fenêtre de sélection des concepts du type Q du domaine 20 Dans cet exemple, on remarque que l'interrogation porte sur un domaine et un type et que l'instruction SQL correspondante s'inscrit automatiquement dans la boîte de dialogue inférieure. Ainsi, on peut imaginer beaucoup d'autres exemples d'interrogations de la base de données. Pour ceux qui connaissent le langage SQL, il pourraient écrire directement l'instruction dans le champ SQL Sentence. Si l'instruction SQL souhaitée est correcte, on clique sur "Search". Quelques instants après, la fenêtre principale (fig.1) de la base de données va traiter tous les concepts du domaine 20 et de type Q. A l'aide de la flèche ®, on pourra parcourir dans l'ordre croissant des codes des concepts toute cette base restreinte, du premier au dernier terme. Au dernier terme, on pourra revenir aux termes précédant en cliquant sur la flèche ¬. Pour quitter cette fenêtre, il faut choisir l'option "Select All" dans le menu "Tools".
Fig.5. Fenêtre de recherche et sélection des termes à partir de leur nom Par exemple, si l'on souhaite trouver la famille des termes anglais contenant dans leur dénomination le mot "voltage", il faudra entrer dans le champ "Find what" le mot *voltage*, c'est-à-dire le groupe de lettres recherché précédé et suivi d'un astérisque qui remplace toute partie non écrite de la dénomination complète des termes contenant ce groupe. On pourra écrire seulement le mot voltage, mais la base de données ne fournira que ce mot, et pas toute la famille de ce mot. En entrant *voltage, on obtiendra la famille des mots se terminant par le groupe de lettres voltage. Enfin, en écrivant voltage*, on obtiendra la famille des mots commençant par ce groupe de lettres. Le groupe de lettres est quelconque et ne doit pas nécessairement avoir de signification : une recherche sur le groupe *voltag* sera aussi utilisable. En activant respectivement les boutons "Concept code", "Term code" ou "Term name", la famille des termes obtenue pourra être ordonnée selon le code du concept, le code du terme ou l'ordre alphabétique des dénominations. La recherche des termes et la création de la famille est déclenchée en cliquant sur le bouton "Find next". En cliquant sur "Find next" ou "Find preview", tous les termes de la famille seront ordonnés dans l'ordre choisie. Pour revenir au premier écran (Fig.1), il faudra cliquer sur le bouton "Close".
Fig.6. Fenêtre de recherche des termes à partir leur code Il ne faut pas confondre cette option "Search Term - By code" avec l'option "Go to" du menu "Tools" qui requiert le code du concept. L'option "Select All" du menu "Tools" permet de revenir à la base initiale, ordonnée à partir des codes des concepts, suite à une recherche effectuée avec "Tools - Search term".
3. Introduction des termes de la langue additionnelle Supposons que l'on veut introduire le terme de la langue additionnelle (allemand) qui correspond au concept identifié à l'aide du descripteur anglais respectif. On part de la fenêtre principale (Fig.1) du programme WINTEZ et on sélectionne l'anglais comme langue de travail. Avec le menu "Tools" et les options "Search term" et "By name", on recherche le terme anglais et on l'introduit dans la fenêtre principale. On vérifie que ce terme est bien le descripteur d'un concept, et non un synonyme, et que le descripteur français correspond bien à la traduction du Dictionnaire CEI. Enfin, à l'aide de la définition du Dictionnaire, on vérifie que le concept du descripteur anglais est bien identifié. Dans la fenêtre principale, l'enregistrement de la langue additionnelle est vide pour ce concept. On choisit cette langue comme langue de travail (allemand), on clique sur "Add Term", et on obtiendra cette nouvelle fenêtre de dialogue : Fig.7. Fenêtre d'introduction des termes et de leurs références (écran des termes) 3.1. Disposition des champs La première barre de cette fenêtre contient les champs suivants :
Sous la seconde barre réservée à l'expression du terme, la troisième barre contient la relation terme<>publication, comprise dans les champs suivants :
Les boutons de cette fenêtre sont :
Dans la partie inférieure de cet écran, il y a une fenêtre dans laquelle l'ordinateur inscrit automatiquement toutes les publications rattachées au terme, dans la langue de travail. Dans cette "boîte à liste", les publications sont précédées des informations suivantes : code numérique de la publication, niveau de référence du terme dans la publication respective, page où le terme à été identifié, section, dernier numéro du terme sur la page et code de l'éditeur. Après avoir introduit les informations dans cette fenêtre, on clique sur "OK" pour que ces informations soient introduites dans les fichiers des termes et des références aux publications de la langue de travail (le polonais). Si l'on veut modifier un terme déjà introduit dans la langue de travail, on se place dans le champ inférieur de la fenêtre principale, et on clique sur @, qui indique le descripteur. A ce moment, on peut cliquer sur "Edit Term" et éditer le terme dans la fenêtre ouverte (fig. 7). Si l'on veut ajouter un terme non descripteur (synonyme toléré ou non, abréviation, etc.), il faut sélectionner, dans le champ inférieur de la fenêtre principale, le descripteur marqué d'un @ et cliquer sur "Add Term". Après avoir cliqué sur OK, on obtiendra la fenêtre principale qui présente les non-descripteurs.
4. Introduction des publications Il s'agit de l'écran qui traite les fichiers (les tables ACCESS) des publications, c'est-à-dire :
On accède à cette fenêtre de traitement des publications (écran des publications) en cliquant sur "New Pubs" (à partir de l'écran des concepts ou de l'écran des termes) ou sur "Go pubs" (à partir de l'écran des termes). Fig.8. Fenêtre d'introduction des publications (écran des publications) Les significations des champs à compléter lors de l'introduction d'une nouvelle publication sont mentionnées ci-dessous :
Les boutons de cet écran sont :
En bas de l'écran des publications, la liste des termes extraits de cette publication apparaît automatiquement avec les données suivantes :
5. Introduction des relations sémantiques rattachées au concept Le bouton "Add Rel" permet d'accéder à cette fenêtre de traitement des relations sémantiques rattachées au concept par, à partir de l'écran des concepts (fenêtre principale).
Fig.9. Fenêtre d'introduction des relations sémantiques (écran des relations concept-concept) On pourra voir, créer ou modifier les relations sémantiques attachées au concept. Les champs "C_Cod" et "Term" s'affichent dès que cet écran apparaît. Dans la partie inférieure de cet écran, il y a une fenêtre où l'ordinateur inscrit automatiquement tous les concepts (dans la langue de travail) rattachées au concept entré dans le champ "C_Cod". Pour ajouter une nouvelle relation, on remplit le champ "Subordonation_rel" avec le type de relation indiquée dans ce qui suit, et dans le champ situé à droite de celui-ci, on inscrit le code du concept correspondant. Si on souhaite effacer un concept, on le sélectionne dans la liste déroulante des relations et on clique sur "DelRel". On utilise trois genres de relations binaires entre concepts :
Relations hiérarchiques Ce sont des relations binaires asymétriques (ayant donc une inverse) de nature logique. On utilisera 5 espèces (ou types) de relations hiérarchiques ascendantes :
Relations hiérarchiques prioritaires La structure du Thesaurus est multi-hiérarchique, avec plusieurs relations ascendantes. Afin de pouvoir en extraire une arborescence unique et de rendre l'identification des champs sémantiques plus aisée, seule l'une des relations ascendantes de chaque concept, est choisie comme prioritaire. Les relations prioritaires sont de même type que les relations de départ et seront indiquées par le symbole graphique suivant:
Relations associatives (non hiérarchiques) Relations symétriques qui associent des concepts qui ne peuvent pas être mutuellement hiérarchisés : leurs aires d'utilisation se recouvrent partiellement ou sont disjointes. En tant que relations symétriques, elles coïncident avec leurs inverses. Chaque association entre deux concepts peut impliquer un point de vue différent (voisinage sémantique vague, analogie logique, dualité, similarité factuelle, quasi-synonymie, opposition logique ou factuelle, apparentement par définition). De ce fait, les associations ne sont que rarement transitives. Les concepts associés peuvent avoir des types différents. On emploie 4 espèces de relations d'association :
Pour faire une image quantitative sur les données introduites dans la base, et prises par domaine, on donnera quelques exemples dans ce qui suit :
Annexes 1. Les tableaux du THCEI utilisés par le code WINTEZ
2. Appartenance des concepts (ou des publications) Domaine principal DO. Sous-domaine SD Ì DO Domaines secondaires DO1,DO2,DO3, DO4
Liste des domaines du THCEI
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||