NORMAND

Étude de la qualification dans un corpus de dégustation du champagne
Sylvie Normand
DYALANG (UPRESA 6065 CNRS)
Université de Rouen

Résumé

Nous étudions le discours de la dégustation du champagne d'un point de vue linguistique. Nous nous intéressons plus spécifiquement au lexique et à la sémantique. Dans le présent article, nous présentons une étude de la qualification dans ce contexte. Nous présentons notre démarche fondée d'une part sur l'analyse du corpus à l'aide d'outils informatiques et, d'autre part, sur une description différentielle du lexique.

Abstract

We study the discourse of champagne wine tasting from a linguistic point of view. More precisely, we are interested in lexicon and semantics. In this article, we present a study of the qualification in this context. We present our methodology based on computer-assisted corpus analysis and on a differential description of the lexicon.

1. Introduction

La dégustation du vin par des professionnels est une activité consistant à interpréter ce que nos différents sens nous transmettent du produit dégusté. Le jugement verbalisé sous différentes formes (fiche de dégustation, commentaire technique...) résulte de cette interprétation. L'objectif du jugement est de rendre compte des qualités des différentes propriétés d'un vin, par exemple nous parlons des différentes qualités de la propriété " acidité ". Nous avons étudié le discours de la dégustation du champagne d'un point de vue linguistique (Normand 1999). Nous avons observé que différents phénomènes linguistiques interviennent lors de la verbalisation du jugement perceptif en dégustation. Dans cet article nous présentons les résultats de notre étude de la qualification dans ce contexte.

Dans le vocabulaire de la dégustation, les adjectifs qualificatifs sont très utilisés. Ils ont la capacité de varier en intensité (par l'usage d'adverbes : très, moins, un peu, beaucoup...) et entrent ainsi dans le paradigme de la graduation. C'est ce que précise R. Rivara (1993) : il est considéré comme " graduable tout adjectif qui admet un adverbe de degré (très, extrèmement [...]) ". Le dégustateur utilise lors de son jugement perceptif une expression linguistique pour marquer avec quelle intensité il perçoit une propriété, par exemple, " attaque souple ", " attaque nerveuse ". " Souple " et " nerveuse " sont deux unités lexicales s'inscrivant dans l'échelle scalaire relative à l'acidité, néanmoins, ces deux unités n'entretiennent pas de relation disjonctive, en effet une attaque qui n'est pas " souple " n'est pas nécessairement " nerveuse ", elle peut être " agressive ", " mince ", etc. Ce point nous conduit à considérer la polarisation selon M. Van Oberke (1975) : " les antonymes gradués de cette classe ne fonctionnent pas comme les signifiés des deux extrémités de la dimension (comme c'est le cas dans naissance/mort [...]) mais comme des pôles de tension ". Sur l'échelle scalaire, nous pouvons plus aisément juger de l'orientation d'une unité que de sa position dans la gradation par rapport aux autres unités de l'échelle. Ceci est probant lorsque nous relevons une profusion d'adjectifs proches. Par exemple, pour exprimer la complexité aromatique, comment opposer " fin " et " élégant " ; pour exprimer l'intensité aromatique, comment opposer " soutenu " et " intense ".

Du point de vue de la terminologie, notons que le vocabulaire de la dégustation relève bien d'une " langue de spécialité " : " [...] ce sont souvent les mots en apparence les plus communs qui lui font prendre conscience du caractère particulier, spécifique, " initiatique " du discours de la dégustation et de ce qu'il recouvre ", d'après M. Coutier (1994). Nous nous inscrivons dans le cadre de la terminologie de domaines de spécialité où nous mettons en avant la notion de textes de spécialité : texte produit par un ou plusieurs acteurs d'un domaine bien déterminé et s'insérant dans une pratique sociale donnée. La terminologie de domaines de spécialité relève de la linguistique, elle s'appuie sur l'analyse de textes de spécialité avec les méthodes de la linguistique et peut faire appel à toutes les branches de celle-ci (morphologie, syntaxe, sémantique). Elle se préoccupe donc de l'analyse des textes de spécialité sous différents angles. Elle s'intéresse au lexique et à sa structuration, elle recense les termes et étudie les relations qu'ils entretiennent dans le discours.

Nous relevons que, bien souvent, la pratique terminologique est axée presque exclusivement sur le substantif en tant que terme. Ce qui précède suggère que nous ne pouvons adopter cette voie. En effet, dans le vocabulaire de la dégustation, bien souvent, le substantif n'a de sens que dans la mesure où il est qualifié. Par exemple, " finale " est considérée comme une unité informative lorsqu'elle est qualifiée de " chaude ", " dure ", " longue ", ... Sans se soustraire totalement à l'unité qualifiée, nous constatons que l'adjectif qualificatif porte l'information. C'est pourquoi nous nous inscrivons dans un programme qui tend à étendre la terminologie à d'autres parties du discours que le substantif comme le précise F. Rastier (1995) : " Le postulat nominal reste influent, et les terminologies sont de fait massivement constituées de noms. Mais ne gagneraient-elles pas à laisser place, de manière réfléchie et systématique, aux autres parties du discours [...] ".

Nous nous démarquons par ailleurs d'une terminologie tendant à constituer le terme en type fixe par le biais de la nominalisation et en isolant le terme de son contexte textuel. Nous illustrons notre point de vue par un exemple. Le qualificatif " vif " ne peut avoir une dénotation fixe mais il prend une valeur selon le contexte textuel dans lequel il apparaît. Il est connoté négativement si " vif " est employé pour rendre compte d'un vin déjà vieilli, par exemple dans le contexte suivant : " je trouve ce vin un peu vif ", il est connoté positivement s'il est utilisé dans un commentaire relatif à un vin jeune, par exemple : " ce vin est jeune, il est vif on doit encore patienter ". Dans ce dernier cas de figure, " vif " rend compte d'un potentiel de vieillissement. Ces deux exemples montrent que " vif " ne peut prendre une valeur dénotative fixe et hors contexte, mais bien que l'unité lexicale se définit par ses contextes, dans ce sens nous rejoignons le point de vue de F. Rastier (1995) : " Nous définissons la sémiosis non comme la relation entre signifiant et signifié, mais comme le réseau des relations entre les signifiés au sein du texte. Nous étendons ainsi au texte la problématique saussurienne de la valeur, fondement de la sémantique différentielle, les signifiants étant les interprétants qui permettent de construire certaines de ces relations. Nous concevons ces relations comme des parcours orientés. Ainsi la sémosis peut être définie comme un résultat de l'interprétation, non comme son point de départ ".

Nous inscrivons notre approche terminologique de la dégustation dans la perspective de la sémantique différentielle développée par F. Rastier (1987) qui présente pour nous un modèle permettant d'analyser et de représenter le sens des unités lexicales à partir de l'étude de corpus. Nous présentons dans la suite de l'article notre démarche d'étude des unités lexicales qualificatives utilisées dans l'activité de dégustation du Champagne. Notre travail s'appuie sur l'analyse d'un corpus que nous avons constitué.

2. Constitution du corpus

Pour cette étude linguistique du vocabulaire de la dégustation nous avons retenu des données provenant de contextes variés en tenant compte de paramètres tels que la dimension orale et écrite, les publics visés (professionnels, amateurs, grand public), le cadre dans lequel s'inscrit le discours (commercial, technique, législatif). L'ensemble de ces paramètres nous a conduit à retenir deux types de sources : (1) les fiches de dégustation (écrit) ; (2) les commentaires d'une dégustation à l'aveugle (oral).

Le corpus écrit est constitué de 400 fiches de dégustation relatives au champagne, représentant 18034 mots. Elles proviennent de 6 sources différentes : " les dégustations du grand jury, le rouge et le blanc ", " les notes Nicolas ", " le guide des meilleurs champagnes de Gilbert et Gayart ", " la revue des vins de France ", " En direct propriété ".

Le corpus oral a été recueilli lors d'une dégustation à l'aveugle - aucune indication sur les produits dégustés n'est donné - ayant réuni 10 professionnels de la dégustation des champagnes (oenologues, sommeliers, chefs de cave,...). La transcription de cette dégustation représente 20294 mots. Les 10 participants étaient répartis en deux groupes et dégustaient les mêmes vins. Après avoir pris des notes sur les produits dégustés, deux personnes du groupe prenaient la parole pour donner leurs commentaires, il s'en suivait une discussion où les autres participants donnaient les leurs. Dans chaque groupe une personne avait pour rôle de présider et de diriger la discussion sur des points controversés, de favoriser l'explication de termes utilisés.

Le corpus étudié est constitué de ces deux sources, la première favorisant souvent l'aspect promotionnel (même si elle utilise pour atteindre ses objectifs des termes techniques), la seconde ayant un aspect plus critique.

Nous envisageons l'utilisation de l'outil informatique comme aide à l'analyse des données textuelles. Du fait que ce corpus présente une cohérence thématique et est suffisamment volumineux, il peut être soumis à une analyse statistique.

3. Les outils informatiques

Nous avons utilisé deux outils informatiques : Alceste et Lexiclass.

3.1 Alceste

Alceste est un logiciel développé par M. Reinert (1995), il offre un ensemble varié de fonctionnalités d'analyse de corpus, nous présentons ici les seules fonctionnalités du logiciel ayant servies lors de notre étude de la qualification. Alceste constitue deux types de dictionnaires, il construit tout d'abord le dictionnaire des formes pleines apparaissant dans le corpus. Il opère une catégorisation morpho-syntaxique de chacune de ces formes. A partir des formes pleines, Alceste effectue une " lemmatisation " en regroupant les formes ayant la même racine, ainsi, sous le même radical " agressi+f " catégorisé A (adjectif) sont regroupées les formes " agressive ", " agressif ", " agressives ". Pour cette étude, nous nous intéressons aux formes catégorisées " A " (adjectif).

3.2 Lexiclass

Nous avons ensuite utilisé le logiciel Lexiclass développé par H. Assadi (1998). Lexiclass est un outil de classification automatique de syntagmes ou de mots extraits d'un corpus en fonction de relations de dépendance syntaxique. Lexiclass a comme principe de fonctionnement de rapprocher deux mots (ou syntagmes) lorsqu'ils partagent un nombre suffisamment important de relations de dépendance syntaxique dans le corpus. Pour cette étude nous effectuons une classification des adjectifs en fonction des noms qu'ils qualifient. A partir du dictionnaire des formes constitué par Alceste, nous avons relevé les formes A (adjectif). Pour chacune d'entre elles nous avons recherché à l'aide du concordancier d'Alceste les unités qualifiées. Si le couple (unité qualifiée, unité qualifiante) rend compte d'un jugement perceptif (ex. : attaque souple) nous le retenons, si le couple n'entre pas dans ce cas de figure nous l'excluons (ex. : vin cher). Nous avons ainsi établi des couples (unité qualifiante, unité qualifiée) que nous avons soumis à l'analyse de Lexiclass. Un extrait de ces données est présenté ci-dessous (tableau 1).

Qualifiant	Qualifié
épais	nez
épais	bouche
évolué	nez
évolué	vin
évolutif	nez
expressif	nez
expressif	arôme
expressif	bouquet

tableau 1 - extrait des données en entrée de Lexiclass

Le logiciel construit l'arbre de classification que nous donnons ci-dessous (figure 1), celui-ci est relatif aux données issues du corpus écrit (les fiches de dégustation). L'arbre de classification ainsi construit se lit de manière " chronologique " (par rapport au déroulement de l'algorithme de classification), de la gauche vers la droite. Pour illustrer cette lecture, nous commentons un extrait de cet arbre :

- Les formes doré, limpide, lumineux teinté sont regroupées dès la première itération de l'algorithme pour former un objet {doré, limpide, lumineux, teinté}. Elles sont proches dans le sens où elles qualifient les mêmes noms ;

- Cet objet est rapproché de la forme soutenu pour former un nouvel objet {doré, limpide, lumineux, teinté, soutenu} ;

- Cet objet est rapproché plus tardivement de ambré et ainsi de suite.

Selon cette démarche, les rapprochements successifs d'objets constituent en final des classes d'adjectifs.

4. Analyse des résultats de Lexiclass

Pour l'extrait que nous avons commenté ci-dessus, les adjectifs regroupés sont représentatifs de la qualification de l'examen visuel et tout particulièrement de deux propriétés à savoir, la limpidité et la couleur. Les résultats des outils informatiques sont des moyens d'accéder au corpus selon un point de vue particulier. Nous nous reposons en partie sur ces résultats pour proposer une présentation des différentes qualités d'une propriété d'un vin en tant que lexique structuré. Ce processus d'analyse se déroule en plusieurs étapes :

1. L'arbre de classification nous fournit tout d'abord des classes d'unités qualifiantes en fonction de l'unité ou des unités qualifiée(s) (Lexiclass a une fonction pour indiquer les unités qualifiées d'une classe, il s'appuie en cela sur les données en entrée, cf. tableau 1 ci-dessus).

2. Suite à la lecture de l'arbre de classification comme nous l'avons décrite précédemment, nous recourons au concordancier d'Alceste pour retourner aux contextes des unités qualifiantes d'une classe.

3. Nous décidons enfin si les classes données par l'arbre de classification sont pertinentes ou non. Dans la plupart des cas, nous les subdivisons en plusieurs taxèmes à l'intérieur desquels nous opposons les unités deux à deux afin de dégager les traits distinctifs de chacune d'entre elles.

Nous utilisons l'outil informatique comme un guide nous permettant de repérer des regroupements significatifs d'unités lexicales (cf. l'arbre de classification). Le concordancier fournit un accès non linéaire au corpus au sein duquel nous pouvons naviguer pour atteindre ces différentes unités, que nous désirons analyser selon un point de vue précis. Dans le cas présent il s'agit du rapport entre unité qualifiante et unité qualifiée. Les contextes textuels auxquels nous avons accès de cette manière, ainsi que notre connaissance de l'activité dans laquelle s'inscrit ce discours, restent des éléments primordiaux pour décrire le sens de ces unités.

Nous donnons à présent les principes de présentation de ces unités en un lexique structuré.

figure 1 - arbre de classification des adjectifs du corpus écrit

5. Principes de présentation du lexique structuré

A partir des différents résultats obtenus, nous proposons une présentation du lexique structuré. L'exemple que nous donnons contient uniquement des adjectifs, mais ce modèle de présentation reste valable pour d'autres parties du discours. Le lexique est structuré dans un premier temps en trois niveaux reflétant le déroulement d'une dégustation technique. Nous reprenons les termes propres à l'activité de dégustation pour introduire cette présentation.

Niveau I : Examen. Il définit dans quel examen la forme linguistique considérée s'inscrit (visuel, olfactif, gustatif). Si une même forme peut se rapporter à différentes propriétés, par exemple " fin " pour nez et " fin " pour l'effervescence, les usages sont différenciés dès ce niveau.

Niveau II : Propriété. Ce niveau définit la propriété que l'on qualifie au niveau III. Cette propriété peut apparaître plusieurs fois dans la hiérarchie, mais elle reste déterminée par le niveau I. Par exemple, la propriété " effervescence " apparaît sous le niveau I " visuel " mais aussi " gustatif ", par conséquent, selon le niveau I, les qualités attachées à " effervescence " différeront.

Niveau III : Qualité. A ce niveau, les formes n'entretiennent plus entre elles des rapports de hiérarchie tels que nous venons de le voir précédemment, mais des rapports de différenciation. Ces rapports doivent être définis pour mettre en évidence ce qui oppose une forme à une autre et par conséquent, ce qui oppose la qualité de la propriété considérée à une autre. Nous notons que ces qualités peuvent s'organiser entre elles sous forme de taxèmes.

Dans l'exemple présenté, les formes constitutives du graphe sont relatives à l'organisation des adjectifs, descripteurs sensoriels d'une propriété donnée. A chacune de ces formes correspond un extrait de contexte dans lequel elle apparaît, celui-ci peut provenir du corpus écrit ou oral.

Nous donnons pour exemple le graphe relatif à la propriété du " glycérol " (ci-dessous). Cette figure illustre les qualités de la propriété du glycérol. Cette propriété est portée par des formes telles que " bouche ", " attaque ", " finale ", " évolution ". Les adjectifs s'organisent selon deux taxèmes //globalisant// et //spécifique//. Par ce biais, nous mettons en avant les descripteurs rendant compte d'un volume en bouche //globalisant// et ceux rendant compte d'un effet spécifique au glycérol, précisant la qualité //spécifique//.

(A) Les éléments " ample " et " plein " sont posés comme synonymes, nous n'avons pas de contextes permettant de les opposer. (B) Nous les distinguons en revanche de " carré " qui rend compte d'un équilibre, d'un volume mais manquant de maturité.

Le deuxième taxème, //spécifique//, organise ses éléments selon l'axe /diminution de l'équilibre acide-glycérol/. Ces formes témoignent d'une présence de plus en plus marquée du glycérol allant jusqu'à l'excès (sirupeux). (E) Le seuil défini sur la figure est une frontière entre les formes connotées positivement et celles connotées négativement. Le corpus oral nous a permis de définir certains traits opposant les formes entre elles : (C) marque la transition entre les éléments globalisants et les éléments spécifiques, " charnu " est un élément marquant la transition (D) /marque plus de vivacité/ (F) /même effet de matière/ + /adhérence/ (G) /même effet de matière/ + /sensation sucrée/.

Pour valider ce modèle de présentation, nous avons constitué dix graphes semblables à celui de la figure 2. Ces graphes contiennent entre 1 et 6 taxèmes chacun et regroupent au total une centaine d'adjectifs. Etant donné la taille du corpus (environ 40 000 mots), ces résultats ont permis une mise en œuvre significative de notre méthodologie.

figure 2 - Représentation de deux taxèmes relatifs à la propriété " glycérol "

6. Conclusion et perspectives

Nous avons montré que notre démarche terminologique pour décrire le vocabulaire de la dégustation s'appuie sur les contextes textuels des unités lexicales considérées ainsi que sur la connaissance que nous avons de l'activité.

La méthodologie mise en œuvre montre la grande utilité de l'outil informatique. En effet, si l'on envisage d'analyser un corpus selon des objectifs différents, l'outil informatique permet de naviguer de manière non linéaire dans le corpus pour accéder aux informations textuelles nous aidant à atteindre ces objectifs. Il permet également d'effectuer des regroupements significatifs d'unités lexicales en fonction de critères morpho-syntaxiques ou statistiques. En cela, l'outil informatique constitue une aide à l'interprétation des textes.

La méthodologie mise au point offre des perspectives appliquées. Le graphe relatif au glycérol présenté ci-dessus montre les relations que les unités lexicales (adjectifs) entretiennent entre elles. Par ces liens ces unités s'organisent en un lexique structuré. Ce type d'organisation peut être étendu à d'autres parties du discours.

C'est pourquoi nous pouvons envisager une interface informatique permettant de naviguer dans le lexique structuré. Outre les renvois au sein du même taxème (tels ceux de la figure 2), nous envisageons des renvois entre taxèmes de types différents, mais se rapportant à la même propriété du même examen. Par exemple, nous avons constitué des classes de verbes et les avons associées aux différentes propriétés (nez, effervescence, etc.). On peut établir des liens entre les classes de verbes introduisant une propriété donnée et les taxèmes d'adjectifs qualifiant celle-ci. Pour chaque unité lexicale, cet outil informatique doit également permettre des renvois aux contextes textuels à partir desquels elle a été définie.

Il est souhaitable qu'une telle interface soit interactive. A partir d'une base telle que nous l'avons décrite précédemment, l'utilisateur pourrait ajouter des liens relatifs à de nouvelles unités lexicales. Ainsi il aurait la possibilité de personnaliser, d'enrichir son lexique à partir d'une base commune.

Bibliographie

Assadi H. (1998), Construction d'ontologies à partir de textes techniques, application aux systèmes documentaires, thèse de l'université Paris 6, 286 p.

Coutier M. (1994), " Tropes et termes : le vocabulaire de la dégustation du vin ", dans dir. Candel D., Meta vol.39 n°4, P.U.M., Montréal, p. 662-675

Normand S. (1999), Analyse sémantique d'un discours professionnel. Les mots de la dégustation du champagne, thèse, Université de Rouen, 347 p.

Rastier F. (1987) (éd. 1996), Sémantique interprétative, P.U.F., Paris, 276 p.

Rastier F. (1995), " Le terme : entre ontologie et linguistique " dans La banque des mots, numéro spécial " terminologie et IA " (actes du colloque TIA'95), CILF, Paris

Reinert M. (1995), " Quelques aspects du choix des unités d'analyse et de leur contrôle dans la méthode" Alceste " ", dans JADT 1995, CISU, Rome, p. 27-34

Rivara R. (1993), " Adjectifs et structures sémantiques scalaires " dans L'information grammaticale n°58, ed. " société pour l'information grammaticale ", Paris, p. 40-46

Van Oberbeke M. (1975), " Antonymie et gradation ", dans La linguistique n°11, P.U.F., Paris, p. 135-154

_retour à la page principale_