Cours - 3. Le mot

Site: PRELUDE - La plateforme de pré-rentrée Unicaen
Cours: Morphologie des langues
Livre: Cours - 3. Le mot
Imprimé par: Visiteur anonyme
Date: vendredi 22 novembre 2024, 01:52

3. Le mot

La définition retenue pour le mot est la suivante : un mot est un signe segmental autonome qui ne soit pas divisible en mots. (Mel’cuk, 1993)

Je rappelle tout d’abord qu’une telle définition n’est possible que dans le cadre d’une langue particulière.

Trois points doivent être développés dans cette définition : 1) le notion de signe segmental, 2) la notion d’autonomie du signe, et 3) la notion subsidiaire de divisibilité.

3.1. Le signe linguistique, sens, signification et valeur grammaticale

Depuis Ferdinand de Saussure, fondateur de la linguistique moderne, il est d’usage d’analyser le signe linguistique - on peut à titre provisoire assimiler le signe au mot - comme une unité à double face comportant d’une part un signifiant et d’autre part un signifié. Dans la langue orale, le signifiant correspond à la forme phonique du signe et dans la langue écrite, il correspond à sa forme graphique. Le signifié représente le concept associé au signifiant. À ces deux notions indissociables, il convient d’en ajouter une autre - le référent - qui représente ce à quoi renvoie le signe dans le monde. Il y a donc une ligne de partage entre ce qui est proprement linguistique - le signe, et ce qui est non linguistique : le référent. Cette conception du signe est illustré par le schéma suivant :

[ ʃa]
"CHAT"
extra-linguistique linguistique

Le référent est ici représenté par un dessin qu’il faut interpréter comme un objet réel ou imaginaire, un chat particulier - le chat de ma concierge par exemple - et le signe se présente sous la forme d’une transcription phonétique pour le signifiant, et sous la forme conventionnelle d’une notation en majuscule et entre guillemets pour le signifié. Pour être plus précis, nous devrions remplacer la notation “CHAT” par l’ensemble des propriétés descriptives nécessaires à la caractérisation du concept. On peut à cet effet utiliser la définition du dictionnaire : animal domestique de la famille des félidés.

La notion de signifié doit être précisée : dans l’exemple précédent, le signifié renvoie à deux notions distinctes, le sens et la signification, qu’il convient d’articuler correctement par rapport au référent.

Précisons tout d’abord qu’un signe linguistique ne se réduit pas au mot. C’est simplement par commodité que le signe est souvent illustré par un mot, comme dans l’exemple précèdent. Tout constituant de la langue fonctionne comme signe. Considérons les exemples suivants :

a. Le chat de la concierge était dans l’escalier hier
b. Le chat de la concierge
c. La concierge
d. concierge

Les quatre énoncés a, b, c et d sont des signes. Le premier est une phrase, le second et le troisième sont des syntagmes nominaux, le dernier est simplement un mot. Le référent de la phrase - ce à quoi elle renvoie dans le monde - est un événement situable dans le temps et dans l’espace. Les référents de b et de c sont respectivement un animal et une personne qu’il est possible également de situer dans l’espace, dans le temps, dans la réalité ou dans une fiction. Par contre le dernier exemple - concierge -, ne peut pas être associé directement à un référent. Le signifié des trois premiers énoncés met en jeu une signification et un sens. Le sens, c’est ce qui permet à une entité du monde (événement, objet, être vivant…) d’être représentée par un signe. Nous dirons que le chat de la concierge et la concierge sont des constituants avec un sens parce qu’il est possible de leur associer un référent. Par contre les simples mots chat et concierge, n’ont pas de sens, car tels quels, on ne peut pas leur associer de référent ; ils n’ont qu’une signification. On peut seulement associer aux signifiants chat et concierge un concept ; ce qu’est un ou une concierge, ce qu’est un chat. Par conséquent, les noms communs isolés n’ont pas de sens par eux-mêmes mais seulement une signification. C’est seulement lorsqu’ils sont employés dans la langue qu’ils acquièrent un sens au moyen notamment de la détermination.

Par ailleurs, le déterminant le est également un signe, mais son signifié n’est pas assimilable à une signification qui puisse faire l’objet d’une définition dans les mêmes conditions que les mots chat et concierge. Il n’a ni sens ni signification. Par contre il permet de construire le sens d’un mot à partir de sa signification, en lui donnant une interprétation particulière. L’article le permet d’isoler un élément parmi un ensemble d’éléments dont la nature est définie par la signification du nom. On dira alors que le a une fonction ou une valeur grammaticale dans l’énoncé - il permet de construire le sens - et le signifié de cet élément correspond à cette valeur grammaticale.

De ce qui vient d’être dit à propos du signe linguistique en général, on peut en déduire pour le mot qu’il a soit un sens, soit une signification, soit une valeur grammaticale. Les trois cas de figure sont illustrés par les exemples suivants :

a. hier, Paul, je : (sens)
b. chat, manger, joli : (signification)
c. le, de, à : (valeur grammaticale)

hier, Paul, je, sont des mots qui ont un sens mais pas de signification. Les mots chat, manger, et joli pris isolément ont une signification mais pas de sens, et les mots le, de, à ont une valeur grammaticale mais ni sens ni signification. Il faut surtout retenir ici que la plupart des noms communs n’ont par eux-mêmes qu’une signification. Notons au passage qu’un mot grammatical telle qu’une préposition peut combiner à la fois une valeur grammaticale et une signification. Si l’on considère les trois prépositions de, par et dans ; il y a une gradation entre ces trois prépositions qui va de la simple valeur grammaticale à une combinaison d’une valeur grammaticale avec une signification spatiale. La préposition par occupe une position intermédiaire : on peut considérer que sa signification est plus abstraite que celle de dans mais qu’elle n’est pas nulle comme dans le cas de la préposition de.

Le mot est donc un signe, et la définition donnée précédemment précise qu’il s’agit d’un signe segmental, c’est à dire qu’il se présente dans la langue nécessairement comme une unité isolable dans un énoncé et qu’il peut être analysé comme une succession de sons, de syllabes et de morphèmes. Ce point est important car le morphème quant à lui n’est pas nécessairement de nature segmental (voir plus loin).

Le mot n’est pas la plus petite unité qui fonctionne comme signe dans la langue ; c’est le morphème. Un mot tel que chanteur s’analyse en deux morphèmes chant et eur et chacun d’eux forme un signe. Les mots qui contiennent plusieurs éléments de signification sont des mots complexes, par opposition aux mots simples comme chat, escalier, hier qui ne sont pas analysables en signes segmentaux.

3.2. L’autonomie du mot

La notion d’autonomie comporte deux volets. Un mot est autonome parce qu’il est libre et séparable. Dans l’exemple le chat de la concierge repris ici, chat est un signe segmental libre parce qu’il n’est pas lié par son contexte immédiat; la présence du segment chat n’implique pas la présence du segment le à gauche, ni la présence du segment de à droite. Comme le montre le découpage, on peut remplacer le et de par autre chose :

le chat de la concierge
plusieurs sauvage

Si nous appliquons le même raisonnement pour le mot escalier, on ne peut pas dire, par exemple, que escalier est constitué de deux segments escal+ier, car la présence du segment “escal” implique celle de “ier” pour former un signe. De plus, il est impossible de traiter ce mot comme un mot complexe formé de deux morphèmes sur le modèle de vitrier par exemple, car la relation entre le tout que forme escalier et les deux segments “escal” et “ier” n’est pas assimilable à la relation qui existe entre vitrier et les segments vitr- (vitre) et -ier. Pour qu’une segmentation du mot escalier soit possible sur le modèle de vitrier, il faudrait dans ce cas que l’élément -ier ait la même signification (formation d’un nom de métier). Escalier est donc un mot simple qui se trouve avoir la même terminaison phonétique et graphique que le mot complexe vitrier.

Le mot défini à partir du critère de liberté ne correspond pas nécessairement au mot tel qui se présente à l’écrit. Considérons les deux exemples suivants :

a. au fur et à mesure
b. d’ores et déjà

Dans ces deux exemples fur et ores ne peuvent pas être considérés comme des mots dans la mesure où fur et ores ne peuvent être envisagés indépendamment des contextes respectifs au___et à mesure et d’___ et déjà. Je reviendrai sur ce problème lorsqu’il sera question de la divisibilité du mot.

Considérons maintenant le cas de l’article, des pronoms personnels associés au verbe et des prépositions dans les contextes suivants :

a. le chat
b. je parle
c. des poils de chat

L’article le, le pronom personnel je et la préposition de ne sont pas libres puisque leur présence dans l’énoncé est liée à la présence d’un nom pour l’article et pour la préposition, et à la présence d’un verbe pour le pronom personnel. De plus, aucun de ces mots ne peut apparaître seul dans la langue : l’article et la préposition sont toujours associés à un nom ou à un syntagme nominal pour les prépositions, tandis que les pronoms personnels tels que je, tu, il(s), elle(s)… placés devant le verbe - pronoms clitiques - sont toujours associés à un verbe. Par contre les mots chat et parle sont bien des éléments libres car ils peuvent apparaître dans un autre contexte ; contexte sans article pour le mot chat comme dans l’exemple des poils de chat, contexte sans pronom pour le verbe comme dans l’exemple Pierre parle trop.

Si nous devions nous en tenir simplement au critère de liberté, appliqué à l’article, au pronom et à la préposition, nous devrions traiter la séquence article + nom, pronom + verbe et préposition + nom comme un seul mot, alors que le nom et le verbe sont traités comme des segments libres par ailleurs. Ce qui est effectivement le cas en roumain pour l’article défini, en espagnol pour les pronoms objet d’une forme verbale impérative, gérondive ou infinitive, et en estonien pour l’équivalent de la préposition avec :

a. lupul (roumain) = le loup (lup = loup, -ul = le)
b. dándomelo (espagnol) = (en) me le donnant
c. pojaga (estonien) = avec (le) garçon (poja = garçon, -ga = avec)

Lupul correspond à le loup, lup étant le nom loup en roumain. De même en espagnol, ce qui en français correspond à trois mots dans en me le donnant est traité dans cette langue comme un seul mot à l’écrit. En estonien - langue apparentée au finnois - l’équivalent de la préposition avec - le segment - ga - est incorporé au nom poja (garçon).

En français, l’article, la préposition et les pronoms clitiques sont bien des éléments autonomes, et il nous faut donc faire appel à un critère supplémentaire pour pouvoir les traiter comme mots à part entière.

Ce critère supplémentaire est celui de la séparabilité. Deux segments quelconques forment deux mots distincts s’il est possible d’insérer entre les deux, un autre mot. Entre l’article et le nom il est possible d’insérer un adjectif : entre le et chat (exemple a), il est possible d’insérer le mot petit. Cette opération étant impossible en roumain, on comprend pourquoi l’article est soudé au nom. Entre le pronom clitique et le verbe il est possible d’insérer la négation (exemple b). Entre la préposition et le nom il est possible d’insérer un déterminant possessif (exemple c) :

a. le petit chat
b. je ne parle pas
c. de son chat

3.3. Les mots composés

Les seuls éléments qui posent problème pour une définition du mot fondée sur son caractère autonome sont les mots composés tels que :

a. pomme de terre ( *pommes nouvelles de terre)
b. porte-bagages
c. portemanteau
d. ivre mort

Ces quatre mots illustrent quatre types de mots composés. Ceux qui, sur le modèle de pomme de terre, se présentent comme des constructions syntaxiques ; les deux mots sont réunis par le biais d’une préposition et de terre est ici un complément de nom ordinaire. Et ceux qui, comme porte-bagages, portemanteau ou ivre mort se présentent sous la forme d’une simple juxtaposition, avec éventuellement une différence de traitement orthographique : certains comme porte-bagages ont un trait d’union, certains ne forment qu’un seul segment écrit comme portemanteau, et d’autres enfin se présentent simplement comme deux mots indépendants.

Chacun de ces mots composés a une signification particulière et les mots n’y sont pas libres. Lorsque nous parlons du légume, la présence de pomme implique la présence de de terre et inversement. De plus, ces composants ne sont pas séparables. Il n’est pas possible d’insérer un adjectif ou un article entre de et terre. On dit : des pommes de terre nouvelles et non des *pommes nouvelles de terre. N’étant ni libres ni séparables les mots composés doivent donc être traités comme des mots uniques. Cette approche est correcte si l’on s’intéresse aux unités de la langue qui sont dotées chacune d’une signification spécifique. D’un autre côté, il est clair que pomme de terre met en jeu trois mots, et deux mots pour porte-bagages, portemanteau et ivre mort. Si l’on s’en tient à la définition de Mel'cuk donnée en 3, les quatres exemples ci-dessus sont bien des formes complexes dans la mesure où chacun d’eux est divisible en mots. Pour chacun d’eux, on reconnaît dans le mot composé, plusieurs mots qui existent indépendamment dans la langue. Pomme est un mot du français, de également et terre également. La même chose pour les trois autres exemples. Il y a donc une analyse possible en plusieurs mots bien que le critère de liberté et de séparabilité ne s’appliquent pas pour les mots composés.

Loin d’être une difficulté pour la définition du mot, ce problème montre simplement que nous devons nous accommoder d’une certaine souplesse dans la conception du mot. En fait il faut considérer que la définition du mot varie aussi selon le point de vue adopté. En ce qui concerne les mots composés des quatres exemples ci-dessus, deux points de vue sont en concurrence pour le moment : le point de vue lexical et le point de vue syntaxique. Du point de vue lexical, pomme de terre est un mot unique du fait qu’il a une signification propre qui ne se réduit pas à une combinaison des significations des mots qui le composent. Si nous devions dans un texte quelconque relever tous les mots pour constituer un glossaire, il est clair que pomme de terre serait traité comme un mot unique (ce mot est également traité comme une entrée lexicale indépendante dans les dictionnaires). Du point de vue syntaxique, pomme de terre est ambigu : d’un côté il fonctionne comme une unité simple susceptible de recevoir un déterminant et d’autres expansions propres au nom comme l’adjectif nouvelles dans pommes de terre nouvelles, d’un autre côté, de terre se présente comme un complément de pomme. Point important : si le mot composé pomme de terre est au pluriel, la marque de pluriel apparaît sur pomme et non à la fin du mot composé. Ce type de mot composé est donc du point de vue syntaxique et morphologique une construction complexe.

3.4. Les clitiques

Le problème qui vient d’être évoqué à propos des mots composés et sa conséquence pour la définition du mot n’est pas spécifique à ce type de mots. Il en va de même pour les pronoms clitiques. Les pronoms clitiques sont les pronoms qui apparaissent dans le contexte immédiat du verbe : je, me, tu, te, etc… Du point de vue syntaxique se sont des mots à part entière - c’est pour cette raison qu’ils sont traités comme tels à l’écrit en français - mais du point de vue phonologique ce ne sont pas des éléments indépendants. Du fait de cette propriété phonologique, on les appelle aussi pronoms atones. Par définition les pronoms clitiques sont toujours adjoints à un autre mot qui leur sert de support. C’est pourquoi ils ne peuvent jamais apparaître seuls. Ainsi, en réponse à une question qui porte sur le sujet de la phrase, on ne dira pas je, mais moi. En outre, les pronoms clitiques ne peuvent pas être coordonnés :

a. -Qui est venu hier ?
-*je/moi
b. *Je et tu sommes venus hier.
Toi et moi sommes venus hier.

Les pronoms clitiques ne sont pas une particularité du français, on les retrouve dans d’autres langues à commencer par les langues romanes. La notion de clitique est plus générale et ne vaut pas seulement pour les pronoms. Par exemple, en latin, il existe une conjonction de coordination clitique équivalente à et :

Terra marique
(sur terre et sur mer)

Un clitique est donc un mot syntaxique mais pas un mot phonologique. La conséquence la plus immédiate est qu’ils ne peuvent pas avoir d’accent.

3.5. Le mot et les niveaux d’analyse

En conclusion, ce qui correspond à un mot varie d’une langue à une autre, et pour une langue donnée, la notion de mot varie également en fonction du niveau d’analyse. Il convient donc de distinguer le mot phonologique (qui se définit notamment par la distribution de l’accent de mot), le mot lexical (possédant une signification propre) et le mot syntaxique qui définit un constituant de la phrase. À ces trois points de vue, on ajoutera le mot morphologique défini comme une unité contenant un ou plusieurs morphèmes :

a. mot phonologique
b. mot lexical
c. mot syntaxique
d. mot morphologique

Comme on vient de le voir à propos des mots composés et des clitiques, l’analyse en unités plus petites ne coïncide pas d’un niveau à un autre. J’illustrerai à nouveau ce point par deux exemples. Le premier exemple concerne les mots complexes :

a. mot phonologique : chanteur /ʃatœr/
b. mot morphologique : chanteur /ʃat +œr/
c. mot syntaxique : chanteurs

Un mot complexe tel que chanteur se découpe au niveau phonologique en deux syllabes chan + teur alors qu’au niveau morphologique son découpage en morphèmes est différent ; chant + eur. Sur le plan syntaxique, chanteur est une unité, il aura par conséquent exactement les mêmes propriétés qu’un nom simple. La marque du pluriel (en gras) se placera à la fin du mot.

Le second exemple met en opposition le niveau phonologique et le niveau syntaxique :

a. mot syntaxique : (les) enfants
b. mot phonologique : les enfants /lɛ+zɑ̃+fɑ̃/

Le groupe les enfants contient deux constituants syntaxiques qui s’accordent en genre et en nombre. Ces deux mots sont séparables. Au niveau phonologique, ce groupe ne forme qu’une seule unité accentuelle dans laquelle le découpage syllabique montre que la consonne de liaison appartient à la syllabe initiale du mot enfant et non à la syllabe précédente de l’article. Ce fait est mis en évidence par la liaison sans enchaînement : on dira plus volontiers “le-zenfants” que "lez-enfants".

3.6. La forme écrite des mots

La forme écrite des mots fournie une assez bonne indication sur la segmentation des énoncés en mots. Mais comme pour le rapport entre l’écriture et la prononciation, il convient de prendre garde cependant à une certaine part d’arbitraire dans la langue écrite. Pour s’en rendre compte il suffit de considérer comment sont réalisés à l’écrit les mots composés - on a déjà vu quelques exemples en 3.3. Les mots composés. Ce qui vaut pour l’analyse phonologique, vaut pour l’analyse morphologique ; de même que la forme écrite reflète plus ou moins bien la prononciation des mots, la forme écrite des mots n’est pas toujours en accord avec l’analyse morphologique. L’adéquation est cependant bien meilleure.

Un exemple particulièrement intéressant pour illustrer le fait que l’écriture peut néanmoins être un bon indicateur pour l’analyse morphologique est la différence écrite entre les verbes s’enfuir et s’en aller. Si on laisse de côté le pronom réfléchi, le premier verbe s’écrit en un seul mot alors que le second s’écrit en deux mots. Ce qui est en jeu ici c’est précisément le critère de la séparabilité. S’en aller s’écrit en deux mots bien qu’il soit comparable à s’enfuir sur le plan de la signification (aspect inchoatif des verbes aller et fuir), parce qu’il existe une construction où il est encore d’usage d’insérer un mot entre en et aller. On a ainsi dans la langue deux formes concurrentes dont l’une appartient à la langue soutenue alors que la seconde est fréquemment réalisée à l’oral :

a. Il s’en est allé de bonne heure.
b. Il s’est en allé de bonne heure.