1.2. Mot, forme de mot et lemme

Dès lors qu’on aborde l’étude des mots, il convient de faire la distinction entre mot, forme de mot et lemme.
Selon la première définition, on est amené à distinguer les mots et les formes de mot. Pour comprendre la différence entre les deux, nous devons partir de la phrase ou du texte. Dans la phrase qui suit :

    Je me suis donné le temps de lire la préface.

nous comptons 10 mots. Il s’agit en fait de 10 formes de mot car les constituants je et me, de même que le et la peuvent être considérés respectivement comme deux formes du même pronom et comme deux formes du même article.
Si nous considérons maintenant la langue dans son ensemble, nous sommes ainsi conduit à regrouper certaines formes de mot sous le même mot : il en serait ainsi des exemples suivants :

    {cheval et chevaux}
    {beau, beaux, belle et belles}
    {donner, donné, donnant, donnait, donnera, …}

Par contre la liste suivante :

    {accepter, acceptable, acceptation}

ne constitue pas un ensemble de différentes formes du même mot. accepter, acceptable, acceptation sont trois mots différents, bien qu’ils présentent une régularité de forme comparable à celle de la liste du verbe donner de la liste précédente. Il appartient donc à la morphologie - définie en termes de mot - d’expliquer pourquoi accepter, acceptable, acceptation sont trois mots différents alors que acceptait, acceptera et acceptons sont trois formes du même mot. Notons qu’ils ont tous en commun une part de signification et une part de leur forme phonologique (séquence en gras).
Une forme de mot est le mot tel qu’il est employé dans la langue, dans un énoncé. La forme du mot dépend principalement de son contexte phonologique et syntaxique.

  • nom

      maison et maisons sont deux formes du même mot. L’un est au singulier, l’autre, au pluriel

  • adjectif

      beau, beaux, belle, belles et bel sont des formes différentes du même mot ; variation en genre et en nombre (contexte syntaxique) et la différence d’emploi entre beau et bel dépend du contexte phonologique : bel devant un mot qui commence par une voyelle (bel appartement) et beau devant un mot qui commence par une consonne (beau décor).

  • pronom

      j’ et je sont deux formes du même mot ; le pronom de 1ère personne du singulier. Le premier est employé devant un mot qui commence par une voyelle tandis que le second est employé devant un mot qui commence par une consonne.

      je, me et moi sont trois formes du même mot ; le pronom de 1ère personne du singulier. Le premier est sujet, le deuxième est complément, et le troisième est employé notamment comme complément d’une préposition.

  • verbe

      chanter, chantons, chantaient, chanterait, chanté, chantées, … sont différentes formes du même mot. La variation concerne le mode, le temps et la personne. Pour les participes, la variation relève du temps (présent ou passé) du nombre et du genre.

  • adverbe

      très est l’unique forme du même mot (mot invariable)

Dès lors que la distinction entre forme de mot et mot est introduite, il est plus difficile de définir ce qu’est un mot. On peut contourner le problème en disant, par exemple, que maisons est une forme de mot et également un mot. Plus précisément, le mot se révèle plus complexe, plus abstrait, comme un ensemble de formes différentes qui partagent la même signification lexicale. La signification lexicale est ce que le dictionnaire donne comme définition du mot.

Résumons : chanter, chantons, chantaient… sont un même mot avec différentes formes car ils ont la même signification lexicale : produire sons mélodieux avec la voix…Par contre chanter, chanteur, chanson sont des mots différents car ils n’ont pas la même signification lexicale, même s’ils partagent des propriétés sémantiques. chanteur n’a pas pour définition : produire sons mélodieux avec la voix mais plutôt : celui qui chante ou personne qui chante …

Reste maintenant à introduire la notion de lemme. Lorsqu’on cherche dans le dictionnaire la définition d’un mot, sa signification lexicale, on ne cherche pas le mot à partir de toutes ses formes ; il n’y a pas une entrée dans le dictionnaire pour maison et une autre pour maisons, de même qu’il n’y a pas pour chaque forme verbale une entrée. Le mot est accessible dans le dictionnaire à partir d’une de ses forme : le lemme. Le lemme est donc la forme du mot qui représente l’ensemble des différentes formes du mot. Le choix de la forme lemmatique repose sur un principe simple : on retient la forme non marquée (le concept de marque a été introduit par le linguiste R. Jakobson). La forme non marquée d’un mot est celle qui ne contient aucune information spécifique, forme neutre, sans morphème explicite. Le singulier est la forme non marquée d’un nom car un mot au singulier tel que maison ne contient aucun morphème de nombre explicite, contrairement à la forme maisons qui présente un morphème de pluriel (en gras). Le masculin singulier est la forme non marquée d’un adjectif car un mot au masculin singulier tel que petit ne contient aucun morphème de genre et de nombre explicite, contrairement à la forme petites qui présente un morphème de genre (en gras) et de pluriel (souligné). L’infinitif est la forme non marquée d’un verbe car cette forme ne donne aucune indication de temps (infinitif = non fini) contrairement aux formes conjuguées et aux participes. Pour les pronoms, le choix de la forme lemmatique est plus délicat ; on peut retenir la forme moi pour le pronom de première personne du singulier dans la mesure où cette forme est la seule qui peut s’utiliser seule, en dehors de tout contexte. Les adverbes étant invariables, le lemme est identique à l’unique forme du mot.

Dans les exemples suivants, les formes de mot sont en italiques, le mot correspond à l’ensemble des formes, et le lemme est souligné :

  • nom {maison, maisons}
  • adjectif {beau, beaux, belle, belles, bel}
  • pronom de première personne du singulier {je, j’, me, m’, moi}
  • verbe {chanter, chantons, chantaient, chanterait, chanté, chantées, chantant, …}
  • adverbe {très}