page précédente

L'ORTHOGRAPHE FRANÇAISE

 

I - DESCRIPTION TRADITIONNELLE

L'orthographe française ne repose pas sur un système, mais sur un ensemble de sous-systèmes qui s'ajoutent et s'entrecroisent. Maurice Grevisse, dans LE BON USAGE, p. 108, recense 5 sous-systèmes, qu'on peut encore parfois dissocier, en arrivant à 6 aspects :

C'est le caractère de base, auquel les autres s'ajoutent.

Elle est phonologique, et non pas phonétique : la phonétique étudie les sons exactement comme ils sont produits. La phonologie ne considère que ce qui est significatif ; par exemple, on ne s'intéresse pas aux différentes variantes du / R / en français, car leur différence n'est absolument pas productive, et ne sert pas à constituer des mots différents ; de même, en japonais, la différence entre / R / et / L / n'est pas significative, donc pas phonologique. Entre deux phonèmes voisins, c'est le cerveau qui fait le tri, en fonction des habitudes phonologiques de la langue à laquelle on est habitué.

L'orthographe française repose donc d'abord sur un certain nombre de lettres dont le rôle est de transcrire des sons. Pourtant, il n'y a pas équivalence entre lettres et sons, car l'alphabet est insuffisant (26 lettres, mais 36 phonèmes). Seules les lettres j, k et v sont toujours prononcées et correspondent toujours au même son ; et ce n'est pas par hasard, car ces lettres ont été ou bien créées (j et v), ou bien importées (k).

En effet, nous utilisons l'alphabet latin. Or, en latin, toutes les lettres se prononçaient, et chaque lettre correspondait à un son précis, à un seul son. Le latin a évolué pour devenir le français, les sons ne sont plus les mêmes, certains se sont divisés, des sons nouveaux sont apparus, et l'alphabet est devenu nettement insuffisant. Quelques lettres se sont rajoutées, venues de l'étranger ou du grec : K / W /Y / Z ; des graphistes astucieux ont rallongé le i en j ou modifié le u en v pour transcrire les sons nouveaux correspondants. Plus tard, on a rajouté des accents, trémas, cédilles, etc. Bref, il n'a pas été facile de construire un alphabet vraiment adapté.

Principaux problèmes :

Les exemples précédents le font deviner assez : la plupart des « anomalies » d'orthographe (non conforme à la prononciation) représentent les traces de l'histoire des mots : traces du mot latin par exemple qui est à l'origine, traces de l'évolution naturelle, figée au moment où l'écrit n'a plus correspondu à l'oral, soit après les XIIème / XIIIème siècles.

Exemples : toutes les syllabes comportant oi [wa] ont connu la prononciation [oj] au XIIIème siècle. Les voyelles nasales transcrites par an / on, etc., reflètent la prononciation du Moyen-Âge. De même, ou / eu / au / eau... Les mots à consonnes nasales doubles comme homme, femme, année, ont connu la prononciation "on / an", le premier n ou m servant à marquer le digramme, et le second à marquer la consonne. Cette prononciation existe encore du côté des Pyrénées (l'« an-née » dernière) ; le picard continue à dire eune « fin-me » pour une femme, les "an" étant mués en "in" en picard.

Attention au sens précis de l'expression : un certain nombre de mots ont connu une correction dont le but était de les rapprocher de leur étymon latin. L'orthographe est donc en ce sens artificiellement étymologique. Cette correction fut générale en français au XVIème siècle, dans un souci de culture (à l'époque, peu de gens savaient lire, et ceux-là étaient très cultivés, particulièrement en latin, les lettres muettes ne les gênaient donc pas). Plus tard, le XVIIIème siècle nettoya largement l'orthographe française, avec quelques oublis.

Exemples : corps (corpus) - temps (tempus) - homme (homo) - compter (computare) - sept (septem) - vingt (viginti) - paix (pax) - voix (uox)...

Certaines corrections ont même été abusives, car on a rapproché les mots français de mots latins qui avaient un rapport de sens, mais n'étaient pas leur étymon.

Exemple : poids (de pensum, corrigé d'après pondus) ; un legs (un lais, de laisser, corrigé consciemmentsur le latin legare).

L'orthographe donne des indications sur les rapports entre les différents termes de la phrase. Ceci concerne donc toutes les variations de forme en fonction de la phrase ou du groupe, donc tous les accords (pluriel, féminin), toutes les désinences, de nombre, genre, et désinences verbales.

A ceci se rajouteront d'autres éléments morphologiques, sur le plan lexical.

L'orthographe du mot restera la même dans toutes les situations : le mot boeuf / oeuf conserve son f au pluriel, malgré la prononciation (on aurait pu écrire des oeux). L'adjectif petit conserve son t, qu'il soit derrière le nom, ou devant avec liaison : un enfant petit / un petit enfant. C'est une évidence, mais c'est en contradiction avec la phonétique.

On conserve surtoutt le rapport orthographique avec les mots de la famille : une consonne finale muette se retrouve, non muette, dans les mots de la famille : forêt (aucune liaison derrière) / forestier ; un prêt / prêter ; un berger / une bergère, la bergerie ; plomb / plomber... ; champ (de campus) / champêtre / campagne / champignon (bas latin *campagniolus = fungus des champs)

Elle sert à distinguer les homophones, tous ces mots généralement monosyllabiques que le contexte éclaire souvent (le sens de la phrase, la présence d'un article, etc.), mais pas toujours, et dont la ressemblance phonétique peut être source d'ambiguïté à l'oral :

Parfois, une fausse étymologie n'est pas corrigée, justement parce que la distinction est utile : le nom poids par exemple ; ou encore, le nom sceau, issu du latin classique sigillum, altéré en sigellum en latin populaire, n'a aucune raison de porter un c, dont le rôle est simplement de le distinguer de seau (avec la variante sel / scel, déjà au Moyen Age).

On rajoutera comme exemples les accents graves sur à, sur , sur , sont le rôle est purement distinctif : c'est à tort qu'on parle d'orthographe grammaticale, car on est dans l'orthographe lexicale, mais en rapport bien sûr avec la nature des mots (pour des élèves, c'est grammatical).

Tout ceci est assez complexe. Il y a pourtant moyen de simplifier, de regrouper ces éléments. Les travaux les plus complets concernant l'orthographe française sont à ce jour ceux de Nina Catach, chercheur au C.N.R.S., qui applique les principes de la linguistique moderne.
 

II - DESCRIPTION MODERNE

Il ne s'agit pas seulement de regrouper certains aspects ; c'est aussi une autre façon d'analyser, selon un point de vue exclusivement contemporain, moderne, synchronique, qui distingue trois types d'éléments écrits, définis par Nina Catach : les phonogrammes, les morphogrammes, et les logogrammes. Dans ces appellations apparemment compliquées, on retrouve la terminaison -gramme, qui signifie « signe écrit » ( et non unité de poids !) comme dans idéogramme, digramme, trigramme.

Il faut auparavant définir une autre notion : le graphème, que nous opposerons au phonème.

Un phonème est la plus petite unité de son, en phonétique, ou en phonologie. Le français standard comporte, en phonologie, 36 phonèmes : 16 voyelles (12 orales, 4 nasales), 17 consonnes, et 3 semi-consonnes. Rappelons que l'alphabet ne compte que 26 lettres.

Un graphème est la plus petite unité visuelle distinctive : une unité écrite, pourvue de valeur ; une valeur qui peut être phonologique ou autre ; le graphème est donc une unité polyvalente.

Exemples :

Nous retrouvons la première catégorie du classement précédent : un phonogramme est un graphème qui correspond à une prononciation.

Ce terme fait référence à la morphologie, c'est-à-dire à la forme ou aux variations de forme des mots. Nous allons comme Nina Catach les diviser en deux, et retrouver des caractères signalés par Grevisse :

Ce sont toutes les désinences, c'est-à-dire toutes les terminaisons qui correspondent à la catégorie grammaticale : un mot uniquement variable en nombre est un nom ; en nombre et genre, c'est un adjectif (pour les déterminants et les pronoms, c'est un peu plus complexe) ; et en conjugaison (mode, temps, personne), c'est un verbe. Ces désinences confèrent aux mots une identité grammaticale, elles servent à prouver la nature grammaticale du mot.

Ex. : on a cheval / chevaux, mais pas chevale / chevales : ce mot n'est donc pas un adjectif, mais un nom (le verbe chevaler existe : chevaler un mur = soutenir, étayer).

Ce sont des indicateurs de séries lexicales : des marques, le plus souvent finales, qui relient un mot (radical) à ses dérivés, comme le d final de tard, toujours muet, qu'on retrouve dans tarder, tardif... (si la lettre finale n'est pas muette, c'est un phonogramme, comme dans klaxon). Ou le t de port (portuaire), le c de porc (porcin, porcidé), etc.

Le fonctionnement de ces marques dérivatives est moins systématique que celui des marques grammaticales, car celles-ci ont été uniformisées artificiellement, alors que l'orthographe lexicale des mots est surtout le fruit de l'histoire de la langue.

Enfin, il existe certaines graphies, d'origine souvent étymologique, jouant un rôle particulier qui les rapproche (pas complètement) du système des idéogrammes : la graphie ne fait qu'un avec le mot, et lui donne une image globale qui le fait reconnaître spontanément, par mémoire visuelle, sans qu'on passe son temps à déchiffrer, une lettre à la fois, pour savoir comment le mot peut bien se prononcer. Qui penserait par exemple à prononcer toutes les lettres de temps ? Ce mot se reconnaît d'un coup d'oeil, et on sait ce qu'il signifie. On procède de même avec un idéogramme, à part que le lien avec la prononciation subsiste toujours en français. Le son est transcrit, mais on transcrit plus que le son.

La méthode globale d'apprentissage de la lecture fonctionne ainsi ; mais elle a le tort de se couper de l'aspect phonologique qui est quand même l'essentiel de la langue, quand on l'utilise seule. Et elle ne convient pas aux élèves qui ont peu de mémoire visuelle.

Ce système concerne essentiellement les homophones, dont il permet donc la distinction (cf. l'aspect distinctif chez Grevisse). On en compte environ 2000 en français, la plupart étant des mots monosyllabiques, qui sont, on le voit, assez nombreux, car très courants (le vocabulaire de base de n'importe quel Français non cultivé est de 5000 mots). Étant courants, ils posent en fait peu de problèmes de reconnaissance pour un lecteur correct. La moyenne du mot français, pris dans le discours, dans des statistiques d'utilisation, est seulement de 4 lettres... (penser à tous les mots qu'on appelle des mots-outils : à, de...). On comprend donc la nécessité d'étoffer les mots, pour leur donner une physionomie. Ainsi, le à se reconnaît d'un coup d'oeil, en principe, comme préposition.

On pourra remarquer que c'est un système qui est en soi peu rentable, et qui revient fort cher. En effet, le nombre des possibilités est limité, et on imagine mal que tous les mots de la langue puissent avoir leur orthographe particulière, valable pour eux seuls (on serait alors dans le système idéographique, l'aspect phonologique disparaîtrait). Heureusement, nous l'avons dit, ces mots sont relativement peu nombreux, et ce sont les plus courants ; la mémoire parvient donc à les retenir sans peine, en principe.

La langue française, comme d'autres, est donc bien un « système de systèmes » ; plusieurs systèmes s'ajoutent et se recouvrent, et cela fonctionne assez bien. C'est d'ailleurs ce qui donne à la fois une identité et une richesse à une langue. Rappelons par exemple que la création d'une langue artificielle comme l'espéranto n'a pas eu de succès, justement parce qu'elle manquait de richesse : trop rationnelle, pas d'histoire, de culture sous-jacente... Le français, lui, malgré les attaques d'outre-Atlantique, n'est quand même pas près de succomber (les apports venant de langues étrangères se sont produits à toutes les époques ; cela constitue un enrichissement pour le français ; ils ne concernent que le vocabulaire ; les changements syntaxiques sont rarissimes, et ne se maintiennent que s'ils ne sont pas générateurs d'ambiguïté, s'ils sont utiles).