HISTOIRE DU LEXIQUE FRANÇAIS
|
I - État du lexique
1) Le vocabulaire commun
Combien de mots la langue française comporte-t-elle ? C'est impossible de le dire réellement.
Il faut d'abord s'entendre sur ce que c'est qu'un mot. Un mot composé comme pomme de terre est-il à compter comme 1 ou 3 ? Les multiples formes du verbe être forment-elles chacune un mot différent ? Nous choisirons, c'est la position de bon sens, de considérer qu'il s'agit à chaque fois d'un mot unique, même s'il prend une forme graphique multiple, ou possède une grande variété de formes (sinon : le singulier et le pluriel seraient à compter à chaque fois comme 2 mots différents : enfant / enfants, cheval / chevaux, oeil / yeux...). A l'inverse, il faut compter les homonymes (homophones + homographes) comme des mots différents. On remarquera aussi qu'un mot a des sens différents, mais liés sémantiquement entre eux, et on n'est pas alors dans l'homonymie mais dans la polysémie. |
On peut quand même essayer d'évaluer le vocabulaire commun du français, avec les réserves qui s'imposent, et en précisant comment on arrive à un compte donné.
Les dictionnaires comptent entre 30 000 et 100 000 mots environ (du Dictionnaire du français au collège chez Larousse au Grand Robert). Or, ils ne répertorient qu'un nombre limité de mots techniques ou scientifiques, qui sont innombrables et réservés aux lexiques spécialisés.
Des spécialistes ont dépouillé un grand nombre de textes situés entre 1785 et 1965 (dépouillement pour le Trésor de la Langue Française). Ils sont parvenus à 71 640 vocables (mots). Dont 907 très fréquents. Il s'agit du vocabulaire dans le langage écrit. Le langage parlé est bien plus pauvre.
Quelques autres statistiques, et des comparaisons avec d'autres langues : un livre de littérature populaire peut compter un demi-millier de mots (Sans Famille, d'Hector Malot, 439) ; un livre mieux écrit, 3 fois plus. La Bible, en anglais (c'est équivalent sans doute en français), 6000 mots ; mais une traduction " basique " la réduit à 850. Shakespeare " monte " à 24 000 mots. Le vocabulaire possédé par une personne peu instruite peut être évalué à 3 000 ou 5 000 mots ; 10 fois plus pour une personne instruite.
Toutes ces données sont à nuancer, car le vocabulaire est un ensemble mouvant en constante évolution.
2) Composition du lexique
En fonction de l'histoire de la langue, on peut compter les mots selon leur origine :
Les mots d'origine
préceltique (antérieurs aux gaulois) se comptent sur quelques
doigts, et surtout dans les parlers régionaux. On parle de mots " à
l'origine incertaine ".
Les reliques
gauloises : 0,08% de notre vocabulaire. Certains sont passés anciennement
en latin, parce que les romains en avaient l'usage (braca > braie
: le pantalon gaulois s'est répandu dans la société romaine)
; d'autres ont été découverts par les romains durant leur
conquête de la Gaule, et ils les ont adoptés pour désigner
des réalités gauloises ; on peut citer aussi le mot vassal,
qui désignait un lien personnel inconnu des romains. Certains ne sont
restés qu'en patois local, comme un frigon en wallon, qui désigne
un petit houx.
Les mots d'origine gauloise correspondent souvent à un vocabulaire de la campagne : des plantes, des arbres (bruyère, chêne, bouleau), des animaux (alouette) ; des termes techniques, qui concernent l'artisanat [des spécialités gauloises] ou l'agriculture (jante, benne, tonneau, charrue, soc, sillon, talus, glaner, chemin, arpent...).
Les mots germaniques,
franciques, couvrent 1,35% de notre vocabulaire, mais 3,5% des mots les
plus fréquents. Ils concernent toute la vie sociale ; particulièrement
le vocabulaire militaire (guerre, épieu, gant, haubert, écharpe,
dard...) ; des termes de droit ou d'administration (maréchal,
sénéchal, échevin, gage...) ; la vie de la campagne
(blé, cresson, épervier, jardin, troupeau, gagner...) ;
la vie de tous les jours (marcher, garder, blanc, riche...). On notera
que le mot franc lui-même a pris des sens élogieux (noble
de coeur, énergique, sincère, etc.), ce qui témoigne de
l'orgueil des anciens Francs.
Le fonds latin
constitue l'essentiel de notre patrimoine héréditaire : 86,53%.
Rappelons qu'il s'agit du latin parlé ; le latin littéraire, classique,
a servi par la suite à faire des mots nouveaux, de manière artificielle.
Les emprunts
aux langues étrangères constituent environ 10% de notre vocabulaire.
Il y en a un peu dans l'Antiquité, beaucoup plus à la Renaissance
(influence de l'Italien), beaucoup à notre époque (anglo-saxon).
On adopte d'abord le mot tel quel (glasnost) ; c'est ce qu'on appelle
un xénisme, mot étranger servant à nommer une réalité
étrangère ; puis on adapte sa prononciation (beef-steack,
écrit biftèque par Queneau) ; enfin le mot est naturalisé
dans sa prononciation, sa graphie et ses désinences (riding-coat >
redingote, packet-boat > paquebot, See-Quayah [nom d'un chef indien cherokee
qui a inventé un syllabaire pour sa langue] > séquoia).
Les invasions
arabes de la fin du VIIIème siècle n'ont laissé
aucune trace ; celles des Normands au IXème siècle n'ont
agi que sur les parlers régionaux, donc en Normandie.
II - Histoire
1) Le Moyen-Âge, jusqu'au XIIIème siècle
Le fonds primitif
est pauvre, au moins jusqu'à la Renaissance Carolingienne. Il suffisait
aux besoins d'une société peu civilisée., où l'on
exprimait peu de pensées abstraites ou de sentiments délicats.
Ce fonds primitif, d'origine latine et partiellement germanique, va s'enrichir
du XIème au XIIIème siècle, époque où se
développe une littérature médiévale.
Quelques remarques
sur l'état de la langue au début de cette période littéraire.
Certains mots se redoublent sémantiquement, l'un d'origine latine, l'autre
germanique : honte (frq *haunita ; cf honnir) et vergogne
(lat. verecundia) sont synonymes, et forment un doublet. D'un
autre côté, les mots sont souvent très polysémiques,
ils ont plusieurs sens . [comparaison : dans le vocabulaire actuel des cités
/ des jeunes, il y a une grande pauvreté, les mots sont peu nombreux
; mais beaucoup de mots ont plusieurs sens très différents, comme
un sens et son contraire, cf grave]
On remarque aussi des dérivations libres [comme aujourd'hui avec re-, dé-, etc.]
Des emprunts
sont faits à d'autres langues : quelques mots normands, régionalement
(Xème) ; des mots grecs, suite au commerce ou aux croisades : diamant
au XIIème (bas latin diamas, croisé avec adamas
= fer très dur, emprunté au grec, qui a donné aimant)
ou endive au XIIIème (emprunté au grec byzantin). Des mots
arabes, suite au commerce et aux croisades : alchimie, échalote
(ville d'Ascalon en Israël > ascalonia cepa, oignon d'Ascalon
> escaluigne, début XIIème), jupe (djubba,
long vêtement de laine de dessous, fin XIIème), alchimie
(= magie noire) ou alambic au XIIIème ; plus tard, magasin,
zéro (arabe sifr > chiffre) [découverte
fondamentale : les romains l'ignoraient], etc.
La langue
savante (= la langue de ceux qui savent, les gens instruits) a recours au latin
: depuis la Renaissance Carolingienne, mais on ne peut que supposer (sans doute
les mots qui respectent l'accent latin), et beaucoup à partir du XIème,
par exemple dans le langage juridique, celle des clercs, des lettrés.
Au XIème siècle, la langue de la Chanson de Roland est encore assez pauvre, et toute concrète, bien que ce soit une langue "savante" pour l'époque. Au XIIème, la langue est plus riche, capable d'exprimer des analyses psychologiques et des nuances de sens. Par exemple, le mot mort était seul de sa famille ; dans le Roland apparaît mortel ; au XIIème, mortellement, mortalité, puis mortifier, mortification. Aux XIIème et XIIIème apparaissent des mots comme obscur, obscurité, obstacle, dont on aurait du mal à se passer aujourd'hui.
2) Le Moyen-français (du XIVème au XVIème)
Selon des statistiques (de Pierre Guiraud) portant sur 20 000 mots souches actuellement vivants (en dehors des multiples mots techniques du XXème, entre autres), 22% remontent à l'ancien français, 43% sont entrés dans l'usage du XIVème au XVIème siècle, et 35% depuis. Le fonds ancien (dont nous venons de parler) représente donc à peine plus d'un mot sur 5, et un peu moins de la moitié ont été créés pendant la période dont nous allons parler. C'est la période de création lexicale la plus intense de l'histoire de notre langue.
Les voyages,
les grandes découvertes, ont amené ce qu'on peut appeler
des " mots voyageurs " : chocolat (venant de l'aztèque, du Mexique,
par les espagnols, 1598), ananas (par l'espagnol aussi, de nana
en tupi-guarani, une langue du Brésil, 1544) ; la caravelle, le
bateau qui a permis les traversées (carvelle début XVème)
vient du portugais caravela, du bas latin carabus = canot.
Au chapitre
des emprunts, on signalera un certain nombre d'italianismes : des termes
militaires comme soldat, sentinelle ; financiers : banque,
crédit ; la vie de la cour : courtisan ; les beaux-arts
: fresque, mosaïque, médaille. On emprunte
aussi à l'italien des suffixes : -ade (cavalcade, qui vient
parallèlement à chevauchée), -esque (chevaleresque,
romanesque).
Il y a encore
et surtout une grande créativité au XVIème siècle,
époque où on était obnubilé par la pauvreté
de la langue française (par comparaison avec l'italien et avec le latin).
Les auteurs de La Pléiade on fait beaucoup d'efforts pour créer
des mots nouveaux, des néologismes, en particulier par dérivation,
c'est-à-dire à l'aide de préfixes et suffixes. On connaît
Ronsard et Du Bellay ; on connaît beaucoup moins aujourd'hui d'autres
auteurs de moins grande valeur plus créateurs, comme Jean Lemaire de
Belges, poète et chroniqueur belge. Rabelais a aussi créé
quantité de mots.
On a créé
par dérivation à partir de mots français (ex : des diminutifs).
On a emprunté
directement au latin (ex : radius), et on a aussi relatinisé des
mots français (parfois à tort) ou calqué des mots ou des
expressions sur le latin (la chose publique / res publica).
On a emprunté
des affixes au latin pour faire des dérivés (ex : -tion)
On a aussi
énormément créé de mots savants, sur des radicaux
latins et grecs, car on traduisait beaucoup d'auteurs de ces deux langues anciennes
; et certaines sciences se développaient, comme la médecine, qui
utilisait beaucoup le grec (traductions d'Hippocrate) ; la politique aussi utilisait
des racines grecques (prestige des Anciens) ; le droit, des racines latines.
C'est de cette époque que datent des doublets, un mot populaire
et un mot (originellement) savant qui le redouble : frêle / fragile
(fragilem), pourrisson / putréfaction, hôtel / hopital
(hospitalem), serment / sacrement (sacer = sacré),
raide / rigide, mâcher / mastiquer, entier / intègre,
livrer / libérer, blâmer / blasphémer... [le mot savant
est le plus long, fait directement sur le mot latin].
Parallèlement,
il y a une évolution dans le français populaire, où se
développent des mots formés avec des suffixes (chantonner,
rêvasser), ainsi que des mots de ce qu'on appelle le jargon,
ou l'argot. Un jargon peut être un langage spécialisé,
comme celui des affaires ; l'argot est au départ la langue des malfaiteurs
(la Cour des Miracles), avec un vocabulaire secret pour dérouter
les indicateurs de police, et il s'est développé au XVIIème
siècle.
Remarque : le sens et la valeur des mots évoluent. Un mot créé à une certaine époque ne doit pas forcément être pris dans son acception actuelle, avec son importance actuelle ; par exemple, patriote, au XVème (= compatriote), ne peut pas avoir la valeur qu'il a prise à partir de la Révolution (= qui aime sa patrie). Il y a un certain nombre de mots qui sont nés une 2ème fois, que l'on a revivifiés bien longtemps après ; des mots aussi qui ont fortement changé de sens, qui ont parfois pris un sens contraire par ironie, par antiphrase (ex : catin : diminutif de Catherine, influencé par putain).
3) Le français classique (XVIIème à mi-XVIIIème)
Il y a eu au XVIIème siècle une rupture totale, par une volonté d'élaguer (donc appauvrir), préciser et épurer la langue, concernant le lexique et la syntaxe (les tournures).
La richesse du XVIème est souvent une fausse richesse : beaucoup de mots n'ont pas de sens bien précis, ni de valeur stylistique déterminée. Chez Montaigne, art, science ou doctrine s'échangent au petit bonheur.
Les théoriciens
classiques, comme Malherbe ou Vaugelas, selon les critères du " bon usage
", interdisent formellement le néologisme, ils rejettent les archaïsmes
(déconfort, courtois.., accusés d'être du " vieux
gaulois "), les provincialismes (Malherbe parlait de " dégasconner "
notre langue), les diminutifs, les mots de niveau populaire, les mots considérés
comme " malhonnêtes " (culotte, convaincu...), les termes
techniques, artisanaux, les mots composés et dérivés. Beaucoup
de mots sont ainsi retranchés, souvent arbitrairement, parce que le jugement
de valeur que l'on porte sur eux est défavorable. On cherche l'élégance
et la justesse de l'expression, en fonction de " la façon de parler
de la plus saine partie de la Cour " (Vaugelas). Cette conception du langage
est à rapprocher de l'atmosphère politique du temps, faite de
centralisation autoritaire et de foi monarchique.
Exemples de mots condamnés : ester (< stare) = se tenir debout ; aujourd'hui uniquement en langage juridique (= soutenir une action) ; mais nous avons rester (< restare).
Suer est condamné, on lui préfère transpirer. Idem pour se rigoler et rire.
Pourtant,
on observe des résistances de certains auteurs, qui défendent
des mots condamnés par d'autres (surgir, astuce). On utilise
aussi des mots " bas " dans les genres comiques (Molière, Scarron...).
Une forme
de création déguisée : on utilise des participes présents
comme adjectifs : inquiétant, rassurant...
On développe
des préfixes privatifs : dé- / in- / anti-, et on fait
de la dérivation.
Contrairement
à ce que cherchaient Malherbe ou Vaugelas, les précieux se distinguaient
dans la conversation par des néologismes ; beaucoup sont disparus (débrutaliser,
importamment...), mais d'autres sont restés : s'encanailler,
féliciter, enthousiasmer, anonyme, incontestable...
On peut parler
aussi de " néologismes de sens " : la Préciosité utilise
beaucoup d'expressions , de périphrases dans un sens métaphorique
et / ou hyperbolique (furieusement, effroyablement, ravissant, " Est-ce
qu'on n'en meurt point ? "), et là aussi beaucoup sont disparues
(la chandelle = le supplément du soleil ; le chapeau = l'affronteur
des temps...), d'autres sont restées : les clartés de l'esprit,
le miroir de l'âme (les yeux), etc.
Il y a toujours
des emprunts, surtout dus aux guerres ; de l'allemand (bivouac [Biwacht
= patrouille supplémentaire de nuit]) ou de l'espagnol, par l'intermédiaire
des mercenaires en particulier : adjudant [cf aider], mirador
[cf regarder]...
Quelques
nuances concernant la période classique : la langue populaire est mal
connue, et la langue parlée cultivée se corrompt dès le
début du XVIIIème siècle.
4) Le français moderne (XVIIIème - XIXème)
Le XVIIIème siècle marque une réaction et un retour aux réalités.
La 2ème
moitié du XVIIIème siècle est marquée par un développement
du lexique technique et scientifique, où l'on prône la néologie.
Des scientifiques comme Réaumur (Histoire naturelle des insectes,
1734) ou Buffon, ou les nombreux collaborateurs de l'Encyclopédie
participent à ce mouvement ; ou encore Lavoisier en chimie. De grands
dictionnaires ont été publiés à l'extrême
fin du XVIIème, et le XVIIIème en publie d'autres (Dictionnaire
de Trévoux), ainsi que des lexiques spécialisés.
L'Angleterre
est à la mode (cf Voltaire) de 1740 à la Révolution, et
on emprunte des anglicismes, dans le domaine du commerce, de la politique, du
social, des sciences, etc. (club, gigue, plaid...). Au XIXème,
cela continue, comme dans le domaine industriel, le vocabulaire des chemins
de fer, le sport (sport, golf, match, partenaire...).
Au XVIIIème,
la mode de la musique italienne fait entrer des mots italiens : sérénade,
concerto, ténor [on disait un dessus au XVIIème, cf
Le Bourgeois Gentilhomme]...
Autres emprunts,
les... emprunts russes, fin XIXème, suite à la mode des romans
russes : steppe, toundra, cosaque...
On rajoutera
le succès de l'argot, utilisé par Balzac, ou par Hugo (cf Gavroche,
Thénardier et les truands dans Les Misérables), Labiche,
etc. : boniment (< bonnir = en dire de bonnes) ; quelques mots
gitans (berge = année : 20 berges), ou yiddish (schnouff
= tabac).
La colonisation
apporte des mots : pyjama vient de l'hindoustani par l'anglais, bled
ou toubib de l'arabe (= terrain, pays / sorcier, guérisseur).
5) Le français contemporain
L'évolution du français contemporain (XXème - XXIème siècle) est plus délicate à analyser, car nous manquons de recul ; mais il y a bien plus de spécialistes qui s'en occupent qu'autrefois, et on peut dessiner quelques tendances :
Une constante
d'abord : l'utilisation de mots de patois pour désigner des réalités
régionales ; ces mots entrent plus facilement qu'avant dans le lexique
commun, à cause des communications et des médias : biniou,
menhir (dolmen est un mot artificiel, fait avec 2 mots bretons),
gruyère, cigale... (wassingue reste régional)
; du breton bizou = anneau, nous avons bijou, qui est devenu un
terme générique, français.
Le vocabulaire
scientifique crée beaucoup de mots de composition savante, sur le latin
et le grec (cf en pharmacie).
Une quantité
invraisemblable de sigles, à la fin du XXème siècle (organismes,
administration, industrie, produits...) : OGM, OMS, ONG...
Beaucoup d'emprunts,
de mots anglo-saxons surtout, pour diverses raisons et dans différents
domaines : les sciences et techniques, le sport, la musique, le cinéma,
le snobisme aussi ; le prestige, justifié ou non, de la civilisation
américaine, son aspect envahissant (sa puissance économique).
Ex : aviation (jet, steward), industrie (bull-dozer), sports (goal, smash, set, skate-board, training, coach), musique et danse (slow, rock, jazz, pop, soul, rave), médias (western, vamp, play-back, recording, reporter, flash, scoop), mode (pull-over, sweater, T-shirt, sweat-shirt, cardigan, new-look, jeans)... + suffixes -ing / -er (= eur)
Les mots étrangers constituaient 5% des mots nouveaux dans les années 50-60 déjà, dont la moitié de mots anglais, et la tendance a continué depuis.
Des tentatives ont eu lieu en réaction contre cette invasion (" la langue française est-elle en péril ? "...) ; elles sont arrivées souvent trop tard ; et les expressions proposées étaient souvent mal adaptées, trop longues par exemple : lobby > groupe de pression, pin's > épinglette (du québécois), brain-storming >...? Certains mots proposés sont restés : walkman > baladeur.
A l'introduction
du vocabulaire, on peut ajouter l'influence du sens de certains mots anglo-saxons
sur les mots équivalents français : au lieu d'ignorer quelque
chose (ne pas savoir), on ignore quelqu'un (= ne pas s'en occuper)
; un challenge excitant n'est pas une compétition sportive qui
produit le même effet que le café, mais un défi passionnant
; on se trouve parfois placé devant deux alternatives,
qui devraient faire 4 solutions, mais continuent à n'en faire que 2...
[on peut réfléchir aussi à l'extension du vocabulaire sportif
dans le vocabulaire général : le coup d'envoi, la dernière
ligne droite, la pression ou les bonnes sensations ; l'adversité
a progressé ne nous renvoie pas dans la trégédie antique,
car il ne s'agit que de l'adversaire...]
Emprunts à
d'autres langues : un peu d'allemand, comme en philosophie ; russe (koulak
> goulag, glastnost), espagnol (corrida, tango), italien
(pizza, spaghetti), pays nordiques (anorak). L'actualité
apporte des mots : kamikaze, ayatollah... Ce sont des xénismes.
Ce vocabulaire emprunté est très sensible aux modes. Il peut disparaître aussi vite qu'il est arrivé, ou bien rester, soit tel quel, soit en se francisant, le plus souvent.
Le langage
des cités, de la rue, des jeunes, est en perpétuelle évolution,
avec du verlan (les ripoux, zarbi, une meuf, tu me vénères
= m'énerves...), des emprunts aux mots arabes, ou gitans (gadjo),
de vieux mots ressuscités, peut-être par hasard (daron, daronne
= père, mère ; c'est ainsi qu'on a appelé le roi et la
reine à la Révolution), de l'argot, etc.