HISTOIRE DU LEXIQUE FRANÇAIS
|
I - État du lexique
1) Le vocabulaire commun
Combien de mots la langue française comporte-t-elle ? C'est impossible de le dire réellement.
Il faut d'abord s'entendre sur ce que c'est qu'un mot. Un mot composé comme pomme de terre est-il à compter comme 1 ou 3 ? Les multiples formes du verbe être forment-elles chacune un mot différent ? Nous choisirons, c'est la position de bon sens, de considérer qu'il s'agit à chaque fois d'un mot unique, même s'il prend une forme graphique multiple, ou possède une grande variété de formes (sinon : le singulier et le pluriel seraient à compter à chaque fois comme 2 mots différents : enfant / enfants, cheval / chevaux, oeil / yeux...). A l'inverse, il faut compter les homonymes (homophones + homographes) comme des mots différents. On remarquera aussi qu'un mot a des sens différents, mais liés sémantiquement entre eux, et on n'est pas alors dans l'homonymie mais dans la polysémie. |
On peut quand même essayer d'évaluer le vocabulaire commun du français, avec les réserves qui s'imposent, et en précisant comment on arrive à un compte donné.
Les dictionnaires comptent entre 30 000 et 100 000 mots environ (du Dictionnaire du français au collège chez Larousse au Grand Robert). Or, ils ne répertorient qu'un nombre limité de mots techniques ou scientifiques, qui sont innombrables et réservés aux lexiques spécialisés.
Des spécialistes ont dépouillé un grand nombre de textes situés entre 1785 et 1965 (dépouillement pour le Trésor de la Langue Française). Ils sont parvenus à 71 640 vocables (mots). Dont 907 très fréquents. Il s'agit du vocabulaire dans le langage écrit. Le langage parlé est bien plus pauvre.
Quelques autres statistiques, et des comparaisons avec d'autres langues : un livre de littérature populaire peut compter un demi-millier de mots (Sans Famille, d'Hector Malot, 439) ; un livre mieux écrit, 3 fois plus. La Bible, en anglais (c'est équivalent sans doute en français), 6000 mots ; mais une traduction " basique " la réduit à 850. Shakespeare " monte " à 24 000 mots. Le vocabulaire possédé par une personne peu instruite peut être évalué à 3 000 ou 5 000 mots ; 10 fois plus pour une personne instruite.
Toutes ces données sont à nuancer, car le vocabulaire est un ensemble mouvant en constante évolution.
2) Composition du lexique
En fonction de l'histoire de la langue, on peut compter les mots selon leur origine :
Les mots d'origine préceltique (antérieurs aux gaulois) se comptent sur quelques doigts, et surtout dans les parlers régionaux. On parle de mots " à l'origine incertaine ".
Les reliques gauloises : 0,08% de notre vocabulaire. Certains sont passés anciennement en latin, parce que les romains en avaient l'usage (braca > braie : le pantalon gaulois s'est répandu dans la société romaine) ; d'autres ont été découverts par les romains durant leur conquête de la Gaule, et ils les ont adoptés pour désigner des réalités gauloises ; on peut citer aussi le mot vassal, qui désignait un lien personnel inconnu des romains. Certains ne sont restés qu'en patois local, comme un frigon en wallon, qui désigne un petit houx.
Les mots d'origine gauloise correspondent souvent à un vocabulaire de la campagne : des plantes, des arbres (bruyère, chêne, bouleau), des animaux (alouette) ; des termes techniques, qui concernent l'artisanat [des spécialités gauloises] ou l'agriculture (jante, benne, tonneau, charrue, soc, sillon, talus, glaner, chemin, arpent...).
Les mots germaniques, franciques, couvrent 1,35% de notre vocabulaire, mais 3,5% des mots les plus fréquents. Ils concernent toute la vie sociale ; particulièrement le vocabulaire militaire (guerre, épieu, gant, haubert, écharpe, dard...) ; des termes de droit ou d'administration (maréchal, sénéchal, échevin, gage...) ; la vie de la campagne (blé, cresson, épervier, jardin, troupeau, gagner...) ; la vie de tous les jours (marcher, garder, blanc, riche...). On notera que le mot franc lui-même a pris des sens élogieux (noble de coeur, énergique, sincère, etc.), ce qui témoigne de l'orgueil des anciens Francs.
Le fonds latin constitue l'essentiel de notre patrimoine héréditaire : 86,53%. Rappelons qu'il s'agit du latin parlé ; le latin littéraire, classique, a servi par la suite à faire des mots nouveaux, de manière artificielle.
Les emprunts aux langues étrangères constituent environ 10% de notre vocabulaire. Il y en a un peu dans l'Antiquité, beaucoup plus à la Renaissance (influence de l'Italien), beaucoup à notre époque (anglo-saxon). On adopte d'abord le mot tel quel (glasnost) ; c'est ce qu'on appelle un xénisme, mot étranger servant à nommer une réalité étrangère ; puis on adapte sa prononciation (beef-steack, écrit biftèque par Queneau) ; enfin le mot est naturalisé dans sa prononciation, sa graphie et ses désinences (riding-coat > redingote, packet-boat > paquebot, See-Quayah [nom d'un chef indien cherokee qui a inventé un syllabaire pour sa langue] > séquoia).
Les invasions arabes de la fin du VIIIème siècle n'ont laissé aucune trace ; celles des Normands au IXème siècle n'ont agi que sur les parlers régionaux, donc en Normandie.
II - Histoire
1) Le Moyen-Âge, jusqu'au XIIIème siècle
Le fonds primitif est pauvre, au moins jusqu'à la Renaissance Carolingienne. Il suffisait aux besoins d'une société peu civilisée., où l'on exprimait peu de pensées abstraites ou de sentiments délicats. Ce fonds primitif, d'origine latine et partiellement germanique, va s'enrichir du XIème au XIIIème siècle, époque où se développe une littérature médiévale.
Quelques remarques sur l'état de la langue au début de cette période littéraire. Certains mots se redoublent sémantiquement, l'un d'origine latine, l'autre germanique : honte (frq *haunita ; cf honnir) et vergogne (lat. verecundia) sont synonymes, et forment un doublet. D'un autre côté, les mots sont souvent très polysémiques, ils ont plusieurs sens . [comparaison : dans le vocabulaire actuel des cités / des jeunes, il y a une grande pauvreté, les mots sont peu nombreux ; mais beaucoup de mots ont plusieurs sens très différents, comme un sens et son contraire, cf grave]
On remarque aussi des dérivations libres [comme aujourd'hui avec re-, dé-, etc.]
Des emprunts sont faits à d'autres langues : quelques mots normands, régionalement (Xème) ; des mots grecs, suite au commerce ou aux croisades : diamant au XIIème (bas latin diamas, croisé avec adamas = fer très dur, emprunté au grec, qui a donné aimant) ou endive au XIIIème (emprunté au grec byzantin). Des mots arabes, suite au commerce et aux croisades : alchimie, échalote (ville d'Ascalon en Israël > ascalonia cepa, oignon d'Ascalon > escaluigne, début XIIème), jupe (djubba, long vêtement de laine de dessous, fin XIIème), alchimie (= magie noire) ou alambic au XIIIème ; plus tard, magasin, zéro (arabe sifr > chiffre) [découverte fondamentale : les romains l'ignoraient], etc.
La langue savante (= la langue de ceux qui savent, les gens instruits) a recours au latin : depuis la Renaissance Carolingienne, mais on ne peut que supposer (sans doute les mots qui respectent l'accent latin), et beaucoup à partir du XIème, par exemple dans le langage juridique, celle des clercs, des lettrés.
Au XIème siècle, la langue de la Chanson de Roland est encore assez pauvre, et toute concrète, bien que ce soit une langue "savante" pour l'époque. Au XIIème, la langue est plus riche, capable d'exprimer des analyses psychologiques et des nuances de sens. Par exemple, le mot mort était seul de sa famille ; dans le Roland apparaît mortel ; au XIIème, mortellement, mortalité, puis mortifier, mortification. Aux XIIème et XIIIème apparaissent des mots comme obscur, obscurité, obstacle, dont on aurait du mal à se passer aujourd'hui.
2) Le Moyen-français (du XIVème au XVIème)
Selon des statistiques (de Pierre Guiraud) portant sur 20 000 mots souches actuellement vivants (en dehors des multiples mots techniques du XXème, entre autres), 22% remontent à l'ancien français, 43% sont entrés dans l'usage du XIVème au XVIème siècle, et 35% depuis. Le fonds ancien (dont nous venons de parler) représente donc à peine plus d'un mot sur 5, et un peu moins de la moitié ont été créés pendant la période dont nous allons parler. C'est la période de création lexicale la plus intense de l'histoire de notre langue.
Les voyages, les grandes découvertes, ont amené ce qu'on peut appeler des " mots voyageurs " : chocolat (venant de l'aztèque, du Mexique, par les espagnols, 1598), ananas (par l'espagnol aussi, de nana en tupi-guarani, une langue du Brésil, 1544) ; la caravelle, le bateau qui a permis les traversées (carvelle début XVème) vient du portugais caravela, du bas latin carabus = canot.
Au chapitre des emprunts, on signalera un certain nombre d'italianismes : des termes militaires comme soldat, sentinelle ; financiers : banque, crédit ; la vie de la cour : courtisan ; les beaux-arts : fresque, mosaïque, médaille. On emprunte aussi à l'italien des suffixes : -ade (cavalcade, qui vient parallèlement à chevauchée), -esque (chevaleresque, romanesque).
Il y a encore et surtout une grande créativité au XVIème siècle, époque où on était obnubilé par la pauvreté de la langue française (par comparaison avec l'italien et avec le latin). Les auteurs de La Pléiade on fait beaucoup d'efforts pour créer des mots nouveaux, des néologismes, en particulier par dérivation, c'est-à-dire à l'aide de préfixes et suffixes. On connaît Ronsard et Du Bellay ; on connaît beaucoup moins aujourd'hui d'autres auteurs de moins grande valeur plus créateurs, comme Jean Lemaire de Belges, poète et chroniqueur belge. Rabelais a aussi créé quantité de mots.
On a créé par dérivation à partir de mots français (ex : des diminutifs).
On a emprunté directement au latin (ex : radius), et on a aussi relatinisé des mots français (parfois à tort) ou calqué des mots ou des expressions sur le latin (la chose publique / res publica).
On a emprunté des affixes au latin pour faire des dérivés (ex : -tion)
On a aussi énormément créé de mots savants, sur des radicaux latins et grecs, car on traduisait beaucoup d'auteurs de ces deux langues anciennes ; et certaines sciences se développaient, comme la médecine, qui utilisait beaucoup le grec (traductions d'Hippocrate) ; la politique aussi utilisait des racines grecques (prestige des Anciens) ; le droit, des racines latines. C'est de cette époque que datent des doublets, un mot populaire et un mot (originellement) savant qui le redouble : frêle / fragile (fragilem), pourrisson / putréfaction, hôtel / hopital (hospitalem), serment / sacrement (sacer = sacré), raide / rigide, mâcher / mastiquer, entier / intègre, livrer / libérer, blâmer / blasphémer... [le mot savant est le plus long, fait directement sur le mot latin].
Parallèlement, il y a une évolution dans le français populaire, où se développent des mots formés avec des suffixes (chantonner, rêvasser), ainsi que des mots de ce qu'on appelle le jargon, ou l'argot. Un jargon peut être un langage spécialisé, comme celui des affaires ; l'argot est au départ la langue des malfaiteurs (la Cour des Miracles), avec un vocabulaire secret pour dérouter les indicateurs de police, et il s'est développé au XVIIème siècle.
Remarque : le sens et la valeur des mots évoluent. Un mot créé à une certaine époque ne doit pas forcément être pris dans son acception actuelle, avec son importance actuelle ; par exemple, patriote, au XVème (= compatriote), ne peut pas avoir la valeur qu'il a prise à partir de la Révolution (= qui aime sa patrie). Il y a un certain nombre de mots qui sont nés une 2ème fois, que l'on a revivifiés bien longtemps après ; des mots aussi qui ont fortement changé de sens, qui ont parfois pris un sens contraire par ironie, par antiphrase (ex : catin : diminutif de Catherine, influencé par putain).
3) Le français classique (XVIIème à mi-XVIIIème)
Il y a eu au XVIIème siècle une rupture totale, par une volonté d'élaguer (donc appauvrir), préciser et épurer la langue, concernant le lexique et la syntaxe (les tournures).
La richesse du XVIème est souvent une fausse richesse : beaucoup de mots n'ont pas de sens bien précis, ni de valeur stylistique déterminée. Chez Montaigne, art, science ou doctrine s'échangent au petit bonheur.
Les théoriciens classiques, comme Malherbe ou Vaugelas, selon les critères du " bon usage ", interdisent formellement le néologisme, ils rejettent les archaïsmes (déconfort, courtois.., accusés d'être du " vieux gaulois "), les provincialismes (Malherbe parlait de " dégasconner " notre langue), les diminutifs, les mots de niveau populaire, les mots considérés comme " malhonnêtes " (culotte, convaincu...), les termes techniques, artisanaux, les mots composés et dérivés. Beaucoup de mots sont ainsi retranchés, souvent arbitrairement, parce que le jugement de valeur que l'on porte sur eux est défavorable. On cherche l'élégance et la justesse de l'expression, en fonction de " la façon de parler de la plus saine partie de la Cour " (Vaugelas). Cette conception du langage est à rapprocher de l'atmosphère politique du temps, faite de centralisation autoritaire et de foi monarchique.
Exemples de mots condamnés : ester (< stare) = se tenir debout ; aujourd'hui uniquement en langage juridique (= soutenir une action) ; mais nous avons rester (< restare).
Suer est condamné, on lui préfère transpirer. Idem pour se rigoler et rire.
Pourtant, on observe des résistances de certains auteurs, qui défendent des mots condamnés par d'autres (surgir, astuce). On utilise aussi des mots " bas " dans les genres comiques (Molière, Scarron...).
Une forme de création déguisée : on utilise des participes présents comme adjectifs : inquiétant, rassurant...
On développe des préfixes privatifs : dé- / in- / anti-, et on fait de la dérivation.
Contrairement à ce que cherchaient Malherbe ou Vaugelas, les précieux se distinguaient dans la conversation par des néologismes ; beaucoup sont disparus (débrutaliser, importamment...), mais d'autres sont restés : s'encanailler, féliciter, enthousiasmer, anonyme, incontestable...
On peut parler aussi de " néologismes de sens " : la Préciosité utilise beaucoup d'expressions , de périphrases dans un sens métaphorique et / ou hyperbolique (furieusement, effroyablement, ravissant, " Est-ce qu'on n'en meurt point ? "), et là aussi beaucoup sont disparues (la chandelle = le supplément du soleil ; le chapeau = l'affronteur des temps...), d'autres sont restées : les clartés de l'esprit, le miroir de l'âme (les yeux), etc.
Il y a toujours des emprunts, surtout dus aux guerres ; de l'allemand (bivouac [Biwacht = patrouille supplémentaire de nuit]) ou de l'espagnol, par l'intermédiaire des mercenaires en particulier : adjudant [cf aider], mirador [cf regarder]...
Quelques nuances concernant la période classique : la langue populaire est mal connue, et la langue parlée cultivée se corrompt dès le début du XVIIIème siècle.
4) Le français moderne (XVIIIème - XIXème)
Le XVIIIème siècle marque une réaction et un retour aux réalités.
La 2ème moitié du XVIIIème siècle est marquée par un développement du lexique technique et scientifique, où l'on prône la néologie. Des scientifiques comme Réaumur (Histoire naturelle des insectes, 1734) ou Buffon, ou les nombreux collaborateurs de l'Encyclopédie participent à ce mouvement ; ou encore Lavoisier en chimie. De grands dictionnaires ont été publiés à l'extrême fin du XVIIème, et le XVIIIème en publie d'autres (Dictionnaire de Trévoux), ainsi que des lexiques spécialisés.
L'Angleterre est à la mode (cf Voltaire) de 1740 à la Révolution, et on emprunte des anglicismes, dans le domaine du commerce, de la politique, du social, des sciences, etc. (club, gigue, plaid...). Au XIXème, cela continue, comme dans le domaine industriel, le vocabulaire des chemins de fer, le sport (sport, golf, match, partenaire...).
Au XVIIIème, la mode de la musique italienne fait entrer des mots italiens : sérénade, concerto, ténor [on disait un dessus au XVIIème, cf Le Bourgeois Gentilhomme]...
Autres emprunts, les... emprunts russes, fin XIXème, suite à la mode des romans russes : steppe, toundra, cosaque...
On rajoutera le succès de l'argot, utilisé par Balzac, ou par Hugo (cf Gavroche, Thénardier et les truands dans Les Misérables), Labiche, etc. : boniment (< bonnir = en dire de bonnes) ; quelques mots gitans (berge = année : 20 berges), ou yiddish (schnouff = tabac).
La colonisation apporte des mots : pyjama vient de l'hindoustani par l'anglais, bled ou toubib de l'arabe (= terrain, pays / sorcier, guérisseur).
5) Le français contemporain
L'évolution du français contemporain (XXème - XXIème siècle) est plus délicate à analyser, car nous manquons de recul ; mais il y a bien plus de spécialistes qui s'en occupent qu'autrefois, et on peut dessiner quelques tendances :
Une constante d'abord : l'utilisation de mots de patois pour désigner des réalités régionales ; ces mots entrent plus facilement qu'avant dans le lexique commun, à cause des communications et des médias : biniou, menhir (dolmen est un mot artificiel, fait avec 2 mots bretons), gruyère, cigale... (wassingue reste régional) ; du breton bizou = anneau, nous avons bijou, qui est devenu un terme générique, français.
Le vocabulaire scientifique crée beaucoup de mots de composition savante, sur le latin et le grec (cf en pharmacie).
Une quantité invraisemblable de sigles, à la fin du XXème siècle (organismes, administration, industrie, produits...) : OGM, OMS, ONG...
Beaucoup d'emprunts, de mots anglo-saxons surtout, pour diverses raisons et dans différents domaines : les sciences et techniques, le sport, la musique, le cinéma, le snobisme aussi ; le prestige, justifié ou non, de la civilisation américaine, son aspect envahissant (sa puissance économique).
Ex : aviation (jet, steward), industrie (bull-dozer), sports (goal, smash, set, skate-board, training, coach), musique et danse (slow, rock, jazz, pop, soul, rave), médias (western, vamp, play-back, recording, reporter, flash, scoop), mode (pull-over, sweater, T-shirt, sweat-shirt, cardigan, new-look, jeans)... + suffixes -ing / -er (= eur)
Les mots étrangers constituaient 5% des mots nouveaux dans les années 50-60 déjà, dont la moitié de mots anglais, et la tendance a continué depuis.
Des tentatives ont eu lieu en réaction contre cette invasion (" la langue française est-elle en péril ? "...) ; elles sont arrivées souvent trop tard ; et les expressions proposées étaient souvent mal adaptées, trop longues par exemple : lobby > groupe de pression, pin's > épinglette (du québécois), brain-storming >...? Certains mots proposés sont restés : walkman > baladeur.
A l'introduction du vocabulaire, on peut ajouter l'influence du sens de certains mots anglo-saxons sur les mots équivalents français : au lieu d'ignorer quelque chose (ne pas savoir), on ignore quelqu'un (= ne pas s'en occuper) ; un challenge excitant n'est pas une compétition sportive qui produit le même effet que le café, mais un défi passionnant ; on se trouve parfois placé devant deux alternatives, qui devraient faire 4 solutions, mais continuent à n'en faire que 2... [on peut réfléchir aussi à l'extension du vocabulaire sportif dans le vocabulaire général : le coup d'envoi, la dernière ligne droite, la pression ou les bonnes sensations ; l'adversité a progressé ne nous renvoie pas dans la trégédie antique, car il ne s'agit que de l'adversaire...]
Emprunts à d'autres langues : un peu d'allemand, comme en philosophie ; russe (koulak > goulag, glastnost), espagnol (corrida, tango), italien (pizza, spaghetti), pays nordiques (anorak). L'actualité apporte des mots : kamikaze, ayatollah... Ce sont des xénismes.
Ce vocabulaire emprunté est très sensible aux modes. Il peut disparaître aussi vite qu'il est arrivé, ou bien rester, soit tel quel, soit en se francisant, le plus souvent.
Le langage des cités, de la rue, des jeunes, est en perpétuelle évolution, avec du verlan (les ripoux, zarbi, une meuf, tu me vénères = m'énerves...), des emprunts aux mots arabes, ou gitans (gadjo), de vieux mots ressuscités, peut-être par hasard (daron, daronne = père, mère ; c'est ainsi qu'on a appelé le roi et la reine à la Révolution), de l'argot, etc.