Chargement...

La genèse du lexique français

La formation du lexique des origines au Moyen-Âge

de Gilles Quentel (Auteur)
Monographies 410 Pages

Résumé

Le lexique est constitué d‘un ensemble de briques appelées racines. Ces briques nous ont été transmises par des langues connues ou soupçonnées, mais aussi loin que porte le regard, il est impossible d‘en discerner l‘origine : on peut créer de nouveaux mots, mais l’on ne crée jamais aucune racine, on en hérite depuis la nuit des temps. Le but de cet ouvrage a été d‘isoler ces briques essentielles du lexique français, et d’observer la façon dont elles se sont assemblées au fil du temps pour former la langue que nous connaissons, sous une perspective à la fois historique (étymologique) et synchronique (néologique). En d’autres termes, nous avons cherché à comprendre comment se formait un lexique, premier pas vers la compréhension de la genèse d’une langue.

Table des matières

  • Cover
  • Titel
  • Copyright
  • Herausgeberangaben
  • Über das Buch
  • Zitierfähigkeit des eBooks
  • Table des matières
  • Introduction
  • Partie I Cadre théorique
  • 1. Stratification de la langue
  • 1.1 Strates et créolisation
  • 1.2 Pré- et Proto-indo-européen
  • 2. Néologie
  • 2.1 Emprunt et héritage
  • 2.2 Processus néologiques
  • 3. Aperçu historique de la stratification du français
  • 3.1 Période substratique ancienne (-9000/-52)
  • 3.2 Le superstrat latin
  • 3.3 Superstrat
  • 3.4 Adstrats
  • 4. Objectifs et méthodologie
  • 4.1 Objectifs
  • 4.2 Méthodologie
  • 4.3 Racines
  • 4.4 Questions lexicographiques
  • Partie II Les Racines du français médiéval
  • 1. Les racines gauloises
  • 1.1 Les premiers locuteurs de celtique en Gaule
  • 1.2 Corpus
  • 1.3 Méthodologie
  • 1.4 Racines celtiques d’origine indo-européenne
  • 1.5 Racines celtiques d’origine indo-européenne douteuse
  • 1.6 Racines celtiques d’origine non-indo-européenne
  • 2. Les racines latines
  • 2.1 Préhistoire du latin
  • 2.2 Le Latin classique
  • 2.3 Le Latin populaire
  • 2.4 Le Bas Latin
  • 2.5 Précisions lexicographiques
  • 2.6 Racines latines italiques d’origine indo-européenne :
  • 2.7 Racines latines d’origine indo-européenne douteuse
  • 2.8 Racines latines d’origine non-indo-européenne
  • 3. Racines étrusques
  • 4. Racines grecques
  • 4.1 Stabilité de la langue
  • 4.2 Le substrat du grec
  • 4.3 Remarques lexicographiques
  • 4.4 Racines grecques d’origine indo-Européenne
  • 4.5 Racines grecques d’origine indo-européenne douteuse
  • 4.6 Racines grecques d’origine non-indo-européenne
  • 5. Racines Germaniques
  • 5.1 Les Francs
  • 5.2 Les Goths
  • 5.3 Les Normands
  • 5.4 Autres sources
  • 5.5 Typologie des langues germaniques
  • 5.6 Racines germaniques d’origine Indo-Européenne
  • 5.7 Racines germaniques d’origine indo-européenne douteuse
  • 5.8 Racines germaniques d’origine non-indo-européenne
  • 6. Les racines orientales
  • 6.1 Contexte historique
  • 6.2 Méthodologie
  • 6.3 Racines sémitiques et proche-orientales:
  • 6.4 Racines Persanes
  • 6.5 Racines égyptiennes
  • 6.6 Racines indiennes
  • 6.7 Autres racines orientales
  • 7. Mots d’origine obscure
  • La question du basque
  • 7.1 Méthodologie
  • 7.2 Classement
  • 7.3 Mots de substrat probables
  • 7.4 Racines celtiques possibles
  • 7.5 Racines latines possibles
  • 7.6 Racines Grecques possibles
  • 7.7 Racines Germaniques possibles
  • 7.8 Etymologies inconnues
  • 8. Mots basés sur des noms propres (éponymie)
  • Partie III Synthèse générale
  • 1. Racines et étymons
  • 1.1 Statistiques
  • 1.2 Origines des étymons :
  • 2. Le rôle des langues vectrices
  • 2.1 Etymons passés par le latin
  • 2.2 Autres transits d’étymons
  • 2.3 Provenance des étymons
  • 3. Productivité des racines
  • 3.1 Préfixes latins passés en ancien français
  • 3.2 Préfixes grecs passés en ancien français
  • 3.3 Préfixes inconnus
  • 3.4 Nombre d’étymons formés par dérivation préfixale et par composition
  • 3.5 Autres processus néologiques
  • 4. Strates lexicales
  • 4.1 Le Substrat gaulois :
  • 4.2 L’Adstrat dominant germanique
  • 4.3 Les emprunts grecs
  • 4.4 Le rôle des emprunts orientaux
  • 4.5 Le problème des mots d’origine inconnue
  • 5. Indo-Européanité du lexique
  • 6. Proposition de modélisation de la genèse lexicale
  • 7. Conclusions
  • Abbréviations
  • Index des racines par correspondances avec le lexique du français moderne
  • Bibliographie

←9 | 10→←10 | 11→

Introduction

Depuis les débuts de sa courte histoire, la linguistique s’est peu intéressée à la question de la genèse des langues. Celle-ci a depuis les origines, c’est-à-dire depuis les néo-grammairiens allemands du XIXème siècle, été considérée comme un long flux continu se scindant au fil du temps en rivières distinctes, qui à leur tour renouvelleraient ce processus. Finalement, l’élément-clef de la différenciation linguistique serait le temps : une première langue-mère, des locuteurs qui émigrent et qui altèrent cette langue originelle au fil des générations, jusqu’à ce qu’elle en soit rendue méconnaissable et devienne, de facto, une nouvelle langue. Ce n’est pas l’analogie des fleuves et des rivières que la linguistique a retenue, mais celle des arbres et de leurs branches, sur le modèle de la phylogénétique des biologistes. Selon ce modèle, une langue ne naîtrait donc pas, à proprement parler : elle ne serait que l’altération progressive et largement aléatoire d’une autre langue. C’est ce postulat, par ailleurs improuvé, que ce livre a pour ambition de remettre en cause. Car les créoles nous l’ont bien montré : une langue naît, brutalement, de la rencontre de plusieurs autres langues. Une langue qui résiste aux influences extérieures est extraordinairement stable : le meilleur cas observable est celui du grec, et dans une certaine mesure de l’égyptien ancien, qui évoluent au fil des millénaires, mais avec une extrême lenteur. Il y a certes, sur les 3500 ans d’attestation de la langue, des distinctions historiques : grec mycénien, grec ancien et grec moderne, mais finalement il s’agit bien d’une seule langue, pas de trois langues distinctes. Alors que, du latin au français, il y a un abîme qui se forme en l’espace de quelques siècles à peine (du Vème au IXème siècles). L’idée d’un flux en évolution n’explique pas l’apparition du français, ni d’ailleurs d’aucune autre langue.

Etudier la genèse d’une langue est une entreprise considérable en soi, et ne peut être menée en l’espace d’un seul livre. Le présent exposé se limite à l’étude du lexique de l’ancien français, étudié dans une perspective à la fois synchronique (néologie) et historique (étymologie).

Le lexique est une mécanique combinatoire : chaque mot est composé d’une racine, au moins, à laquelle il est possible de connecter des préfixes, des suffixes, des confixes, des infixes, ou encore une deuxième racine. On appelle cela la créativité lexicale : les mécanismes qui permettent de composer des lexiques de tailles quasi-infinies, rendant aléatoire tout décompte précis du nombre de mots contenus dans une langue : mot spécialisés, mots dialectaux, sociolectes, mots désuets, mots disparus, mots à venir, tout est fluctuant, variable, transformable, ←11 | 12→et tout se dérobe au décompte statistique. En revanche, les composants de cette combinatoire linguistique sont en nombre fini et relativement stable. En outre, ce nombre est beaucoup plus limité que ce que l’on pourrait croire en se fiant au nombre d’entrées d’un dictionnaire. En réalité la quantité de racines et de préfixes qui composent un lexique littérairement aussi élaboré que celui de la langue française est restreint. Si l’on crée continuement de nouveaux mots, on ne crée en revanche aucune racine nouvelle, aucun affixe nouveau. On les emprunte à d’autres langues, ou on les hérite de langues plus anciennes : emprunt et héritage sont les deux voies de transmission des racines. Mais il n’existe pas de processus de création de racines ex nihilo : les langues n’inventent rien, elles recyclent. On ignore comment ont été créées ces racines fondamentales qui se perpétuent depuis que le langage parlé a été inventé par l’homme, il y a 200 000 ans, ou plus peut-être (Perrault, 2012). Par imitation, comme le croyait Darwin (1871 : 56)? Peut-être. Mais ce n’est pas certain, et ce ne serait qu’une partie de l’explication, puisque peu de mots se réfèrent à des sons. Saussure postule que le signe est arbitraire : le lien entre un objet et la forme phonétique qui le désigne dans une langue donnée est immotivé (1916 : 101). Le mystère des racines reste donc entier. Mais, sans remonter si loin dans le temps, il est possible de retrouver l’origine des racines du français jusqu’à un certain point : jusqu’au latin, au grec, voire au sumérien, ou au proto-indo-européen, ou encore aux langues préhistoriques d’Europe. Que doit le lexique français à toutes ces langues ? C’est entre autres à ces questions : statistique lexicale et origine des racines que ce volume a tenté de répondre.

Un lexique se forme par strates. Les langues européennes disparues du paléolithique et du néolithique d’abord, et dont il ne reste plus aujourd’hui que le basque. Puis le gaulois. Et le latin. Et le francique. A ces strates s’ajoutent les adstrats, les mots empruntés, au grec, à l’arabe, au néerlandais, aux langues orientales… Il en découle une troisième question : quel rôle a joué chacune de ces strates ? En d’autres termes : comment ont-elles interféré les unes avec les autres pour aboutir à la langue française ? Et enfin, la combinatoire lexicale : recatégorisation, dérivation, composition, etc. : les processus sont connus. Mais à travers l’examen minutieux de cet inventaire de racines, il est possible d’observer toute l’envergure de cette créativité, d’en examiner les aspects quantitatifs, les rôles joués par les différentes strates, les différents champs lexicaux, la productivité de telle langue d’emprunt, de tel préfixe, etc. Quatre questions donc, qui sont à la source même de la genèse du lexique, et auxquelles il serait bien audacieux de prétendre apporter des réponses univoques ou définitives. Ce livre a pour but de poser les bases de ce que l’on pourrait appeler la lexicologie fondamentale, celle qui a pour objet l’étude de la genèse lexicale, conçue comme l’une des parties de la genèse ←12 | 13→linguistique tout court. L’idée est simple, si simple que l’on n’a jamais pensé à y consacrer un livre. Si l’on excepte ouvrages de Jacques Cellard (1998 & 2000) sur les racines grecques et latines, qu’il convient de saluer comme tentative à peu près unique dans le genre, bien qu’elle ne couvre qu’une partie du problème. Poser les bases, c’est-à-dire démonter le lexique un peu comme si l’on démontait un moteur et que l’on en rangeait les pièces par catégories de formes, de fonction, de taille, etc. et donc avant tout répertorier les racines et les préfixes du français à partir d’un corpus déterminé. Le présent exposé s’arrête au XIVème siècle, à une date où la langue française est formée et attestée, avant les grandes vagues d’emprunts savants qui s’intensifient à partir de la Renaissance, tout au long de la révolution industrielle et jusqu’aujourd’hui. Ensuite, proposer un cadre théorique et un début d’analyse de ce qui a été observé, tenter de répondre aux premières questions qui se posent, formuler les premières constatations. Ce livre n’est qu’une prémisse, en tant que tel il n’est certainement pas exempt de défauts. En outre, certaines prises de position pourront sembler radicales : le rejet de la théorie échoïque, la remise en cause de nombreuses étymologies indo-européennes, la réévaluation du rôle des substrats, le questionnement du modèle phylogénétique traditionnel, etc. Elles découlent du fait que plusieurs a-prioris traditionnels de la linguistique historique apparaissent in fine irréalistes, et qu’ils réclament donc un réexamen de fond. Ces prises de position ne sont pas gratuites, il ne s’agit pas de réfuter par principe, mais de remettre en cause des postulats théoriques qui ne résistent pas aux faits. Elles susciteront sans doute des objections, c’est en tous cas ce que l’on doit espérer, car il ne s’agit en aucun cas d’assener des vérités définitives mais bien davantage de rouvrir les débats sur des points qui paraissent acquis, à tort nous semble-t-il, et surtout de reposer la question la plus essentielle des études linguistiques, qui n’est plus (et n’a sans doute jamais été) au centre des débats : celle de comprendre comment naît une langue.

Gilles Quentel

Gdańsk le 1er mai 2017

←15 | 16→←16 | 17→

1. Stratification de la langue

1.1 Strates et créolisation

1.1.1 Le modèle phylogénétique

La vision traditionnelle que l’on a de la genèse d’une langue suit le modèle de la descendance phylogénétique : une langue-mère engendre des langues-filles, qui sont sœurs les unes des autres, et qui forment une famille. Le principe est clairement formulé par Emile Littré (1864 : 7) pour qui le latin est la « langue-mère » et le français, l’espagnol, le roumain etc. des « langues-sœurs ». Ce modèle, qui a été celui de la linguistique indo-européenne des Neue-Grammatikker du XIXème siècle et qui a été repris jusqu’aujourd’hui dans à peu près tous les travaux académique (cf. Goose, 1994) n’est pas sans susciter des objections. La première est qu’il n’a pas été donné aux linguistes d’assister à la naissance d’une langue suivant ce processus : tout ce que l’on peut observer, ce sont des évolutions linguistiques lentes (celle du grec par exemple, observable depuis le mycénien du XVème siècle avant notre ère jusqu’à aujourd’hui, cf. partie II-4.1). Mais ces évolutions lentes ne paraissent pas produire de nouvelles langues : l’ancien français évolue vers le français moderne sur une période documentée de mille ans, sans qu’il soit possible in fine de considérer que le français moderne est une langue nouvelle, distincte de l’ancien français, malgré des différences notables entre les deux. La seconde est d’ordre structurel : pour qu’une langue-mère engendre une langue-fille selon ce schéma, il faut supposer que des bouleversements internes se produisent au cours de cette évolution, et que ces bouleversement sont inhérents à la structure même de la langue : il n’y a pas d’interférence de type substrat/superstrat, même si l’on concède en général qu’il ait pu y avoir des emprunts à des langues tierces. L’évolution phonétique, par exemple, est basée sur les schémas d’accentuation, les processus d’assimilations et de dissimilations. Les singularités grammaticales des langues romanes telles que l’apparition de temps composés, ou encore les singularités syntaxiques telles que l’usage de l’article (Posner, 1996: 126), semblent être apparues suite à une évolution naturelle d’une langue synthétique (le latin) vers une langue analogique (le proto-roman) (Guillaume, 1919). Mais cette conception structuraliste, dont A. Lodge a pointé les défaillances (Lodge, 2004) échoue à expliquer pourquoi le français et le portugais possèdent des nasales alors que l’italien et l’espagnol n’en ont pas, de même qu’elle échoue à expliquer pourquoi le système de conjugaison latine s’effondre dans les langues romanes pour laisser la place ←17 | 18→à quelque-chose de nouveau (temps composés, mode conditionnel, disparition du futur en –bo et de toute la conjugaison passive, etc.). Il est symptomatique que des deux grands romanistes historiques que sont Diez (1874) et Meyer-Lübke (1890), aucun ne s’interroge sur les causes et les origines des phénomènes qu’il décrit (Weinreich et al., 1968), (Ostrá, 1991 : 9). Jusqu’à aujourd’hui, Rebecca Posner (1996 : 28) ne voit pas au phénomène de la nasalisation d’explication autre que structurelle, c’est-à-dire due aux accidents d’une mécanique interne déconnectée du monde extérieur. Ce principe d’une évolution lente et irrépressible permet de comprendre suivant quel processus un phénomène se déroule (on sait parfaitement comment se forme une voyelle nasale), il n’explique en aucun cas quelle en est la cause : si l’on comprend bien comment apparaît une voyelle nasale on ignore finalement pourquoi elle est apparue (en français et en portugais) ou pas (en italien, en espagnol, en roumain, etc.). Or c’est précisément ce que l’on voudrait savoir.

Si la littérature académique est si diserte sur la manière dont un phénomène nouveau se produit, elle n’en évoque jamais les causes, et ceci parce que le modèle phylogénétique l’interdit: puisqu’une langue-mère engendre des langues-filles, l’on ne peut trouver d’explication à tout phénomène nouveau qu’en en cherchant la source dans la structure de la langue-mère ou dans les hasards des évolutions subséquentes. Cela peut s’appliquer à la nasalisation comme à n’importe quelle autre innovation du français ou des langues romanes, qu’elle soit phonétique, morphologique, syntaxique ou lexicale. Le principe de succession phylogénétique instauré par Schleicher interdit de considérer la question des interférences linguistiques, et donc probablement de trouver la seule réponse possible à toutes ces questions : la confluence de plusieurs langues dans le processus de genèse linguistique.

Ces deux objections amènent à s’interroger sur la pertinence du modèle phylogénétique dans le cas de la genèse du français en particulier. L’alternative réside dans un modèle qui ne soit plus endogène (une nouvelle langue se crée par changements internes inhérents à la structure même d’un état de langue antérieur) mais exogène (d’autres langues interfèrent avec une première pour en former une nouvelle) (Lodge 2003 : 58). Le modèle exogène est donc celui d’une hybridation, c’est-à-dire d’une créolisation, processus qui présente l’avantage considérable d’être attesté, d’une part, et de proposer des solutions au problème du déclenchement des changements linguistiques d’autre part. Deux avantages qui répondent aux deux objections que l’on vient de formuler. Ce modèle présente en outre l’avantage de s’adapter parfaitement au cas du gallo-roman, comme on va le voir.

←18 | 19→

1.1.2 La créolisation linguistique

La créolisation est un concept qui possède deux définitions : une spécifique et une étendue. La définition spécifique est relative au contexte historique précis dans lequel se sont développées les langues que l’on désigne aujourd’hui sous le nom de « créoles » (Holm,1988 : 6), (Chaudenson 2002), c’est-à-dire celui de l’esclavage dans les anciennes colonies d’Amérique notamment. La définition étendue reprend le même processus mais l’extrait de son contexte historique et l’applique à la genèse des langues en général : Feist (1932) l’avait déjà appliquée à la genèse des langues germaniques. C’est cette seconde acception qui sera utilisée ici.

La créolisation se déroule selon le schéma suivant: un peuple autochtone, démographiquement plus important, parlant une langue A, est absorbé d’une manière ou d’une autre (conquête, métissage, annexion, déportation, migration, etc.) par un peuple B inférieur en nombre mais dominant socialement, et contraint de parler sa langue. Une situation de conflit linguistique apparaît alors, qui met en jeu des facteurs sociaux très complexes : mariages inter-ethniques, rôle linguistique du père, de la mère, de la famille, du microcosme social, du macrocosme économique et politique, etc (Migge 2003 :54). Lexicalement, ce conflit tourne souvent à l’avantage de la langue B, qui s’impose mais qui se trouve profondément altérée par le fait que les indigènes sont des locuteurs de la langue A. La langue résultant de cette hybridation, que l’on appellera C (Créole) est adoptée dès la génération suivante (cf. le cycle pidgin-créole de Hall 1966), (Bickerton, 2014:218) après une phase dite de pidginisation chez les parents, pour qui le créole n’est pas la langue maternelle. La langue C n’est donc la descendante ni de A ni de B en particulier, mais des deux à la fois (McWorther,1998 :788). De ce fait, elle contredit, ou du moins pose une alternative au modèle phylogénétique qui prédit des lignées de langues-mères et de langues-filles, en proposant une genèse par hybridation plutôt que par hérédité. Dans ce cas de figure, une langue est lexicalisante (B) et l’autre grammaticalisante (A) (Whitman, 1994). La langue A correspond au substrat et la langue B au superstrat. S’il n’est plus question ici de langue-mère, la notion de matrice a néanmoins été introduite (Migge 2003 : 23) pour désigner la langue qui transmet son système de règles formelles (morphologiques et syntaxiques). La distinction entre langue-mère et matrice est considérable, puisque dans un processus de créolisation c’est en général le substrat qui est la matrice, alors que si l’on accepte la conception phylogénétique, la langue-mère du français est le latin, donc le superstrat. En effet, le peuple A, dominé par le peuple B, conserve selon toute vraisemblance un certain nombre de traits de sa langue d’origine, tout en adoptant la langue B. Les interactions ←19 | 20→entre le substrat A et le superstrat B n’ont guère fait l’objet d’études approfondies jusqu’ici en ce qui concerne le français, puisqu’il a toujours été admis qu’il était issu à peu près exclusivement du latin. Il semble du moins acquis que les théories superstratistes (domination inconditionnelle de la langue A par la langue B) ne sont pas corroborées par l’observation (voir à ce sujet McWorther 1988 : 790). Il s’agit donc à présent d’examiner si le processus peut s’appliquer au gaulois et au français. Les différents créoles parlés à travers le monde offrent dans ce domaine des perspectives instructives, car ce sont des langues qui se sont formées très rapidement (processus dit de nativization, cf. Hall 1966 et Hymes 1971 : 3), pour ainsi dire, sous les yeux des observateurs. Des populations africaines réduites en esclavage, parlant des langues, probablement bantoues pour la plupart (Hazaël-Massieux, 2008 : 397) sont déportées vers les Caraïbes où elles doivent apprendre la langue de leurs maîtres (français, anglais, néerlandais ou espagnol). Il résulte de ces interférences linguistiques l’apparition d’une nouvelle langue, appelée « créole ». Les créoles se sont formés dans des circonstances dramatiques, et rien ne dit que les choses se soient toujours passées ainsi, mais d’une manière générale l’observation de cas anciens documentés a tendance à montrer que les nouvelles langues sont apparues dans des contextes de grande violence, et c’est certainement le cas du gallo-roman. On a tendance à l’oublier à travers l’image plaisante propagée par la littérature populaire et certains livres d’histoire, mais la guerre des Gaules menée par Jules César a fait entre 6 et 700 000 morts côté gaulois et plus de 500 000 hommes réduits à l’esclavage (Goudineau, 2007 : 252): un peuple n’abandonne pas sa culture, sa religion, et encore moins sa langue, sans y avoir été acculé, ce qui implique que de puissantes forces de coercition entrent en jeu.

Si l’on considère la découpe classique de la langue en quatre parties : phonétique – morphologie – syntaxe – lexique, l’observation des créoles antillais enseigne que la phonétique et la syntaxe restent sous l’influence de langue A (Quentel 2015 : 12), tandis que le lexique passe sous l’influence de la langue B (De Graf 2001), (Migge 2003 : 23), (Ansaldo, 2007 : 9). Le rôle de la morphologie dans le cas des créoles semble être une hybridation de formes des langues A et B. En effet, la phonétique des créoles a été largement influencée par celle des langues africaines (disparition du [ʁ] français par exemple), de même que la syntaxe (article français préfixé au substantif et perdant sa fonction initiale entre autres), la morphologie est à la fois française (marques de genre et de nombre) et africaine (restitution du système de préfixes des langues bantoues, système verbal), et le lexique est presque intégralement français. Hall (1966) relève que le degré de préservation des caractéristiques morphologiques de la langue A est lié au temps de contact de C avec B, c’est-à-dire environ cinq siècles dans le cas qui nous intéresse (où A= gaulois, B = latin et C= gallo-roman). Il n’est pas dit que ←20 | 21→les choses se soient toujours passées ainsi, bien entendu, mais il semble que le français se soit formé, il y a 1500 ans, d’une manière analogue : la phonétique du latin a été profondément transformée sous l’influence du gaulois (cf. entre autres Delattre, 1946: 2), (Zink,1986: 108), (Dauzat, 1939: 17), (Martinet, 1952: 215), (Gray, 1944: 229), (Watkins, 1955: 19), etc.). L’origine de la syntaxe n’est pas élucidée (cf partie II-2.1), mais elle n’est clairement pas latine. La morphologie est partiellement latine (temps simples, marques de genre et de nombre) mais pas toujours (le-ons de la 1ère personne du pluriel est celtique, les procédés de thématisation en c’est, -ce, -ci également, les temps composés ne sont pas latins – il ne s’agit là que d’exemples), ce que relevait déjà Littré dans l’introduction de son Histoire de la langue française (1864). Il est très difficile à ce stade de spécifier ce que le français, et les langues gallo-romanes en général, ont pu hériter du celtique continental étant donné que la morphologie et la syntaxe de ces langues sont très mal connues (cf. Lambert : 2003). En l’état actuel des connaissances, et aussi un peu par tradition, c’est le latin qui est considéré comme la matrice morphologique du français, mais cela ne correspond pas au schéma de genèse linguistique attendue, puisque dans les processus de créolisation observés c’est la langue A qui est la matrice (Migge, 2003 :23). Le peu que l’on sache du gaulois tendrait pourtant à corroborer cette observation de Migge, puisque le marqueur « -s » du pluriel peut, par exemple, très bien avoir été hérité du gaulois (accusatif pluriel en –us/-as), mais ceci n’est pour le moment qu’une hypothèse. Quant au lexique, il est incontestablement dominé par le latin, la proportion de mots gaulois ayant survécu est faible : il y a donc eu, conformément aux modèles de créolisation, une relexification (le lexique du superstrat a remplacé celui du substrat, cf. Whitman 1994), comme nous allons en avoir confirmation dans les pages qui suivent. Le fait de savoir si la grammaire est empruntée, en tout ou en partie, au substrat, sera étudié dans un ouvrage ultérieur. En effet la perméabilité du substrat à la grammaire du superstrat est corrélée à la durée et à l’intensité du contact entre les langues de substrat et de superstrat (Chaudenson 2002 : 14), et les résultats de l’hybridation sont donc fluctuants d’une situation à une autre.

1.1.3 Superstrats et adstrats

Suivant ce modèle, une nouvelle langue est donc le résultat de la fusion de deux langues plus anciennes, A e B, dominée et dominante, substrat et superstrat. Le processus ne s’arrête pas là : une fois créolisée, la langue se trouve confrontée à de nouvelles interférences parmi lesquelles on distingue deux catégories : les (nouveaux) superstrats et les adstrats (Deroy 1956 : 111). Après que le gaulois a fusionné avec le latin pour produire le gallo-roman, il a à nouveau été altéré par ←21 | 22→les langues avec lesquelles il est entré en contact, pacifiquement ou non. Cependant, il ne s’agit plus, une fois que la langue s’est formée, de créolisation, mais de simple évolution par contact, où les interférences ne concernent plus que le lexique, la plupart du temps de façon marginale: ce que l’on appelle ici superstrat prend donc un sens différent de celui qu’il revêt dans le contexte d’une créolisation. On relèvera d’ailleurs que, suivant le modèle phylogénétique traditionnel comme cela a été fait jusqu’ici, le latin n’a pas été considéré comme un superstrat mais comme la langue-mère du français. Mais puisqu’il n’y a pas de langue-mère dans une créolisation, la notion de superstrat prête à équivoque. Le superstrat est la langue B de la minorité dominante selon les créolistes, il n’est, pour les lexicologues, qu’un adstrat qui n’a pas survécu dans la zone concernée (Deroy 1956 :111). C’est notamment le cas de l’ancien bas-francique pour le français, qui est plus un adstrat qu’un superstrat, ne serait-ce que du fait de son influence sur le lexique, pour l’essentiel, et du fait que l’aristocratie guerrière qui l’a amené en Gaule n’en a pas imposé ni même recommandé l’usage. Pour plus de clarté, il serait correct de ne parler de superstrat que pour la langue B de la créolisation, et d’adstrat pour toutes les autres, mais le cas du francique comporte une certaine ambiguïté qui empêche de le considérer comme un pur adstrat, notamment du fait qu’il a été importé par voie de domination militaire, et que son impact n’est certes que lexical mais il est significatif. Il ne s’agit donc en aucun cas d’un réservoir lexical voisin auquel on emprunte quelques concepts culturels, comme on pourrait l’attendre d’un adstrat. On considèrera toutefois que le francique est davantage à ranger du côté des adstrats que des superstrats. Les adstrats sont des langues, souvent proches, qui constituent des réservoirs d’emprunts (ou « fournisseurs d’emprunts » pour Deroy 1956 :111). L’influence de ces langues peut être considérable au niveau lexical, mais demeure faible voir nul aux autres niveaux (phonétique, syntaxique et morphologique), et c’est en effet le cas du francique. Une langue adstratique est le plus souvent influente du fait de son rayonnement culturel. Ce fut aussi le cas, pour le français, du grec et de l’arabe, bien qu’il n’y ait pas eu dans ces derniers cas, de domination militaire. L’arabe par exemple, aura joué pour l’espagnol un rôle équivalent à celui du francique pour le français.

Ces adstrats dominants sont le plus souvent le résultat d’une conquête. Cependant, pour des raisons là encore très complexes, ils ne sont pas à même de former une nouvelle matrice et d’absorber le créole qui vient d’émerger. Pour le français, l’adstrat dominant est germanique : c’est celui des premières dynasties de rois qui se forment après le chaos qui a suivi la fin de l’empire romain (Mérovingiens puis Carolingiens). Ces peuples parlaient une langue appelée conventionnellement « ancien bas francique », pour la distinguer du « francique ripuaire ». On l’abrège ←22 | 23→« abfr » dans les dictionnaires. Cependant, pour des raisons de commodité il sera désigné ici sous la simple dénomination de « francique » et abrégé en « frq . ». Le francique, bien qu’il ait laissé une trace dans la langue, n’a pas été en mesure de jouer un rôle analogue à celui du latin. Son influence est donc réelle, en particulier sur le plan lexical, mais marginale comparée à celle du latin. Pour résumer : une langue de substrat fusionne avec une langue socialement dominante (superstrat) et imposée, laquelle est ensuite soumise à l’influence de superstrats et de réservoirs d’emprunts que l’on appellera adstrats simples ou dominants, selon qu’ils ont été les langues d’une nouvelle aristocratie ou pas. A titre d’illustration, on pensera à l’anglais qui s’est construit sur un substrat celtique (brittonique), dont le superstrat est le saxon germanique, et qui a été lexicalement influencée par un adstrat dominant français. Mais le français, au même titre que le francique, n’a pas vu son influence sur l’anglais excéder le domaine lexical. Le français, de son côté, s’est construit comme l’anglais sur un substrat celtique (gaulois), mais avec un superstrat différent : le latin, lequel a ensuite été soumis à l’influence d’un adstrat dominant francique. Cette stratification linguistique peut se retrouver dans la genèse de nombreuses langues : l’espagnol possède un substrat cantabre (non indo-européen) (Quentel & Kaźmierczak, 2017), un superstrat latin et un adstrat dominant arabe, le roumain un substrat illyrien (dace) (Mihaila :1980), un superstrat latin et une influence adstratique slave (Kopecký 2004). Ceci est évidemment très schématique, et il existe de nombreuses variétés de situations et de nuances, mais elles sont toutes basées sur le processus fondamental [substrat + superstrat = hybridation (créolisation)] + [adstrats éventuels] = nouvelle langue. La connaissance de ces processus est corrélée à l’existence de corpus écrits dans les langues concernées: on sait que le latin est le superstrat du français parce que c’est une langue documentée par une abondante quantité de textes. On connaît également l’existence du substrat gaulois, dont on possède un corpus écrit (limité), parce que les Romains le mentionnent, et parce que la toponymie en garde une trace. En revanche, le superstrat francique n’est pas directement documenté, mais on en connaît l’existence par des sources historiques, et il est possible de le reconstruire par comparaison avec d’autres langues germaniques (cf. partie II-5.1).

Résumé des informations

Pages
410
ISBN (PDF)
9783631729939
ISBN (ePUB)
9783631729946
ISBN (MOBI)
9783631729953
ISBN (Relié)
9783631656778
Langue
Français
Date de parution
2019 (Février)
mots-clé
French language Historical Linguistics Substrata Etymology Language birth Creolisation
Published
Berlin, Bern, Bruxelles, New York, Oxford, Warszawa, Wien, 2019. 410 p., 11 ill. n/b, 6 tabl.

Notes biographiques

Gilles Quentel (Auteur)

Gilles Quentel est professeur de linguistique comparée à l’université de Gdańsk. Il a soutenu un doctorat de linguistique scandinave à l’université Paris-Sorbonne, ainsi qu’un master de linguistique danoise à la Syddansk Universitet (Kolding – Danemark) et un master de Lettres Modernes à l’Université de Bretagne Occidentale (Brest).

Précédent

Titre: La genèse du lexique français