La reconstruction des langues et la linguistique historique

Transcription

La reconstruction des langues et la linguistique historique
Cours n°4:
La reconstruction des langues et
la linguistique historique
Licence de Sciences Cognitives
3ème année
Plan du cours
1.
Des points de vue et des approches différents
2.
Introduction aux méthodes de classification et
de reconstruction
3.
Les grandes familles de langues et les
protolangues : limites et débats actuels
4.
A la recherche de la langue originelle
Plan du cours
1.
Des points de vue et des approches différents
Deux approches en linguistique
z
Etude d’une langue à un instant donné :
¾ linguistique
z
synchronique
Etude de l’évolution d’une langue au cours
du temps :
¾ linguistique
diachronique
Classification
z
Principe : regrouper les langues du monde
actuelles en familles à plus ou moins grande
échelle
z
z
z
Pas d’hypothèse sur l’histoire des langues
Une approche en synchronie
Linguistique aréale : distinguer des aires
géographiques correspondant à une
caractéristique linguistique particulière
Reconstruction (1)
z
Principe fondamental : les proximités entre
langues peuvent traduire une histoire commune
z
Un problème : distinguer les emprunts des
véritables relations génétiques
z
Une fois les emprunts mis à part, deux langues
présentant des caractéristiques voisines
descendent d’une langue ancestrale commune
z
plus les deux langues sont proches, plus leur ancêtre
commun est récent
Reconstruction (2)
z
A partir de langues actuelles voisines, tenter de
reconstruire la langue ancestrale (ou protolangue ou
langue-mère)
z
Un prolongement naturel et classique de la classification
(mais pas obligatoire)
z
Différents niveaux à aborder :
z
z
phonologie, lexique, syntaxe etc.
Un processus récursif : à partir d’un ensemble de
protolangues apparentées, reconstruction d’une
protolangue plus ancienne etc.
Classification et Reconstruction
z
Des approches complémentaires et croisées
z
Le travail de reconstruction travaille sur un ensemble de
langues supposées apparentées Æ travail de
classification au préalable
z
Inversement, la reconstruction des langues-mères
permet de confirmer l'existence des familles de langues
z
Des familles de langues à + ou – grande échelle
z
des langues ancestrales à + ou – grande profondeur
Æ Reconstruction d’arbres des langues (présentes et
passées)
Transition
Quelles méthodes employer pour
rendre plus concrets les points
précédents ?
Plan du cours
1.
Des points de vue et des approches différents
2.
Introduction aux méthodes de classification et
de reconstruction
La naissance de la linguistique historique
z
Sir William Jones (1746-1794)
z
« The Sanskrit language, whatever be its antiquity, is of a wonderful
structure ; more perfect than the Greek, more copious than the
Latin, and more exquisitely refined than either, yet bearing to both of
them a stronger affinity, both in the roots of verbs and in the forms of
grammar, than could possibly have been produced by accident ; so
strong, indeed, that no philologer could examine them all three,
without believing them to have sprung from some common source,
which, perhaps, no longer exists. »
(In Stockdale, J. (1807). Troisième discours
anniversaire: On the Hindus, 1786, Asiatic Society of
Calcutta. The Collected Works of Sir William Jones III)
La linguistique historique
z
Autres appellations : linguistique comparée, grammaire comparée
z
Une discipline de la linguistique qui étudie l'histoire et l'évolution des
langues (prises individuellement) ou des familles de langues
z
z
Principale méthode de travail :
z
z
z
comparaison entre les différents états d'une même langue ou entre des
langues différentes mais issues d'un même ancêtre
recherche de concordances phonétiques syntaxiques ou sémantiques
régulières Æ parenté entre langues = relation génétique
Comparaisons et reconstruction : des démarches complémentaires
z
z
z
initialement surtout basée sur la comparaison de textes ; cf. philologie
(comparée)
retrouver la langue mère à partir des langues filles
nature des évolutions, innovations et rétentions entre l’état initial et les
états finaux (phonétique, phonologie, lexique, syntaxe etc.)
Une branche importante : la phonétique historique
Les comparaisons en phonétique
historique
z
Travail sur le lexique des langues
z
Deux éléments à prendre à compte pour le lexique :
z
z
z
le sens des mots
la forme des mots = les sons qui les composent
Les mots de deux langues peuvent être plus ou moins proches ; 4
explications possibles :
z
z
hasard (meli : miel en hawaïen et en grec ancien)
emprunt
z
algorithme, girafe, orange : emprunts du français à l’arabe
développement (universel) du langage chez le jeune enfant (« Why papa
and maman »)
histoire commune (main / mano)
z
z
z
Gulemedo (japonais) / Gourmet d’Or (français) ; karibu (« bienvenue » en
swahili, emprunté à l’arabe)
Une notion clé : les
correspondances régulières
z
Une correspondance régulière est une transformation
phonologique qui change sans exception un phonème A
de la langue 1 en phonème B de la langue B
z
Les correspondances régulières indiquent une relation
génétique entre deux langues
z
Liées à l’hypothèse néo-grammairienne d’évolution des
sons :
z
les changements des sons qui composent les mots se
produisent :
z
z
z
z
graduellement au niveau phonétique
abruptement au niveau lexical
un changement peut ne se produire que dans certains contextes
une alternative : la diffusion lexicale (Wang, 1969)
La méthode de comparaison
z
Considérer un ensemble de mots
z
z
z
z
z
apparier les mots selon leur sens (en prenant en compte
d’éventuels glissements sémantiques)
tenter de détecter les emprunts ou les ressemblances liées au
hasard (pas facile)
rechercher des correspondances régulières entre les mots
tenter d’expliquer les différentes évolutions qui ont pu conduire
au cas étudié
Notion de cognat :
z
z
deux mots sont cognats s’ils dérivent d’un même mot d’une
langue ancestrale
détection des cognats : mots qui vont présenter une proximité
sémantique et une correspondance régulière
La méthode de comparaison
Exemples (1)
Sardinian
Italian
Romansh French
Spanish
‘100’ kεntu
t∫εnto
tsjεnt
sà†
θjen
‘sky’
t∫elo
tsil
sjεl
θjelo
‘stag’ kεrbu
t∫εrvo
tsεrf
s εR
θjerbo
‘wax’ kεra
t∫era
tsaira
siR
θera
kεlu
D’après Trask, « Historical Linguistics », 1996 (p. 203)
La méthode de comparaison
Exemples (2)
(d’après Philippson (2002) : la méthode comparative, communication orale au colloque CNRS/
Fondation des Treilles : Origines de l'homme, du langage et des langues, Tourtour)
sens
mâcher
couper un arbre
arbre
feu
envoyer
Swahili
-tafuna
-tema
m-ti
m-oto
-tuma
Dawida
-dafuna
-dema
m-di
m-odo
-duma
→Correspondance régulière entre le /t/ du swahili
et le /d/ du dawida
La méthode de comparaison
Exemples (3)
(d’après Philippson (2002) : la méthode comparative, communication orale au colloque CNRS/
Fondation des Treilles : Origines de l'homme, du langage et des langues, Tourtour)
vomir
-tapika
-daika
nu
-tupu
-duu
passer
-pita
-ida
→Correspondance régulière entre le /p/ du
swahili et le /Ø/ du dawida
La méthode de comparaison
Exemples (4)
z
Les correspondances régulières peuvent
n’apparaître que dans certaines conditions :
coussinet de tête
pintade
singe
-kata
-kanga
-kima
-ngada
-nganga
-ngima
coup de poing
poulet
-konde
-kuku
-ngonde
-nguku
Æ La correspondance n’est régulière qu’à l’initiale
Des évolutions + ou - transparentes
z
Évolutions sémantiques :
z
z
blanc en français et black en anglais sont cognat: ils ont la
même racine : bhel- « briller,brûler »
Évolutions phonétiques / phonologiques :
z
sugu en yao et eto en makua (langues bantoues du
Mozambique) désignent tous les deux la même plante et sont
cognats
z
des correspondances régulières plus ou moins faciles à mettre
au jour
Le travail de reconstruction
z
Objectif : remonter aux mots de la protolangue
z
z
z
au niveau de la forme : reconstruire la proto-forme à partir des
correspondances régulières et de la connaissance des changements
phonétiques
au niveau sémantique : remonter au sens de la proto-forme
Exemple de la langue-mère du swahili et du dawida
z
z
correspondance régulière : swahili /t/ ↔ dawida /d/
trois possibilité pour la langue mère :
z
z
z
z
/t/
/d/
autre chose
Un grand nombre de langues comparées permet de déterminer la
forme ancestrale à partir de la connaissance des évolutions
possibles et de l’ensemble des formes dérivées…
z
e.g. si certains sons ou mots ont disparus dans certaines langues-filles
Limitations des méthodes de
comparaison et de reconstruction (1)
z
Les méthodes marchent d’autant mieux que les langues ont divergées
récemment.
z
exemple : comparaison de l’allemand et du français :
Fisch
Vater
Fell
Ferkel
Voll
z
Poisson
Père
Peau
Porc
Plein
possible correspondance entre /f/ et /p/ à l’initial mais le reste des mots ne
soutient guère cette proposition (trop de changements et d’emprunts)…
Limitations des méthodes de
comparaison et de reconstruction (2)
z
z
Comparaison du latin et du vieux-haut-allemand :
Fisc
Pisc-is
Fater
Pater
Vëll
Pell-is
Farh
Porc-us
Voln
Plen-us
La structure des mots correspond bien mieux
Les listes de Swadesh
z
Un problème de base : les emprunts et les changements
multiples dans le lexique brouillent les relations
génétiques
z
e.g. les emprunts non détectés conduisent à sous-estimer la
profondeur d’un ancêtre commun à plusieurs langues
z
Une intuition : choisir des mots du lexique plus résistant
aux changements et aux emprunts
Æ
Les listes de Swadesh (1957)
(Morris Swadesh, 1909-1967)
z
z
des listes de mots (100 ou 200) du lexique de base : éléments
de l’environnement, parties du corps etc.
des concepts supposés universels et très stables
Un exemple de collecte de données
http://en.wiktionary.org/wiki/Swadesh_lists_for_Slavic_languages
La lexicostatistique (1)
z
Le plus souvent basée sur les listes de Swadesh
z
Une approche pour reconstruire l’arbre des filiations
ancestrales pour une famille de langues apparentées
z
Méthode :
z
z
établir le % de cognats dans la liste de mots étudiés pour
chaque paire de langues
à partir de la matrice de % entre N langues, reconstruire un
arbre des langues selon le principe suivant :
z
z
plus le % de cognat est important, plus les langues sont proches
différents algorithmes possibles : nearest-neighbour joining etc.
La glottochronologie
z
Une approche complémentaire à la lexicostatistique
z
Basée sur une analogie avec le carbone 14 qui se transforme au
cours du temps en carbone 13
z
z
z
z
loi d’évolution : dC/dt = - α.C
demi-vie du C14 : 5730 ans
la dégradation du C14 se produit à un taux constant au cours du temps
Hypothèse : les mots se transforment comme le C14 au cours du
temps
z
z
z
changements dans le vocabulaire de base à un rythme relativement
constant au cours du temps
% de cognat relié au temps de divergence entre 2 langues
estimation du taux de changement (ou de la demi-vie d’un mot) à partir
de cas connus : pour la liste de 200 mots de Swadesh, 81% du lexique
est préservé au bout de 1000 ans
c : % de cognats
r : constante glottochronologique
Critiques de l’approche de Swadesh
z
Les concepts des listes de Swadesh sont-ils réellement
indépendants des cadres culturels ?
z
Les changements se produisent-ils vraiment à un rythme
constant au cours du temps :
z
z
z
z
un rythme constant ?
un même rythme pour différentes paires de langues ?
Influence des facteurs sociaux
impact de l’écriture
Æ Les listes de Swadesh sont toujours utilisées aujourd’hui
Æ La glottochronologie est un peu tombée en désuétude
Les comparaisons multi-latérales
z
Une approche due à Joseph Greenberg
(1915-2001)
z
Comparaison de larges listes de mots
Æ facilite la détection de proximités
entre langues
z
Une approche dédiée à la classification et non à la
reconstruction
Très critiqué pour certaines aires géographiques
(Amériques), mais base de classifications
aujourd’hui acceptées (Afrique)
z
D’autres approches possibles
z
L’utilisation de vocabulaire spécifique à une région / une population
du monde :
z
z
z
z
vocabulaire de la chasse ou de la pêche
vocabulaire agraire
noms de poissons (Mouguiama-Daouda, 1995), d’oiseaux etc.
Comparer non les mots mais les structures phonologiques,
morphologiques, syntaxiques etc. des langues
z
z
ex. : peut-on étudier les filiations entre langues à partir de l’ordre des
mots (M. Gell-mann) ?
dépend de la fréquence et de la nature des changements
Plan du cours
1.
Des points de vue et des approches différents
2.
Introduction aux méthodes de classification et
de reconstruction
3.
Les grandes familles de langues et les
protolangues : limites et débats actuels
En remontant dans le passé…
z
Application récursive de la méthode de
reconstruction :
z reconstruction
de protolangues à partir de
langues actuelles
z utilisation de ces protolangues pour remonter
dans le passé et remonter à une protolangue
plus ancienne
z
Validité d’une telle approche récursive ?
L’impact du renouvellement lexical
Les mots du lexique se
renouvellent constamment…
Mais à quelle vitesse ?
z
z
Le renouvellement efface les
traces des mots du passé.
Swadesh et la
glottochronologie
Critiques : influence des
facteurs sociaux…
Limite des
reconstructions ?
Et avant ?
Les grandes familles linguistiques
z
La notion de stock linguistique
z
z
z
J. Nichols
ensemble de langues dérivables d’une même langue
ancestrale avec un bon degré de confiance
aujourd’hui : quelques centaines de stocks
z
A une profondeur de 2000 ans : environ 50
familles de langues
z
A une profondeur de 5000 ans : environ 10-15
macro-familles de langues
Les 12 macro-familles
linguistiques de Merritt Ruhlen
Des débats houleux
z
Grands débats actuels sur les macro-familles
z
+ on remonte dans le temps ↔ + les familles sont
importantes, + les débats sont houleux
z
exemple de désaccords :
z
z
z
réalité de la famille Amerind
hypothèse Nostratique versus hypothèse Eurasiatique
hypothèse Austrique
Limites de l’approche
z
Les hypothèses précédentes signifient-elles que seules une quinzaine de
langues étaient parlées sur Terre il y a 5,000 ans ???
z
+ on remonte dans le temps, + les imprécisions sont nombreuses
z
Imprécisions des macro-classifications proposées entre autres par Joseph
Greenberg (ex. la famille Amerind) : trop de langues considérées,
approximations et erreurs inévitables
z
Le processus de reconstruction pointe méthodologiquement vers une
réduction du nombre de langues
z
z
pas de prise en compte de la variabilité dialectale
pas de prise en compte d’éventuels phylums éteints sans avoir laissé de traces
z
Vitesse d’évolution des langues du passé identique à celle des langues
actuelles ?
z
Un consensus aujourd’hui : il n’est pas possible de reconstruire
sérieusement au-delà d’une profondeur de 8,000 ans BP
Quelques pistes pour l’étude des
langues de la préhistoire
z
Étudier plus précisément les liens entre structures
sociales et diversité des langues
z
relations méconnues pour les périodes actuelles et pour les
périodes plus anciennes
z
exemples de questions :
z
z
z
une population structurée en petits groupes d’individus isolés
présente-t-elle + de diversité linguistique qu’une population
composée de groupes plus importants ?
ses langues évoluent-elles plus vite ?
nécessité de mieux connaître les populations de la préhistoire
(taille, organisation, répartition etc.)
Plan du cours
1.
Des points de vue et des approches différents
2.
Introduction aux méthodes de classification et
de reconstruction
3.
Les grandes familles de langues et les
protolangues : limites et débats actuels
4.
A la recherche de la langue originelle
Une quête ancienne
z
A la recherche de la langue adamique / de la
langue parfaite
z
Une approche plus scientifique de la question
avec le développement de la linguistique
historique
z
z
Trombetti, début du 20ème siècle : hypothèse d’une
unique langue originelle, que l’on pourrait reconstruire
grâce à la linguistique historique
Les travaux de Merrit Ruhlen (Ruhlen, 1994)
Le proto-world
z
Une application à l’extrême des comparaisons
entre langues et du processus de reconstruction
z
identification de mots de la langue dont dériveraient
toutes les langues modernes : le proto-world
z
relations entre les grandes familles de langues et les
migrations d’Homo sapiens
z
relation entre le proto-world et les premières
populations de sapiens en Afrique de l’est il y a
environ 100,000 ans
Une citation
“Another striking resemblance among the world's language families
is a word whose original meaning was probably 'finger‘ (though it
has evolved to 'one' and 'hand'[='fingers'] in many languages), and
whose original form was something like tik. I first became aware of
the widespread nature of this root at a public lecture that Greenberg
gave at Stanford in 1977, in which he mentioned three roots that
were widely distributed around the world: tik 'finger,' pal 'two'
(which we will look at in the following section), and par 'to fly.' As
you no doubt noticed in your examination of Table 10, no less than
eight of the twelve families show traces of tik 'finger,one,' namely,
Nilo-Saharan (B), Niger-Kordofanian (C), Afro-Asiatic (D),
Eurasiatic (G), Dene-Caucasian (H), Austric (I), Indo-Pacific (J)
and Amerind (L).”
(Ruhlen, 1994)
Critiques de l’approche de M. Ruhlen
Des attaques de type « statistique » :
• comment prouver que les ressemblances mises en avant sont statistiquement
significatives
• trop de laxisme sur les correspondances sonores et sémantiques
Conclusions
z
Une connaissance de plus en plus fine des relations entre les
langues actuelles
z
z
z
z
meilleure compréhension de la diversité linguistique
langues et gènes
reconstruction des langues ancestrales
Une approche toutefois limitée
Æ Nécessité d’approches innovantes pour étudier la préhistoire des
langues :
z
z
z
influence des structures sociales de la population
mise à profit des données archéologiques
simulations informatiques