L`épenthèse consonantique en français

Transcription

L`épenthèse consonantique en français
UNIVERSITÉ DE NICE SOPHIA-ANTIPOLIS
U.F.R. L.A.S.H., DÉPARTEMENT DE LINGUISTIQUE
LABORATOIRE 'BASES, CORPUS ET LANGAGE' (UMR 6039)
Thèse de doctorat nouveau régime
L'épenthèse consonantique en français
Ce que la syntaxe, la sémantique et la morphologie peuvent faire à la phonologie :
parles-en de ta numérotation impossible
origine syntaxique,
morphologique, sémantique
position forte
Gouv
[C
V]
V
|
C0
V
Lic
épenthèse
présentée par
Claudine Pagliano
sous la direction de Tobias Scheer
Volume 1 – L'épenthèse consonantique dans les langues en général
Remerciements
C'est un plaisir pour moi, arrivée au terme de cette thèse, d'exprimer ma gratitude aux
personnes qui ont participé, chacune à sa manière, à en améliorer les conditions d'élaboration.
Je tiens à remercier tout d'abord les personnes qui ont contribué à sa réalisation
matérielle : Yvon Deschamps, qui a informatisé le protocole de recherche semi-automatique
exploité dans la création du corpus ; les douze locuteurs qui se sont prêtés au jeu du
questionnaire avec bonne humeur et le plus honnêtement possible ; les courageuses relectrices
qui ont énergiquement traqué coquilles et tournures maladroites.
Ma reconnaissance s'adresse également aux membres du laboratoire Bases, Corpus et
Langage (UMR 6039) pour leur soutien. Elisabetta Carpitelli, Michèle Olivieri et Carole de
Féral m'ont fait profiter de leurs conseils dans leurs domaines de prédilection respectifs.
Annie Veissière m'a fait bénéficier autant de son bon sens à toute épreuve que de ses
jugements précieux de locuteur non linguiste. Je remercie tout particulièrement Sylvie Mellet
pour son écoute, l'aide efficace qu'elle m'a apportée à divers moments difficiles de la thèse, et
sa disponibilité.
Merci à ma famille de m'avoir laissée dans ma bulle durant les mois les plus chargés
de la rédaction. Mention toute particulière à Dylan et Megan, arrivés au monde durant la
gestation de cette thèse. J'ai également apprécié le soutien de mes amis, et je remercie
particulièrement Margareta, Mojca et Estelle pour leur aide logistique autant que morale.
J'ai eu la chance de bénéficier des critiques, des idées et du soutien de mes deux
"copains phonologues", Delphine Seigneur et Olivier Rizzolo. Merci enfin à Tobias Scheer,
qui a fait preuve de beaucoup de disponibilité et dont les commentaires ont énormément
apporté à cette thèse.
A vous tous, pour votre patience et votre présence, merci.
iii
Conventions employées dans la thèse
Organisation générale de la thèse et renvoi aux différentes sections
La thèse se présente sous la forme de quatre volumes : les trois premiers correspondent
aux trois parties de la thèse, le dernier contient les annexes. Au début de chaque volume
figure un sommaire abrégé de la thèse, la table des matières complète se trouvant en fin de
volume. Un index des langues étudiées dans la première partie est proposé en fin du premier
volume ; un index général est fourni à la fin de chaque volume, avant la table des matières.
Les références figurent à la fin du troisième volume.
Chacune des trois parties de la thèse comporte trois à cinq chapitres. La numérotation
des chapitres est continue, c'est-à-dire qu'elle n'est pas réinitialisée en deuxième et troisième
parties, de façon à faciliter le repérage au sein de la thèse. Les sections, les puces et les notes,
en revanche, sont réinitialisées à chaque nouvelle partie.
Les renvois à d'autres sections de la thèse se font au moyen du code suivant : le
numéro de la partie est donné en chiffres romains, celui du chapitre entre crochets, suivi du
numéro de la section concernée. Ainsi, pour renvoyer à la section 3.3.2 du chapitre 9 de la
partie 3 le code utilisé sera-t-il le suivant : I [9] 3.3.2. Si les renvois concernent le chapitre
dans lequel on se situe, ne sera précisé que le numéro de la section.
iv
Abréviations et notations
Au niveau mélodique :
C
=
consonne
V
=
voyelle
T
=
obstruante
R
=
sonante
L
=
liquide
N
=
nasale
X
=
segment quelconque
[CÕC] =
domaine de gouvernement infrasegmental
(CV)
chute d'une unité [CV]
=
Au niveau syllabique :
σ
=
syllabe
A
=
attaque
R
=
rime
N
=
noyau
C
=
coda
x
=
position squelettale
Relations :
G
=
gouvernement
GP
=
gouvernement propre
GIS
=
gouvernement infrasegmental
L
=
licenciement
LG
=
licenciement pour gouverner
ECP
=
Principe des Catégories Vides
*mot
=
réalisation impossible d'un mot
°mot
=
base virtuelle
Divers :
Sommaire
Sommaire
Introduction générale
1
PARTIE I. L'ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN
GÉNÉRAL
Introduction
Chapitre 1. Distribution géographique, variation qualitative, contextes
d'apparition et causalités
1. Définition
2. Substance des épenthèses consonantiques dans les langues du monde
3. Les épenthèses en français
Chapitre 2. Le caractère particulier des consonnes coronales : phonétique,
phonologie, théories
1. Les coronales : quelques faits phonétiques
2. Le statut particulier des coronales : phonologie
3. Le statut particulier des coronales : les théories génératives
Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français :
liaison et épenthèse
1. Epenthèse et alternances consonne ~ zéro
2. Analyses antérieures de l'épenthèse
Conclusion
5
PARTIE II. L'ÉPENTHÈSE CONSONANTIQUE DEVANT SUFFIXE
DÉRIVATIONNEL EN FRANÇAIS : LES FAITS
Introduction
Chapitre 4. Délimitation de l'objet d'étude
1. Français standard, populaire, ordinaire...
2. Le français dans sa dimension temporelle
3. Point sur la suffixation
Chapitre 5. Constitution de la base de données
1. Création d'un corpus à partir de sources écrites.
2. Introduction de données uniquement orales (G)
3. Bilan sur les méthodes de constitution du corpus
4. Bilan sur les terminaisons représentées dans le corpus
Chapitre 6. De la base de données au corpus de travail
1. Premier filtre : étymologies et consonnes sous-jacentes
2. Deuxième filtre : les écueils de la morphologie dérivationnelle française - qu'est-ce
qui est dérivé de quoi ?
Chapitre 7. De l'intérêt d'un questionnaire.
1. Etapes préliminaires
2. Élaboration d'un questionnaire portant sur les conditions d'apparition des épenthèses
3. Résultats du questionnaire
4. Bilan général du questionnaire
Conclusion
6
7
7
12
88
109
109
119
144
204
204
259
299
300
301
302
302
309
311
340
342
385
389
391
394
395
452
543
543
549
560
593
594
Sommaire
PARTIE III. EPENTHÈSE CONSONANTIQUE EN FRANÇAIS :
DISTRIBUTION D'UNE UNITÉ [CV] PAR LA SYNTAXE, LA SÉMANTIQUE
ET LA MORPHOLOGIE, ET SES CONSÉQUENCES PHONOLOGIQUES
Introduction
Chapitre 8. Cadre théorique
1. Phonologie de Gouvernement et cadre CVCV
2. Position forte et Coda-Miroir (Scheer & Ségéral 2001)
Chapitre 9. [CV] sémantique : les conséquences phonologiques de l'emphase
1. Préliminaires
2. Emphase et géminées
3. Emphase et épenthèse
4. Bilan sur le [CV] sémantique
Chapitre 10. [CV] syntaxique : les conséquences phonologiques de l'enclise
1. Mise en place de la problématique
2. Analyse
3. Bilan sur le [CV] syntaxique
Chapitre 11. [CV] morphologique : les conséquences phonologiques de la
dérivation
1. Interaction morphologie / phonologie
2. Formation des adverbes en -ment en français (Pagliano 1999a)
3. Classes de suffixes
4. Dérivés suffixaux et épenthèses consonantiques
5. Bilan sur le [CV] morphologique
Chapitre 12. Prolongements de l'analyse : la position forte
1. Emphase, intensif et gémination
2. Nature de l'épenthèse en français
3. Position forte et épenthèse consonantique en français : réciprocité ?
Conclusion de la partie III
595
596
599
599
603
614
614
622
628
664
669
669
673
725
728
729
731
767
779
803
804
804
808
812
819
Conclusion générale
822
Index
825
Références
827
Annexes
859
Table des matières
Table des matières
Introduction générale
1
PARTIE I. L'ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN
GÉNÉRAL
5
Introduction
6
Chapitre 1. Distribution géographique, variation qualitative, contextes
d'apparition et causalités
1. Définition
1.1. Epenthèse, étymologie et sous-jacence
1.2. Eléments épenthésables
1.3. Epenthèses et environnement phonologique
1.3.1. Les épenthèses "avatar"
1.3.2. Les épenthèses ex nihilo
2. Substance des épenthèses consonantiques dans les langues du monde
2.1. Nature de la consonne épenthésée
2.1.1. Vélaires
2.1.2. Glottales
2.1.2.1. Fricative h
2.1.2.1.1. Langues gabaritiques
2.1.2.1.2. Langues amérindiennes
2.1.2.1.3. Langue austronésienne
2.1.2.2. Occlusive !
2.1.2.2.1. Langues austronésiennes
2.1.2.2.2. Langues gabaritiques
2.1.2.2.3. Langues amérindiennes
2.1.2.2.4. Continent asiatique
2.1.2.2.5. Continent africain
2.1.2.2.6. Continent européen
2.1.2.2.7. Bilan sur le coup de glotte
2.1.3. Coronales
2.1.3.1. Liquides
2.1.3.1.1. Continent africain
2.1.3.1.2. Continent australien
2.1.3.1.3. Continent asiatique
2.1.3.1.4. Continent européen
2.1.3.2. Nasale
2.1.3.3. s, z
2.1.3.4. t, d
2.1.3.4.1. Langues amérindiennes
2.1.3.4.2. Autres continents
2.1.3.5. Bilan sur les coronales
2.1.4. Récapitulatif des langues et des consonnes concernées
2.1.4.1. Classement par son épenthésé
2.1.4.2. Classement par région géographique
2.1.5. Contextes syllabiques d'épenthèse en fonction du son épenthésé
7
7
8
9
9
9
11
12
12
13
16
16
16
16
18
19
20
25
26
26
28
28
30
31
31
31
33
33
33
35
37
37
38
39
41
41
41
43
44
Table des matières
2.1.5.1. Sons épenthésables en coda
2.1.5.1.1. Fin de proposition
2.1.5.1.2. Fin de mot
2.1.5.1.3. Fin de syllabe
2.1.5.2. Sons épenthésables en attaque
2.1.5.2.1. Début d'unité supérieure
2.1.5.2.2. Début de mot
2.1.5.2.3. Début de syllabe
2.1.5.3. Tableau récapitulatif
2.1.6. Bilan de la section
2.2. Pourquoi
2.2.1. Coarticulation et résolution de groupes de consonnes interdits
2.2.1.1. Epenthèses après sonantes
2.2.1.1.1. Devant obstruantes
2.2.1.1.2. Devant sonante ou obstruante
2.2.1.2. Epenthèse devant liquide
2.2.1.3. Epenthèses en finale après consonne : diachronie de
l'allemand
2.2.2. Contraintes structurales
2.2.2.1. Structure de la proposition
2.2.2.2. Structure de l'unité lexicale
2.2.2.2.1. Finale de mot
2.2.2.2.2. Début de mot
2.2.2.3. Structure syllabique
2.2.2.3.1. Coda requise
2.2.2.3.2. Attaque requise = résolution d'hiatus
2.2.3. Conditionnement morphologique
2.2.3.1. A l'intérieur d'un morphème ?
2.2.3.2. Frontière morphologique
2.2.3.2.1. Entre deux mots
2.2.3.2.2. Dans les composés ?
2.2.3.2.3. Entre préfixe et radical
2.2.3.2.4. Entre radical et suffixe ou désinence
2.2.3.3. Bilan sur les frontières morphologiques
2.2.4. Bilan général du conditionnement interne
2.2.4.1. Conditionnement morphologique
2.2.4.2. Conditionnement phonologique
2.2.4.3. Résumé
2.2.5. Facteurs non linguistiques
2.2.5.1. Influence de l'orthographe
2.2.5.2. Analogie et remotivation
2.2.5.3. Motivations sociales et contextuelles
2.2.6. Bilan sur les conditionnements
3. Les épenthèses en français
3.1. Au sein d'un groupe consonantique
3.2. Epenthèses syntaxiques
3.2.1. En français "régional"
3.2.2. En français "standard"
3.3. Epenthèses à la frontière morphologique interne
3.3.1. Entre préfixe et radical
44
44
45
46
46
47
47
48
50
52
53
54
54
55
57
58
60
62
62
63
63
65
66
66
67
72
72
73
74
75
76
77
79
79
81
83
84
84
85
86
87
88
88
89
91
91
92
94
95
Table des matières
3.3.2. Entre radical et suffixe
3.3.2.1. Après consonne : Plénat (1997, 1999)
3.3.2.1.1. Présentation des données
3.3.2.1.2. Analyse des données
3.3.2.1.3. Bilan
3.3.2.2. Après voyelle
3.3.2.2.1. En hiatus
3.3.2.2.2. Devant consonne
3.4. Bilan sur le français
3.5. Bilan du chapitre 1
Chapitre 2. Le caractère particulier des consonnes coronales : phonétique,
phonologie, théories
1. Les coronales : quelques faits phonétiques
1.1. Les coronales en phonétique acoustique.
1.2. Phonétique articulatoire : lame de la langue.
1.3. Lieux d'articulation des coronales
1.3.1. Coronales antérieures
1.3.2. Coronales palato-alvéolaires
1.3.3. Coronales rétroflexes
1.3.4. Coronales alvéopalatales
1.3.5. Coronales palatales
2. Le statut particulier des coronales : phonologie
2.1. Fréquence
2.1.1. Dans les langues du monde
2.1.2. Au sein d'une langue
2.1.3. Dans l'inventaire des sons
2.1.4. Dans le discours
2.1.5. Dans leur distribution
2.1.6. Bilan sur la fréquence
2.2. Transparence
2.3. Assimilation
2.4. Neutralisation
2.5. Marque et implication
2.6. Chute
2.7. Cooccurrence
2.8. Dérivation ?
2.9. Aphasie
2.9.1. Substitution
2.9.2. Syncope
2.9.3. Epenthèse
2.10. Bilan sur la singularité des coronales
3. Le statut particulier des coronales : les théories génératives
3.1. Chomsky & Halle (1968)
3.2. Géométrie des Traits
3.2.1. Structure interne des éléments
3.2.2. La sous-spécification
3.2.2.1. Sous-spécification radicale et marque
3.2.2.1.1. La notion de marque
3.2.2.1.2. Sous-spécification radicale
96
97
97
101
104
106
107
107
107
108
109
109
109
110
112
115
115
116
117
118
119
119
119
120
121
121
121
122
123
128
131
133
133
136
138
139
139
140
141
143
144
145
147
148
153
155
155
158
Table des matières
3.2.2.2. Spécification contrastive
3.2.2.3. Spécification contrastive modifiée
3.2.3. Contre la sous-spécification des coronales ?
3.2.3.1. Rice (1996)
3.2.3.2. Goad (1995)
3.2.4. Bilan sur la sous-spécification
3.3. Les théories monovalentes
3.3.1. Phonologie de Dépendance
3.3.2. Phonologie de Gouvernement
3.3.2.1. cadre général
3.3.2.2. L'élément R
3.3.2.2.1. Projet de l'école londonienne
3.3.2.2.2. Rejet de R
3.3.2.2.3. Szigetvári (1994)
3.3.2.2.4. Cyran (1997)
3.3.2.2.5. Scheer (1996)
3.3.2.3. Bilan sur la représentation des coronales au sein de la
Phonologie de Gouvernement
3.4. Théorie de l'Optimalité
3.4.1. Présentation générale du cadre
3.4.2. Les coronales dans le modèle
3.4.2.1. La classe des coronales
3.4.2.1.1. Coronales vs. labiales et vélaires
3.4.2.1.2. Coronales vs. glottales
3.4.2.2. Au sein de la classe des coronales
3.4.3. Bilan sur les coronales en OT
3.5. Bilan sur la représentation des coronales dans les théories phonologiques
Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français :
liaison et épenthèse
1. Epenthèse et alternances consonne ~ zéro
1.1. Analyses antérieures de la liaison
1.1.1. La consonne appartient au premier morphème
1.1.1.1. Supplétion
1.1.1.1.1. Cadre non génératif
1.1.1.1.2. Cadre génératif linéaire
1.1.1.1.3. Cadre génératif multilinéaire
1.1.1.1.4. Bilan sur la supplétion
1.1.1.2. Présence de la consonne au niveau lexical, à la finale
1.1.1.2.1. Cadre pré-génératif
1.1.1.2.2. Cadre génératif linéaire
1.1.1.2.3. Cadre génératif multilinéaire
1.1.1.2.4. En théorie de l'Optimalité
1.1.1.2.5. Bilan sur la consonne en fin de premier mot
1.1.2. La consonne appartient au deuxième morphème
1.1.2.1. Supplétion
1.1.2.2. Présence de la consonne au niveau lexical, à l'initiale
1.1.2.3. La consonne est le deuxième morphème impliqué
1.1.3. La consonne n'appartient à aucun des deux morphèmes
1.1.3.1. Cadre pré-génératif
161
162
164
164
166
169
170
172
177
178
180
180
181
185
187
188
190
191
191
192
192
193
195
202
202
203
204
204
207
208
208
208
209
210
210
211
212
212
216
223
227
228
228
228
229
230
231
Table des matières
1.1.3.2. Cadre génératif linéaire
1.1.3.3. Cadre génératif multilinéaire
1.1.3.4. Bilan sur l'épenthèse
1.1.4. Bilan sur les analyses antérieures de la liaison
1.2. Liaisons obligatoires, facultatives et impossibles
1.2.1. Après un "pluriel"
1.2.2. Après un singulier
1.2.2.1. Liaison facultative
1.2.2.2. Liaison obligatoire
1.2.2.2.1. A l'intérieur du syntagme nominal
1.2.2.2.2. A l'intérieur du syntagme verbal
1.2.2.2.3. Entre deux syntagmes
1.2.2.3. Liaison interdite
1.2.2.3.1. Après substantif
1.2.2.3.2. Après pronom sujet
1.2.2.3.3. Après verbe : devant préposition ou
déterminant
1.2.2.4. Récapitulatif par catégorie lexicale du premier terme
1.2.3. Bilan sur la liaison
1.3. La flexion
1.3.1. Flexion nominale
1.3.1.1. Nombre
1.3.1.1.1. Une seule forme sous-jacente
1.3.1.1.2. Allomorphie
1.3.1.2. Genre
1.3.1.2.1. Consonne sous-jacente
1.3.1.2.2. Epenthèse
1.3.1.1.3. Bilan sur la flexion nominale de genre
1.3.2. Flexion verbale
1.3.2.1. Mode
1.3.2.2. Personne
2. Analyses antérieures de l'épenthèse
2.1. Cadre non syllabique : insertion d'une consonne
2.1.1. Epenthèse en hiatus : Pupier (1971)
2.1.1.1. Présentation de l'analyse
2.1.1.2. Critique
2.1.1.2.1. Frontière morphologique
2.1.1.2.2. Fléchage dans le lexique
2.1.1.2.3. Surgénération des sites d'épenthèse
2.1.2. Epenthèse et mélodie des consonnes contextuelles : Wetzels
(1985), Picard (1987a, 1987b, 1989), Clements (1987)
2.1.2.1. Présentation de l'analyse
2.1.2.1.1. Occlusives intrusives
2.1.2.1.2. Epenthèses consonantiques
2.1.2.2. Critique
2.1.3. Epenthèse en hiatus et frontière morphologique : Wetzels (1987)
2.1.3.1. Présentation de l'analyse
2.1.3.2. Critique
2.1.4. Bilan sur le cadre non-syllabique
2.2. Cadre syllabique : présence d'une position consonantique
231
234
235
236
237
238
239
241
241
242
243
243
244
244
245
245
246
246
247
247
247
248
248
249
250
251
251
256
256
257
259
260
260
260
263
263
263
264
265
265
266
268
270
270
270
274
275
276
Table des matières
2.2.1. Epenthèse consonantique et syllabation : Piggott & Singh (1985),
Itô (1989)
2.2.1.1. Piggott & Singh (1985)
2.2.1.1.1. Présentation de l'analyse
2.2.1.1.2. Critique
2.2.1.2. Itô (1989)
2.2.1.2.1. Présentation de l'analyse
2.2.1.2.2. Critique
2.2.1.3. Bilan sur le cadre syllabique
2.2.2. Epenthèse, syllabation et morphologie : Théorie de l'Optimalité
2.2.2.1. Prince & Smolensky (1993) : FILL theory.
2.2.2.1.1. Epenthèse en attaque
2.2.2.1.2. Epenthèse en coda ?
2.2.2.1.3. Bilan
2.2.2.2. McCarthy & Prince (1995) : DEP theory.
2.2.2.2.1. Principe général
2.2.2.2.2. Illustration : épenthèse de [l] en coda
2.2.2.3. Critique
2.2.3. Epenthèse et accent : Scheer (2000a)
2.2.3.1. Présentation de l'analyse
2.2.3.2. Critique
2.2.4. Bilan
Conclusion
276
276
276
279
280
280
282
282
283
283
285
286
287
288
289
290
291
293
293
295
297
299
Table des matières
PARTIE II. L'ÉPENTHÈSE CONSONANTIQUE DEVANT SUFFIXE
DÉRIVATIONNEL EN FRANÇAIS : LES FAITS
300
Introduction
301
Chapitre 4. Délimitation de l'objet d'étude
1. Français standard, populaire, ordinaire...
1.1. Français standard
1.1.1. Standard, norme et communauté linguistique
1.1.2. Standard et correctitude de la langue
1.1.3. Standard et naturalité
1.1.4. Bilan sur le français standard
1.2. Français populaire
1.3. Français ordinaire
1.4. Variations régionale et sociale
1.5. Bilan
2. Le français dans sa dimension temporelle
3. Point sur la suffixation
3.1. Mise au point terminologique
3.1.1. Mot et lexique
3.1.1.1. Mots et unités lexicales.
3.1.1.2. Que trouve-t-on dans le lexique ?
3.1.2. Racines et radicaux, thèmes et bases
3.2. Formation des unités lexicales : composition et dérivation
3.2.1. Critère paradigmatique.
3.2.2. Amalgame sémantique.
3.2.3. Critère graphique
3.2.4. Autonomie des éléments formant les composés
3.2.5. Non-autonomie des éléments formant les dérivés
3.2.6. Ordre déterminant / déterminé dans les unités lexicales construites
3.2.7. Bilan
3.3. Dérivation et flexion.
3.4. La dérivation suffixale : problème syntaxique ou morphologique ?
3.5. Aspects particuliers des suffixes
3.5.1. Position dans l'unité lexicale construite
3.5.2. Allomorphie et homonymie suffixales
3.6. Compositionalité du sens des dérivés.
3.7. Contraintes sur la formation des unités lexicales construites.
3.7.1. Règles de formation de mots
3.7.2. Ordre des morphèmes
3.7.3. Combinaison des morphèmes
3.7.4. Parasynthèse
3.8. Les "éléments intermédiaires"
302
302
302
304
305
305
306
306
307
307
309
309
311
311
312
312
315
316
318
319
320
321
322
323
324
326
326
328
330
330
332
333
334
334
335
336
336
338
Chapitre 5. Constitution de la base de données
1. Création d'un corpus à partir de sources écrites.
1.1. Ressources non exploitées
1.2. Liste informatisée de 64.296 mots du français (A)
1.2.1. Méthode et justification
1.2.2. Traitement préalable du corpus
340
342
342
344
345
345
Table des matières
1.2.3. Comparaison des unités lexicales par la gauche
1.2.4. Comparaison du "déchet" par la droite
1.2.5. Obstacles et difficultés
1.2.5.1. Alternances de radicaux
1.2.5.2. Allomorphies suffixales
1.2.5.3. Homographie de radicaux
1.2.5.4. Epenthèse commune à une famille lexicale
1.2.5.5. Epenthèse identique devant un même suffixe
1.2.5.6. Aveuglement graphique
1.2.6. Bilan
1.3. Dictionnaires d'argot (B)
1.3.1. Dictionnaire de l'argot français et de ses origines
1.3.2. Dictionnaire du français argotique et populaire
1.3.3. Récapitulatif des termes relevés dans les dictionnaires d'argot
1.4. Recherche à partir d'expressions dans le TLFi (C)
1.5. Données issues d'articles (D)
1.6. Examen systématique des termes présentant les suffixes -ier, -age et -erie
(E)
1.7. Données issues de Néologismes du français contemporain (H)
1.8. Données issues de L'insolite, Dictionnaire des mots sauvages (K)
1.9. Bilan des ressources écrites.
2. Introduction de données uniquement orales (G)
3. Bilan sur les méthodes de constitution du corpus
4. Bilan sur les terminaisons représentées dans le corpus
349
351
354
354
361
363
364
366
366
367
368
368
369
370
371
376
378
Chapitre 6. De la base de données au corpus de travail
1. Premier filtre : étymologies et consonnes sous-jacentes
1.1. Terme composé et non dérivé
1.2. Epenthèse mal placée
1.3. Etymologie
1.3.1. Héritage d'un terme latin
1.3.2. Présence de la consonne dans la base
1.3.3. Consonne uniquement graphique
1.3.4. Croisement de plusieurs étymologies
1.3.5. Consonne différente de celle de l'épenthèse
1.3.6. Bilan sur l'apport de l'étymologie sur la constitution du corpus
1.3.6.1. En fonction des critères retenus.
1.3.6.2. En fonction de la provenance des termes possiblement
porteurs d'une épenthèse
1.4. Consonne sous-jacente révélée par le féminin
1.4.1. Bases en -aud
1.4.2. Terminaison en -at
1.4.3. La famille de gueux
1.4.4. Terminaison en [u]
1.4.5. Bilan du premier filtre à ce niveau du traitement
1.5. Alternances suffixales (en début de suffixe du dérivé)
1.5.1. -iser vs. -er
1.5.2. -eter vs. -et + -er
1.5.3. -ot(t)er vs. -ot + -er
1.5.4. Suffixes argotiques
394
395
395
396
397
400
401
403
404
404
406
406
406
380
382
384
385
389
391
407
409
409
410
410
410
411
411
413
415
416
Table des matières
1.5.5. Autres variantes suffixales
1.5.6. Bilan sur les alternances suffixales
1.5.7. Récapitulatif du traitement du corpus jusqu'à présent
1.6. Alternances radicales
1.6.1. Bases incertaines
1.6.2. Suffixes présents en fin de thème
1.6.2.1. -ard : foulardage, bousarderie, musarderie, jobarder
1.6.2.2. -at : gravatier, goujaterie / crachaté / taxateur, taxatif
1.6.2.3. -aud : marauder, minauder, rustauderie, finauderie,
badaudage, badauder, badauderie, esquimaudage
1.6.2.4. -is : roulis
1.6.2.5. Récapitulatif
1.7. Trois familles lexicales particulières
1.7.1. La famille de pied
1.7.2. La famille de sorcier
1.7.3. La famille de coq
1.7.4. Bilan
1.8. Codage des termes maintenus
1.8.1. Position
1.8.2. Formation savante : noms d'habitants et de pays
1.8.2.1. Nom de pays
1.8.2.2. Noms d'habitants
1.9. Bilan au terme du premier filtre
1.9.1. Bilan des méthodes de recueil
1.9.1.1. Récapitulatif des termes rejetés, indécis et maintenus
1.9.1.2. Evaluation du succès de chaque méthode
1.9.2. Composition des 422 termes maintenus dans le corpus
1.9.2.1. En fonction de la méthode de recueil du terme dans le
corpus
1.9.2.2. Tri en fonction de la base des dérivés
1.9.2.3. Tri en fonction de la finale de la base
1.9.2.3.1. Et des bases elles-mêmes
1.9.2.3.2. Et de la consonne épenthésée
1.9.2.4. Tri en fonction de l'initiale du suffixe
1.9.2.4.1. Et du suffixe
1.9.2.4.2. Et de la consonne épenthésée
1.9.2.5. Tri en fonction de la consonne épenthésée
1.9.2.6. Tri en fonction de la catégorie lexicale
1.9.2.6.1. De la base puis de celle du dérivé
1.9.2.6.2. Du dérivé puis de celle de la base
1.9.2.7. Tri en fonction de la taille du radical
1.9.2.7.1. Puis de la base
1.9.2.7.2. Puis de la consonne épenthésée
1.9.2.8. Tri par suffixe
1.10. Conclusion de la section
2. Deuxième filtre : les écueils de la morphologie dérivationnelle française - qu'est-ce
qui est dérivé de quoi ?
2.1. Suffixes diminutifs
2.1.1. -eau
2.1.2. -(el)et(te)
418
420
420
421
421
423
424
424
425
425
425
427
427
427
428
429
429
429
430
430
430
431
431
431
432
433
433
433
433
434
436
437
438
440
441
442
442
444
446
446
448
450
451
452
453
453
453
Table des matières
2.1.3. -in
2.2. Suffixes ethniques
2.2.1. -ain(e)
2.2.2. -ais(e)
2.2.3. -ois(e)
2.2.4. -ie
2.3. Suffixes scientifiques
2.3.1. -ine
2.3.2. -ite
2.4. Suffixes purement adjectivaux
2.4.1. -al(e)
2.4.2. -(at)aire
2.4.3. -esque
2.4.4. -ième
2.4.5. -ien et -éen
2.4.6. -if (-ive)
2.4.7. -ique
2.4.8. -(at)oire
2.5. Suffixes purement nominaux
2.5.1. -age
2.5.2. -aille
2.5.3. -ée
2.5.4. -esse
2.5.5. -ille
2.5.6. -(at)ion
2.5.7. -is
2.5.8. -isme
2.5.9. -iste
2.5.10. -(it)ude
2.5.11. -(e)ment
2.5.12. -on
2.5.13. -ot(e)
2.5.14. -(i)té
2.5.15. -(at)ure
2.6. Suffixes "mixtes"
2.6.1. -ier et variantes
2.6.1.1. -andier
2.6.1.2. autres -ier
2.6.1.3. -ière
2.6.1.4. -(er)ie
2.6.1.5. -(er)aie
2.6.2. -(at)eur et -(at)eux
2.6.2.1. -(at)eur, -(at)euse, -(at)rice
2.6.2.2. -(at)eux
2.6.3. -ard, -asse
2.6.3.1. Le suffixe -ard
2.6.3.2. -ass(e)
2.6.3.3. La terminaison -ar
2.7. Suffixes verbaux
2.7.1. Suffixes en relation avec verbe en -er
453
454
455
455
456
456
457
458
458
459
459
459
461
462
462
463
465
467
468
468
473
474
474
474
475
476
477
478
478
479
481
483
484
484
486
486
486
488
497
499
503
504
504
507
510
510
512
513
515
515
Table des matières
2.7.1.1. -é(e) (participe passé)
2.7.1.2. -ant (participe présent)
2.7.1.3. -able
2.7.2. Suffixes infinitifs
2.7.2.1. -iner
2.7.2.2. -iser
2.7.2.2.1. Le suffixe -iser
2.7.2.2.2. La terminaison -iser
2.7.3. Les suffixes infinitifs
2.7.3.1. -ir
2.7.3.2. -er
2.8. Ajouts au corpus liés à ce second filtre
2.8.1. Verbes en -er
2.8.2. Dérivés en -ier
2.8.3. Dérivé en -eur
2.9. Bilan au terme du deuxième filtre
2.9.1. Répartition des 435 termes traités
2.9.1.1. Termes rejetés
2.9.1.2. Termes indécis
2.9.1.3. Termes maintenus
2.9.1.4. Termes ajoutés
2.9.1.5. Bilan quantitatif des 435 termes
2.9.2. Bilan concernant les termes jusqu'alors "indécis"
2.9.3. Représentation schématique de l'ensemble de la base de données à
ce stade
2.9.4. Evaluation des méthodes de recueil
2.9.5. Composition des 272 termes maintenus dans le corpus
2.9.5.1. Tri en fonction de la base
2.9.5.2. Tri en fonction de la finale de la base
2.9.5.3. Tri en fonction de l'initiale du suffixe
2.9.5.4. Tri en fonction de la consonne épenthésée
2.9.5.5. Tri en fonction de la catégorie lexicale
2.9.5.6. Tri en fonction de la taille du radical
2.9.5.7. Tri en fonction du suffixe
2.10. Conclusion
515
518
519
519
520
520
520
521
522
522
523
523
523
525
526
526
526
526
526
527
527
527
527
528
Chapitre 7. De l'intérêt d'un questionnaire.
1. Etapes préliminaires
1.1. Etablissement d'une liste de suffixes vitaux
1.1.1. Productivité et vitalité des suffixes
1.1.2. Sources exploitées
1.2. Questionnaire portant sur la productivité des suffixes.
2. Élaboration d'un questionnaire portant sur les conditions d'apparition des épenthèses
2.1. Conditionnements phonologiques
2.1.1. Voyelle finale du radical
2.1.2. Voyelle initiale du suffixe
2.1.3. Taille de la base
2.2. Conditionnements morphologiques
2.2.1. Catégorie lexicale de la base
2.2.2. Catégorie de suffixe
543
543
544
544
545
546
549
550
550
553
553
555
555
556
529
530
531
531
534
537
539
540
541
542
Table des matières
2.2.3. Suffixes
2.3. Détails pratiques
2.3.1. Elaboration des questions en fonction des critères phonologiques
et morphologiques
2.3.2. Mode de questionnement
2.3.3. Répartition de l'échantillon de locuteurs.
3. Résultats du questionnaire
3.1. Etiquetage des résultats.
3.2. Résultats par locuteur
3.3. Résultats en fonction de la voyelle finale du radical
3.3.1. Concaténation simple
3.3.2. Epenthèse
3.3.3. Autres
3.3.4. Bilan
3.4. Résultats en fonction de la voyelle initiale du suffixe
3.4.1. Concaténation simple
3.4.2. Epenthèse
3.4.3. Autres
3.4.4. Bilan
3.5. Résultats en fonction de la taille du radical
3.5.1. Concaténation simple
3.5.2. Epenthèse
3.5.3. Autres
3.5.4. Bilan
3.6. Résultats en fonction de la catégorie lexicale de la base
3.6.1. Concaténation simple
3.6.2. Epenthèse
3.6.3. Autres
3.6.4. Bilan
3.7. Résultats en fonction de la catégorie du suffixe
3.7.1. Concaténation simple
3.7.2. Epenthèse
3.7.3. Autres
3.7.4. Bilan
3.8. Résultats en fonction du suffixe
4. Bilan général du questionnaire
556
557
557
558
560
560
561
563
567
568
570
572
573
574
574
575
578
579
580
580
581
582
583
583
583
584
585
585
586
586
588
588
589
590
593
Conclusion
594
Table des matières
PARTIE III. EPENTHÈSE CONSONANTIQUE EN FRANÇAIS :
DISTRIBUTION D'UNE UNITÉ [CV] PAR LA SYNTAXE, LA SÉMANTIQUE
ET LA MORPHOLOGIE, ET SES CONSÉQUENCES PHONOLOGIQUES
595
Introduction
596
Chapitre 8. Cadre théorique
1. Phonologie de Gouvernement et cadre CVCV
2. Position forte et Coda-Miroir (Scheer & Ségéral 2001)
2.1. Etablissement de la position forte
2.2. Début de mot = [CV] (Lowenstamm 1999)
2.3. Unicité des contextes de position forte
2.4. Gouvernement et licenciement : définition unitaire
599
599
603
604
606
609
610
Chapitre 9. [CV] sémantique : les conséquences phonologiques de l'emphase
1. Préliminaires
1.1. Représentation de l'accent dans le cadre CVCV
1.1.1. Allongement compensatoire en italien
1.1.2. Aspiration des occlusives en anglais
1.1.3. Bilan
1.2. manifestations de l'accent en français
1.2.1. Accent tonique
1.2.2. Accent d'insistance
2. Emphase et géminées
2.1. Géminées consonantiques
2.2. Géminées vocaliques : formidaaable !
2.3. Bilan
3. Emphase et épenthèse
3.1. Devant voyelle : épenthèse de [!]
3.1.1. A l'initiale de mot : c'est [!] incroyable
3.1.2. En hiatus interne
3.1.2.1. A proximité d'une frontière morphologique : co[!]opérer
3.1.2.2. A l'intérieur d'un morphème : caca[!]o
3.1.3. Bilan
3.2. Devant coup de glotte : épenthèse de [!]
3.2.1. Représentations des mots à initiale en "h aspiré"
3.2.1.1. Encrevé (1988a)
3.2.1.2. Phonologie de Gouvernement
3.2.1.3. Coup de glotte lexical
3.2.1.4. Coup de glotte lexical et position forte
3.2.2. Emphase et mots à "h aspiré"
3.2.3. Statut particulier du coup de glotte
3.2.3.1. Coup de glotte et emphase
3.2.3.2. Coup de glotte et gémination
3.2.3.3. Définition d'un domaine phonologique
3.2.3.4. Coup de glotte et domaine phonologique
3.2.3.5. Bilan
3.3. Application
3.3.1. Verbe à finale en "attaque branchante" : vivre où ?
614
614
615
615
618
619
619
620
620
622
622
625
627
628
628
628
630
631
631
632
634
635
635
637
638
639
640
641
641
641
642
643
646
646
647
Table des matières
648
649
650
651
652
3.3.1.1. Avec enchaînement : [vivru], [vivruu]
3.3.1.2. Sans enchaînement
3.3.1.2.1. Vα gouverne Cα : [vivr&u]
3.3.1.2.2. Vα ne gouverne pas Cα : [viv!u]
3.3.1.2.3. Réalisations emphatiques : [vivr&!u], [viv!u],
[viv|!u]
3.3.2. Verbe à finale "coda-attaque" : porte où ?
3.3.2.1. Avec enchaînement : [p(rtu], [p(rtuu]
3.3.2.2. Sans enchaînement : [p(rt&u] vs.[p(rt&!u]
3.3.3. Verbe à finale vocalique : manger où ?
3.3.3.1. Sans enchaînement
3.3.3.1.1. Sans emphase : [m+,-eu]
3.3.3.1.2. Avec emphase : [m+,-euu], [m+,-e!u]
3.3.4. Verbe à finale consonantique simple : partir où ?
3.3.4.1. Avec enchaînement : [partiru], [partiruu]
3.3.4.2. Sans enchaînement : [partir!u]
3.3.5. Bilan de l'étude des séquences [verbe + où]
3.4. Bilan de l'épenthèse en relation avec l'emphase
4. Bilan sur le [CV] sémantique
655
655
656
657
658
658
659
660
660
661
662
663
664
Chapitre 10. [CV] syntaxique : les conséquences phonologiques de l'enclise
1. Mise en place de la problématique
1.1. Inversion du sujet
1.2. Impératif
2. Analyse
2.1. La consonne de liaison appartient au verbe
2.1.1. La consonne relève de la flexion
2.1.1.1. Liaison hors inversion
2.1.1.2. Morphèmes personnels
2.1.1.3. Deux catégories de verbes
2.1.1.4. Bilan
2.1.2. La consonne est flottante en fin de radical
2.1.3. Séparabilité du verbe et de la consonne de liaison
2.1.4. Bilan
2.2. La consonne de liaison est attachée au clitique
2.2.1. Démonstration
2.2.1.1. Position de la consonne
2.2.1.2. Français régional
2.2.1.3. Contexte mélodique
2.2.1.4. Constance de la nature de la consonne
2.2.1.5. Présence obligatoire de la consonne
2.2.1.6. Formalisation
2.2.2. Réfutation
2.2.2.1. Liaison hors enchaînement
2.2.2.2. Inventaire des éléments précédés d'une consonne à l'inversion
2.2.2.3. Pas de [t] à l'initiale
2.2.3. Bilan
2.3. La consonne de liaison est épenthétique
669
669
670
672
673
673
674
674
677
679
680
681
682
683
684
684
684
685
686
686
686
686
687
687
687
688
689
690
Table des matières
2.4. Proposition : morphème piloté par la syntaxe et marqueur d'accord
2.4.1. Morphème d'inversion
2.4.2. Morphème de placement de clitique
2.4.3. Marqueur d'accord
2.4.3.1. Proposition
2.4.3.2. Retour sur la liaison
2.4.3.3. Typologie des consonnes "de liaison"
2.4.4. Représentation
2.4.4.1. Finale en consonne flottante
2.4.4.2. Donne-moi [z] en terrasse le [CV] d'inversion
2.4.4.3. Finale vocalique
2.4.4.4. Finale consonantique complexe fixe
2.4.4.4.1. "Attaque branchante" : [TR]
2.4.4.4.2. "Coda-attaque" et "bogus clusters" : [RT] vs.
[TT]
2.4.4.4.3. Trois types de groupes consonantiques en
CVCV
2.4.4.5. Finale consonantique simple fixe
2.4.4.6. Personnes du pluriel
2.4.5. Inversion du sujet et première personne
2.4.6. Liaison vs. inversion : l'aspiration consonantique en français
canadien
2.4.7. Enclise et proclise
3. Bilan sur le [CV] syntaxique
Chapitre 11. [CV] morphologique : les conséquences phonologiques de la
dérivation
1. Interaction morphologie / phonologie
1.1. Rôle de la morphologie en phonologie
1.2. Traduction de la morphologie en phonologie
2. Formation des adverbes en -ment en français (Pagliano 1999a)
2.1. Données
2.2. Analyse comparative
2.2.1. Morphème suffixal
2.2.2. Adverbes en -(&)ment
2.2.2.1. Base à finale consonantique simple latente : bassement
2.2.2.2. Base à finale consonantique latente derrière consonne fixe :
sourdement
2.2.2.3. Base à finale consonantique simple fixe : lucidement
2.2.2.4. Base à finale consonantique complexe fixe : âprement
2.2.3. Adverbes en -ément : commodément
2.2.4. Adverbes en -ment : joliment
2.2.5. [CV] et gémination
2.2.6. Adverbes en -[a]ment : méchamment
2.2.7. Bilan
2.3. Les géminées en français
2.3.1. "Vraies" géminées
2.3.2. "Fausses" géminées
2.3.3. Retour à l'emphase
2.3.4. Géminées virtuelles
691
691
692
694
695
697
697
700
701
702
705
705
705
708
715
717
718
718
721
723
725
728
729
730
730
731
732
733
733
734
734
735
736
737
738
739
740
741
742
744
744
746
748
752
Table des matières
2.3.4.1. Manifestations en colonais et en somali (Ségéral &
Scheer 1999, 2001b)
2.3.4.1.1. Allemand colonais
2.3.4.1.2. Somali
2.3.4.2. En français
2.3.4.2.1. Collègue
2.3.4.2.2. Illisible
2.3.4.2.3. Méchamment
2.3.5. Gémination et position forte
2.4. Bilan
3. Classes de suffixes
3.1. Classes de suffixes et Phonologie Lexicale
3.2. Classes de suffixes et modèle représentationnel
3.3. Classes de suffixes en français
4. Dérivés suffixaux et épenthèses consonantiques
4.1. Avant voyelle
4.1.1. En hiatus
4.1.2. Après consonne
4.2. Avant consonne
4.2.1. Suffixes -ier, -ième, -ien, -ois
4.2.1.1. Glide en attaque vs. glide en noyau
4.2.1.2. Le suffixe -ier
4.2.1.3. Le suffixe -ien
4.2.1.4. Le suffixe -ième
4.2.1.5. Le suffixe -ois
4.2.1.6. Bilan
4.2.2. Suffixes -elet, -ement, -eraie, -erie, -eté
4.2.2.1. Suffixes à initiale consonantique ?
4.2.2.2. Frontière morphologique [CVCV] ?
4.2.2.3. Schwa en initiale de suffixe ?
4.2.2.4. Réalisation du schwa lexical
5. Bilan sur le [CV] morphologique
753
753
755
757
758
758
760
763
766
767
768
770
772
779
779
779
780
784
785
785
786
790
792
793
794
794
795
796
797
801
803
Chapitre 12. Prolongements de l'analyse : la position forte
1. Emphase, intensif et gémination
2. Nature de l'épenthèse en français
3. Position forte et épenthèse consonantique en français : réciprocité ?
3.1. Syntaxe et sémantique vs. morphologie
3.2. Initiale de mot et épenthèse consonantique
3.3. De l'initiale de mot en français
Conclusion de la partie III
804
804
808
812
812
814
815
819
Conclusion générale
822
Index général
825
Références
827
Table des matières
ANNEXES
859
Annexe 1 : Liste des termes après le premier filtre
Annexe 1a - Mots retenus après le premier filtre - tri par origine puis base puis
consonne épenthésée
Annexe 1b - Mots retenus après le premier filtre - tri par base puis consonne
épenthésée
Annexe 1c - Mots retenus après le premier filtre - tri par finale base puis base
Annexe 1d - Mots retenus après le premier filtre - tri par finale base puis consonne
épenthésée puis suffixe
Annexe 1e - Mots retenus après le premier filtre - tri par initiale suffixe, suffixe puis
consonne épenthésée
Annexe 1f - Mots retenus après le premier filtre - tri par initiale suffixe, suffixe puis
consonne épenthésée
Annexe 1g - Mots retenus après le premier filtre - tri par consonne épenthésée puis
suffixe
Annexe 1h - Mots retenus après le premier filtre - tri par catégorie de la base puis
catégorie du dérivé
Annexe 1i - Mots retenus après le premier filtre - tri par catégorie du dérivé puis
catégorie de la base
Annexe 1j - Mots retenus après le premier filtre - tri par gabarit radical puis base
Annexe 1k - Mots retenus après le premier filtre - tri par gabarit radical puis consonne
épenthésée
Annexe 1l - Mots retenus après le premier filtre - tri par suffixe puis consonne
épenthésée
Annexe 1m - Mots retenus après le premier filtre - tri par suffixe puis consonne
épenthésée
Annexe 1n - Liste des préfixes du français du TLFi
Annexe 1p - Liste des argots spécifiques (Colin, Mével & Leclère 2001)
860
861
Annexe 2 : Liste des termes après le deuxième filtre
Annexe 2a - Récapitulatif du traitement des 435 dérivés traités au second filtre
Annexe 2b - Tri des mots retenus après le 2ème filtre - ordre alphabétique
Annexe 2c - Mots retenus après le deuxième filtre - tri par base puis consonne
épenthésée
Annexe 2d - Mots retenus après le deuxième filtre - tri par finale base, consonne
épenthésée, suffixe, base
Annexe 2e - Mots retenus après le deuxième filtre - tri par initiale suffixe, suffixe puis
consonne épenthésée
Annexe 2f - Mots retenus après le deuxième filtre - tri par consonne épenthésée puis
base puis suffixe
Annexe 2g - Mots retenus après le deuxième filtre - tri par consonne épenthésée puis
suffixe
Annexe 2h - Mots bleus après le deuxième filtre - tri par catégorie de la base puis
catégorie du dérivé
Annexe 2i - Mots bleus après le deuxième filtre - tri par taille du radical puis suffixe
Annexe 2j - Mots retenus après le deuxième filtre - tri par suffixe puis consonne
épenthésée
Annexe 2k - Tri mots retenus après le deuxième filtre - par contexte syllabique
919
920
926
927
868
874
882
887
891
894
897
900
903
908
910
912
915
918
932
937
939
944
946
948
950
955
Table des matières
Annexe 3 : Récapitulatif du traitement des 859 termes
Annexe 3a - Classement des 859 termes selon leur origine d'extraction
Annexe 3b - Classement des 859 termes selon leur terminaison
Annexe 3c - Corpus détaillé
Annexe 3d - Nature de la consonne épenthésée à la frontière suffixale
957
958
961
967
1101
Annexe 4 : Questionnaire
Annexe 4Aa - Suffixes vitaux
Annexe 4Ab - Ebauche de questionnaire visant à tester la vitalité des suffixes
Annexe 4Ba - Type de finales du radical et gabarit du radical
Annexe 4Bb - Nature de la base et nature du suffixe
Annexe 4Bc - Questionnaire visant à tester la production d'épenthèses entre radical et
suffixe
Annexe 4C - F14 (Nice-Nice)
Annexe 4C - F21 (Var-Nice)
Annexe 4C - F23 (Guillaume 06 - Nice)
Annexe 4C - F25 (Lyon - Nice - Paris)
Annexe 4C - F31 (Seine-et-Marne - Var - Nice)
Annexe 4C - F47 (Tunisie - Nice)
Annexe 4C - F52 (Nice - Nice)
Annexe 4C - F53 (Nice - Normandie)
Annexe 4C - H18 (Nice - Nice)
Annexe 4C - H24 (Nice - Nice)
Annexe 4C - H50 (Bourgogne - Nice)
Annexe 4C - H55 (Paris - Nice)
Annexe 4Da - Résultats en fonction de la voyelle finale du radical
Annexe 4Db - Résultats en fonction de la voyelle initiale du suffixe
Annexe 4Dc - Résultats en fonction de la taille du radical
Annexe 4Dd - Résultats en fonction de la catégorie lexicale de la base
Annexe 4De - Résultats en fonction de la catégorie du suffixe
Annexe 4Df - Résultats en fonction du suffixe
1108
1109
1111
1113
1118
1124
1134
1139
1144
1149
1154
1159
1164
1169
1174
1179
1184
1189
1194
1196
1198
1200
1202
1204
Introduction générale
Introduction générale
Le sous-titre de cette thèse se veut représentatif des trois contextes d'épenthèse
consonantique en français : parles-en [parlz] illustre l'épenthèse avant un pronom clitique, à
l'impératif et à l'inversion du sujet. Numérotation [nymerotasjç] représente les épenthèses
entre radical et suffixe. Enfin, l'occlusive glottale à l'initiale de l'adjectif impossible [posibl]
marque le troisième cas d'épenthèse, à l'emphase.
Cette thèse poursuit deux objectifs, l'un d'ordre empirique et l'autre théorique. Elle
offre un corpus original de données présentant une épenthèse consonantique à la frontière
dérivationnelle suffixale en français. Elle propose également une analyse portant sur une
modélisation de l'intervention des niveaux supérieurs de la grammaire en phonologie, par la
création d'une position forte. Ces deux pôles trouvent leur origine dans une source commune :
l'étude de l'épenthèse consonantique en français.
La contribution empirique de cette thèse est assurée par la constitution de données
dont le recensement systématique n'avait jusqu'à présent pas été entrepris. Le corpus fini
rassemble 272 dérivés français, correspondant à 206 bases différentes, qui comportent une
consonne entre le radical et le suffixe.
C'est un processus de filtrage méthodique et rigoureux qui a permis de déterminer le
caractère épenthétique de la consonne. Ont ainsi été rejetés près de 70 % des 859 termes de la
base de données préalablement constituée à partir de sources aussi diverses que les recueils de
néologismes ou les dictionnaires électroniques, au moyen de méthodes d'extraction manuelles
ou semi-automatisées. Les consonnes dont une analyse étymologique a établi l'existence
diachronique ont été éliminées du corpus, ainsi que celles qui peuvent être créditées d'une
existence lexicale et celles pour lesquelles l'étude suffixale a établi un doute quant à leur
nature ex nihilo.
Je prends en effet le parti de considérer dans l'établissement de ce corpus, comme dans
l'étude en elle-même, les seules consonnes non-étymologiques, non sous-jacentes et qui ne
sont pas prédictibles par le contexte : les consonnes ex nihilo.
1
Introduction générale
L'hypothèse soutenue est que l'épenthèse consonantique ne dépend aucunement du
niveau mélodique en français, mais du niveau syllabique. Je démontrerai ainsi que l'hiatus ne
constitue pas en lui-même le contexte déclencheur de l'épenthèse consonantique, mais que
celle-ci est conditionnée par l'existence dans la séquence d'une position consonantique forte, à
laquelle n'est associé aucun segment lexical.
Je soutiens que c'est la présence d'une unité [CV] correspondant à la frontière
dérivationnelle suffixale qui est responsable de cette position forte. Cette unité [CV] est la
traduction, en phonologie, de la frontière morphologique, c'est-à-dire de cet objet jusqu'alors
opaque et le plus souvent transcrit par #, + et d'autres diacritiques. Proposer une
implémentation phonologique d'un objet morphologique s'inscrit dans un projet plus large,
initié par Lowenstamm (1999) en ce qui concerne le début de mot, et qui consiste à identifier
la nature des objets non proprement phonologiques mais qui jouent pourtant un rôle en
phonologie. Il incombe en effet au phonologue d'exprimer la réalité de ces objets autrement
que par une représentation diacritique. Leur modélisation en termes phonologiques permet
d'expliquer leurs effets dans la structure au lieu de simplement en faire état.
Je propose pour ma part l'interprétation d'un second type de frontière morphologique,
autre que le début de mot : celle de la frontière dérivationnelle, ou plus exactement d'une
frontière dérivationnelle suffixale du français, dont on observe la manifestation à travers
l'épenthèse consonantique. Ainsi un dérivé comme numéroter, formé à partir de la base
numéro et du suffixe -er, présente-t-il une épenthèse consonantique de l'occlusive coronale [t]
qui est selon la théorie que je présente la résultante de cette frontière morphologique
particulière. Comme en anglais, il existe donc deux classes de suffixes en français : les
suffixes qui ont cette frontière morphologique, et ceux qui ne l'ont pas.
J'étends de plus la démarche à la syntaxe et à la sémantique. La frontière
dérivationnelle suffixale ne constitue en effet qu'un des trois contextes d'épenthèse
consonantique du français sur lesquels se penche cette thèse. Seront également considérées les
épenthèses consonantiques liées à l'emphase, que l'on observe par exemple dans la réalisation
[s(t)posibl] de la séquence c'est impossible, dans laquelle l'emphase porte sur la première
syllabe, à initiale vocalique, de l'adjectif. Il s'agit là d'un facteur sémantique, voire stylistique,
puisque c'est l'emphase qui est le déclencheur de l'épenthèse : la réalisation de la séquence
hors emphase ne comporte pas l'occlusive glottale ([s(t)posibl]). Le troisième cas étudié
concerne les épenthèses en relation avec le placement du pronom clitique dans la phrase,
c'est-à-dire causées par la syntaxe : dans parles-en, le [z] est épenthétique.
2
Introduction générale
Toutes ces épenthèses sont obligatoires : on ne peut réaliser numéroter sans [t]
(*[nymeroe]), non plus que c'est impossible, lorsque l'emphase porte sur la première syllabe,
sans [] ou parles-en sans [z] (*[parlz]). En outre, la consonne épenthétique, dans ces cas,
est toujours la même dans un contexte donné. Ceci établit une différence marquée avec le
phénomène de liaison qui met en jeu une consonne flottante variable.
Je référerai à ces trois cas d'épenthèse en fonction du niveau qui les conditionne ; je
parlerai ainsi d'épenthèse morphologique pour numéroter, syntaxique pour parles-en et
sémantique pour c'est impossible. Je montrerai que pour chacune de ces situations, l'existence
d'une unité [CV], en provenance des trois niveaux supérieurs, explique l'apparition de
l'épenthèse consonantique. Cette unité [CV] est également la cause, dans certains cas, de la
gémination d'une consonne lexicalement présente : c'est épouvantable [s(t)eppuvtabl]. Je
parlerai ainsi des [CV] morphologique, syntaxique et sémantique, respectivement.
Cette extension de la démarche qui consiste à déterminer l'identité phonologique
d'objets issus d'autres composants de la grammaire n'est novatrice qu'en ce qui concerne les
langues indo-européennes. C'est chose acquise dans la tradition sémitique : ce qui est connu
comme gabarit n'est rien d'autre, en réalité, que la représentation graphique d'effets
phonologiques induits par des ordres morphologiques et sémantiques.
La première partie de la thèse sera consacrée à une présentation générale du
phénomène de l'épenthèse consonantique tel qu'il apparaît dans la littérature. Y est également
inclus un chapitre concernant les consonnes coronales, qui sont celles que l'on observe à
l'épenthèse entre radical et suffixe en français, et à leur statut particulier reconnu à la fois
empiriquement et au sein des théories phonologiques. Un troisième volet examinera la
représentation de l'épenthèse consonantique dans les théories selon deux axes : ses rapports
avec le phénomène des alternances consonne ~ zéro en français, et les analyses portant sur
l'épenthèse à proprement parler.
La deuxième partie s'articule autour de l'élaboration du corpus qui constitue la
contribution empirique de cette thèse : l'épenthèse consonantique à la frontière dérivationnelle
suffixale. Outre l'élaboration du corpus lui-même, du recueil brut d'unités lexicales dérivées à
la sélection finale des termes présentant effectivement une épenthèse consonantique ex nihilo,
elle propose un questionnaire qui enquête sur les conditions d'apparition de l'épenthèse dans
des néologismes.
3
Introduction générale
C'est dans la troisième partie que sera présentée l'analyse qui met en exergue
l'implémentation en phonologie d'une séquence [CV] envoyée par les niveaux supérieurs de la
grammaire, [CV] dont la présence crée une position forte responsable de l'apparition des
consonnes épenthétiques du français. J'aborderai également dans cette partie la représentation
des mots à h aspiré et les liaisons post-verbales, qui se révèleront être de pures "fictions
orthographiques".
La proposition centrale de cette thèse est la suivante : il n'y a pas d'épenthèse en
dehors de la position forte en français. Autrement dit, toutes les épenthèses consonantiques en
français sont le résultat d'une position forte. La réciproque est vraisemblablement juste : une
position forte non pourvue de mélodie constitue une condition nécessaire et suffisante à
l'apparition d'une épenthèse consonantique ; j'aborderai le cas du début de mot dans la thèse.
La position forte est symbolisée par le schéma ci-dessous. J'expliquerai la
représentation dans la thèse, mais il est essentiel de retenir dès à présent que la position forte
est la consonne C0 parce qu'elle s'inscrit dans la structure en fonction des relations suivantes :
origine syntaxique,
morphologique, sémantique
position forte
Gouv
[C
V]
V
C0
|
V
Lic
épenthèse
4
Partie I.
L’épenthèse consonantique
dans les langues en général
5
Partie I – L'épenthèse consonantique dans les langues en général
Introduction
Cette première partie a pour ambition de brosser le portrait général de l'épenthèse
consonantique, tant du point de vue de son étendue empirique que de la façon dont les
théories ont pu la traiter.
Le premier chapitre sera consacré à la revue des divers cas d'épenthèse dans les
langues du monde en général et en français en particulier, en mettant l'accent sur le type de
segment inséré et sur les motivations possibles à cet apport mélodique.
A l'issue de ce chapitre, un premier bilan quant à la qualité de la consonne
épenthétique conduira à s'intéresser plus précisément aux coronales, du point de vue de leur
statut particulier comme de leur représentation phonologique, ce qui constituera l'objet du
second chapitre de cette première partie.
Le dernier chapitre proposera un examen des analyses linguistiques proposées pour
rendre compte du phénomène de l'épenthèse consonantique, depuis les cadres linéaires jusqu'à
la Théorie de l'Optimalité, tant en lui-même qu'au sein du cadre plus large des alternances
consonne ~ zéro.
6
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Chapitre 1.
Distribution géographique, variation qualitative,
contextes d'apparition et causalités
Qu’entend-on précisément par "épenthèse" ? S'agit-il de l'épenthèse d'un élément, ou
nécessairement d'un phonème complet ? Comment les épenthèses sont-elles analysées dans
les théories actuelles ? Occupent-elles une position particulière à l'intérieur du mot ? Peut-on
parler de voyelles et de consonnes typiquement épenthétiques ? Trouve-t-on fréquemment des
épenthèses dans les langues du monde ?
Ce premier chapitre a pour vocation de répondre à ces questions afin d'établir un
tableau général de l'épenthèse consonantique - occurrences dans les langues du monde, types
de consonnes concernés, traitement par les théories.
Dans une première partie, j'exposerai différents points de vue quant à l'objet
"épenthèse" et établirai précisément le type d'épenthèses constituant l'objet d'étude de cette
thèse. Une deuxième partie sera consacrée à l'exposé des épenthèses consonantiques dans les
langues du monde, en orientant celui-ci sur la nature de la consonne épenthésée ainsi que sur
une intervention possible de la morphologie, et à une recherche des contextes d'apparition
généraux. Dans une troisième partie je passerai en revue les différentes représentations que
reçoivent les coronales dans diverses théories linguistiques génératives de la fin des années
soixante jusqu'aux théories actuelles.
1. Définition
Les articles ou ouvrages mentionnant l'épenthèse tiennent généralement pour acquise
la définition même de ce qu'est une épenthèse. Trouver un éclaircissement sur ce qu'on entend
précisément par ce terme nécessite une plongée dans les dictionnaires, sinon spécialisés, du
moins suffisamment étendus.
7
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
1.1. Epenthèse, étymologie et sous-jacence
L'épenthèse est définie par Dubois et al. (1994) comme un "phénomène qui consiste à
intercaler dans un mot ou un groupe de mots un phonème non étymologique pour des raisons
d'euphonie, de commodité articulatoire, par analogie, etc." Pour le TLF, c'est un "phénomène
consistant dans l'apparition, à l'intérieur d'un mot ou groupe de mots, d'un phonème adventice
d'origine ou de nature non étymologique qui contribue à en faciliter l'articulation." Mounin
(1974 [2000]) la qualifie de "métaplasme qui consiste en l'apparition, à l'intérieur d'un mot,
d'un phonème non étymologique. On l'explique généralement comme un adoucissement
d'articulations inhabituelles." Dans le glossaire de son ouvrage sur La construction des mots
en français, Apothéloz (2002 : 154) la définit comme l'"ajout d'un ou de plusieurs phonèmes
non étymologiques dans un mot", prenant pour exemple une prononciation de lorsque en
[ls´k´].
Toutes ces définitions mettent en exergue le caractère non étymologique de
l'épenthèse : est épenthétique un élément dont on ne trouve pas trace en diachronie. J'ajouterai
à cette définition le caractère non sous-jacent de l'épenthèse : un élément qui apparaît à la
liaison ou au féminin en français ne peut pas être considéré comme épenthétique (cf. section
II [6] 1). Il n'est cependant pas toujours simple de décider du caractère sous-jacent ou
épenthétique d'un segment ; l'alternance consonne ~ zéro a été abordée par de nombreux
linguistes, parmi lesquels Tranel (1981 : 160-162), Schane (1968), Selkirk (1972), Dell
(1973), Hyman (1985), Prunet (1986, 1987), pour qui elle résulte de la présence d'une
consonne latente sous-jacente en fin de radical ou d'une consonne qui se réalise uniquement
dans certains contextes morphologiques1. Ceci me permet d'obtenir cette première définition
de l'épenthèse :
(1)
Première définition de l'épenthèse
Un segment épenthétique est un élément non étymologique et non sous-jacent.
L'étape suivante dans cette mise au point de ce qui est entendu par épenthèse va
consister à cerner ce que le terme "élément" recouvre dans cette définition.
1
Cf. section I [3] 1 pour un exposé des analyses de l'alternance consonne ~ zéro.
8
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
1.2. Eléments épenthésables
Il s'agit maintenant de préciser ce qu'on entend par "élément". S'agit-il nécessairement
d'un phonème, ou le terme englobe-t-il également des unités plus petites ? Les définitions
répertoriées plus haut semblent indiquer que l'épenthèse concerne nécessairement un phonème
entier et n'est pas envisageable pour un élément seul. Cependant, aucun argument ne vient
appuyer cette restriction, ni dans ces ouvrages généraux ni dans les articles plus pointus sur le
sujet. Rien n'empêche apparemment de considérer que peuvent être épenthésés un accent (cf.
Popescu 2000), un ton, un segment qui ne soit pas un phonème, ou un élément plus petit tel
qu'un trait distinctif, une position dans le squelette, une ligne d'association.
1.3. Epenthèses et environnement phonologique
En ce qui concerne les épenthèses, il convient de distinguer deux groupes :
- les épenthèses dont la mélodie est un avatar de leur environnement.
- les épenthèses ex nihilo, c'est-à-dire dont la mélodie est sans rapport avec leur
environnement.
1.3.1. Les épenthèses "avatar"
Dans notre première approche de la notion d'épenthèse, nous avons exclu les éléments
sous-jacents d'une représentation de la classe des épenthèses. Certains sons cependant, sans
être présents dans le matériel lexical, émanent de ce matériel en ce sens qu'ils sont des copies
de tout ou partie des traits d'un phonème appartenant au même morphème ou à un morphème
voisin.
Les glides issus de voyelles entrent dans cette catégorie d'épenthèses puisque la qualité
de leur mélodie est intimement liée aux segments les environnant. Si l'on prend par exemple
le verbe français formé à partir du substantif pli et du suffixe verbal -er, la forme attendue
*[plie] est écartée au profit de [plije], comprenant un glide directement issu de la voyelle
antérieure haute précédente. De même, /tru/ + /e/ est réalisé [tuwe] et /my/ + /e/ [mye]
(voire [me] selon les variétés de français, les locuteurs ou les moments ; selon Klein (p.74),
l'observation attentive de la prononcation de mots de cette espèce par des informateurs
francophones ne laisse aucun doute sur la présence d'une semi-voyelle de transition entre les
deux voyelles", même si elle est moins perceptible sur le plan acoustique. Cette catégorisation
9
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
indique plutôt que s'il y a "épenthèse" de glide, elle sera conditionnée par une voyelle fermée
ou mi-fermée dans son contexte immédiat. Pour reprendre de Lacy (2002a : 188) :
"Epenthetic segments can be divided into two types for PoA [place of articulation]. One is
where the PoA is copied from a nearby segment. This is the case in glide epenthesis, for
example, where the glide is palatal [j] if an adjacent vowel is front, but labial [w] if the vowel
is back."
Kitto & De Lacy (1999) relèvent en ce qui concerne les voyelles les cas suivants,
parmi lesquels les copies de voyelles peuvent aussi bien être de vraies voyelles que les glides
correspondants :
(2)
le southern tati, langue indo-européenne de la branche indo-iranienne
parlée en Azerbaïdjan et en Iran (Yar-Shalter 1969)
le farœse, langue indo-européenne de la branche germanique du nord
parlée au Danemark (Anderson 1972)
copies de voyelles
le malais
adjacentes
le bardi ou baadi, langue australienne nyulnyuliane
le winnebago, langue amérindienne siouan de la vallée du Mississipi
(Miner 1992)
l'awtuw, langue papoue de Nouvelle-Guinée (Feldman 1986)
le dakota, langue amérindienne siouan de la vallée du Mississipi
copies partielles de (Shaw 1980)
voyelles adjacentes le pomo du sud-est, langue amérindienne hokane parlée en Californie,
sur les côtes est du lac Clear Lake (Moshinsky 1974)
Le cas relevé par Rubin (2000 : 114) en français du Midi s'apparente également à ce
type d'épenthèse. Il s'agit de l'épenthèse de [] après une voyelle nasale, de /boN/2 réalisé
[bç] par exemple : le mode d'articulation est copié du segment précédent.
Dans le paragraphe précédent (section 1.2), il a été établi que n'importe quel type
d'élément, quelle que soit sa taille, pouvait être considéré comme épenthétique à partir du
moment où il n'était ni étymologique ni sous-jacent. Dans le cadre d'épenthèses du type traité
ici, la frontière entre assimilation et épenthèse devient floue : un trait distinctif qui n'est ni
2
Je n'entrerai pas ici dans le débat de la lexicalité de la voyelle nasale, qui n'a aucune incidence sur le
phénomène traité dans cette étude. La représentation proposée correspond à la thèse défendue par Sauzet (1998)
qui considère que "les voyelles nasales du français sont systématiquement dérivées de séquences où une voyelle
est suivie de consonne nasale". Cf. également Prunet (1986), Tranel (1986). Une représentation où la voyelle
nasale serait lexicale accréditerait la thèse d'une épenthèse, mais celle-ci serait de toute façon étroitement
dépendante du contexte phonologique immédiat.
10
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
étymologiquement attesté dans une position donnée, ni sous-jacent, mais qui est donné à la
position par le contexte, participe-t-il d'un phénomène d'assimilation ou d'épenthèse ? Je
reviendrai sur ce point dans le paragraphe suivant.
La deuxième catégorie d'épenthèses distinguée ici, après celle des épenthèses liées à
leur environnement phonologique, est constituée par les épenthèses que je qualifierai d'ex
nihilo.
1.3.2. Les épenthèses ex nihilo
Il s'agit des épenthèses dont la mélodie ne peut pas être prédite à partir de
l'environnement, "where the PoA is not influenced by surrounding segments - 'default'
epenthesis" (De Lacy 2002a : 188-189). Dans ce cas, c'est généralement la consonne par
défaut dans la langue considérée qui va être épenthésée dans le cas des épenthèses
consonantiques (cf. section 2).
Le problème de la confusion entre épenthèse et assimilation, quelle que soit la taille du
segment incriminé, ne se pose plus ici : un trait distinctif non étymologique et non sous-jacent
qui apparaît dans une position donnée sans que l'on puisse l'imputer au contexte phonologique
ne pourra en aucune manière être considéré comme relevant d'un phénomène d'assimilation.
Cette bipartition des épenthèses n'est pas toujours aussi compartimentée dans les
langues du monde : au sein d'une même langue, dans un contexte similaire, sera choisi tantôt
le premier type d'épenthèses, tantôt le second. "Epenthetic quality is not simply a parametric
choice between copying and default segmentism. In a number of languages, epenthetic vowels
copy only some features while markedness constraints dictate the quality of others." (Rehg &
Sohl 1981 : 55). De Lacy (2002a : 191) partage cet avis : "there are also some languages that
assign epenthetic consonants their PoA through assimilation in some environments, and a
default PoA in others. For example, a number of languages epenthesize glides next to high
vowels, but [] elsewhere: Dutch (Booij 1995:191), Tamil (Wiltshire 1988), Kalinya
(Rosenthall 1994:180), Malay (Cohn 1989, Cohn & McCarthy 1994)."
11
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Je m'intéresserai dans cette étude uniquement aux épenthèses ex nihilo entre radical et
suffixe. La définition finale de l'épenthèse retenue ici sera donc la suivante :
(3)
Définition de l'épenthèse
Un segment épenthétique est un élément (phonème, trait, ton, accent, ligne
d'association, etc.) non étymologique, non sous-jacent et non prédictible par le
contexte.
Ayant établi ce qui sera entendu par épenthèse dans cette thèse, je vais établir dans la
section suivante un tableau de l'ensemble des épenthèses consonantiques relevées dans les
langues du monde correspondant à l'acception retenue ici.
2. Substance des épenthèses consonantiques dans les langues du monde
Cette section va s'organiser en deux parties : dans un premier temps j'orienterai mon
exposé en fonction de la nature de la consonne épenthésée, puis j'aborderai le sujet sous
l'angle des motivations à l'apparition d'une épenthèse.
2.1. Nature de la consonne épenthésée
Un premier point à éclaircir en ce qui concerne les épenthèses consonantiques dans les
langues du monde est la nature phonétique des sons épenthésés. Toutes les consonnes sontelles susceptibles d'être épenthésées ? Toutes les consonnes épenthésables le sont-elles dans
les mêmes proportions ?
La littérature fournit une réponse quasiment consensuelle à ces deux questions : toutes
les consonnes ne sont pas égales face à l'épenthèse, le tiercé gagnant étant constitué des
glottales, suivies des coronales et des vélaires. "In contrast, no language inserts an epenthetic
labial [p f m] or dorsal [k x ]" (de Lacy 2002a : 191)3. La section suivante va établir la
réalité des épenthèses de vélaires.
3
Cette dernière affirmation est cependant à nuancer ; Vaux (2003 : 14-15) répertorie quelques langues dont il
affirme qu'elles comportent des épenthèses de labiales mais sans illustrer son propos.
12
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.1. Vélaires
Les vélaires sont épenthésables, mais ne sont pas les consonnes les plus fréquemment
épenthésées dans les langues du monde. Outre le fait que ce ne sont pas les consonnes les plus
fréquentes, c'est surtout la nasale vélaire qui est concernée, plus que les occlusives (cf. Rubin
2000 : 113-114).
Le kaingang (Yip 1992, Lombardi 1997 : 14 et de Lacy 2002a : 190), langue macroge parlée à São Paulo au Brésil, présente une épenthèse de consonne vélaire pour laquelle
malheureusement on ne dispose pas de beaucoup de détails.
En revanche, Lombardi (1997) mentionne un type particulier d'épenthèse en coda
finale, l'épenthèse de consonnes nasales vélaires, connu sous le nom d'épenthèse
anusvara/angma dans la tradition sanscrite. Ceci concerne la plupart des épenthèses de
consonnes vélaires, ce qui semble indiquer que les vélaires sont réservées à la fois à un lieu
d'articulation précis en ce qui concerne l'épenthèse, et que celle-ci n'est pas due à la présence
d'un hiatus (cf. section 2.2).
Dans beaucoup de cas // semble être la nasale non-marquée en coda finale (cf. Trigo
1988). Ceci se manifeste notamment quand il y a neutralisation ou épenthèse en coda. Ainsi
les seules consonnes possibles en coda en buginese (langue austronésienne d'Indonésie, cf.
Mills 1975) sont // et //, ce qui placerait pour cette langue la vélaire avant les coronales, en
terme de marque (cf. chapitre 2 section 2). En buginese, la structure minimale du mot requiert
une consonne en coda d'un monosyllabe. Lors de l'emprunt d'un monosyllabe sans coda, la
langue y adjoint un [] : tea "thé" sera emprunté sous la forme [te] (cf. section 2.2.2.2.)
Rice (1996 : 496 ; 533) cite également parmi les langues connaissant l'épenthèse de la
nasale vélaire le murut, langue austronésienne de la famille malayo-polynésienne de l'ouest
parlée en Malaisie4 (Prentice 1971), pour laquelle elle ne donne malheureusement pas plus de
détails.
Un troisième cas d'épenthèse de vélaire est observé en uradhi, langue australienne
pratiquement éteinte parlée dans la région de Queensland (Crowley 1983, Hale 1973, 1976,
4
Les informations relatives à la classification et à la localisation des langues présentées ici sont issues, sauf
mention contraire, de SIL (2002).
13
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Paradis & Prunet 1993, Trigo 1988 : 57ss, Rice 1996 : 531-533, de Lacy 2002a : 190), qui se
rattache également au type anusvara/angma décrit plus haut, en ce sens qu'il s'agit d'une
épenthèse de nasale vélaire en coda. En uradhi, le dernier mot d'une expression ne peut se
terminer phonétiquement par une voyelle ; si le matériel lexical ne fournit pas de consonne à
la finale, il y a insertion d'une nasale selon les modalités définies ci-dessous. On distinguera
avec Paradis & Prunet (1993) suivant Crowley (1983) trois dialectes uradhi : l'atampaya, le
yadhaykenu et l'angkamuthi.
En atampaya (a), un [] est inséré après une finale de mot (d'expression) en [a] ou [u],
et une vélaire nasale avant [ ] après une finale de mot en [i].
En yadhaykenu (b), quelle que soit la voyelle finale elle peut se manifester sans
épenthèse, ou avec une épenthèse de [].
En angkamuthi (c), trois possibilités sont offertes au locuteur : soit la voyelle se
manifeste seule, soit elle est suivie d'un [] épenthétique, soit la voyelle est nasalisée.
(4)
forme sous-jacente
(a) atampaya
/ama/
/yuku/
à l'intérieur d'une
expression
à la finale d'une
expression
glose
[ama]
[yuku]
[ama]
[yuku]
"personne"
"arbre"
/iwi/
(b) yadhaykenu
/ama/
[iwi]
[iwi ]
"oiseau du matin"
[ama]
[ama], [ama]
"personne"
/yuku/
/ipi/
(c) angkamuthi
/ama/
/yuku/
/ipi/
[yuku]
[ipi]
[yuku], [yuku]
[ipi], [ipi]
"arbre"
"eau"
[ama]
[yuku]
[ipi]
"personne"
[ama], [ama], [ama]
[yuku], [yuku], [yuku] "arbre"
"eau"
[ipi], [ipi], [ipi]
Dans le premier dialecte, l'épenthèse est obligatoire, alors qu'elle n'est qu'optionnelle
dans les deux autres, concurrencée par la version sans épenthèse ou la version nasalisée.
Par ailleurs, Vaux (2003 : 10) cite le mongol (Rialland & Djamouri 1984, Beffa &
Hamayon 1975 : 43) parmi les langues épenthésant l'occlusive vélaire orale [g], mais les
données qu'il fournit ne permettent pas de conclure en faveur de l'épenthèse plutôt que d'une
14
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
allomorphie ou de la présence d'une consonne sous-jacente. La consonne incriminée apparaît
entre deux voyelles longues ou entre une diphtongue et une voyelle longue5, à la frontière
entre base et morphème flexionnel (Vaux ne donne pas "désinence" mais "suffixe" ;
cependant, les exemples fournis ne relèvent pas de la dérivation) :
(5)
morphème flexionnel
ablatif
/-AAs/
génitif
/-IIn/
instrumental
/-AAr/
base
dalai
odoo
dülii
xii
da
debee
guu
glose
"mer"
"maintenant"
"sourd"
"air"
"chef"
"marécage"
"fermoir"
dérivé
dalai[g]aas
odoo[g]oos
dülü[g]ees
xii[g]ii
da[g]iin
debee[g]iin
guu[g]aar
On remarquera parmi les exemples fournis par Vaux (2003) un qui ne relève pas du
contexte défini par lui : la base da ne se termine pas par une voyelle longue, cependant [g] est
inséré dans le dérivé.
Cette section a mis en évidence le lien qu'entretiennent les épenthèses consonantiques
vélaires, d'une part avec le mode articulatoire nasal, d'autre part avec la position en coda
finale. Il s'agira dans la suite de l'exposé de déterminer s'il s'agit dans les deux cas d'un lien
exclusif : les nasales épenthésées sont-elles uniquement vélaires ou peut-on en trouver
d'autres lieux d'articulation (cf. section 2.1) ? Ne peut-on trouver que des vélaires en coda (cf.
section 2.2) ?
Les vélaires ne sont pas les consonnes les plus fréquemment trouvées en épenthèse.
Pour Ortmann (1998 : 71), elles ne font même pas partie des consonnes observées dans les cas
d'épenthèses productives, celles-ci se limitant à l'occlusive glottale et aux coronales. Je vais
donc maintenant me tourner vers les épenthèses de glottales, avant d'achever cette
présentation par les coronales.
5
Vaux précise que la consonne épenthésée est "[g] in [+atr] contexts, [G] in [-atr] words."
15
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.2. Glottales
Les consonnes glottales sont les grandes favorites en ce qui concerne l'épenthèse, avec
une préférence nette pour le coup de glotte. Peut-on mettre en évidence une position
particulière liée à cette catégorie d'épenthèse, comme on l'a fait pour les vélaires en coda ?
2.1.2.1. Fricative h
La littérature fait état essentiellement de deux groupes faisant appel à l'épenthèse de la
fricative glottale : les langues gabaritiques d'une part, les langues amérindiennes d'autre part.
Bien que ces deux groupes ne se situent pas sur le même plan, je vais garder cette partition en
tant que représentative de la littérature consacrée à ce type d'épenthèses. Je terminerai cette
présentation par l'épenthèse facultative en hanunoo, langue austronésienne parlée aux
Philippines.
2.1.2.1.1. Langues gabaritiques
Les langues gabaritiques forment un premier groupe exploitant la fricative glottale :
Rose (1996 : 108) mentionne le [h] comme épenthèse en hébreu moderne, en tigré, langue
éthio-sémitique du nord, et en nisgha (écrit également nisga'a), langue tsimhianique de la
famille penutienne parlée en Colombie Britannique, reprenant pour cette dernière les données
de Shaw (1987, 1991) : "marcher" sera prononcé [hi-y:]6 à partir du morphème /y:/.
Cette dernière, en tant que langue amérindienne gabaritique, est une transition toute
trouvée vers le deuxième groupe mentionné plus haut comme ayant recours au [h], celui des
langues amérindiennes.
2.1.2.1.2. Langues amérindiennes
Certaines langues amérindiennes utilisent en effet l'épenthèse consonantique en [h].
C'est le cas tout d'abord du yucatec, langue maya parlée par les Amérindiens de Yucatán au
Mexique : les mots de cette langue se terminent obligatoirement par une consonne ; aussi les
emprunts ne satisfaisant pas cette condition se parent-ils d'un [h] à la finale (cf. Orie &
Bricker 1997, repris dans Lombardi 1997, également Straight 1976 : 71, de Lacy 2002a :
189).
6
Rose ne donne pas d'explication concernant le son [i] qui apparaît également lors de l'épenthèse de [h].
16
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Le huariapano, langue morte du Pérou, pratique également l'épenthèse en [h] pour se
conformer à l'exigence de poids des syllabes accentuées, qui doivent être lourdes (cf. Parker
1994 : 100-101, 1998 ; cf. également de Lacy 2002a : 189).
De Lacy (2002a : 189) reprenant Rice (1989 : 133) relève un [h] épenthétique dans
deux dialectes de slave ou slavey (langue amérindienne de la famille na-dene athapaskane) du
nord, le hare et le bearlake, parlés au Canada, dans la région de Mackenzie. Dans ces deux
langues le [h] est épénthésé de façon à ce que toutes les syllabes aient une attaque, y compris
celles ne comportant pas de consonne sous-jacente à l'initiale :
(6)
consonne initiale sous-jacente
[tice] "nous commençons à chanter"
/t-ice/
/ice/
/le-i-wee/
voyelle initiale sous-jacente
"nous chantons"
[hice]
[lehiwee] "nous coupons en deux"
De Lacy (2002a : 189) cite également le chipewyan (Li 1946), langue amérindienne
na-dene parlée au Canada de la même famille que le slavey, parmi les langues exploitant
l'épenthèse de [h].
L'ayutla mixtec ou coastal guerrero mixteco (de Lacy 2002a : 189, Pankratz & Pike
1967), langue oto-manguéenne parlée au Mexique, a recours à l'épenthèse de la fricative
glottale du fait d'une exigence relative à la structure du mot. La première syllabe d'un mot
prosodique doit en effet être de la forme CVC, ce qui se manifeste généralement par la
gémination de la consonne suivante (cf. (7)a) ; cependant, du fait que dans cette langue les
occlusives ne peuvent pas se trouver en coda, lorsque la consonne suivante est une occlusive
un /h/ est inséré de façon à remplir la coda (cf. (7)b).
(7)
consonne
syllabe
occlusive
consonne
syllabe
occlusive
forme sousjacente
/toso/
2ème /tima/
non/cele/
/naja/
ème /tuta/
2
/aku/
/kati/
gémination de la 1ère C de
la 2ème syllabe
[tos.so]
[tim.ma]
[cel.le]
[naj.ja]
*[tut.ta]
glose
épenthèse de [h]
[tuh.ta]
"arche florale"
"bougie"
"ciseaux"
"chien"
"atol"
[ah.ku]
"quelques"
[kah.ti]
"coton"
17
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Le guajiro (Mansen & Mansen 1984, Alvarez 1995 ; cf. également Vaux 2003 : 16),
langue amérindienne arawak parlée en Colombie et au Vénézuela, épenthèse la fricative
glottale en fin de mot, derrière une voyelle brève accentuée :
(8)
[ka’ih]
[ny’ah]
[m’ah]
[m’aa]
kashi
nüsha
ma
maa
derrière voyelle brève
derrière voyelle longue
"lune"
"sang"
"terre, monde"
"avec toi"
Parmi les langues amérindiennes pratiquant l'épenthèse de [h] citons encore, à la suite
de de Lacy (2002a : 189), les langues tucanoan (Welch & Welch 1967 : 18), famille parlée
principalement en Colombie et au Brésil, le yagua (Payne & Payne 1986 : 438), langue
amérindienne peba-yaguan parlée au Pérou, et le fox (Bloomfield 1924 : 220), langue
amérindienne parlée en Oklahoma, Kansas et Nebraska, avec l'exemple suivant :
/mana icawiwa/ [mana hichawiwa].
2.1.2.1.3. Langue austronésienne
Vaux (2003) répertorie le hanunoo (Schane 1973b : 54), langue austronésienne de la
famille malayo-polynésienne parlée dans les Philippines, parmi les langues pratiquant
l'épenthèse de la fricative glottale. Le contexte fourni par lui est l'hiatus vocalique seul,
cependant les exemples fournis se situent à la frontière morphologique et concernent un type
particulier de bases, les adjectifs numéraux. Signalons enfin que dans cet exemple rien ne
permet d'écarter l'hypothèse de la lénition :
(9)
base
unum
usa
glose
"six"
"un"
suffixe
-i
-i
dérivé
unumi
usahi
glose
"mets-le en six"
"fais-en un"
Les données disponibles sur l'épenthèse de [h] précisent l'hypothèse émise à la fin de
la section 2.1.1. : les vélaires sont certes réservées à la position en coda, mais la position en
coda n'est pas propre aux vélaires. Toutefois, on notera que sur les trois cas attestés ici
d'épenthèse de [h] en coda, deux sont soumis également à d'autres paramètres : en yucatec, ce
n'est pas la position de coda en tant que telle qui est importante, mais la position finale de
mot ; toutes les codas ne sont donc pas concernées, et celles qui le sont ne le sont qu'au nom
d'un autre paramètre. En ayutla mixtec, la structure du mot requiert une coda qui ne soit pas
18
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
une occlusive, ce qui provoque l'apparition du [h] quand la réduplication de la consonne
suivante, qui constitue le mode de réponse par défaut à cette contrainte, fournirait précisément
une occlusive ; [h] n'est épenthésé en coda que par égard à son statut de non occlusive. [h]
n'est donc le plus souvent lié à la position de coda que du fait de causes extérieures à cette
position, ce qui concourrait à privilégier malgré tout la relation entre la coda et les vélaires,
faisant de celles-ci les consonnes non marquées de la position.
Cette hypothèse sera à vérifier en observant le comportement des autres consonnes
possibles en épenthèse à l'égard de la position en coda : laissent-elles le champ libre à la
nasale vélaire où sont-elles également attestées, sans condition supplémentaire ?
Par ailleurs, on ne peut identifier aucune position propre à l'épenthèse de [h], qui est
possible aussi bien en coda, comme on vient de le voir, qu'en attaque (en slave ou en fox par
exemple).
Le [h] n'est pas la seule glottale à apparaître en épenthèse ex nihilo dans les langues du
monde. L'occlusive glottale connaît en effet un succès encore plus important en tant que
consonne "parasite".
2.1.2.2. Occlusive 
"Phonetically, the glottal stop, unreleased, is the negation of
all sound whether vocalic or consonantal. Is it the perfect minimum
or terminus of the syllable, the beginning and the end, the master or
maximum consonant?" F.R. Palmer (1948)7
Le coup de glotte est pour Lombardi (1997 : 14) "the optimal epenthetic consonant, all
things being equal". Suivant notamment Ladefoged (1971), Hyman (1975), Schane (1973b),
Lass (1976), elle considère le coup de glotte comme une obstruante à part entière et non
comme un glide. En effet, [] et [h] ont été classés avec les glides depuis Jakobson et al.
(1952 : 19) et Chomsky & Halle (cf. Durand 1986b : 80 ou Bessel 1992 : 56 pour un
récapitulatif). Cette position est due en partie au fait que, tout comme les glides, les laryngales
sont des "briseurs d'hiatus" (Kenstowicz & Kisseberth 1979 : 243-244) : les glides lorsque
l'hiatus contient l'une des voyelles hautes [i] et [u], les laryngales lorsqu'il inclus un [a].
7
Cité par Lombardi (1997 : 1), mais sans indiquer les références précises.
19
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Cependant, les données du malais (Durand 1986a) notamment mettent à mal cette unification
des laryngales avec les glides.
Sans entrer dans le débat du statut du coup de glotte, je le considérerai néanmoins
comme une consonne étant donné que la plupart des théories phonologiques actuelles le
considèrent comme tel, de façon à rendre compte dans la partie suivante de leur manière de le
considérer en regard des coronales.
Je retiendrai également de ce débat le rôle attribué au coup de glotte dans la résolution
des hiatus, et évaluerai cette proposition : l'épenthèse de coup de glotte est-elle exclusivement
liée à l'hiatus ?
[] est une consonne épenthétique exploitée sur tous les continents : aussi bien les
langues austronésiennes que les langues amérindiennes ou africaines y font appel, on la trouve
également en Asie et en Europe ainsi que dans les langues gabaritiques.
2.1.2.2.1. Langues austronésiennes
Un certain nombre de langues austronésiennes sont concernées par l'épenthèse du coup
de glotte, et ont été traitées dans la littérature. Les langues austronésiennes ou malayopolynésiennes forment une famille de 300 à 500 langues comprises par environ 300 millions
d'individus dans la péninsule de Malaisie, à Madagascar, à Taïwan, en Indonésie, en
Nouvelle-Guinée, dans les îles polynésiennes, dans les Philippines et en Nouvelle-Zélande.
En indonésien (Carr & Kassin 1999, Pater 2001 : 171-174, Cohn 1989, Cohn &
McCarthy 1994), l'épenthèse du coup de glotte dépend de la frontière morphologique. A
contexte phonologique égal, c'est-à-dire à l'intérieur d'un même hiatus (i_a), la langue insèrera
soit un glide homorganique de la première voyelle, soit un coup de glotte. C'est la position
morphologique de l'hiatus qui déterminera le type de son inséré : glide à l'intérieur de mot ou
entre radical et suffixe, [] entre préfixe et radical.
20
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(10)
forme sous-jacente
/diam/
/siap/
/hari + an/
/udi + an/
/di + ambil/
/di + adari/
intérieur de mot
entre radical et suffixe
entre préfixe et radical
épenthèse de glide
[dijam]
[sijap]
[harijan]
[udijan]
épenthèse de []
[diambil]
[diadari]
glose
"tranquille"
"prêt"
"quotidien"
"examen"
"pris"
"enseigné"
En malais (Carr & Kassin 1999, cf. également Durand 1986a, Zaharani 1998, Teoh
1994), l'insertion de l'occlusive glottale se fait, qu'il y ait frontière morphologique ou pas
(cependant, tous les exemples fournis par Carr & Kassin 1999 se situent à une frontière
morphologique) :
(11)
radical + suffixe
préfixe + radical
composés
réduplication
morphèmes
/mula + i/
/m´ + buta + i/
insertion de 
[mulai]
[m´mbutai]
"aveugle"
/di + ambel/
/s´ + ora/
[diambel]
[sora]
"pris"
"une personne"
/k´rt´/ + /api/
[k´rtapi]
"locomotive à vapeur"
/di + ambel/ + /aleh/
/uda/
/anai/
/isi/
[diambelaleh]
[udauda]
[anaianai]
[isiisi]
"emporter"
"lois"
"insectes"
"peaux"
glose
Le makassarese ou makassar (Aronoff et al. 1987, Broselow 2000, McCarthy 1998,
2002, McCarthy & Prince 1994), langue austronésienne malayo-polynésienne parlée en
Indonésie, présente un cas d'épenthèse de l'occlusive glottale accompagnant une épenthèse
vocalique, copie de la dernière voyelle radicale, après r, l, s. Il est à noter que si le radical se
termine en voyelle, il n'y a pas d'épenthèse consonantique.
(12)
forme sous-jacente
épenthèse
/rantas/
[rantasa]
finale radicale consonantique
finale radicale vocalique
pas d'épenthèse
glose
"sale"
/teter/
[tetere]
"rapide"
/jamal/
[jamala]
"vilain"
/lompo/
[lompo]
"gros"
En selayarese, langue austronésienne de l'ouest parlée en Sulawesi du Sud en
Indonésie (Lombardi 2003 : 12-14, Mithun & Basri 1986, Broselow 1984) le coup de glotte
est épenthésé dans les séquences de deux voyelles identiques en hiatus.
21
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Cependant, tous les coups de glotte entre deux voyelles identiques ne relèvent pas
d'une épenthèse ; on distinguera donc les cas où le coup de glotte est sous-jacent et se retrouve
quel que soit le groupe de voyelles (cf. (13)a), des cas où le coup de glotte n'apparaît qu'entre
deux voyelles identiques, auquel cas on a affaire à une épenthèse (cf. (13)b).
(13)
kuurai
(b) coup de glotte épenthétique
"je l'accompagne"
"tu l'accompagnes"
riurai
riinui
"tu le bois"
mais
(a) coup de glotte sous-jacent
"être excessif"
taata
taente "être érigé"
"être saoul"
tainu
kuinui
"je le bois"
De plus, le coup de glotte est aussi inséré à l'initiale de l'unité d'intonation, ce qui
signifie que les mots en isolation dont le matériel lexical fournit une voyelle en premier
élément se voient affublés d'un [] épenthétique.
(14)
inni
(a) à l'initiale d'une unité intonationnelle
"ceci"
aapa inni
(b) ailleurs
"qu'est ce"
Lombardi (2003 : 13-14) mentionne parmi les langues connaissant l'épenthèse glottale
l'ilokano (cf. Hayes & Abad 1989 : 351, Rose 1996 : 108 ; également Ortmann 1998 : 71,
Rosenthall 1997 : 144) ou iloko, langue d'Indonésie également. Outre les cas où l'épenthèse,
comme en tamil, intervient avant un [a] au même titre que les glides [w] et [j] interviennent
respectivement avant les voyelles arrondies et les voyelles hautes, l'ilokano connaît un cas où
les glides et le [] surgissent dans les groupes vocaliques quels qu'ils soient, et en variation
libre : dans les emprunts et dans "certain forms to which -an and -en are not normally
attached".
(15)
(a) épenthèse de coup de
glotte
pajojoen
pajojowen
"cause to play with yoyo"
trabahoen
trabah(o)wen
"work-goal focus"
pabasien
pabasijen
"lieu où le vin de canne à sucre est fait / consommé"
(b) épenthèse de glide
glose
Le kisar, de la branche sud-ouest de la famille malayo-polynésienne centrale
(Lombardi 2003 : 14-15, Christensen & Christensen 1992), ne semble pas en surface
présenter d'opposition à l'initiale entre voyelle et coup de glotte : aucun mot ne commence
phonétiquement par une voyelle. Cependant, lorsqu'il y a réduplication, on constate que
certains mots rédupliquent le coup de glotte initial et d'autres non. Dans le premier cas (cf.
22
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(16)a) le coup de glotte est donc bien sous-jacent, puisqu'il est rédupliqué, alors que dans le
second (cf. (16)b) il doit être épenthétique puisqu'il n'apparaît plus dès lors que le morphème
n'est plus à l'initiale.
(16)
umu
(a) coup de glotte sous-jacent
"dense"
"très dense"
umuumu
alam
"nuit"
alalam
eni
(b) coup de glotte épenthésé
"ceci"
"celui-ci"
enieni
"de bonne heure"
Si l'on suppose une structure sous-jacente */eni/ en (b), la réalisation rédupliquée
devrait être *[enieni]. On posera donc des structures sous-jacentes de type /umu/ et
/alam/ dans le premier cas, mais /eni/ dans le second, qui se réalisera phonétiquement avec
un coup de glotte à l'initiale, du fait de la structure syllabique qui impose une consonne en
début de mot dans cette langue.
De plus, selon que les mots contiennent dans le lexique une consonne à l'initiale ou
non, ils s'attachent à différents allomorphes du morphème pronominal de première personne
du singulier et du morphème de négation. Dans le cas où une consonne est à l'initiale, donc où
un coup de glotte est présent dans le lexique, on trouve la variante [jau] du morphème de
première personne (a) ; dans le cas où le mot commence dans le lexique par une consonne,
c'est un allomorphe de la forme [j] suivi d'une copie de la voyelle suivante, et ce bien qu'un
coup de glotte soit quand même inséré en surface.
(17)
(a) consonne, // sous-jacent Æ [jau]
"j'enterre"
jau karu
"je fais"
jau hii
"je lave"
jau omhe
"je ferme"
jau elek
(b) voyelle à l'initiale Æ [j] + voyelle
"je dors"
ja amkuru
"je tue"
je esne
"je bois"
jo omun
Lambert (1999 : 83-84 ; cf. 1.3.3.) mentionne les épenthèses de coup de glotte en
atayal, langue austronésienne de la branche formosane parlée à Taïwan. La structure des mots
atayaliens exige la présence d'une consonne à la finale ; si cette consonne n'est pas fournie par
le matériel lexical, c'est une occlusive glottale qui vient en épenthèse afin de satisfaire la
structure, comme l'illustrent les données suivantes :
23
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(18)
input
/an- aka/
/am- satu/
/am- si/
/am- kai/
/sini/
/am- ktri/
/m- paa/
/am- su/
output
anak
samatu
sami
mkai
sini
kamtari
mapaa
samau
glose
"casser"
"envoyer"
"mettre"
"chercher"
"croire"
"s'agenouiller"
"porter"
"donner un coup de pied"
Lombardi (1997) cite encore parmi les langues austronésiennes utilisant le [] le
sundanese, langue parlée en Java de l'ouest de la branche malayo-polynésienne de l'ouest
(Robins 1953). De Lacy (2002a : 189) indique également le larike (Laidig 1992, Laidig &
Laidig 1995) langue austronésienne malayo-polynésienne centrale parlée en Indonésie.
Le schéma ci-dessous reprend schématiquement les langues austronésiennes
concernées par l'épenthèse (adapté de SIL 2002) :
austronésien
malayo-polynésien (indonésien)
de l'ouest
sulawesi
sulawesi du sud
makassar
selayarese
Philippines du nord
Luzon du nord
ilokano
sundic
sundanese
malayic
malayan
malais local
makassarese
du centre-est
malayo-polynésien central
timor
maluku du sud-ouest
kisar-roma
kisar
maluku central de l'est
ouest puis est
larike
formosan
atayalique
atayal
24
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.2.2.2. Langues gabaritiques
Outre les langues austronésiennes, d'autres langues utilisent le coup de glotte en
épenthèse. En ce qui concerne les langues gabaritiques, Rose (1996 : 100 ; 108) cite l'arabe8
et l'hébreu moderne.
Lombardi (2003 : 11-12) reprend des données fournies verbalement par McCarthy sur
9
l'arabe et distingue les cas où le coup de glotte initial résulte d'une épenthèse des cas où il est
phonologique : lorsqu'il est sous-jacent, le coup de glotte apparaît aussi bien à l'initiale qu'en
position intervocalique (cf. (19)a). Lorsqu'il est épenthétique en revanche (cf. (19)b), l'hiatus
éventuel est résolu par la chute de la seconde voyelle.
(19)
(a) coup de glotte sous-jacent
"une épingle"
ibra
"il a dit 'une épingle'"
qaalaibra
"elle a dit 'une épingle'"
qaalatibra
(b) coup de glotte épenthétique
"écoute"
ismaq
"il a dit 'écoute'"
qaalasma
"elle a dit 'écoute'"
qaalatisma
Le tigrigna (également écrit tigrinya ou tigray), langue du groupe éthio-sémitique
parlée en Erythrée et dans la province éthiopienne du Tigray, utilise l'épenthèse d'occlusive
glottale à la frontière entre une racine nominale et certaines désinences, telles que le
morphème /u/ "possessif 3ème personne", devant voyelle (Denais 1994 : 52-54) :
(20)
racine à finale consonantique
racine à finale vocalique
/faras - u/
/aza - u/
[farasu]
[azu], [azu], [azau]
"son cheval"
"sa maison"
/abbo - u/
[abbou], [abbuu]
"son père"
/adde - u/
[addiu]
"sa mère"
/dmmu - u/
[dmmuu]
"son chat"
/sahafi - u/
[sahafu]
"son écrivain"
D'autres phénomènes peuvent apparaître : élision de la voyelle précédente,
modification de son timbre, etc., mais on trouvera tout de même l'épenthèse de coup de glotte.
Après les langues amérindiennes et gabaritiques, tournons-nous vers un troisième
ensemble de langues concerné par l'épenthèse du coup de glotte, les langues amérindiennes.
8
9
Rose ne précise pas de quelle variété d'arabe il s'agit dans son article.
Lombardi ne précise pas s'il s'agit de l'arabe moderne ou classique dans son article.
25
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.2.1.3. Langues amérindiennes
La littérature fait état de quatre langues amérindiennes ayant recours à l'épenthèse en
[] : le cupeño, le tunica, le mohawk et le tsishaath nootka.
Le cupeño ou takic du sud, langue amérindienne de la famille uto-aztèque parlée en
Californie du Sud, présente un cas d'épenthèse d'occlusive glottale dans les cas où le gabarit
minimal d'un mot n'est pas atteint par le matériel lexical seul (données de Crowhurst 1994,
réanalysées par Lombardi 1997, 2003 : 17 ; également de Lacy 2002a : 189, 2002c) :
(21)
/hu/
/kwa/
[hu]
[kwa]
[ti]
/ti/
"péter"
"manger"
"rassembler"
Dans certains cas bien définis, le tunica présente aussi une épenthèse glottale (cf.
section 2.1.3.2), mais celle-ci s'accompagne nécessairement d'une syllabe entière, aussi ne
peut-on pas la mettre sur le même plan que les autres.
De Lacy (2002a : 189) mentionne encore deux autres langues amérindiennes à utiliser
le [] en épenthèse, à savoir le mohawk (Hale & White Eagle 1980), langue amérindienne
iroquoise parlée au sud de l'Ontario au Canada et aux Etats-Unis, et le tsishaath nootka
(Stonham 1999), langue amérindienne de la famille wakashan parlée en Colombie
Britannique.
Après le continent américain représenté par les langues amérindiennes, c'est au tour du
continent asiatique de nous dévoiler ses secrets en ce qui concerne l'épenthèse de [].
2.1.2.2.4. Continent asiatique
Le continent asiatique est quant à lui représenté par trois langues : le tamil pour l'Inde,
le koryak pour l'océan Pacifique et le persan pour le Moyen-Orient.
Le tamil, langue de la famille dravidienne du Sud, présente un cas d'épenthèse de coup
de glotte (Christdas 1988, Lombardi 1997, 2003 : 10) devant [a] à l'initiale, alors que devant
les voyelles arrondies [o] et [u] on trouvera le glide [w], et [j] devant les voyelles antérieures
[i] et [e].
26
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(22)
/peer-aacaj/
intérieur de mot
"avidité"
[peeraas]
/aacaj/
initiale de mot
[aas]
"espoir"
Le koryak, langue paléo-sibérienne (Kenstowicz 1976, Lombardi 2003 : 16) parlée
principalement dans la péninsule de Kamchatka dans l'océan Pacifique nord, utilise le coup de
glotte à l'initiale de mot devant voyelle, satisfaisant ainsi la requête d'une consonne à l'initiale
de cette langue. Comme pour le tamil, c'est la comparaison avec la même base adjointe à un
préfixe se terminant par une consonne qui permet de mettre en évidence le caractère
épenthétique du coup de glotte.
(23)
intérieur de mot
initiale de mot
"s'évanouir"
[mal-ajat-k]
"tomber"
[ajat-k]
Le persan présente un cas d'épenthèse de coup de glotte en variation libre avec
l'apparition d'un glide10 homorganique de l'une des deux voyelles de l'hiatus qui constitue le
contexte déterminant (cf. Vaux 2003 : 15) :
(24)
forme sous-jacente
/baazari + i/
épenthèse de []
[baazarii]
[baazariji]
glose
"un homme d'affaires"
/baalaa + i/
[baalaai]
[baalaaji]
"celui d'en haut"
/maa + o + somaa/
[maaosomaa]
[maawosomaa]
"nous et vous"
/zaa + u/
[zaau]
[zaawu]
"enceinte"
/naame + at/
[naameat]
*[naamejat]
"votre lettre"
réalisation avec glide
Ce tableau met en évidence l'apparition du coup de glotte en hiatus, sans qu'il soit
possible toutefois de décider si la frontière morphologique joue un rôle déterminant dans cette
épenthèse ou pas.
Intéressons-nous maintenant, après ce tour d'horizon des langues austronésiennes,
gabaritiques, amérindiennes et asiatiques, aux langues africaines, avant de terminer cette
présentation des épenthèses de coup de glotte par les langues européennes.
10
On remarque par ailleurs que la réalisation avec glide n'est pas toujours autorisée (*[naamejat]) sans que l'on
puisse pour antant attribuer cette interdiction, au vu de ces seules données, au fait qu'aucune des voyelles de
l'hiatus n'est fermée ; en effet, [maawosomaa] atteste d'un glide dans le même contexte [voyelle moyenne _
voyelle ouverte]. Signalons enfin que chacune des deux voyelles de l'hiatus peut propager un glide, comme en
témoigne la variation constatée dans /doru + i/ "l'hypocrisie", qui peut se réaliser avec propagation de la
première voyelle ([doruwi]) comme de la seconde ([doruji]).
27
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.2.2.5. Continent africain
L'Afrique n'est pas en reste avec trois langues, à savoir le kçnni, le gokana et le tigré,
et une famille de langues, les langues chadiques, en lice.
En kçnni, langue niger-congolaise parlée dans le nord du Ghana, la consonne
épenthétique insérée à la fin des propositions ou entre deux voyelles à travers une frontière de
mot est le coup de glotte (Cahill 1999, Lombardi 2003 : 32), soit toujours aux extrémités d'un
mot et non à l'intérieur.
De même, le gokana, langue niger-congolienne, (cf. Hyman 1985 ; également
Lombardi 1997, 2003) insère une occlusive glottale à l'initiale de mot pour répondre à la
structure syllabique exigée par la langue.
De Lacy (2002a : 189) relève en outre des cas d'épenthèses d'occlusive glottale dans
les langues chadiques (Frajzynger & Koops 1989), sous-groupe de la famille afro-asiatique
rassemblant près de 200 langues parlées principalement au Nigeria, au Chad et au Cameroun ;
en tigré (Raz 1983), langue afro-asiatique de la branche éthiopienne parlée en Erythrée ainsi
qu'au Soudan.
Le dernier continent à explorer est l'Europe. Trouve-t-on des épenthèses de coup de
glotte sur le vieux continent ?
2.1.2.2.6. Continent européen
Pour l'Europe, ce sont les langues slaves et les langues germaniques qui manifestent
leur intérêt pour le coup de glotte.
En allemand (Wiese 1996, Alber 2001 et références inclues ; cf. section 2.2. pour une
présentation plus détaillée), un coup de glotte est inséré à l'initiale devant voyelle et à
l'intervocalique devant voyelle accentuée, l'épenthèse étant optionnelle dans ce dernier cas :
(25)
a. à l'initiale devant voyelle
b. à l'intervocalique devant voyelle accentuée
awtoo
ka()'oot
Auto
chaotisch
"voiture"
"chaotique"
28
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
En anglais (Lombardi 2003 : 17), après une pause on ne constate "no real vowel-initial
words". Dans le cas où le mot commence par une voyelle dans le lexique, l'exigence
consonantique est remplie par le coup de glotte, qui n'est pas présent à l'intérieur dès lors que
le mot n'est plus en initiale de proposition, sauf en cas de réalisation "particulièrement
emphatique".
(26)
position dans la proposition
initiale
graphie
eel
intérieure
intérieure, emphatique
big eel
the EEL
épenthèse
[ijl]
pas d'épenthèse
[bijl]
glose
"anguille"
"grosse anguille"
"l'anguille"
[ijl]
Le bulgare (Rubach 2000 : 287-290) présente un cas d'insertion de coup de glotte,
obligatoire, à l'initiale de mot devant voyelle, mais non à l'intervocalique.
(27)
intérieur de mot
initiale
_i
_u
_a
_i
_u
_a
graphie
egoist
kontinuum
teatar
Iraq
urnata
Amerika
hiatus
épenthèse de 
[oi]
[uu]
[ea]
[i]
[u]
[a]
glose
"dialecte"
"continuum"
"théâtre"
"Irak"
"l'urne"
"Amérique"
On observe un comportement similaire du tchèque, au moins en ce qui concerne la
norme prescriptive, à l'égard de l'épenthèse d'occlusive glottale : pas d'insertion ailleurs qu'à
l'initiale devant voyelle (Kucera 1961, Rubach 2000 : 297-302). En revanche, le tchèque
permet également l'insertion du glide [j] à l'intérieur d'un hiatus dont l'un des membres est /i/.
(28)
intérieur de mot
initiale
_i
i_
_u
_e
_i
_u
_a
_o
graphie
kokain
dialekt
muzeum
poeta
idiot
ulice
Amerika
okna
hiatus
épenthèse de j
[aji]
[ija]
épenthèse de 
[eu]
[oe]
[i]
[u]
[a]
[o]
glose
"cocaïne"
"dialecte"
"musée"
"poète"
"idiot"
"rue"
"Amérique"
11
L'oclusive glottale dévoise la consonne occlusive précédente : v Americe [ramertse] "en Amérique", od
Aleny [otalen] "d'Alène", z okna [sokna] (Janda & Townsend 2000 : 10, Palková 1997 : 326). "Even
speakers who do not use the glottal stop devoice these obstruents".
29
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
On notera cependant qu'une frontière morphologique intérieure de mot en hiatus,
généralement entre préfixe et radical, peut également se voir adjoindre un coup de glotte,
facultatif. Celui-ci permet notamment de distinguer deux mots homophones en surface mais
distincts dans le lexique (Janda & Townsend 2000 : 9-10, Palková 1997 : 325-326) :
(29)
proudi
pas d'épenthèse car intérieur de morphème
radical proud +
"jaillit"
[proui]
(présent)
terminaison i
épenthèse de [] car frontière morphématique
préfixe pro + radical
"fumera
à
[proi]
travers"
ud + terminaison i
2.1.2.2.7. Bilan sur le coup de glotte
Ce survol des langues utilisant l'occlusive glottale en cas d'épenthèse consonantique
montre bien l'importance de ce lieu d'articulation, puisque nulle région du monde n'est
épargnée.
Il a également mis en évidence le manque de relation particulière entre le coup de
glotte et une position particulière. On trouve certes quantité d'épenthèses de [] en hiatus
(indonésien, selayarese, ilokano, knni, allemand, tchèque)12, mais le [] intervient également
dans d'autres contextes qui n'exigent qu'une seule voyelle dans leur contexte immédiat, à leur
droite : à une frontière morphologique (tigrigna, malais), en attaque ou début de mot (kisar,
arabe, tamil, allemand, anglais, bulgare, tchèque), en initiale de proposition (anglais). On
trouve enfin [] en finale de mot (makassar, atayal, cupenõ) ou de proposition (knni).
Au contraire de l'épenthèse de vélaire qui se situe essentiellement en coda, l'apparition
du coup de glotte n'est liée à aucune position particulière ni même à l'hiatus, contrairement à
ce que le laissait entendre son classement avec les glides précisément pour ce motif.
En outre, l'hypothèse formulée en fin de section 2.1.2.1. s'avère infondée. Certes les
vélaires sont épenthésées en coda sans qu'il soit besoin d'autre motif que la nécessité d'avoir
une consonne dans cette position précise, au contraire des fricatives nasales, qui peuvent se
trouver en coda mais le plus souvent du fait de raisons morphologiques supplémentaires. Mais
la position de coda n'est pas pour autant propre à la nasale vélaire, non plus que l'on peut la
considérer comme la consonne non marquée de cette position, puisque l'on constate le même
"manque de motivation" extérieur à la position pour les occlusives glottales : les quatre
langues connaissent l'épenthèse de [] – le knni, l'atayal, le makassar et le cupeño - ne
12
Pour une étude des autres critères déterminants, cf. section 2.2.
30
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
l'appellent que pour des raisons strictement structurales et non en vertu d'autres contraintes
morphologiques.
En-dehors des glottales, les plus fréquemment attestées en épenthèse, une autre
catégorie de consonnes est assez fréquente dans les langues du monde : les coronales.
2.1.3. Coronales
Les coronales paraissent en effet être, avec les glottales // et /h/, les consonnes
épenthétiques les plus fréquentes (Béland & Favreau 1991 : 218). Je distinguerai dans cette
présentation les différentes coronales épenthésées par leur mode articulatoire : les sonantes
tout d'abord, en commençant par les liquides pour arriver aux nasales, puis les obstruantes,
avec tout d'abord les fricatives puis les occlusives.
Là encore, je tenterai de découvrir s'il existe un contexte de prédilection relatif à
l'apparition des coronales en épenthèse.
2.1.3.1. Liquides
Les liquides sont des épenthèses très prisées dans les langues du monde. On en trouve
en Afrique, en Australie, en Asie et en Europe.
2.1.3.1.1. Continent africain
[l] est très peu cité en tant qu'épenthèse dans la littérature. On le trouve notamment en
baka, langue niger-congolaise du Cameroun (Kleinhenz 1992 ; également Ortmann 1998 :
72). Le contexte déclencheur est constitué (a) par un hiatus de deux voyelles identiques,
auquel cas l'épenthèse est optionnelle, et (b) par n'importe quel hiatus pourvu qu'il
corresponde à une frontière dérivationnelle.
(30)
/m/
(a) /soo/
/moo/
/si + /
(b)
/m + /
[ml]
[solo]
[molo]
[sil]
[ml]
"faire"
"sécher"
"tuer"
"regarder – perfectif"
"faire – perfectif"
31
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
L'épenthèse de [r] est bien plus documentée que celle de [l]. A l'intervocalique, le
gokana, langue niger-congolaise parlée au Nigéria, présente une épenthèse de [r] entre deux
orales (et de [n] entre deux nasales, cf. paragraphe suivant). Hyman (1985, repris par
Lombardi 1997, 2003) considère ces réalisations comme correspondant à un phonème /l/
sous-jacent. Il n'y a cependant épenthèse que lorsque les voyelles en hiatus sont toutes les
deux longues (après une voyelle brève, les voyelles longues s'abrègent), et à l'intérieur d'un
pied, considéré comme un constituant morphologique.
Enfin, seuls deux suffixes sont concernés par cette épenthèse : le suffixe correspondant
à la deuxième personne du pluriel sujet et le logophorique.
(31)
réalisation
oo zov-ii
oo sii-rii
glose
réalisation
Deuxième personne du pluriel
"vous prenez"
oo -i
"vous dansiez"
oo ban-ii
"vous attrapiez"
oo naa-nii
oo tu-e
"il prenait"
oo zov-ee
oo sii-rii
"il dansait"
"il attrapait"
oo tu-i
Logophorique
oo -
glose
"vous cachez"
"vous mendiez"
"vous faisiez"
"il cachait"
oo ban-
oo naa-n
"il mendiait"
"il faisait"
En kçnni, langue niger-congolaise parlée dans le nord du Ghana, on constate une
épenthèse de [r] entre une voyelle radicale longue [aa], [] ou [çç] et le suffixe du pluriel en
ce qui concerne les noms de classe 1 (Cahill 1998, 1999, Lombardi 2003 : 32). Cette
épenthèse s'accompagne d'un abrègement de la voyelle longue précédente.
(32)
singulier
base en voyelle brève à la finale
base à voyelle longue à la finale
pluriel
s-
ta-
bnt-
s-a
tan-a
bnt-ra
glose
"poisson"
"pierre"
"crapaud"
daa-
da-ra
"jour"
Le knni conclut cet aperçu des épenthèses de liquides coronales en Afrique. Le
second continent exploré ici est l'Australie.
32
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.3.1.2. Continent australien
Une seule langue austronésienne est citée comme comportant des épenthèses
consonantiques en [r], il s'agit de l'anejom ou aneityum (de Lacy 2002a : 190, Lynch 2000 :
29), langue austronésienne de la famille malayo-polynésienne de l'est parlée à Vanuatu à l'est
de l'Australie.
Après l'Afrique et l'Australie, tournons-nous vers l'Asie.
2.1.3.1.3. Continent asiatique
Une seule langue exploite le type d'épenthèses coronales envisagé ici. En japonais une
alternance apparaît dans le paradigme verbal (Lombardi 1997, Mester & Itô 1989, de Chene
1985, Poser 1986, McCawley 1968) : plusieurs terminaisons comportent un [r] lorsque leur
initiale syllabique est une voyelle, mais non quand elles commencent par une consonne :
(33)
pres.
prov.
pass.
bases à finale consonantique
das-u
das-eba
das-areru
"sortir"
bases à finale vocalique
tabe-ru
tabe-reba
tabe-rareru
"manger"
Le problème ici est de savoir s'il s'agit de l'élision du /r/ (Poser 1986, McCawley 1968)
ou de son épenthèse (Mester & Itô 1989, de Chene 1985). De Chene, repris par Lombardi
(1997), base son analyse notamment sur les résultats d'une expérience exploitant des verbes
dénués de sens, mettant ainsi en évidence le caractère restrictif du contexte de l'épenthèse :
uniquement à la frontière d'un radical verbal.
Nous avons visité successivement l'Afrique, l'Australie et l'Asie sous le prétexte de
l'épenthèse de liquide coronale. Il est temps de rentrer dans nos contrées pour chercher si l'on
n'y trouve pas également ce que nous sommes allés chercher si loin.
2.1.3.1.4. Continent européen
En anglais (Szigetvári 1994 : 192, Ortmann 1995 : 1) un [] est inséré entre deux
voyelles adjacentes si la première ne peut pas propager de glide afin de résoudre l'hiatus. Si la
première voyelle est [], [u], [i:] ou [u:], un glide est propagé ; si en revanche il s'agit d'un [],
33
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
d'un [a:] ou d'un [ø:], c'est l'épenthèse qui est choisie pour résoudre l'hiatus, comme on peut le
voir dans le tableau ci-dessous. Cependant, "the prescriptivist stands against filling hiatus with
[] and other reasons as well make some speakers of English fill it with [], i.e.  (Jones 1966 :
113)." (Szigetvári 1994 : 220 note 6).
(34)
propagation d'un glide
s[i:j]ing
n[aw]and
seeing
now and
grandma is
India and
glose
épenthèse d'un []
"voyant"
"maintenant et"
"mamie est"
"l'Inde et"
grandm[a:] is
Indi[] and
Il est intéressant de relever à cet endroit que l'épenthèse de [r] n'est pas toujours
considérée comme une épenthèse de coronale (Akinlabi 1993 ; également Ortmann 1998 :
72), mais il s'agit dans ce cas d'analyse portant sur une langue donnée, en l'occurrence le
yoruba, n'ayant donc pas de valeur générale.
L'anglais de Bristol présente constitue le deuxième cas d'épenthèse en [l] documenté
par la littérature : un [l] est inséré en finale de mot après un schwa (Lombardi 1997, 2003,
Hughes & Trudgill 1979, Wells 1982, Gick 1999) de telle sorte que des mots comme Eva et
evil se retrouvent homophones.
Enfin, Vaux (2003 : 22) signale qu'en espagnol sévillan, les emprunts manifestent un
[r] épenthétique. Toutefois, il ne fournit qu'un seul exemple ne permettant pas de déterminer
avec certitude le contexte en hiatus – l'épenthèse concerne-t-elle uniquement une certaine
catégorie de voyelles ? – et ce [r] est ici en variation libre avec [s].
(35)
mot emprunté
chalet
épenthèse de [r]
chaleres
épenthèse de [s]
chaleses
Les liquides coronales sont donc bien attestées dans le phénomène de l'épenthèse, le
plus souvent en hiatus (seul l'anglais de Bristol fait exception à cette règle) mais le plus
souvent sans que ce hiatus soit une condition suffisante (cf. section 2.2).
Les coronales sont également largement employées dans les cas d'épenthétisation sous
la forme de la nasale [n], ce qui invalide la relation d'exclusivité constatée en section 2.1.1.
entre le mode d'articulation nasal et le lieu vélaire.
34
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.3.2. Nasale
On trouve la nasale coronale épenthésée dans des langues d'origines diverses,
permettant à cette consonne d'être représentée en Amérique avec le tunica, en Afrique avec le
fula et le gokana, en Asie avec le coréen, en Australie avec le murut et en Europe avec le
suisse allemand.
Le tunica, langue amérindienne éteinte anciennement parlée en Louisiane centrale,
(Haas 1940, Lombardi 1997, 2003) présente un cas d'épenthèse de la nasale coronale /n/.
En fin de proposition, les séquences en tunica doivent obligatoirement comporter une
consonne. Si le lexique ne fournit pas cette consonne, /n/ est inséré13 :
(36)
Forme régulière
hatika
sahku
Phrase-final form (ton omis)
hatikan
sahkun
glose
"encore"
"un"
Certaines catégories de mots, portant l'accent à la finale, ne peuvent pas prendre
directement l'épenthèse de la nasale et insèrent une syllabe entière, formée d'un coup de glotte
et d'une copie de la voyelle précédente, avec le /n/ en coda.
(37)
Forme régulière
ri
ke
ru
arupo
Phrase-final form
riin
keen
ruun
arupoon
glose
"maison"
"guêpe"
"hickory"
"rêve"
Le fula (Bagemihl 1989, Lombardi 1997), langue de la famille niger-congolaise parlée
notamment en Gambie, au Mali et au Sénégal, connaît un jeu de langage consistant à inverser
les deux premières consonnes d'un mot :
(38)
fula
saare
war
umara
13
fula transformé
raase
raw
muaru
glose
"concession"
"vient"
nom propre
Quelques mots préfèrent à l'épenthèse de la nasale la chute de la dernière voyelle, mais ils restent minoritaires.
35
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Cependant, lorsque ces deux consonnes sont identiques, la deuxième dans le mot
transformé est remplacée par un /n/ épenthétique, et ce, quel que soit le lieu d'articulation de
la consonne qui est élidée :
(39)
fula
fula transformé
glose
baaba
baana
"père"
daada
daana
"mère"
jaaje
jaane
nom propre
C'est le seul endroit où un /n/ apparaît en épenthèse en fula14.
Le gokana (Hyman 1982, 1985, Lombardi 1998), langue niger-congolienne parlée au
Nigéria dont nous avons déjà observé la propension à l'épenthèse en [r], manifeste
parallèlement une épenthèse en [n] lorsque le site est entre deux nasales (cf. (31)).
De Lacy (2002a : 190) ajoute à cette liste le coréen (Hong 1997) et le murut (Prentice
1971 : 113) langue austronésienne de la famille malayo-polynésienne de l'ouest parlée en
Malaisie.
En ce qui concerne le continent européen, c'est le haut alémanique, "basically Swiss
German", qui comporte des épenthèses de nasale coronale, selon Ortmann (1995 : 1-3)
reprenant des données de Heusler (1888 : 110) et Weinhold (1863 : 171). Il définit ces
épenthèses comme en relation avec la cliticisation, lorsque le clitique est complément :
(40)
suisse allemand
wo [n] er ko isch
däs Stuck, wo [n] erer id gfalle hätt
gröBer wie [n] i
gang zu [n] ere
traduction des mots
quand il arrivé est
la pièce, que elle pas plu a
plus grand que moi
va à elle
glose
"quand il est arrivé"
"la pièce qu'elle n'a pas aimée"
"plus grand que moi"
"va à elle"
La nasale coronale, comme les liquides, n'est donc pas exclusivement liée à l'hiatus (et
dans ce cas l'hiatus n'est pas non plus un critère suffisant, cf. section 2.2) puisqu'on la trouve
également épenthésée en fin de proposition (tunica).
14
Lombardi 1997 note :" It is unclear whether we should expect to see markedness constraints reflected in the
same way in language games as in natural languages; for example, do they actually tend to use unmarked
consonants in epenthesis? Perhaps not; Stuart Davis (p.c.) points out that some language games use labials, for
instance, and we probably don’t want to use this to argue that the Place markedness hierarchy should be revised.
There are surely functional reasons that language games might want to use more marked consonants deliberately,
to mark the language game situation (and of course, because labials are just funnier than other consonants.)"
36
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Les épenthèses de coronales semblent assez fréquentes dans les langues du monde, du
moins tant qu'il s'agit de sonantes. En est-il de même pour les obstruantes ?
2.1.3.3. s, z
/s/ et /z/ sont des épenthèses, sinon fréquentes, du moins courantes en français,
"standard" comme régional (cf. section 3). Pourtant, il semblerait que les langues du monde
ne partagent pas cette affection du français pour les coronales antérieures fricatives, puisqu'un
seul article à ma connaissance fait état de ce type d'épenthèse dans d'autres langues. Outre
l'emprunt mentionné en espagnol sévillan (chalet > chaleses, cf. 2.1.3.1.4.), Vaux (2003 : 24)
signale une épenthèse "randomly in coda" en espagnol dominicain (Nuñez-Cedeño 1988) :
(41)
teatro "théâtre"
abocado "avocat"
réalisations possibles
[teastro]
[teatros]
[asboado]
[abosado]
[aboasdo]
[aboados]
réalisations interdites
*[tesatro]
*[teatsro]
*[saboado]
Cette désaffection de l'épenthèse ne s'étend pas aux occlusives coronales, tant s'en
faut. Rose (1993 : 173) le dit bien, "the coronal /t/ is often an epenthetic segment". Ce
sentiment est partagé notamment par Broselow (1984), Hume (1994) et Spring (1990), et
nombre de langues viennent confirmer cette impression.
2.1.3.4. t, d
Les langues qui ont recours à l'épenthèse des occlusives coronales font en fait presque
uniquement appel à [t], que ce soit les langues amérindiennes, africaines, asiatiques,
australiennes ou européennes, les quatre dernières n'étant en fait représentées que par une
langue chacune.
37
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.3.4.1. Langues amérindiennes
Les langues amérindiennes utilisant l'épenthèse en [t] sont au nombre de deux :
l'asheninca campa et l'odawa.
Les langues de la famille arawak étaient anciennement parlées de la Floride au Chili,
elles ne sont plus actuellement pratiquées qu'en Amérique du Sud. En axininca campa15 (cf.
Payne 1981 ; cf. également Itô 1989 : 237, Kitto & De Lacy 1999, Lombardi 1997, McCarthy
& Prince 1993), langue parlée au Pérou, l'attaque est obligatoire (sauf en début de mot
prosodique, qui ne sera donc pas concerné par l'épenthèse). Si une attaque n'est pas remplie
par le matériel lexical entre une base et un suffixe, donc en hiatus vocalique à la frontière
dérivationnelle suffixale, un /t/ est épenthésé pour remplir mélodiquement la position :
(42)
forme sous-jacente
/noN-kim-i/
/noN-pok-i/
/noN-pisi-i/
réalisation sans épenthèse
[nokimi]
[nompoki]
réalisation avec épenthèse
[nompisiti]
glose
"je balaierai"
"j'entendrai"
"je balaierai"
/noN-piyo-i/
[nompiyoti]
"j'entasserai"
/i-N-koma-i/
[ikomati]
"il pagaiera"
/i-N-koma-aa-i/
[ikomataati]
"il repagaiera"
/i-N-koma-ako-i/
[ikomatakoti]
"il pagaiera pour"
/i-N-koma-ako-aa-i-ro/
[ikomatakotaatiro]
"il repagaiera pour ça"
Cette épenthèse se trouve uniquement avec la suffixation. Dans le cas de la
préfixation, un éventuel hiatus est résolu par la chute de la voyelle. C'est ce qui fait dire à
Lombardi (1997, 2003) que les coronales ne sont épenthétiques que dans des cas
morphologiquement restreints. Je reprendrai cette hypothèse en section 2.2.
Piggott (1990), repris par Lombardi (1997, 2003), mentionne une épenthèse de /t/ à la
frontière entre un préfixe de personne et un radical en odawa (ojibwa : langue amérindienne
du groupe algonquin du Canada et des États-Unis), comme l'illustre le tableau ci-dessous (où
les règles d'effacement de voyelles sont omises puisque non pertinentes pour le sujet traité) :
(43)
Forme sous-jacente
/ki-akat-i/
kitakati
"tu es timide"
/ki-osamikwam-m/
kitosamkwamim
"vous faîtes la grasse matinée"
/ni-ompass/
nitompass
"mon bus"
15
Réalisation
glose
On trouve également écrit Asheninca Campa
38
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
L'hiatus avec le même préfixe attaché aux noms d'une autre classe, celle des
possessions inaliénables, est en revanche résolu non par l'épenthèse mais pas l'élision :
(44)
(a)
(b)
(c)
Forme sous-jacente
/ni-oss/
/okima-ak/
/okkkwe-ak/
/ki-pi-ia-w/
Réalisation
noss
okimak
okkwek
kipia / kipiia
glose
"mon père"
"chefs"
"asticots"
"il est venu ici"
Après l'Amérique, intéressons-nous aux autres continents, représentés chacun par une
langue.
2.1.3.4.2. Autres continents
L'amharique est une langue gabaritique parlée en Ethiopie16, de la famille chamitosémitique.
Selon Broselow (1984) (cf. également Lombardi 1997), /t/ est la consonne par défaut
en amharique ; c'est notamment elle qui est épenthésée lorsque la structure gabaritique
requiert une consonne. Dans la colonne (a) est exposé un verbe dont la structure sous-jacente
est bilitère. Une épenthèse apparaît au gérondif et à l'infinitif pour atteindre le gabarit trilitère
souhaité (Broselow précise que "the reason why the j of this root does not spread to fill the
final consonant slot is because there is no language-specific rule which would cause it to
spread: automatic spreading is not a universal principle.") ; la colonne (b) illustre le cas des
verbes possédant bien trois consonnes dès le lexique, les deux dernières étant identiques, la
colonne (c) le cas "normal", avec trois consonnes différentes dès le lexique.
(45)
(a) /fj/ "consumer"
fäjjä
fäjto
mäfjät
(b) /wdd/ "aimer"
wäddädä
wäddo
mäwdäd
(c) /lbs/ "ouvrir"
läbbäsä
läbso
mälbäs
glose
perfectif
gérondif
infinitif
Sont également référencés le coréen (Kim-Renaud 1986 : 19, De Lacy 2002a : 189) et
le maori (de Lacy 2002a : 189, 2002d), langue austronésienne malayo-polynésienne du
groupe centre-est parlée au nord et à l'est de la Nouvelle-Zélande.
16
Pour une description du système phonologique de l'amharique, cf. Leslau (1997).
39
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
En maltais (Ortmann 1995 : 3-4), un [t] est inséré si les deux conditions suivantes
surviennent simultanément : après un numéral et avant une épenthèse de [i]. L'épenthèse
vocalique se trouve dans d'autres contextes, aussi est-on en droit de supposer qu'il ne s'agit
pas d'épenthèse d'un CV entier mais bien de deux épenthèses distinctes. L'exemple ci-dessous
illustre d'une part l'épenthèse en elle-même à partir de deux unités lexicales sans [t], d'autre
part que cette épenthèse ne survient pas si le [i] suivant n'est pas épenthétique mais lexical.
(46)
épenthèse
zewg
hbieb
zewg + hbieb
sewg + Indjani
pas d'épenthèse
zewgt ihbieb
zewg (*t) Indjani
glose
"deux"
"amis"
"deux amis"
"deux Indiens"
En allemand enfin (Scheer 2002 : 11), on observe en diachronie une épenthèse
d'occlusive coronale, [t] ou [d], en fin de mot ou de morphème, après [n], [r], [s], [], [] et
[f].
(47)
après [n]
après [r]
après [s]
après []
après [] (rare)
après [f]
moyen haut allemand
iergen
ieman
vollen
sinvluot
allenhalben
wësenlîch
anderhalp
ackes
obez
sus
bâbes
habech
dornach
bredige
werf
saf
nouveau haut allemand
iergend
jemand
vollends
Sintflut
allenthalben
wesentlich
anderthalp
Axt
Obst
sonst
Papst
Habicht
Dornacht
Predigt
Werft
Saft
glose
"n'importe quel"
"quelqu'un"
"complètement"
"flotte"
"partout"
"important"
"un et demi"
"axe"
"fruit"
"sinon"
"pape"
"aigle"
nom de la ville
"sermon"
"chantier naval"
"jus"
Il est temps d'établir un bilan concernant cette classe de consonnes : est-elle liée à un
contexte particulier comme les vélaires, ou est-il impossible d'établir une distribution
particulière, comme pour les glottales ?
40
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.3.5. Bilan sur les coronales
D'une manière générale, on peut dire que non seulement l'épenthèse de coronale n'est
pas imposée par la présence d'un hiatus, mais que celui-ci est loin d'être même une condition
nécessaire. Le seul cas où elle est conditionnée uniquement par l'hiatus est en réalité un cas où
un glide ne peut pas propager de la première voyelle (anglais). L'hiatus est une condition
requise mais non suffisante dans plusieurs langues (baka, gokana, knni, japonais, fula, haut
allémanique, odawa), et il n'intervient pas dans nombre d'autres. En effet, l'épenthèse de
coronale peut être requise par la langue en fin de morphème (allemand), de mot (anglais de
Bristol, allemand) ou de proposition (tunica) ; par le gabarit (amharique) ; par une frontière
morphologique seule (maltais) ou associée à la position d'attaque (asheninca campa).
La section suivante propose un récapitulatif des consonnes épenthésées dans les
langues du monde, en fonction du son épenthésé puis de la région géographique d'une part,
des contextes d'apparition de l'épenthèse liés aux différents sons d'autre part.
2.1.4. Récapitulatif des langues et des consonnes concernées
2.1.4.1. Classement par son épenthésé
Le tableau ci-dessous permet de récapituler les langues citées ici en fonction du son
épenthésé qu'elles manifestent :
(48)
vélaires
[]
[]
glottales
[h]
buginese (Mills 1975, Lombardi 1997)
uradhi (Trigo 1988, Crowley 1980, 1983, Rice 1996, De Lacy 2002a)
murut (Prentice 1971, Rice 1996)
kaingang (Yip 1992, Lombardi 1997, De Lacy 2002a)
mongol (Rialland & Djamouri 1984, Beffa & Hamayon 1975, Vaux 2003)
yucatec (Orie & Bricker 1997, Lombardi 1997, Straight 1976, De Lacy 2002a)
huariapano (Parker 1994, 1996, 1998, de Lacy 2002a)
hare et bearlake (Rice 1989, De Lacy 2002a)
chipewyan (Li 1946, De Lacy 2002a)
ayutla mixtec (Pankratz & Pike 1967, De Lacy 2002a)
langues tucanoan (Welch & Welch 1967, De Lacy 2002a)
yagua (Payne & Payne 1986, De Lacy 2002a)
fox (Bloomfield 1924, De Lacy 2002a)
hébreu moderne (Rose 1996)
tigré (Rose 1996)
nisgha (Shaw 1987, Rose 1996)
hanunoo (Schane 1973, Vaux 2003)
guajiro (Mansen & Mansen 1984, Alvarez 1995, Vaux 2003)
41
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
[]
[l]
[r]
coronales
[n]
[s]
[d]
[t]
indonésien (Cohn 1989, Cohn & McCarthy 1994, Karr & Kassin 1999, Pater 2001)
malais (Durand 1986a, McCarthy 1998, Carr & Kassin 1999, Zaharani 1998,)
makassar (Aronoff et al 1987, Broselow 1999, McCarthy 1998, McCarthy & Prince
1994)
selayarese (Mithun & Basri 1986, Lombardi 2003)
ilokano (Hayes & Abad 1989, Rose 1996, Lombardi 2003, Ortmann 1998, Rosenthall
1997)
kisar (Christensen & Christensen 1992, Lombardi 2003)
atayal (Lambert 1999)
buginese (Mills 1975, Lombardi 1997)
sundanese (Robins 1953, Lombardi 1997)
larike (Laidig 1992, Laidig & Laidig 1995, De Lacy 2002a)
hébreu moderne (Rose 1996)
arabe (McCarthy, Lombardi 2003)
tigrigna (Denais 1994)
cupeño (Crowhurst 1994, Lombardi 1997, 2003, de Lacy 2002a)
mohawk (Hale & White Eagle 1980, de Lacy 2002a)
tsishaath nootka (Stonham 1999, de Lacy 2002a)
tunica (Haas 1940, Lombardi 1997, 2003)
gokana (Hyman 1985, Lombardi 1997, 2003)
kçnni (Cahill 1999, Lombardi 2003)
langues tchadiques (de Lacy 2002a, Frayzingier & Kopo 1989)
tigré (de Lacy 2002a, Raz 1983)
tamil (Christdas 1988, Lombardi 1997, 2003)
koryak (Kenstowicz 1976, Lombardi 2003)
persan (Picard 2002, Vaux 2003)
allemand (Wiese 1996, Alber 2001)
anglais (Lombardi 2003)
bulgare (Rubach 2000)
tchèque (Kucera 1961, Rubach 2000)
anglais de Bristol (Lombardi 1997, 2003, Hugues & Trudgill 1979, Wells 1982, Gick
1999)
baka (Kleinhenz 1992, Ortmann 1998)
français québécois (Morin 1982)
gokana (Hyman 1985, Lombardi 1997, 2003)
kçnni (Cahill 1998, 1999, Lombardi 2003)
anejom (de Lacy 2002a, Lynch 2000)
japonais (Lombardi 1997, Mester & Itô 1989, de Chene 1985, Poser 1986, McCawley
1968)
anglais (Szigetvári 1994, Ortmann 1995)
espagnol sévillan (Vaux 2003)
tunica (Haas 1940, Lombardi 1997, 2003)
fula (Bagemihl 1989, Lombardi 1997)
gokana (Hyman 1985, Lombardi 1997, 2003, de Lacy 2002a)
coréen (Hong 1997, de Lacy 2002a)
murut (Prentice 1971, de Lacy 2002a)
suisse allemand (Orrtmann 1995)
espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003)
allemand (Scheer 2002)
asheninca campa (Payne 1981, Kitto & De Lacy 1999, Lombardi 1997, McCarthy &
Prince 1993)
amharique (Broselow 1984, Lombardi 1997)
odawa (Piggott 1990, Lombardi 1997, 2003)
maltais (Ortmann 1995)
allemand (Scheer 2002)
42
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Les épenthèses consonantiques dans les langues du monde se limitent donc à trois
points d'articulation :
- la vélaire []
- les glottales [h] et surtout []
- les coronales, sonantes et occlusives.
2.1.4.2. Classement par région géographique
La carte suivante17 offre une vision globale du type de consonne épenthésée par
continent ou région géographique18. Elle ne se veut aucunement limitative et vise simplement
à représenter les données rassemblées plus haut.
(49)
, r, s, t, d, n, l
h, , n, t
h, , t
, r, t
, h, , r
, r, n, l
, h, t
Cette représentation permet d'aboutir à la conclusion somme toute attendue que les
sons épenthésés ne sont pas propres à une région du globe plutôt qu'à une autre ; les éventuels
"trous" dans la distribution - pas de vélaire épenthétique en Europe ou en Afrique, pas de coup
de glotte en Amérique du Sud - doivent donc être imputés à un manque de données plutôt qu'à
un éventuel paramètre linguistique.
17
Fond de carte issu de http://www.graphicmaps.com/atlas/world.htm
Les [l] enregistrés en français québécois ne figurent pas avec le continent américain, dans le sens où ont été
reportées sur ce continent "uniquement" les langues amérindiennes, natives, et non celles issues de langues
européennes comme le français ou l'anglais.
18
43
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
En ce qui concerne le français, on ne rencontrera que deux types d'épenthèses, toutes
deux coronales : l'épenthèse en fricative le plus souvent sonore et en occlusive le plus souvent
sourde (cf. section I [1] 3). C'est pourquoi il semble pertinent de s'intéresser de plus près à
cette catégorie de consonnes que sont les coronales.
2.1.5. Contextes syllabiques d'épenthèse en fonction du son épenthésé
Lors du passage en revue des consonnes observables en épenthèse, j'ai précisé leurs
contextes d'apparition. Dans ce bilan sont distinguées les deux positions possibles pour une
consonne : la "coda" et l'"attaque"19. Il ne s'agira pas ici de distinguer de contextes
déclencheurs, ce qui sera réservé à la section 2.2, mais uniquement de repérer et d'évaluer
quantitativement les positions syllabiques où l'on observe des épenthèses. Précisons ici que
n'ont pas été abordées les langues pour lesquelles l'épenthèse n'est pas aisément classable en
termes de coda et d'attaque (cf. section 2.2.1).
Pour de Lacy (2002a : 190), "of the epenthetic consonants, [n  l] seem to be
acceptable epenthetic codas. Epenthetic onsets are typically [ t h] or a homorganic glide
[j w] and perhaps []." A la lumière des langues et des épenthèses répertoriées au long de la
section 2.1, peut-on confirmer cette impression ?
2.1.5.1. Sons épenthésables en coda
On observe en coda toutes les catégories de sons répertoriées : des vélaires comme des
glottales et des coronales. Je distinguerai ici trois cas de figure : les épenthèses que l'on ne
trouve qu'en fin de proposition pour une langue donnée, celles que l'on trouvera en fin de mot,
et celles qui seront dans n'importe quelle coda de la langue où qu'elle se situe dans une unité
supérieure (fins de proposition et de mot comprises).
2.1.5.1.1. Fin de proposition
Trois langues parmi l'inventaire dressé ici utilisent l'épenthèse pour satisfaire une
structure de proposition en coda : l'uradhi (cf. section 2.1.1.), qui épenthèse la nasale vélaire ;
19
J'emploie ici les termes de "coda" et d'"attaque" dans leur acception courante, sans leur associer de quelconque
statut à l'intérieur d'une théorie donnée. La "coda" est donc entendue comme la position post-nucléaire d'une
syllabe, tandis que l'"attaque" renvoie au(x) segment(s) pré-nucléaire(s) de la syllabe.
44
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
le knni (cf. section 2.1.2.2.) qui préfère le coup de glotte ; le tunica (cf. section 2.1.3.2.) qui
choisit la dentale nasale.
Le tableau ci-dessous récapitule ces trois langues avec leurs références et un exemple
lorsqu'il en était de disponible :
(50)
langue
uradhi
knni
tunica
références
Trigo 1988, Crowley
1980, 1983, Rice
1996, de Lacy 2002a
Cahill 1999, Lombardi
2003
Haas 1940, Lombardi
1997, 2003
son
épenthésé
[]
forme sousjacente
/ama/
illustration
réalisation en fin de réalisation
proposition
ailleurs
glose
[ama]
[ama]
"personne"
[hatikan]
[hatika]
"encore"
[]
[n]
Plus nombreuses sont les langues ici répertoriées qui font appel à l'épenthèse
consonantique en fin de mot.
2.1.5.1.2. Fin de mot
Il s'agit ici des langues qui comportent une épenthèse en coda lorsque celle-ci est en
fin de mot, mais non lorsqu'elle se situe à l'intérieur du mot. Les glottales sont toutes deux
concernées par cette position : [h] en yucatec et en guajiro (cf. section 2.1.2.2.), [] en atayal,
makassar et cupeño (cf. section 2.1.2.2.). Deux coronales s'y intéressent également, chacune
représentée par une langue : [l] est épenthésé en fin de mot en anglais de Bristol (cf. section
2.1.3.1.), [t] (et [d]) en allemand (cf. section 2.1.3.4.). Dans ce dernier cas, précisons que
l'épenthèse s'observe en diachronie, et qu'elle concerne également le début de morphème (cf.
section 2.2).
Le tableau suivant rappelle par un exemple (lorsque la littérature afférente en fournit)
la situation de ces langues :
45
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(51)
langue
yucatec
guajiro
atayal
son
illustration
épenthésé forme sous-jacente réalisation en fin de mot
glose
Orie & Bricker 1997,
[h]
Lombardi 1997, Straight
1976, de Lacy 2002a
Mansen & Mansen 1984,
"lune"
[h]
[kaih]
Alvarez 1995, Vaux 2003
Lambert 1999
"mettre"
[]
/am + si/
[sami]
références
makassar Aronoff et al. 1987,
Broselow 1999, McCarthy
1998, 2002, McCarthy &
Prince 1994
Crowhurst 1994, Lombardi
cupeño
1997, 2003, de Lacy 2002a
Lombardi 1997, 2003,
anglais
de Bristol Hugues & Trudgill 1979,
Wells 1982, Gick 1999
allemand Scheer 2002
buginese Mills 1975, Lombardi 1997
[]
/jamal/
[jamala]
"vilain"
[]
/kwa/
[kwa]
"manger"
mha : ieman
nha : jemand
"quelqu'un"
"thé"
[l]
[t]
[]
[te]
Le dernier cas d'épenthèse en "coda", après l'épenthèse en fin de proposition et celle en
fin de mot, concerne tout simplement la finale de syllabe, quelle que soit la position de celleci dans une unité supérieure - mot, proposition, unité intonationnelle.
2.1.5.1.3. Fin de syllabe
Trois langues de l'inventaire établi ici sont concernées, dont deux avec la même
consonne épenthétique : [h] (cf. section 2.1.2.1). Il s'agit de deux langues amérindiennes,
l'ayutla mixtec (Pankratz & Payne 1986, de Lacy 2002a ) et l'huariapano (Parker 1994, 1996,
1998, de Lacy 2002a). L'espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003) épenthèse
quant à elle un [s] (cf. section 2.1.3.3.) dans cette position.
Nous venons de rappeler quelles langues ont recours à l'épenthèse consonantique en
coda. Cependant, la plupart des langues qui ont été répertoriées ici épenthèsent une consonne
en attaque, comme on va le voir dans la section suivante.
2.1.5.2. Sons épenthésables en attaque
Seules les glottales et les coronales sont épenthésables en attaque, aucune vélaire
n'étant attestée dans l'inventaire établi en début de section 2.1. Comme dans le cas de la coda,
46
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
on peut ici distinguer les trois catégories suivantes : les épenthèses en début d'unité supérieure
(proposition ou intonation), celles en début de mot, et celles en début de syllabe.
2.1.5.2.1. Début d'unité supérieure
Le coup de glotte est le seul son auquel il soit fait appel en début d'une unité plus
grande que le mot (cf. section 2.1.2.2.), et ce dans deux langues : l'anglais pour l'initiale de
proposition, et le selayarese pour celle d'intonation.
(52)
langue
anglais
selayarese
illustration
son
épenthésé réalisation en initiale réalisation ailleurs
glose
Lombardi 2003
"anguille"
[]
[ijl]
[ijl]
Lombardi 2003, Mithun
"ceci"
[]
[inni]
[inni]
& Basri 1986, Broselow
1982
références
Intéressons-nous maintenant aux langues qui épenthèsent une consonne en début de
mot.
2.1.5.2.2. Début de mot
Il s'agit ici des langues qui ne font appel à l'épenthèse que pour une attaque en début
de mot lorsque le matériel lexical ne fournit pas de consonne.
Là encore, les huit langues inventoriées ont recours uniquement au coup de glotte (cf.
section 2.1.2.2.). On en trouve le rappel dans le tableau suivant :
(53)
langue
kisar
arabe
tamil
koryak
gokana
allemand
bulgare
tchèque
références
Lombardi 2003,
Christensen & Christensen
1992
Lombardi 2003
Christdas 1988, Lombardi
2003
Kenstowicz 1976,
Lombardi 2003
Hyman 1985, Lombardi
1997, 2003
Scheer 2000a, Alber 2001,
Hall 1992, Wiese 1996
Rubach 2000
Kucera 1961, Rubach 2000
son
illustration
épenthésé forme sous-jacente réalisation à l'initiale
glose
/eni + eni/
"celui-ci"
[]
[enieni]
[]
[]
[ismaq]
[aas]
"écoute"
"espoir"
[ajatk]
"tomber"
[]
[awtoo]
"voiture"
[]
[]
[u]rnata
[i]diot
"urne"
"idiot"
[]
/ismaq/
/aacaj/
[]
47
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Vient enfin l'endroit où l'on relève le plus d'épenthèse à travers les langues : le début
de syllabe, où que soit cette syllabe.
2.1.5.2.3. Début de syllabe
La plupart des langues qui épenthèsent une consonne en début de syllabe le font en
hiatus vocalique. Ce n'est cependant pas une règle absolue, en témoignent des langues comme
le malais, le tigrigna ou le maltais, qui attestent des insertions après coda. La position
d'initiale de syllabe n'est en effet pas, moins encore que pour les autres contextes proposés ici,
déterminante dans l'apparition d'une épenthèse ; elle n'en est bien souvent qu'une condition
nécessaire (cf. section 2.2).
On peut citer ici le mongol pour les épenthèses de vélaires, avec les réserves émises en
section 2.1.1 quant à la réalité de l'épenthèse. Ce serait alors le seul cas relevé dans deux
catégories : la seule épenthèse de vélaire orale, et la seule épenthèse de vélaire en attaque.
Parmi les glottales, seuls les dialectes hare et bearlake de la langue slavey et le
hanunoo attestent d'une épenthèse de [h] en initiale de syllabe (cf. section 2.1.2.1), toutes les
autres attestations concernant le coup de glotte (cf. section 2.1.2.2).
Les quatre coronales répertoriées fournissent des cas d'épenthèse dans cette position :
les liquides en baka, gokana, knni, japonais, espagnol sévillan et anglais (cf. section 2.1.3.1),
la nasale en fula, gokana et haut alémanique (cf. section 2.1.3.2), et l'occlusive en asheninca
campa, odawa et maltais (cf. section 2.1.3.4).
Le tableau suivant offre une vue synthétique de l'ensemble des données concernées,
avec une illustration lorsque celle-ci est disponible :
48
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(54)
langue
références
Rialland & Djamouri 1984,
Beffa & Hamayon 1975, Vaux
2003
et Rice 1989, de Lacy 2002a
mongol ?
hare
bearlake
hanunoo
Schane 1973, Vaux 2003
son
épenthésé
[]
[h]
forme sousjacente
/le + i + wee/
[]
[]
Cahill 1998, 1999, Lombardi
2003
Lombardi 1997, Mester & Itô
1989, de Chene 1985, Poser
1986, McCawley 1968
Vaux 2003
[lehiwee]
glose
[usahi]
"nous coupons
en deux"
"mets-le en un"
/di + ambil/
[diambil]
"pris"
/mula + i/
[mulai]
"aveugle"
[kuurai]
[h]
indonésien Carr & Kassin 1999, Pater 2001,
Cohn 1989, Cohn & McCarthy
1994
Carr & Kassin 1999, Zaharani
malais
1998, Durand 1986a, McCarthy
1998
selayarese Lombardi 2003, Mithun & Basri
1986
Hayes & Abad 1989, Rose 1996,
ilokano
Lombardi 2003, Ortmann 1998,
Rosenthall 1997
Picard 2002, Vaux 2003
persan
Cahill 1998, 1999, Lombardi
knni
2003
allemand Wiese 1996, Alber 2001, Hall
1992, Scheer 2001
Janda & Townsend 2000,
tchèque
Palková 1997
Denais 1994
tigrigna
Kleinhenz 1992, Ortmann 1998
baka
Hyman 1985, Lombardi 2003
gokana
illustration
réalisation à
l'initiale
[dalaiaas]
[]
[]
/lailo/
[lailo]
"je
l'accompagne"
"affectionate"
[]
[]
/zaa + u/
[zaau]
"enceinte"
[ka'oot]
"chaotique"
[]
[]
/pro + ud + i/
[proi]
[]
/sahafi + u/
[sahafiu]
"fumera
à
travers"
"son écrivain"
[l]
[r]
/soo/
[solo]
[oo sii rii]
"sécher"
"vous attrapiez"
[r]
[dara]
"jour
[r]
tabe-ru
"manger,
présent"
[r]
chaleres
"chalet"
Szigetvári 1994, Ortmann 1995
[r]
Indi[r] and
"l'Inde et"
fula (jeu)
gokana
Bagemihl 1989, Lombardi 1997
Hyman 1985, Lombardi 2003
[n]
[n]
"mère"
"il faisait"
haut
alémaniqu
e
asheninca
campa
Ortmann 1995, Heusler 1888,
Weinhold 1863
[n]
daana
[oo naa-n]
wo [n] er
[t]
/i +  + koma + [ikomati]
i/
"il pagaiera"
odawa
Kitto & De Lacy 1999, Payne
1981, Lombardi 1997, McCarthy
& Prince 1993
Piggott 1990, Lombardi 2003
[t]
"mon bus"
maltais
Ortmann 1995
[t]
/ni + ompass/
/zewg + hbieb/
knni
japonais
espagnol
sévillan
anglais
[nitompass]
[zewgt ihbieb]
"quand il"
"deux amis"
On remarquera ici la double présence du knni, due au fait que d'autres facteurs que la
position interviennent dans la distribution de l'épenthèse, et du gokawa puisque le contexte
49
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
influence la qualité de la consonne épenthésée. Cependant, dans cette partie il ne s'agit que de
situer l'épenthèse et non d'expliquer son apparition, objet de la section 2.2.
2.1.5.3. Tableau récapitulatif
Le tableau suivant permet de récapituler les endroits où l'on trouve des épenthèses
dans les langues du monde présentées ici, en fonction de la nature du son épenthésé comme
de la classe à laquelle ce son appartient :
(55)
[]
[]
[h]
fin de
proposition
uradhi
/
/
"coda"
fin de mot
buginese
/
yucatec
atayal
makassar
cupeño
fin de
syllabe
/
/
ayutla mixtec
huariapano
/
anglais
selayarese
(unité
d'intonation)
"attaque"
début de mot
/
/
/
/
/
/
anglais de
Bristol
/
kisar
arabe
tamil
koryak
gokana
allemand
bulgare
tchèque
/
/
/
/
tunica
/
/
/
/
/
allemand
/
/
/
knni
[]
[l]
début de
proposition
/
/
/
/
[r]
[n]
[t]
début de
syllabe
/
(mongol)
hare et
bearlake
indonésien
malais
tigrigna
selayarese
ilokano
knni
allemand
tchèque
baka
gokana
knni
japonais
anglais
fula (jeu)
gokana
haut
alémantique
asheninca
campa
odawa
maltais
vélaires
glottales
coronales
Est mise en évidence ici la prépondérance, au moins quantitative, de l'attaque sur la
coda en regard de l'épenthèse consonantique, et particulièrement du début de syllabe : en
dehors de la nasale vélaire, tous les sons relevés sont épenthésables dans cette position. A
l'intérieur de la position "coda", c'est la fin de mot qui est la plus diversement attestée.
On constate par ailleurs une relative distribution complémentaire entre les deux
consonnes glottales : en-dehors précisément de ces deux contextes de début de syllabe et de
fin de mot que l'on vient d'identifier comme plus ou moins généraux, c'est tantôt l'une, tantôt
50
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
l'autre qui apparaît en épenthèse : le coup de glotte privilégie les extrémités des propositions
et le début de mot, mais ne se manifeste pas en fin de syllabe ; la fricative glottale au contraire
n'intervient qu'en fin de syllabe et non dans les autres contextes. Faut-il voir là un universal
concernant ces deux consonnes, ou une manifestation de l'opposition occlusive / fricative en
ce qui concerne les épenthèses ? Cette dernière hypothèse se vérifie ici : tous les autres sons
épenthésables sont occlusifs, et aucun en-dehors de [h] n'est possible en fin de syllabe. Il
semble donc que ce contexte sélectionne les fricatives, donc [h], la seule disponible dans cet
inventaire.
La fin de proposition se distingue également, dans le sens où elle privilégie les nasales
dans chaque classe de sons, quand il y en a ; à défaut, elle choisit l'occlusive correspondante.
Ainsi a-t-on [] pour les vélaires et [n] pour les coronales, mais [] pour les glottales puisque
aucune nasale n'est disponible.
On remarquera enfin que pour les attaques qui ne sont pas de la catégorie générale,
seul le coup de glotte est habilité à être épenthésé, et ce sur l'ensemble des trois catégories de
consonnes.
A ce niveau, il est possible d'amender la proposition de de Lacy (2002a) citée en début
de section et rappelée ici : "of the epenthetic consonants, [n  l] seem to be acceptable
epenthetic codas. Epenthetic onsets are typically [ t h] or a homorganic glide [j w] and
perhaps [].". Outre [n], [] et [l], [h] s'avère également possible en coda, dans davantage de
langues que les trois sons cités par de Lacy ; [] et [t] sont également acceptables dans cette
position. De même, en attaque la quasi-totalité des sept sons épenthésables sont possibles et
non seulement les glottales et [t], seule [] étant exclue dans cette position. En ce qui
concerne les glides homorganiques, on a vu que leur distribution en tant qu'"épenthèse" était
complémentaire dans certaines langues de celle du coup de glotte.
Afin de mieux mettre en évidence les particularités de chacun des trois grands groupes
de consonnes - vélaire, glottal, coronal - qui sont concernées par le phénomène de l'épenthèse,
on trouvera dans le tableau suivant les trois classes de consonnes mises en relation avec les
endroits où elles sont présentes en tant qu'épenthèses dans les langues du monde.
51
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
"coda"
(56)
vélaire
glottales
coronales
fin de
proposition
9
9
9
"attaque"
fin de mot
fin de syllabe
début de
proposition
9
9
9
9
9
début de mot
9
début de
syllabe
9
9
Ce tableau met en évidence de façon très nette la primauté des glottales sur les autres
lieux d'articulation intéressés par l'épenthèse. Un classement simple en "coda" et "attaque"
aurait pu laisser croire la même latitude pour les coronales, mais on voit ici que bien qu'elles
soient deux fois plus nombreuses à intervenir (quatre coronales vs. deux glottales), leurs
contextes d'apparition sont deux fois plus restreints que les glottales. La catégorie des vélaires
avec son seul représentant ne figure que dans deux des contextes sur les six distingués ici.
Il est vrai que ne figurent dans ces tableaux récapitulatifs que les langues pour
lesquelles la littérature a fourni suffisamment de détails pour permettre de statuer, aussi est-il
nécessaire que les généralisations ici observées soient tempérées à la lumière de davantage de
données. Cependant, ces tendances sont suffisamment fortes pour valider l'hypothèse
présentée en introduction du caractère plus général des épenthèses de glottales et plus
anecdotiques des épenthèses des autres lieux d'articulation.
2.1.6. Bilan de la section
L'ensemble de cette section 2.1. a permis de prendre contact avec le phénomène de
l'épenthèse à travers les langues du monde, et d'en apprécier l'étendue.
Par ailleurs, certaines observations concernant la nature de la consonne épenthésée en
regard de son emplacement dans les unités phonologiques ont pu être formulées.
Ont été ainsi mises en évidence l'absence de certaines consonnes dans le phénomène,
particulièrement des labiales mais également de certaines coronales, palatales et vélaires, qui
brillent par leur absence.
Parmi les consonnes qui apparaissent en épenthèse, des contextes ont été dégagés : les
glottales sont disponibles quelle que soit la position dans la syllabe, le mot ou une unité
supérieure, les coronales se manifestent en coda comme en attaque, mais pas dans des soussections de ces catégories, et les vélaires ne se manifestent qu'en fin de proposition. A
l'intérieur de la catégorie des glottales a été mise en évidence une complémentarité quant aux
52
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
positions que [h] et [] sont susceptibles d'occuper, et certains contextes semblent privilégier
un mode articulatoire particulier : la fin de proposition donne la priorité aux nasales, les
débuts de proposition et de mot aux occlusives.
A l'issue de cette première section, le choix d'une consonne épenthésée plutôt que
d'une autre dans les langues du monde est maintenant plus explicite. Mais on ne sait encore
que peu de choses sur les motivations de l'apparition même d'une épenthèse. C'est ce qui va
faire l'objet de la section suivante.
2.2. Pourquoi
Pourquoi les langues choisissent-elles d'avoir recours à l'épenthèse ? Quelles sont les
raisons phonétiques, structurales ou morphologiques invoquées ? Pour reprendre Lambert
(1999 : 50) en effet, "epenthesis is often seen as triggered by something – epenthesize only
when necessary."
Dans cette partie seront abordées les causes proposées dans la littérature concernant
l'épenthèse. Les motivations spécifiques au cas plus particulier de l'épenthèse entre radical et
suffixe en français seront traitées dans la section 3 de ce même chapitre.
Je distinguerai trois grandes motivations. La première concerne les épenthèses
consonantiques au sein d'un groupe de consonnes, les deux dernières sont de portée plus
générale.
La première explication avancée est la résolution de groupes de consonnes interdits
par la langue, à laquelle l'ajout d'une consonne occlusive permet de se conformer.
Sont ensuite évoquées les contraintes structurales, du niveau de la proposition jusqu'à
celui de la syllabe.
Je terminerai cet inventaire en mentionnant les motivations extralinguistiques pouvant
entrer en jeu dans la présence d'une consonne non étymologique, non sous-jacente et non
conditionnée par le contexte.
53
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.2.1. Coarticulation et résolution de groupes de consonnes interdits
Les cas d'épenthèses présentés ici ne correspondent pas exactement à la définition qui
est retenue de l'épenthèse dans le cadre de cette étude (cf. section 1). La nature de la consonne
"parasite" dépend en majeure partie du contexte : dans un phénomène ns > nts par exemple, si
[dental] relève du contexte, l'occlusion n'est héritée ni de [n], ni de [s]. Or, j'ai admis que
n'importe quel élément, aussi petit soit-il, peut être envisagé comme épenthésé. Dans le cas
d'épenthèses au sein d'un groupe de consonnes, deux explications sont avancées : un
phénomène de coarticulation tout d'abord, qui serait exclusivement phonétique et qui donc
exclurait totalement ces cas de mon étude. Un phénomène de résolution de groupes de
consonnes, qui peut, selon l'interprétation que l'on lui en donne, impliquer une épenthèse au
sens où je l'entends ici : le contexte pose un problème et fournit une partie des éléments de
réponse, mais l'aspect occlusif de la consonne épenthésée n'est pas issu de l'environnement de
la consonne et peut donc être considéré comme une épenthèse de trait ou même simplement
de position.
Je commencerai par présenter les épenthèses après consonnes sonantes avant de
m'intéresser à celles devant liquides. Dans un troisième paragraphe je mentionnerai un cas
d'épenthèse après consonne à la finale, qui ne semble correspondre à aucun des cas décrits ici.
2.2.1.1. Epenthèses après sonantes
Une explication traditionnellement avancée à l'apparition d'une consonne épenthétique
dans un contexte consonantique, alors qu'il s'agit là d'une augmentation de la complexité de
l'ensemble, est le phénomène de coarticulation : le son épenthésé assurerait la transition
articulatoire entre les deux consonnes qu'il joint. On peut citer par exemple Wetzels (1985 :
285) : "intrusive stops are traditionally understood as sounds emerging at the phonetic surface
as the result of specific coarticulation effects, generally involving the manner of articulation
features 'nasal', 'continuant', and 'lateral'".
Cette hypothèse est cependant largement concurrencée par une analyse en termes de
résolution de groupes de consonnes interdits dans une langue donnée. Dans une première
sous-section, je vais m'intéresser aux épenthèses devant obstruantes, puis à celles pour
lesquelles le deuxième élément du groupe est indifférent.
54
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.2.1.1.1. Devant obstruantes
En anglais (Wetzels 1985 : 288, Clements 1987 : 32 ; également Piggott & Singh
1985 : 419-420), une occlusive peut être facultativement insérée dans des groupes de
consonnes dont le premier élément est une nasale, pourvu que l'obstruante suivante
n'appartienne pas à l'attaque d'une syllabe accentuée. Le tableau suivant illustre chacun des
cas possibles :
(57)
_s
nts
(sense)
lts
(false)
mps
(hamster)
ks
(youngster)
n_
l_
m_
_
_
nt
(ninth)
lt
(health)
mp
(warmth)
k
(length)
_
nt
(censure)
lt
(Welsh)
mp
(assumption)
k
(anxious)
_f
/
_t
/
/
/
mpf
(triumph)
/
mpt
(dreamt)
/
La consonne épenthésée est une occlusive non-voisée, homorganique de la première
consonne du groupe. Si l'on considère par exemple le terme dreamt, sont en contact au niveau
sous jacent la nasale [m] et l'occlusive [t]. La consonne épenthésée [p] a récupéré le lieu
d'articulation de la première consonne, en l'occurrence ici le lieu labial, et non de la deuxième,
sans quoi elle serait coronale.
Ce type d'épenthèse s'observe également en variation libre en gallois (Wetzels 1985 :
288) comme les exemples suivants l'illustrent :
(58)
hemt
variante sans épenthèse
variante avec épenthèse
hempt
"chemise"
glose
hemden
hembden
"chemises"
komt
kompt
(il) "vient"
hat
hakt
(il) "pend"
La variation dans le voisement de la consonne épenthésée paraît dépendre de celui de
la consonne suivante : lorsque celle-ci est voisée, la consonne intruse l'est également.
En allemand, (cf. Wiese 1996 : 233), le groupe de consonnes déclencheur d'une
épenthèse facultative est composé d'une consonne sonante suivie d'une consonne fricative. On
55
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
peut concevoir que cette consonne est épenthétique puisqu'elle n'est pas présente dans le
pluriel des formes l'attestant au singulier, comme le tableau suivant le montre :
(59)
Singulier sans
épenthèse
ans
Singulier avec
épenthèse
ants
Pluriel sans
épenthèse
nz
Pluriel avec
épenthèse
*ntz
Gans, Gänse
vams
vamps
vmz
*vmpz
Wams, Wämser
hals
halts
hlz
*hltz
Hals, Hälse
Graphie
Glose
"oie"
Là encore, la consonne épenthésée est homorganique de la première consonne du
groupe dans lequel elle s'inscrit.
On pourrait penser que ce type d'épenthèses est propre au groupe germanique.
Pourtant, Wetzels (1985 : 288) signale une consonne épenthétique qui apparaît, entre le latin
et l'ancien français, entre une nasale et un [s] final. Laborderie (1994 : 77-78 ; 84) ajoute le
contexte [_s], si bien que l'épenthèse concerne le cas plus général des sonantes suivies de [s]
en finale. Bourciez (1967 : 165) mentionne les deux types de contextes ; pour lui, il s'agirait
plutôt d'une question de prononciation ("ce z prononcé ts"). Le groupe final est par la suite
repassé à s puis s'est amuï. Le tableau suivant photographie la situation au moment où
l'épenthèse est attestée :
(60)
latin
vieux français
glose
annos
ants
"années"
ponos
points
"poing"
enoclos
enults
"genou"
consilius
conseutz
"conseil"
Dans les deux premiers termes, la chute du [o] entraîne la mise en contact de la nasale
avec [s] à la finale, le conflit étant résolu par l'épenthèse de la consonne occlusive
homorganique de la consonne précédente. Dans les deux derniers, le [l] s'est palatalisé du fait
de sa présence à la suite de l'occlusive vélaire ou devant un yod (genoclos et consilius
respectivement) ; en contact avec [s] suite à la chute du [o] pour genoclos et du [u] pour
consilius, il a favorisé l'apparition d'une consonne homorganique.
Dans ce cas encore, le voisement ne vient pas de la première consonne mais de la
seconde, ce qui explique que l'épenthèse soit non voisée.
56
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Ce qui est facultatif pour les langues germaniques doit recevoir une explication en
termes de coarticulation, l'aspect facultatif de l'épenthèse démontrant que le groupe de
consonnes dans laquelle elle s'inscrit n'est pas interdit par la langue.
Cette explication tombe au rang de simple candidate en ce qui concerne l'ancien
français, puisque cette fois l'épenthèse est obligatoire à partir du moment où la nasale est
entrée en contact avec la fricative, lors de la chute de la voyelle. Il semblerait donc qu'il faille
dans ce cas privilégier l'hypothèse du groupe interdit. Bourciez (1967 : 193) signale d'ailleurs
que "le groupe ns n'existait déjà en latin que graphiquement, s'étant de très bonne heure réduit
à s simple dans la prononciation". Face au groupe [ns], le latin a opté pour la troncation de la
nasale, l'ancien français pour l'épenthèse d'une consonne intermédiaire.
Après l'épenthèse au sein d'un groupe [nasale + obstruante] considérons le cas où la
deuxième consonne peut être une sonante.
2.2.1.1.2. Devant sonante ou obstruante
Jones (1976 : 124-125 ; cf. également Piggott & Singh 1985 : 418, Wetzels 1985 :
287) relève un cas d'épenthèse derrière sonante entre le vieil et le moyen anglais. Le
deuxième élément du groupe dans lequel la consonne s'inscrit peut être une obstruante comme
une sonante, comme l'illustre le tableau ci-dessous :
(61)
contexte
devant obstruante
a. derrière nasale devant nasale
bilabiale
vieil anglais
æmti
moyen anglais
empti
glose
nemnan
nempne
"nommer"
scea(m)ol
schambel
"tabouret"
ym(e)l
imble
"dé à coudre"
"vide"
b. derrière nasale devant liquide
coronale
on(o)r
under
"tonnerre"
spin(e)l
spindel
"fuseau"
c. derrière liquide
alre (acc)
alder
"eux tous"
La consonne épenthésée est homorganique de la première consonne du groupe, comme
dans tous les cas d'épenthèse interconsonantique relevés jusqu'à présent. La variation de
voisement est quant à elle due à la deuxième consonne : dans le cas des sonantes, la consonne
épenthétique est voisée, mais non-voisée devant une occlusive sourde.
57
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Etant donné le caractère obligatoire de cette épenthèse, l'hypothèse du groupe de
consonnes interdit est privilégiée sur la coarticulation. Il semblerait donc que la langue rejette
des groupes composés de deux nasales ([mn]) ou de deux sonantes ([nl], [nr], [ml]), ainsi que
la séquence [mt], ce dernier cas étant plus surprenant puisque les deux consonnes
appartiennent à deux classes différentes.
Dans ce cas, et bien que la nature de la consonne épenthésée soit partiellement
déterminée par le contexte, il reste que la position, voire le trait occlusif, sont des apports de
matériel ex nihilo.
Le deuxième cas distingué, après l'épenthèse derrière sonante, est l'épenthèse devant
liquide. Les deux ne s'excluent pas l'un l'autre : nombre d'exemples attestent l'apparition d'une
consonne entre sonante et liquide.
2.2.1.2. Epenthèse devant liquide
En ancien français (Bourciez 1967 : 195 ; 188 ; 162 ; cf. également Piggott & Singh
1985 : 419, Walker 1978 : 66, Wetzels 1985 : 286-287, Morin 1980) on observe des
épenthèses consonantiques devant les liquides, précédées de nasales ou liquides, mais
également derrière les fricatives [s] et [z] comme l'illustre le tableau suivant :
(62)
contexte
m_r
m_l
(a) derrière nasale
n_r
(b) après liquide
l_r
z_r
(c) après [s] ou [z]
s_r
latin
cam(e)ra
*remem(o)rare
sim(u)lare
cum(u)lu
cin(e)re
pon(e)re
ven(i)re-habeo
*ven(e)risdie
mol(e)re
*col(u)ru
*vol(e)re-habeo
fall(e)re-habet
co(n)s(ue)re
*las(a)ru
*cis(e)ra
*ess(e)re
antecess(o)r
ancien français
chambre
remembrer
sembler
combre
cendre
pondre
vendrai
vendredi
moldre
coldre
voldrai
faldra
cosdre
lasdre
cisdre
estre
ancestre
français moderne
viendrai
moudre
coudre
voudrai
faudra
coudre
ladre
cidre
être
ancêtre
58
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Les changements notés dans ce tableau ne concernent pas le point abordé ici : [l] s'est
vocalisé en [u] (Bourciez 1967 : 187), [z] et [s] devant consonnes se sont effacés (Bourciez
1967 : 162).
Les épenthèses derrière consonne nasale (a) et liquide (b) correspondent également au
cas traité dans le paragraphe précédent (2.2.1.1.2.), puisqu'il s'agit d'épenthèse derrière
sonantes. Cependant, les obstruantes sont exclues du deuxième élément du groupe
consonantique, aussi les classera-t-on préférentiellement ici.
Il faut conclure de ce tableau que les séquences de nasales suivies de liquides ([mr],
[ml], [nl], de liquides ([lr]) et de fricatives suivies de liquides ([zr], [sr]) sont interdites. Mises
en contact par la chute de la voyelle atone, les consonnes ont réagi en produisant une
consonne homorganique de la première consonne. On ne peut cependant pas ici attribuer son
voisement à la seconde puisque dans le contexte s_r, c'est [t] qui est épenthésé et non [d]. Le
voisement est ici dépendant de la première consonne.
Ce phénomène d'épenthétisation s'observe dans d'autres langues romanes (Wetzels
1985 : 287) :
(63)
contexte
espagnol
italien
m_
n_
l_
m_
s_
l_
latin
hom(i)nem
ven(i)ra
sal(i)ra
mem(o)rare
pess(u)lus
slavo
langue moderne
hombre
vendra
saldra
membrare
peskjo
skjavo
glose
"homme"
"il viendra"
"il partira"
"mémoriser"
"pierre"
"esclave"
S'ajoute en ce qui concerne les groupes [skl] une glidicisation du [l].
En anglais (Wetzels 1985 : 288, Clements 1987 : 32, également Piggott & Singh
1985 : 419-420), une épenthèse d'occlusive se rencontre dans un groupe donc le deuxième
élément est une liquide et le premier une sonante ou une fricative. Le tableau suivant illustre
les combinaisons attestées dans le deuxième cas, c'est-à-dire devant consonne liquide, par les
auteurs cités. Aucun exemple n'est malheureusement fourni.
59
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(64)
_r
deuxième
élément
liquide
_l
s_
str
skl
z_
zdr
/
m_
mbr
mbl
n_
ndr
l
l_
ldr
/
Là encore, le voisement comme le lieu d'articulation de la consonne épenthésée
proviennent de la première consonne.
Il en va de même en grec ancien et en gallois (Wetzels 1985 : 287) ainsi qu'entre
l'indo-européen, le germanique et le slave (Bloomfield 1933 : 384), comme l'attestent les
exemples suivants :
(65)
contexte
grec
gallois
vieil anglais
vieux bulgare
m_
n_
s_
l_
s_
s_
langue ancienne
*gam-ros
*anr-os
s(i)roop
polre
*srow
*srow
langue moderne
gambros
andros
stroop
polder
strem
struja
glose
"marié"
"homme" (génitif)
"sirop"
"terre"
Les cas d'épenthèses devant liquide sont tous obligatoires, ainsi que tous
diachroniques, comme l'était celui de l'épenthèse en ancien français dans le contexte [n_s].
Tous sont considérés être provoqués par la mise en contact "malheureuse" de deux consonnes,
dont l'une au moins est une sonante, dont le groupe est interdit par la langue. Si l'on peut
déduire le lieu d'articulation ainsi que le voisement du contexte, le mode articulatoire comme
la position même de la consonne "intruse" sont quant à eux épenthétiques.
Tournons-nous vers un cas nettement plus obscur, le cas de l'épenthèse en finale après
consonne.
2.2.1.3. Epenthèses en finale après consonne : diachronie de l'allemand
Nous avons eu l'occasion d'observer en section 2.1. des épenthèses consonantiques en
finale de mot : en yucatec ([h]), en atayal, makassar et cupeño ([]), en anglais de Bristol ([l]).
L'allemand, qui épenthèse [t] ou [d] en fin de mot en diachronie, faisait également partie de
l'inventaire. Cette dernière langue doit pourtant faire l'objet d'une attention particulière. En
60
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
effet, on ne peut imputer à une exigence structurale l'épenthèse qu'elle manifeste, puisque
celle-ci a lieu derrière une autre consonne et non derrière une voyelle comme dans le cas des
autres langues citées ici.
De plus, la mélodie de la consonne épenthésée dépend en partie de son environnement
puisque le voisement est dicté par la consonne précédente, alors que dans les autres langues
qui épenthèsent une consonne à la finale c'est toujours la même qui s'y trouve, la consonne
"par défaut". Le tableau suivant (cf. Paul et al. 1881 : 161, voir aussi Scheer 1996 : 189-190 ;
2002 : 11) propose un récapitulatif du phénomène, qui ne se produit qu'après [n, r, s, , f, (g)]
finaux (fin de mots ou de morphèmes), entre le moyen-haut allemand et l'allemand actuel :
(66)
nrsgf-
moyen haut allemand
iergen
ieman
sinvluot
wësenlîch
anderhalp
ackes
bâbes
habech
dornach
bredige
saf
werf
nouvel haut allemand
irgend
jemand
sintflut
wesentlich
anderthalp
Axt
Papst
Habicht
Dornacht
Predigt
Saft
Werft
glose
"quelque"
"quelqu'un"
"un et demi"
"hache"
"pape"
"autour (subst)"
ville
"prêche"
"jus"
"chantier naval"
Cette fois l'épenthèse ne se limite pas au contexte post-sonant puisque l'on constate des
épenthèses après fricatives ([s], [], [f]) et même après occlusive ([g]).
On ne peut arguer du même raisonnement coarticulatoire que lorsque l'épenthèse se
situe à l'intérieur de mot, entre deux morphèmes dont la consonne finale du premier donnerait
son caractère occlusif et son lieu d'articulation, voire son voisement, et la seconde au mieux le
voisement. En revanche, en ce qui concerne la finale de mot, le raisonnement ne tient plus :
d'une part, il ne s'agit plus d'épenthèse au sein d'un groupe de consonnes mais uniquement
après une consonne ; d'autre part, seule les occlusives coronales sont épenthésées, et ce même
après des consonnes d'autres lieux d'articulation : vélaire dans le cas de bredige, labio-dental
dans celui de saf ou werf.
Les épenthèses de consonnes interconsonantiques, quand elles sont obligatoires et non
facultatives, relèvent d'une adjacence interdite par la langue de deux consonnes dont l'une au
moins est sonante. Cette adjacence résulte d'un processus diachronique de chute de voyelle,
ou de la concaténation de deux morphèmes (grec ancien). La langue réagit par l'insertion
61
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
d'une consonne "tampon", qui vient briser le groupe interdit. Cette explication ne règle
cependant pas tous les cas d'insertion de consonne dans un contexte consonantique, puisque
l'épenthèse finale en allemand après consonne n'entre pas dans ce cas de figure.
La justification par la coarticulation ou la réaction à des groupes de consonnes
interdits ne concerne qu'une partie des épenthèses consonantiques, celles précisément
présentes entre deux consonnes. Pour la majorité des épenthèses attestées, qui ne se situent
pas dans un groupe consonantique, l'explication la plus communément offerte relève de
contraintes structurales.
2.2.2. Contraintes structurales
Pour Paradis (1988 : 71-91), une stratégie de réparation est une "operation that applies
to a phonological unit or structure in order to repair the violation of a structural or segmental
phonological constraint of universal or language-particular type. It is context-free, the context
being determined by the very constraint which justifies its application." Pour elle, les
stratégies de réparation sont ce qui permet d'expliquer bon nombre de phénomènes
phonologiques, parmi lesquels l'emprunt.
Je vais présenter les différentes contraintes structurales par ordre de taille de la
structure impliquée, de la plus grande à la plus petite. Je commencerai donc par la
proposition, avant de présenter les contraintes liées au mot, puis terminerai par les contraintes
imposées par la structure syllabique, ce dernier volet incluant une présentation de la résolution
d'hiatus.
2.2.2.1. Structure de la proposition
La proposition est la plus grande unité pour laquelle la littérature mentionne l'insertion
d'une épenthèse consonantique. En tunica en effet (Haas 1940, Lombardi 1997, 2003), un [n]
est inséré en fin de proposition : la forme régulière du morphème ayant pour signifié "encore"
est [hatika], mais en fin de proposition on entendra [hatikan] (cf. section 2.1.3.2).
L'anglais (Lombardi 2003) illustre un autre cas d'épenthèse liée à la proposition, cette
fois en début ; [] est inséré en début de proposition (ou en réalisation emphatique) : eel se
62
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
prononce [ijl] à l'initiale d'une proposition (ou en réalisation emphatique) mais [ijl] à
l'intérieur.
Outre la proposition, l'unité intonationnelle peut également être source d'épenthèse. Le
selayarese (Lombardi 2003, Mithun & Basri 1986) présente en effet une épenthèse en début
d'unité intonationnelle en l'absence de consonne lexicale (cf. section 2.1.2). Ainsi le
morphème de démonstratif dans l'exemple ci-dessous comporte-t-il un coup de glotte en début
d'unité intonationnelle, mais non à l'intérieur :
inni
"ceci"
aapa inni
"qu'est-ce"
La proposition et l'unité intonationnelle peuvent déclencher l'apparition d'épenthèses
consonantiques si le matériel lexical ne propose pas de consonne, à la frontière gauche ou à la
frontière droite selon les langues concernées.
Les contraintes liées à la taille d'une unité ne se limitent cependant pas à ce type
d'éléments et se retrouvent aux niveaux inférieurs que sont les mots et les syllabes.
2.2.2.2. Structure de l'unité lexicale
Certaines études mettent en effet en relation l'épenthèse consonantique et la taille
minimale du mot. Dans d'autres cas, cette contrainte structurale, bien que non explicitement
donnée, s'avère probable dans l'apparition d'une épenthèse, ou au moins en partie sa cause.
2.2.2.2.1. Finale de mot
Broselow (1984) fait état de l'épenthèse consonantique en amharique, langue
gabaritique éthiopienne. Comme dans toutes les langues sémitiques, un verbe a besoin de trois
consonnes en amharique. L'épenthèse de [t] survient lorsque la mélodie fournie par le lexique
est insuffisante pour remplir les positions consonantiques requises par le gabarit, quel que soit
l'environnement morphologique : /fj/ "consumer" sera réalisé [fäjjä] au perfectif, avec
redoublement de la deuxième consonne, mais avec épenthèse au gérondif et à l'infinitif,
respectivement [fäjto] et [mä-fjät] ([mä] est ici un préfixe, il n'entre pas en jeu dans le
décompte des consonnes du verbe). Cette langue n'est pas à mettre sur le même plan que les
63
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
autres, dans le sens où ce n'est pas la position finale de mot, mais la position finale de gabarit,
qui constitue le contexte déclencheur.
En cupeño (Crowhurst 1994, Lombardi 1997), langue amérindienne uro-aztèque
parlée aux Etats-Unis, l'épenthèse de coup de glotte est requise en coda pour satisfaire une
taille de mot minimale, à savoir une syllabe fermée par une coda, si le matériel lexical n'est
pas suffisant : /hu/ est réalisé [hu] "péter" , /kwa/ s'observe en tant que [kwa] "manger".
En atayal (Lambert 1999) également, un coup de glotte est épenthésé en fin de mot,
en cas de défaillance lexicale. Par exemple, la forme sous-jacente /m- paa/ "porter" est
réalisée [mapaa].
Dans ce chapitre consacré aux contraintes structurales liées au mot figurent également
les emprunts. Un mot importé d'une langue source n'est pas toujours adapté aux exigences de
la langue cible. Aussi doit-il, en vue de son assimilation, se plier à la structure requise par la
langue qui l'accueille. Pour reprendre les propos de Broselow (2000 : 1) : "Loanwords
normally undergo changes that bring them into conformity with native language phonological
patterns." Toutefois, Paradis (1996) met en avant le fait que cette adaptation des segments non
conformes ne se fait pas de manière systématique ; elle ne s'observe en effet que dans 85.2%
des 12635 séquences mal formées qu'elle a relevées dans des emprunts anglais en québécois
français ou des emprunts français en arabe marocain, kinyarwanda et fula ; les séquences sont
laissées telles quelles, bien qu'inadaptées, dans 10.7% des cas.
Lombardi (1997 : 14) mentionne les emprunts en buginese, qui font appel à
l'épenthèse de nasale vélaire "to meet the minimal word requirement" : le mot anglais tea ne
sera pas repris par la forme *[te] en buginese mais par [te], ce qui signifie que la langue
choisit de faire appel à l'épenthèse de nasale vélaire pour adapter le mot à sa structure (cf.
également Mills 1975 : 53).
En yucatec (cf. Orie & Bricker 1997, également Straight 1976 : 71, de Lacy 2002a :
189, Lombardi 1997) les mots doivent se terminer par une consonne. Un emprunt se terminant
en voyelle se verra adjoindre [h] en finale de mot.
Par ailleurs, il est à noter que certaines consonnes sont épenthésées en finale de mot,
sans que ce soit pour autant la syllabe ou la proposition qui requière un tel ajout (cf. section
64
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.1.5.1). De telles épenthèses semblent donc également dues à la taille du mot et non de la
syllabe.
En makassar (Aronoff et al. 1987, Broselow 2000, McCarthy 1998, 2002, McCarthy
& Prince 1994) est épenthésé un coup de glotte en finale de mot si le radical se termine par
une consonne, ce coup de glotte s'accompagnant d'une épenthèse de voyelle correspondant à
la copie de la dernière voyelle radicale. De cette manière, le morphème /jamal/ "vilain" est
réalisé [jamala].
Le dialecte anglais parlé à Bristol (Lombardi 1997, 2003, Hugues & Trudgill 1979,
Wells 1982, Gick 1999) utilise quant à lui l'épenthèse de [l] en fin de mot à condition que la
voyelle précédente soit un []. Le prénom Eva, par exemple, est prononcé de la même
manière dans ce dialecte que le substantif evil (cf. section 2.1.3.1).
En guajiro (Mansen & Mansen 1984, Alvarez 1995, Vaux 2003), la fricative glottale
est insérée à la fin d'un mot quelle que soit sa taille, pourvu que la dernière voyelle soit brève
et accentuée : /m'a/ "terre, monde" est réalisé [mah].
Intéressons-nous maintenant à la frontière gauche du mot.
2.2.2.2.2. Début de mot
Nous avons vu en section 2.1.5.2.2. huit langues insérant une consonne épenthétique
en début de mot lorsque la forme sous-jacente commence par une voyelle : le kisar, l'arabe, le
tamil, le koryak, le gokana, l'allemand, le bulgare et le tchèque. Dans chacun de ces cas, la
consonne insérée est un coup de glotte (cf. 2.1.2.2).
Pour cinq de ces langues, l'insertion de [] est automatique dès lors qu'une initiale de
mot est vocalique, de façon à ce que la structure de mot de la langue soit respectée : le kisar
(Lombardi 2003, Christensen & Christensen 1992), le koryak (Kenstowicz 1976, Lombardi
2003), le bulgare (Rubach 2000), l'arabe (Lombardi 2003) et le gokana (Hyman 1985,
Lombardi 1997, 2003).
Le tamil (Christdas 1988, Lombardi 2003) pour sa part a le "choix" entre l'épenthèse
du coup de glotte ou la propagation d'un yod, selon la qualité de la voyelle à la droite de la
position : s'il s'agit de [i] ou [e], [j] va se propager et occuper l'attaque ; si la voyelle est [o] ou
[u], c'est [w] que l'on trouvera à l'initiale ; le coup de glotte est réservé aux cas où la voyelle
initiale est [a]. Il n'y a donc épenthèse que par défaut, lorsque la voyelle suivante ne peut pas
propager de glide.
65
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Le tchèque (Kucera 1961, Rubach 2000) et l'allemand (Scheer 2000a, Alber 2001,
Hall 1992, Wiese 1996) se distinguent des autres langues en ce que le contexte initial n'est pas
le seul déclencheur de l'apparition d'une consonne épenthétique. En tchèque en effet, un coup
de glotte peut également être inséré, facultativement, à une frontière morphologique en hiatus.
Le deuxième contexte d'épenthèse que connaît l'allemand est également en hiatus, mais cette
fois c'est le fait que la deuxième voyelle de l'hiatus est accentuée qui est déterminant. Ces
deux langues seront examinées plus précisément en section 2.2.3.3.
Les deux frontières du mot sont donc susceptibles de constituer un motif suffisant à
l'apparition d'une consonne épenthétique, selon que la structure d'une langue donnée requiert
de façon obligatoire l'une ou l'autre.
Après l'influence des structures de la proposition et du mot sur l'apparition de
consonnes épenthétiques, abordons une troisième catégorie d'items propre à favoriser la
présence d'une épenthèse : la syllabe.
2.2.2.3. Structure syllabique
Comme pour les deux constituants abordés dans les sections précédentes, la syllabe est
une structure pouvant exiger la présence d'une consonne à sa frontière droite comme à sa
frontière gauche : dans certaines langues, une syllabe doit obligatoirement comporter une
attaque, dans d'autres c'est la coda qui n'est pas optionnelle.
2.2.2.3.1. Coda requise
En ce qui concerne la coda, j'ai eu l'occasion de souligner en section 2.1.5. que seule la
fricative glottale, parmi toutes les consonnes attestées en épenthèse, pouvait occuper cette
position en tant qu'épenthèse. Deux langues requièrent une coda pour satisfaire leur structure
syllabique : l'ayutla mixtec (Pankratz & Payne 1986 ; cf. également de Lacy 2002a) et le
huariapano (Parker 1994, 1998 ; cf. également de Lacy 2002a).
Dans la première de ces langues, l'exigence syllabique se double d'un conditionnement
lié à la consonne suivante : il faut absolument en ayutla mixtec que la première syllabe d'un
mot comporte une coda, mais les codas ne peuvent jamais être occlusives. Si le matériel
lexical ne fournit pas de coda, une première solution consiste à dupliquer la consonne initiale
66
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
de la seconde syllabe. Si celle-ci est une occlusive, cette solution est exclue, aussi la langue at-elle recourt à une épenthèse de [h].
En huariapano, il faut distinguer les syllabes accentuées des syllabes non accentuées.
Sur la première catégorie pèse une exigence de poids : toutes les syllabes accentuées doivent
être lourdes. En conséquence, si une syllabe portant l'accent n'a pas de coda fournie par le
matériel lexical, elle insère un [h].
Ces deux langues sont les seuls cas ici recensés d'épenthèse consonantique due à la
structure de la syllabe, et dans le deuxième cas cette condition s'assortit d'une contrainte liée à
l'accent.
Mentionnons le cas de l'espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003) qui
insère un [s] dans l'une des codas du mot, en variation libre : teatro "théâtre" est réalisé
[teastro] ou [teatros]. Il est difficile dans ce cas de déterminer si c'est la syllabe qui exige une
coda, puisque seule une des syllabes du mot est concernée, ou si la contrainte est liée au mot
lui-même.
Les épenthèses consonantiques attestées en attaque sont bien plus nombreuses que
celles recensées en coda.
2.2.2.3.2. Attaque requise = résolution d'hiatus
On a vu en section 2.1. que les épenthèses consonantiques se situent principalement en
attaque de syllabe. Il s'agissait cependant d'une constatation empirique et non d'une
explication. Dans cette section, ces cas vont être étudiés du point du vue explicatif.
Il serait tentant de distinguer ici deux cas : celui où l'exigence d'attaque serait liée à un
hiatus et celui où il n'y aurait pas d'hiatus à la source de l'épenthèse. Dans ce dernier cas, deux
contextes sont théoriquement possibles : à l'initiale de mot, et derrière une coda. L'initiale de
mot a déjà été traitée plus haut.
Quant au contexte CVC._V, il n'est pas documenté dans la littérature comme
déclencheur d'épenthèses à lui seul : si une consonne est épenthésée après une coda, c'est
toujours pour une raison autre que la structure syllabique. J'ai signalé en section 2.1.5. trois
cas où une consonne pouvait être épenthésée entre une coda et une consonne : le malais, le
67
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
tigrigna et le maltais. Dans ces trois cas, le contexte déclencheur est d'ordre morphologique et
non structural, cf. section 2.2.3.
L'obligation d'attaque imposée par la syllabe (et non par le mot ou la proposition) se
confond donc avec la résolution d'hiatus.
Celle-ci constitue l'explication sans doute la plus courante pour l'apparition d'une
consonne ni étymologique ni sous-jacente dans la réalisation d'une séquence. En effet, "vowel
clusters (hiatus) are universally dispreferred" (Ortmann 1995 : 7).
L'hiatus peut justifier à lui-seul l'apparition d'une épenthèse consonantique, mais il
arrive également qu'il soit une condition nécessaire, certes, mais non suffisante pour
l'apparition d'une consonne. Je commencerai par rappeler les langues où l'hiatus semble seul
servir de déclencheur à l'épenthèse, avant d'aborder les cas où l'hiatus se double de
motivations morphologiques ou mélodiques.
2.2.2.3.2.1. Hiatus seul
On rencontre des hiatus déclencheurs dans un certain nombre de langues. Pourtant,
seuls deux dialectes de la langue amérindienne slave considèrent l'hiatus comme une
condition suffisante à l'apparition d'une épenthèse : le hare et le bearlake (Rice 1989, de
Lacy 2002a) épenthèsent un [h] dans toute attaque de syllabe non remplie par du matériel
mélodique.
Dans tous les autres cas d'épenthèse en hiatus, celui-ci constitue une condition
nécessaire mais non suffisante. Soit l'hiatus s'assortit d'une condition d'ordre mélodique, soit
c'est la morphologie qui intervient.
68
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.2.2.3.2.2. Hiatus condition nécessaire mais pas suffisante
2.2.2.3.2.2.1. Hiatus accompagné d'un conditionnement mélodique
En selayarese (Mithun & Basri 1986, Lombardi 2003), l'hiatus s'accompagne d'une
condition mélodique. On ne trouve une épenthèse de coup de glotte que si les deux voyelles
de l'hiatus sont identiques : [kuurai] "je l'accompagne" mais [riurai] "tu l'accompagnes"
(cf. section 2.1.2.2.1).
En baka (Kleinhenz 1992, Ortmann 1998 : 72), deux cas d'épenthèses en hiatus sont
relevés : l'un correspond à une frontière dérivationnelle et sera donc abordé dans la section
suivante. L'autre intéresse cette partie : l'hiatus s'assortit de la condition mélodique d'être
constitué de deux voyelles identiques, auquel cas une [l] s'insère en son sein. Ainsi les formes
sous-jacentes
/m/ "faire"
ou
/soo/ "sécher"
seront-elles
réalisées
respectivement
[ml] et [solo]. L'épenthèse est optionnelle et le contexte déclencheur est constitué par un
hiatus de deux voyelles identiques.
En anglais enfin (Szigetvári 1994), un [r] est facultativement inséré en hiatus à
condition que la première voyelle ne soit pas haute, auquel cas c'est un glide qui apparaît :
(67)
seeing
grandma is
propagation d'un glide
s[i:j]ing
épenthèse d'un []
grandm[a:] is
glose
"voyant"
"mamie est"
Dans le premier cas la présence d'une voyelle haute provoque l'apparition d'un glide,
dans le deuxième c'est un [r] qui est épenthésé.
2.2.2.3.2.2.2. Hiatus et dissimilation
Dans les autres langues répertoriées, l'hiatus est une condition nécessaire à l'apparition
d'une épenthèse, mais non suffisante. Dans certains cas, il se doublera d'un contexte
dissimilatoire propice à l'insertion d'une coronale. C'est le cas du français sous l'analyse de
Plénat et al. (2002), que je développerai dans la section 3 de ce chapitre.
Le jeu de langage du fula mentionné en 1.2.1.3.2. fait appel à l'épenthèse de [n] dans
le cas où les deux consonnes inversées sont identiques.
69
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(68)
fula
consonnes différentes
consonnes identiques
saare
daada
fula transformé
raase
daana
glose
"concession"
"mère"
Il s'agit donc là encore d'une épenthèse provoquée par deux consonnes identiques,
l'une s'effaçant au profit d'une consonne "neutre". Il est dommage que les données ne
permettent pas d'établir avec certitude que le [n] est bien totalement indépendant du [d] qu'il
remplace.
2.2.2.3.2.2.3. Hiatus et accent
En allemand (Alber 2001, Scheer 2000a : 152), outre le coup de glotte obligatoire à
l'initiale de mot que j'ai indiqué en section 2.2.2, un coup de glotte est optionnellement inséré
en hiatus pourvu que la seconde syllabe soit accentuée : ['kaçs] "chaos" n'est pas en variante
libre avec *['kaçs], mais [ka'ooti] "chaotique" l'est avec [ka'ooti]. L'accent seul n'est pas
un élément suffisant pour déclencher l'apparition du coup de glotte : si c'était le cas, tous les
mots allemands en contiendraient au moins un.
2.2.2.3.2.2.4. Hiatus et conditionnement morphologique
Outre ces phénomènes dissimilatoires ou mélodiques peuvent se joindre à l'hiatus des
contraintes morphologiques, beaucoup plus fréquentes, qui conditionnent l'apparition d'une
épenthèse consonantique.
Je ne citerai ici que les cas où le conditionnement morphologique a été formellement
identifié comme s'ajoutant à l'hiatus en tant que déclencheur. Les langues concernées par la
nécessité de la présence d'un hiatus associé à un conditionnement morphologique seront
exposées en détail dans la section suivante (2.2.3), aussi n'en donnerai-je ici que la liste pour
mémoire : le knni, l'indonésien, le tchèque, l'odawa, l'ilokano, le gokana, le tigrigna et le
japonais.
En kçnni, l'hiatus doit se situer à la frontière de mot pour déclencher l'apparition d'une
épenthèse de coup de glotte, et pour une épenthèse de [r] il faut un hiatus de deux voyelles
longues, l'épenthèse ne concerne qu'un seul suffixe et ne fonctionne qu'avec une classe de
noms particulière. Le gokana épenthèse un [r] ou un [n] selon que l'hiatus est constitué de
voyelles orales ou nasales, mais dans tous les cas il faut que lesdites voyelles soient longues et
70
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
situées à l'intérieur d'un pied, et l'épenthèse ne fonctionne qu'avec deux suffixes donnés. En
odawa, un [t] est épenthésé en hiatus si celui-ci est à la frontière entre un préfixe de personne
et un radical nominal, et uniquement avec une classe de nom définie. En japonais, l'hiatus
doit se doubler d'une frontière devant désinence verbale. En ilokano, l'épenthèse n'est que
facultative et s'observe en hiatus certes, mais pourvu qu'il se situe à une frontière
morphologique et devant deux suffixes particuliers. En indonésien, seule une catégorie de
frontière morphologique est propre à déclencher l'apparition d'une épenthèse à condition
qu'elle se tienne en hiatus. Cette double condition se retrouve en tchèque, pour lequel
l'épenthèse n'est d'ailleurs que facultative. S'ajoute enfin le tigrigna dans lequel "[] est défini
comme le segment consonantique minimal apte à briser un hiatus vocalique" (Denais 1994 :
55), pourvu qu'il soit associé à une frontière morphologique particulière.
L'hiatus est donc conçu comme un déclencheur d'épenthèse largement répandu, même
s'il suffit rarement à lui seul à déclencher l'apparition d'une épenthèse consonantique.
L'épenthèse est d'ailleurs très souvent décrite comme une stratégie de réparation visant à
résoudre des hiatus : pour Lombardi (1997), l'épenthèse est la "optimal resolution of hiatus".
2.2.2.3.2.3. Résolution d'hiatus
L'épenthèse n'est pourtant pas la seule entorse possible à la concaténation pure et
simple de deux morphèmes. Lors de la concaténation de deux morphèmes en hiatus peuvent
en effet se produire au moins cinq cas de figure, certains pouvant se d'ailleurs se combiner, et
ce, rien que pour le français.
Il se peut tout d'abord qu'il n'y ait simplement aucune modification, comme c'est le cas
lors de la concaténation des adjectifs épicènes type aisé ou joli avec le morphème adverbial ment : aisément, joliment.
Dans le cas où le dernier son de la base est un i ou un u, il arrive que ces voyelles
produisent un glide à la frontière morphologique20 : cri + er > crier [kije], bien que l'on
puisse également attribuer ce glide à la base verbale (cf. Boyé 2003). Si l'on considère qu'il
20
Cf. par exemple Piggott & Singh (1985 : 416), pour qui les segments épenthésés sont, dans un contexte
intervocalique, "usually" des glides, ou Lombardi (2003 : 9-10), selon laquelle "in languages that resolve hiatus
via epenthesis, another common approach is to epenthesize a glide that agrees in features with an adjacent vowel,
often a high vowel."
71
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
s'agit bien d'une épenthèse, seule la première voyelle de l'hiatus influence la nature de
l'épenthèse ; autrement dit, seule une voyelle haute peut produire un glide.
Une autre modification possible est la chute d'un phonème, comme on le trouve en
asheninca campa lorsque deux voyelles se trouvent en contact à la préfixation (cf. 1.2.1.3.2.) ;
en français, on trouve la chute de la voyelle par exemple dans le cas de la concaténation de
Victoria avec le suffixe -ien, le résultat étant la perte du -a final de la base : victorien.
La concaténation peut permettre à une consonne sous-jacente d'apparaître en surface,
comme dans le cas de la concaténation du morphème -esse [s] à l'adjectif petit [pti] :
petitesse [ptits]. Le résultat fait alors ressortir le -t sous-jacent de l'adjectif, qu'on trouve à la
liaison (petit ami [ptitami]) comme au féminin (petite [ptit]).
Le dernier cas envisagé ici est l'épenthèse, sujet de cette étude : bijou + ier = bijoutier.
Les causes phonologiques de l'épenthèse étant ainsi mieux cernées, se profile la
question suivante : pourquoi lorsqu'une de ces motivations est rencontrée dans une langue,
l'épenthèse consonantique n'est-elle pas pour autant systématique ?
Un premier élément de réponse a déjà été apporté en ce qui concerne le traitement des
hiatus : les langues disposent d'autres outils que l'épenthèse pour s'adapter à une situation
inconfortable.
Un deuxième élément de réponse tient à la langue même : un hiatus peut être
parfaitement toléré dans une langue mais totalement interdit dans une autre, établissant la
motivation de l'épenthèse liée à l'hiatus en termes de paramètre et non de principe.
Se greffent également souvent à une cause structurale des raisons morphologiques, que
je traiterai plus précisément dans la section suivante.
Enfin, des paramètres sociaux tels que la mode ou la popularité d'une variante peuvent
justifier du choix de l'épenthèse à un moment donné dans la langue. Ils seront détaillés en
section 2.2.5.
2.2.3. Conditionnement morphologique
2.2.3.1. A l'intérieur d'un morphème ?
En allemand, le coup de glotte peut être épenthésé à une frontière morphologique
comme à l'intérieur d'un morphème pourvu que l'on soit en situation d'hiatus (Alber 2001).
72
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Dans ce cas, est prioritaire la contrainte structurale exigée par la syllabe et non le
conditionnement morphologique. Toutefois, il faut que la voyelle suivante soit accentuée.
Pour autant, ce n'est pas la position intérieure du morphème qui sert de déclencheur.
Dans aucune langue, donc, la position intérieure de morphème ne déclenche
d'épenthèse. Aussi, lorsqu'on parle de conditionnement morphologique, entend-on
exclusivement la frontière morphologique.
2.2.3.2. Frontière morphologique
Les
frontières
morphologiques
semblent
déclencher
nombre
d'épenthèses
consonantiques. Si l'on en croit Ortmann (1995 : 7), "C-epenthesis is largely restricted by
morphological conditions." Alber (2001 : 1-2) renchérit sur la particularité des frontières : "At
the edges of prosodic and morphological categories often phonological processes take place
that do not happen elsewhere, or conversely, phonology that happens elsewhere fails to take
place (…) but it is not always clear how such edge-effects are brought about."
Le caractère particulier des frontières morphologiques est largement reconnu. Ainsi
pour une des deux catégories d'épenthèses de [l] attestées en baka (Kleinhenz 1992,
également Ortmann 1998 : 72), en-dehors de l'hiatus composé de deux voyelles identiques
mentionné dans le paragraphe précédent, l'épenthèse est déclenchée par une frontière
dérivationnelle en hiatus, quel que soit le type de frontière. Cependant, les seuls exemples
disponibles n'attestent cette assertion qu'en ce qui concerne la frontière entre base et
désinence : /si + / "regarder – perfectif" est réalisé [sil]. En persan (Picard 2002, Vaux
2003) on observe une épenthèse de coup de glotte ou de glide homorganique en hiatus,
apparemment systématiquement à la frontière morphologique mais quelle que soit cette
frontière (cf. section 2.1.2.2.4).
En effet, il serait intéressant d'établir maintenant si les différents types de frontières
provoquent les mêmes effets, autrement dit de répertorier les épenthèses éventuellement
attestées entre deux mots mais également à l'intérieur des mots composés, entre préfixe et
radical et entre radical et suffixe.
73
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.2.3.2.1. Entre deux mots
Trois langues parmi celles répertoriées ici réservent l'épenthèse à la frontière entre
deux mots : le knni, le haut alémanique et le maltais.
En kçnni (Cahill 1999, Lombardi 2003 : 32), langue niger-congolaise parlée dans le
nord du Ghana, la consonne épenthétique entre deux voyelles à travers une frontière de mot
est le coup de glotte, soit toujours aux extrémités d'un mot et non à l'intérieur.
La frontière morphologique se double donc d'une exigence d'hiatus, comme on l'a vu
dans la section précédente.
Le haut alémanique (Heusler 1888, Weinhold 1863 ; cf. également Ortmann 1995)
quant à lui insère un [n] entre deux mots pourvu que l'un des deux soit un clitique
complément. A la nature de la frontière morphologique s'ajoute une exigence relative à la
nature du morphème même : wo [n] er ko isch "quand il est arrivé", größer wie [n] i "plus
grand que moi".
Ce double conditionnement morphologique s'observe également en maltais (Ortmann
1995 : 3-4), langue dans laquelle un [t] est inséré entre deux mots si les deux conditions
suivantes surviennent simultanément : après un numéral et avant une épenthèse de [i].
L'exemple ci-dessous permet de démontrer le lien nécessaire entre l'épenthèse de [i] et celle
de [t] :
(69)
zewg + hbieb
sewg + Indjani
épenthèse
zewgt ihbieb
pas d'épenthèse
zewg (*t) Indjani
glose
"deux amis"
"deux Indiens"
Sur trois langues concernées par l'épenthèse d'un élément entre deux mots on constate
d'une part que les consonnes épenthésées dans chaque langue sont différentes, ce qui signifie
qu'on ne peut attribuer un son particulier au conditionnement morphologique ; d'autre part que
la frontière de mot participe du conditionnement de l'épenthèse mais n'est jamais suffisante :
soit il faut la présence impérative d'un hiatus, soit d'une certaine catégorie de morphème.
74
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Tournons-nous maintenant vers les frontières intérieures de mot, à commencer par
celle située dans une unité lexicale composée.
2.2.3.2.2. Dans les composés ?
Peu de travaux abordent l'épenthèse consonantique dans les composés. Morin (1982 :
36-39) traite du [l] "des composés du type lampe à [l] huile" en français québécois, pour
l'exclure en tant qu'épenthèse : "le [l] dans les composés du type lampe à [l] huile est
vraisemblablement un article agglutiné qui a été réinterprété comme une consonne de liaison"
(Morin 1982 : 41). Wetzels (1987 : 316 note 15) s'intéresse pour sa part aux consonnes de
liaison en français, pour lesquelles il établit que "no epenthetic consonants appear at the
juncture of elements of compounds".
Seul le malais (Carr & Kassin 1999, cf. également Durand 1986a, Zaharani 1998,
Teoh 1994), dans l'inventaire des langues établi ici, manifeste une épenthèse à la frontière
morphologique d'un composé. On ne peut cependant maintenir l'idée que c'est la frontière du
composé qui sert de déclencheur ; en réalité toutes les frontières morphologiques en hiatus se
voient affectées d'un coup de glotte épenthétique, comme le rappelle le tableau suivant :
(70)
/mula + i/
/di + ambel/
/k´rt´/ + /api/
insertion de 
[mulai]
[diambel]
[k´rtapi]
glose
"aveugle"
"pris"
"locomotive à vapeur"
/uda/
[udauda]
"lois"
morphèmes
radical + suffixe
préfixe + radical
composés
réduplication
Carr & Kassin (1999 : 9) affirment même que l'insertion de l'occlusive glottale
s'applique "regardless of the presence of boundary", tout en reconnaissant que le malais
"should, but does not, exhibit GSI [glottal stop epenthesis] stem-internally".
Il semblerait donc que la frontière morphologique à l'intérieur d'un terme composé ne
constitue pas un critère déclenchant l'apparition d'une épenthèse.
75
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Si la composition se révèle décevante, tournons-nous vers les frontières liées à la
dérivation pour déterminer leur importance quant à l'épenthèse consonantique. La première
catégorie de frontière liée à la dérivation examinée ici est la frontière entre préfixe et radical.
2.2.3.2.3. Entre préfixe et radical
La frontière entre préfixe et radical provoque des comportements particuliers. Par
exemple en malais (Cohn 1988, Carr & Kassin 1999), on relève un processus d'assimilation
valable entre préfixe et radical, mais pas entre radical et suffixe (ni à l'intérieur d'un
composé), comme le tableau suivant le montre :
(71)
radical
suffixe
morphèmes
+ /tanam + kan/
/m´ + baun + kan/
préfixe
radical
+ /m´ + bua/
/m´ + daki/
composé
assimilation
non assimilation
[tanamkan]
[mmbaunkan]
glose
"planter"
"développer"
[mmbua]
"jeter"
[mndaki]
"escalader"
/taman/ + /bua/
[tamanbu]
"jardin de fleurs"
Cette particularité de la frontière morphologique préfixe + radical (par opposition à la
frontière radical + suffixe) se retrouve au niveau du phénomène de l'épenthèse. Dans les
données recueillies ici en effet, trois langues sont concernées par l'insertion d'une consonne
dans ce contexte.
L'indonésien (Carr & Kassin 1999, Pater 2001 : 171-177 et Carr & Kassin 1999
référant à Cohn 1989, Cohn & McCarthy 1994) tout d'abord manifeste un comportement
particulier entre un préfixe et un radical en ce qui concerne l'hiatus i_a, en y insérant un coup
de glotte, alors qu'elle propagera un glide à partir de la première voyelle dans les autres
positions, à savoir intérieur de mot et frontière radical + suffixe.
(72)
forme sous-jacente
épenthèse de glide
intérieur de mot
entre radical et suffixe
entre préfixe et radical
/diam/
/hari + an/
/di + ambil/
[dijam]
[harijan]
épenthèse de []
[diambil]
glose
"tranquille"
"quotidien"
"pris"
La position est donc déterminante quant à la nature du son qui apparaît, mais c'est
l'hiatus qui détermine le fait même qu'il y ait épenthèse.
76
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
L'hiatus joue le même rôle nécessaire en tchèque (Janda & Townsend 2000 : 9-10,
Palková 1997 : 325-326). Cette langue procède à une épenthèse facultative de coup de glotte
entre préfixe et radical dans le but de distinguer deux homophones de surface, comme
l'illustre l'exemple suivant :
(73)
proudi
pas d'épenthèse car intérieur de morphème
radical proud +
terminaison i
[proui]
"jaillit"
(présent)
épenthèse de [] car frontière morphématique
préfixe pro + radical
ud + terminaison i
[proi]
"fumera à
travers"
Dans ce cas cependant, la frontière ne détermine pas la nature du son qui apparaît, elle
constitue simplement un motif supplémentaire d'épenthèse.
La langue amérindienne odawa (Piggott 1990) manifeste une épenthèse de l'occlusive
coronale [t] à la frontière entre préfixe et radical, à la condition que le préfixe soit personnel et
que la frontière soit en hiatus.
(74)
Forme sous-jacente
/ki-akat-i/
kitakati
Réalisation
"tu es timide"
Glose
/ki-osamikwam-m/
kitosamkwamim
"vous faîtes la grasse matinée"
/ni-ompass/
nitompass
"mon bus
La frontière morphologique, là encore, se double d'un autre critère nécessaire pour se
voir adjoindre une épenthèse : une certaine catégorie de morphèmes préfixaux.
Les autres langues connaissant l'épenthèse consonantique conditionnée par une
frontière morphologique n'introduisent de consonne qu'entre radical et suffixe et non entre
préfixe et radical. C'est ce qui permet à Carr & Kassin (1999) d'établir le "mot phonologique"
comme un radical accompagné de son ou ses éventuel(s) suffixe(s) : ainsi le cas non-marqué
pour un processus phonologique est-il selon eux celui qui s'applique à l'intérieur du mot
phonologique.
2.2.3.2.4. Entre radical et suffixe ou désinence
La position radical + suffixe est, dans certaines langues, particulière elle aussi.
77
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Le tigrigna (Denais 1994 : 52-54), exploite l'épenthèse du coup de glotte à la frontière
entre un radical nominal et certaines désinences, tel que le morphème /u/ "possessif 3ème
personne", après voyelle :
(75)
racine à finale consonantique
racine à finale vocalique
/faras - u/
/aza - u/
[farasu]
[azu], [azu], [azau]
"son cheval"
"sa maison"
A nouveau, le contexte créé par la frontière morphologique est nécessaire, mais non
suffisant. L'hiatus participe en effet tout autant de l'apparition d'une épenthèse, puisque celleci ne se manifeste pas après une consonne, à frontière morphologique identique.
En kçnni (Cahill 1998, 1999, Lombardi 2003 : 32), [r] est inséré entre une voyelle
radicale longue [aa], [] ou [çç], et le suffixe du pluriel en ce qui concerne les noms de
classe 1. Cette épenthèse s'accompagne d'un abrègement de la voyelle longue précédente.
(76)
singulier
base en voyelle brève à la s-
finale
ta-
base à voyelle longue à la bnt-
finale
daa-
pluriel
glose
s-a
tan-a
bnt-ra
"poisson"
"pierre"
"crapaud"
da-ra
"jour"
Le conditionnement est donc quadruple : il faut un hiatus, la frontière morphologique,
le suffixe du pluriel et un radical appartenant aux noms de classe 1.
L'ilokano (Hayes & Abad 1989 : 351, Rose 1996 : 108 ; également Ortmann 1998 :
71, Rosenthall 1997 : 144, Lombardi 2003 : 13-14) connaît un cas où les glides et le []
surgissent en hiatus et en variation libre : dans les emprunts et dans "certain forms to which an and -en are not normally attached".
(77)
épenthèse de coup de glotte
pajojoen
épenthèse de glide
pajojowen
glose
"cause to play with yoyo"
La frontière morphologique ne constitue donc ici qu'un des motifs d'apparition de
l'épenthèse, avec l'hiatus et la restriction à certains suffixes.
78
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
En gokana (Hyman 1985, Lombardi 1997, 2003), on constate l'apparition d'un [n]
entre deux voyelles nasales ou d'un [r] entre deux voyelles orales, pourvu dans les deux cas
que les voyelles soient longues, à la frontière morphologique entre un radical verbal et l'une
des deux désinences suivantes : logophorique ou deuxième personne du pluriel sujet (cf.
sections 2.1.3.1 et 2.1.3.2). Dans ce cas l'épenthèse de sonante n'apparaît que dans un hiatus
situé à une frontière suffixale particulière, et sa mélodie est partiellement prédictible par le
contexte.
Le japonais (McCawley 1968, de Chene 1985 ; également Lombardi 1997, Mester &
Itô 1989, Poser 1986) enfin témoigne de l'apparition d'une consonne épenthétique en hiatus,
mais uniquement à la frontière entre un radical verbal et une désinence (cf. section 2.1.3.1).
2.2.3.3. Bilan sur les frontières morphologiques
La position à la frontière de morphème intérieure de mot est donc marquée, qu'il
s'agisse de la frontière après un préfixe ou avant un suffixe. On remarquera cependant
qu'aucun des cas relevés ici ne se satisfait de la frontière morphologique comme seul motif à
l'apparition d'une épenthèse.
2.2.4. Bilan général du conditionnement interne
Le tableau synoptique (78) permet d'embrasser visuellement l'ensemble des
conditionnements attestés, qu'ils soient phonologiques ou morphologiques. Il aurait fallu un
tableau à plusieurs dimensions pour rendre parfaitement compte du phénomène de
l'épenthèse. A défaut, les indications qui relèvent de la phonologie mais non de la structure
d'un élément, ou de la morphologie mais non de la frontière, sont indiquées pour chaque
langue entre parenthèses.
79
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(78)
Tableau récapitulatif des conditionnements internes à l'apparition d'une épenthèse
phonologie
conditionnement morphologique
morphologie
int. morph.
frontière
entre mots
frontière de
composé
[CC] interdits
structure de la proposition
initiale
finale
conditionnement phonologique
structure du mot
initiale
finale
frontière
préfixe +
radical
frontière
radical +
suffixe
tamil (_V)
allemand
anglais
(moderne, dia)
gallois
+ mélodie
(moderne, dia)
espagnol (dia)
italien( dia)
grec (dia)
anglais
tunica
kisar
koryak
bulgare
arabe
gokana
tchèque
allemand
anglais (emphase)
baka
tchèque
indonésien (+mél)
odawa (+morph)
baka
ilokano
japonais
tigrigna
axininca campa (+morph)
knni (+mél +morph)
gokana (+mél +morph)
allemand
anglais de Bristol selayarese (V1=V2)
baka (V1=V2)
(_)
anglais
(V1 non hte)
guajiro ('V_)
fula
(dissimilation
première consonne du mot)
amharique (gab)
cupeño
atayal
buginese (emp)
yucatec (emp)
makassar (dout)
sans motif
phonologique
maltais (+morph
+ _i ép)
knni
ht alémanique (+morph)
+ accent
sans conditionnement morphologique
structure de la syllabe
initiale
finale
huariapano
ayutla
mixtec
(_.Cocc)
hare & bearlake
malais ?
80
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Dans ce tableau figurent les langues recensées ici en fonction des motivations relatives
à l'apparition d'une épenthèse. Certaines, comme l'allemand ou le gokana, interviennent plus
d'une fois, du fait qu'elles ont recours à l'épenthèse dans différents cas de figure.
Sont indiquées entre parenthèses les motivations liées à la mélodie (identifiée par
"mél" ou directement par l'indication du conditionnement mélodique) et à une catégorie
morphologique particulière (codée par "morph"), puisqu'elles se combinent avec les frontières
morphologiques et les contraintes structurales - elles correspondraient aux troisième et
quatrième dimensions nécessaires à ce tableau. La mélodie a cependant pu être distinguée au
sein de la catégorie "sans conditionnement morphologique", de même que l'accent, sans pour
autant rendre le tableau illisible.
L'indication "dia" présente en regard de certaines langues correspondant à des groupes
de consonnes interdits indique la dimension diachronique de l'épenthèse dans ces langues par
rapport au conditionnement fourni.
Rappelons enfin que sont classés en "début de syllabe" + "frontière de mot" et non
"début de mot" + "frontière de mot" le knni et le haut alémanique du fait que la frontière de
mot se couple d'une exigence d'hiatus et non d'initiale du deuxième mot.
Ce tableau met en exergue plusieurs régularités, que je regrouperai sous les deux titres
suivants : conditionnement morphologique et conditionnement phonologique. Je présenterai
ensuite un résumé des tendances dégagées.
2.2.4.1. Conditionnement morphologique
Les cas où le seul conditionnement morphologique favorise l'apparition d'une
épenthèse ne sont pas légion : seul le maltais semble concerné dans ce tableau, et il ne s'agit
que d'un "effet d'optique" dû à la représentation en deux dimensions. En effet, et comme il
l'est indiqué entre parenthèses dans le tableau, les motifs morphologiques constitués par la
frontière de mots et la nature du morphème précédent s'assortissent de la présence nécessaire
d'un [i] épenthétique en début de deuxième mot, donc d'une contrainte d'ordre mélodique.
Parmi les langues répertoriées ici, aucune donc ne se contente du conditionnement
morphologique comme déclencheur de l'apparition d'une épenthèse.
En ce qui concerne les conditionnements morphologiques, l'intérieur de morphème
comme la frontière à l'intérieur d'un composé ne semblent jamais déclencher l'épenthèse,
même liés à d'autres facteurs. Dans le meilleur des cas et uniquement pour ce qui concerne
81
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
l'intérieur d'un composé, c'est le fait qu'il y ait une frontière qui joue un rôle (en malais), mais
pas ce type de frontière particulièrement.
La frontière de mot n'intervient pour sa part que dans deux cas : en knni et en haut
alémanique. Pour la première langue, le manque d'illustration ne permet pas de déterminer si
un contexte supplémentaire, d'ordre phonologique, intervient dans l'apparition de l'épenthèse,
ou si l'hiatus combiné à cette frontière particulière est suffisant à la déclencher. En ce qui
concerne le haut alémanique en revanche, la nature de l'un des deux morphèmes en contact est
décisive : il faut qu'il y ait un clitique dans le contexte immédiat de la frontière
morphologique pour qu'apparaisse une épenthèse.
Le conditionnement morphologique apparaît donc ne s'exercer que dans les cas
d'hiatus, et il s'avère que ce sont principalement les frontières intérieures de mot liées à la
dérivation qui joue un rôle dans l'apparition de l'épenthèse. Peut-être faut-il relativiser cette
observation du fait que les études à partir desquelles l'inventaire des langues ici considéré ont
précisément davantage porté sur l'intérieur du mot que sur ses frontières extérieures ou sur des
unités plus grandes ; cependant, il semble que ce ne soit pas le cas puisque nombre de langues
attestent d'une épenthèse conditionnée précisément par des structures plus grandes que la
syllabe, mais sans conditionnement morphologique associé.
On observe par ailleurs que les groupes de consonnes interdits, type [nr] en ancien
français, ne sont jamais combinés à une frontière morphologique qui participerait elle aussi au
déclenchement de l'apparition d'une épenthèse. Ils peuvent être mis en contact par la
concaténation, mais ce n'est en aucun cas obligatoire puisque, comme nous l'avons vu en
section 2.2.1, c'est le plus souvent la chute d'une voyelle qui crée ces groupes. La
morphologie n'entretient donc pas de lien nécessaire avec l'épenthèse dans ce cadre.
En outre, le conditionnement morphologique constitué par les types de frontières
s'assortit souvent d'une contrainte supplémentaire - en-dehors de l'hiatus obligatoire dans
presque toutes, liée à la nature d'un des morphèmes mis en contact (haut alémanique, odawa,
knni, japonais, tigrigna, maltais) ou à la mélodie de l'un ou des deux éléments de l'hiatus
(indonésien, knni, gokana, maltais).
82
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
2.2.4.2. Conditionnement phonologique
La structure d'une proposition, d'un mot ou d'une syllabe peuvent constituer à elle
seule le motif de l'apparition d'une épenthèse. C'est même, dans le cas de la proposition,
exclusivement le cas. L'épenthèse consonantique joue donc le rôle de marqueur de cette unité,
en tunica comme en anglais.
Les frontières de mots sont parfois assorties de contraintes liées à la mélodie (tamil,
anglais de Bristol), ou à la prosodie (réalisation emphatique de l'anglais), mais jamais à la
morphologie. En fait, elles suffisent à déclencher l'apparition d'une épenthèse dans la plupart
des cas recensés ici.
Les exigences liées à la structure de la syllabe ne montrent pas la même indépendance
face aux contraintes morphologiques. Comme on l'a constaté dans la section précédente
(2.2.5.1), c'est même le seul élément structural apte à se combiner avec ces contraintes
morphologiques, pourvu qu'il s'agisse de l'initiale de syllabe et non de la finale.
La finale de syllabe ne participe au contexte favorisant l'apparition de l'épenthèse que
dans deux des langues répertoriées ici, et ne constitue jamais le contexte suffisant : en
huariapano, seule la syllabe lourde réclame une coda, aussi l'accent joue-t-il un rôle dans
l'apparition de l'épenthèse ; en ayutla mixtec, c'est l'absence de coda devant une consonne
occlusive qui déclenche l'épenthèse de [h].
L'initiale de syllabe constitue le contexte principal de l'apparition d'une épenthèse.
Etant donné que l'on a distingué l'initiale de mot et l'initiale de proposition d'une part, l'initiale
de syllabe se confond avec l'hiatus vocalique dans tous les cas où la morphologie n'intervient
pas. L'hiatus constitue une condition nécessaire et suffisante dans deux cas : dans les dialectes
voisins hare et bearlake, et en malais, avec une réserve concernant cette dernière langue du
fait que l'on n'a pas d'attestation d'épenthèse en intérieur de morphème.
Dans quatre langues, l'hiatus doit s'assortir d'une mélodie particulière : les deux
voyelles doivent impérativement être identiques (selayarese, baka), ou la première voyelle
non haute (anglais) ; dans le cas du fula, c'est la mélodie de la première consonne du mot qui
entre en jeu.
En allemand, une épenthèse de coup de glotte ne se déclenche que lorsque l'hiatus est
associé à l'accent. Une remarque concernant l'allemand doit être formulée ici. L'allemand
manifeste une épenthèse de coup de glotte à l'initiale de mot d'une part, en hiatus dont la
83
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
deuxième syllabe est accentuée d'autre part. Ces deux contextes ont été réunis par Scheer
(2000a : 140-155) en tant que constituant un contexte disjonctif puisque produisant "les
mêmes effets phonologiques sur des objets qui sont initiaux de mot et placés sous (à
proximité de) l'accent", ce qui permet de proposer une explication unifiée de l'apparition d'une
épenthèse en allemand (en-dehors des cas d'épenthèse en finale après consonne). Etant donné
que c'est la seule langue de cet inventaire à être en mesure de bénéficier de cette explication
mais que ce n'est pas la langue pour laquelle je cherche une explication, je ne développerai
pas le détail de son analyse ici.
Dans les autres langues considérées dans l'inventaire, l'hiatus se combine avec une
contrainte relative à une frontière morphologique (knni, baka, tchèque, ilokano, japonais,
tigrigna, axininca campa), voire, en plus, à une mélodie particulière (knni, gokana), ou
"seulement" à la frontière et à la mélodie (indonésien).
2.2.4.3. Résumé
De cette étude des éléments internes déclencheurs de l'épenthèse ressortent deux
informations principales :
1. l'hiatus est une condition nécessaire dans 20 cas sur 29 répertoriés ici, mais n'est une
condition suffisante que pour un ou deux d'entre eux.
2. les frontières morphologiques ne sont jamais suffisantes pour faire apparaître une
épenthèse, et se combinent dans 10 cas sur 11 à l'hiatus.
Il s'agira d'observer les épenthèses en français à la lumière de ces tendances qui
semblent se dégager de l'examen des langues présentant une épenthèse dans le monde (cf.
section 3 et partie III). Pour l'heure, intéressons-nous aux facteurs extra-linguistiques de
l'apparition d'une épenthèse consonantique.
2.2.5. Facteurs non linguistiques
Parmi les facteurs pouvant favoriser l'apparition d'une épenthèse figurent un certain
nombre de raisons extérieures à la structure de la langue, phonologique, syntaxique,
sémantique ou morphologique. Il s'agit tout d'abord de l'influence de l'orthographe : dans
quelle mesure une consonne sans réalité linguistique mais figurant dans la graphie d'un mot
va-t-elle être prononcée ? L'analogie est un second facteur couramment invoqué à l'apparition
84
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
d'une épenthèse, parfois associé à troisième facteur, partiellement lexicologique, qui consiste
en la remotivation d'un signifiant, sa réinterprétation pouvant aboutir à l'insertion d'une
consonne issue d'un autre paradigme. Enfin, des raisons sociales ou contextuelles peuvent
également être envisagées.
Commençons par évaluer l'influence possible de l'orthographe sur l'apparition d'une
épenthèse.
2.2.5.1. Influence de l'orthographe
La question de l'influence de l'orthographe sur les réalisations épenthétiques n'est pas
si triviale qu'il y paraît au premier abord. Pour Apothéloz (2002 : 142 note 3), "l'influence de
l'écrit sur l'oral est (...) telle que certaines de ces marques peuvent se manifester dans des
prononciations recherchées ou hypercorrigées, notamment par le biais de la liaison :
[tyazydlas] (tu as eu de la chance), [ilztditbi] (ils entendirent un bruit)."
Il met d'ailleurs en parallèle deux systèmes morphologiques distincts pour une langue
donnée : "à côté du système morphologique naturel et "premier" de la réalité orale, existe un
système morphologique "second", sorte d'artefact engendré par les conventions régissant
l'orthographe. En français ce système second a une prégnance particulière dans le domaine de
l'orthographe dite grammaticale […]. Dans le domaine de la flexion verbale et nominale,
l'orthographe française a un ensemble de marques purement graphiques, qui n'ont pas de
correspondant oral. L'omniprésence de l'écrit, de même que la tendance, très forte en
francophonie, à naturaliser les conventions orthographiques pour en faire la réalité
linguistique première, ne font que renforcer la prégnance de cette morphologie seconde, ce
qui contribue au retour à masquer la réalité orale." (Apothéloz 2002 : 141-142)
S'il est vrai en effet qu'une langue est d'abord orale avant que d'être écrite d'une part, et
que si tous les locuteurs d'une langue la parlent, tous ne l'écrivent pas d'autre part, il n'est donc
cependant pas irraisonné de supposer une influence de l'écrit sur la réalisation d'épenthèses
consonantiques. La connaissance - ou la supposition - de l'orthographe d'un mot peut inciter
un locuteur à réaliser un son qui ne serait au départ qu'écrit pour des raisons indépendantes de
la phonétique (rappel de l'étymologie, distinction d'avec un terme homophone, etc.). Pupier &
Grou (1974) envisagent d'ailleurs cette hypothèse explicative dans le cas des [t] finaux que
l'on entend facultativement en français canadien et qui ne sont pas sous-jacents : [but] / [bu]
85
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
"bout", [patut] / [patu] "partout", [pt] / [po] "pot", etc. Dans ce cas l'hypothèse est rejetée
du fait que ces [t] se trouvent également à la finale de termes ne comportant pas de -t dans
leur graphie : [ft] "frais", [puit] "pourrie", [isit] "ici", [lt] "laid", etc.
Cependant, dans une langue comme le français où d'une part, le statut de l'écrit est très
important, et où d'autre part, ledit écrit comporte tant de consonnes non prononcées, la
tentation est grande pour le locuteur, face à une incompatibilité structurale ou à un hiatus
"dérangeant", de faire appel à ces consonnes, qui de purement graphiques peuvent accéder au
statut de son réellement réalisé. Bien entendu, l'influence de l'écrit sur l'oral ne se justifie que
dans la mesure où d'autres motivations, phonologiques cette fois, se greffent sur l'écrit : toutes
les consonnes graphiques ne sont pas prononcées en français !
L'écrit peut donc, dans une certaine mesure, expliquer l'apparition d'une consonne. Je
reviendrai sur le cas particulier du français en section III [10] 2.4.3.3. Une seconde
explication non phonologique est aussi fréquemment avancée pour rendre compte de ces
épenthèses : l'analogie.
2.2.5.2. Analogie et remotivation
L'analogie est prise pour justification de l'épenthèse dans la diachronie du français
comme en français actuel ou encore en français québécois.
Picard (1989 : 227) s'intéresse à l'évolution du latin SPINULA. Pour résoudre le
problème posé par la juxtaposition des consonnes [n] et [l] après la chute du [u], pourquoi ne
pas avoir inséré un [t] ? La coronale était la consonne attendue, tant du fait que les deux
consonnes du contextes étaient elles-mêmes coronales que parce qu'il s'agit d'une consonne
plus fréquente en épenthèse que les vélaires. Pourtant, c'est précisément une vélaire qui a été
préférée : épingle et non épintle. La raison en est analogique et non phonologique21 : "on the
basis of the likes of angle, sangle, cingle, ongle, etc., especially in light of the apparently
general tendency to do away with all such dental + l clusters by various means like
metathesis, substitution, dissimilation and reduction". Je reviendrai sur cet exemple précis en
section 3.1. pour présenter l'explication classique avancée pour ce terme.
Morin (1982 : 28-29 ; 31-36) cite le cas des épenthèses syntaxiques en français
québécois (cf. section 3.2.1) de type "ça [l] a pour effet" ou "on [l] allait à l'hôpital" : "si l'on
21
Picard mentionne tout de même que "Bloch & Wartburg have a simpler solution, namely, that "le groupe -nglfait postuler une forme lat. *spingula due probablement à un croisement avec spicula 'piquant'" (1986 : 229)"
86
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
admet que le [l] après ça est une innovation récente, alors il ne peut qu'avoir été construit
analogiquement à partir de la liaison après les autres pronoms clitiques sujets." Il en est de
même pour les épenthèses après on. Analogie également, toujours selon Morin, dans le cas
d'un [z] après ça dans de nombreux parlers de l'est de la France, "où elle a été
vraisemblablement construite par analogie sur le modèle du clitique sujet vous, voir Bloch
(1917), Aub-Büscher (1962)".
Pupier (1971 : 129) fait quant à lui appel à l'analogie pour expliquer les dérivés
faisander et caviarder en français, formés respectivement sur faisan et caviar qui ne
comportent pas de consonne sous-jacente finale (faisane et non *faisante ou *faisande pour le
féminin, caviar avarié et non caviar - t - avarié pour la liaison).
Outre l'influence de l'orthographe et l'analogie, des motivations d'ordre social ou
contextuel jouent également souvent un rôle dans l'apparition d'une épenthèse.
2.2.5.3. Motivations sociales et contextuelles
Toutes les épenthèses consonantiques d'une langue donnée ne sont pas nécessairement
réalisées par tous les locuteurs. Entrent en compte, comme dans la plupart des phénomènes
phonologiques synchroniques (liaison, élision, etc.), des variables d'ordre social comme la
profession, le niveau d'études, l'origine, l'âge, le sexe des locuteurs, ainsi que le contexte de
l'énonciation.
Morin (1982 : 10) y fait explicitement référence en ce qui concerne l'épenthèse de [l]
en français québécois (cf. section 3.2.1), tout en reconnaissant la difficulté de quantifier
précisément leur influence : "Nous ne serons pas en mesure […] d'examiner précisément le
statut sociolinguistique et la distribution géographique de ces [l]. Il nous apparaît seulement
que leur fréquence d'utilisation dépend de la classe sociale (elle est plus grande dans les
milieux défavorisés) et peut-être de l'âge et de l'origine géographique des locuteurs (nos
données […] proviennent principalement de Montréal). Elle dépend aussi de certains
contextes que nous préciserons : si nous avons noté ces [l] après ça comme dans l'exemple
(la) ou dans les noms composés comme lampe à [l]huile assez fréquemment chez nos
étudiants et nos collègues à l'Université, les formes du type (1b) et (1c) sont régulièrement
absentes dans ce milieu ; d'ailleurs certains linguistes professionnels, "locuteurs autochtones
avertis" (sic), affirment n'avoir jamais entendu rien de semblable."
87
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Nous étudierons plus en détails ce qu'il en est de l'influence de ces facteurs sociaux
quant à l'épenthèse synchronique entre radical et suffixe lors de l'étude des données que j'ai
rassemblées au moyen d'un questionnaire (cf. II [7]).
2.2.6. Bilan sur les conditionnements
Les facteurs internes à la langue se rassemblent en deux grandes catégories : les motifs
d'ordre phonologique, parmi lesquels figure en priorité l'hiatus, et les motifs d'ordre
morphologique, notamment les frontières de morphèmes. Nous avons vu que c'est en hiatus
qu'apparaissent le plus souvent les épenthèses consonantiques, sans que l'hiatus soit pour
autant une condition suffisante ; c'est en effet au niveau de la frontière initiale de syllabe
qu'interviennent les conditionnements morphologiques.
Outre ces facteurs propres à chaque langue, des motivations indépendantes peuvent
contribuer à l'apparition d'une épenthèse, tels que l'influence de l'orthographe, la prégnance de
l'analogie et l'impact des environnements sociaux et contextuels. Il est plus difficile d'évaluer
précisément leur part dans l'apparition d'une épenthèse, mais on ne peut pas les exclure de
l'ensemble des facteurs favorisant l'insertion d'une consonne non sous-jacente, non
étymologique et non prédictible par le contexte.
L'ensemble de cette section 2 a permis de prendre contact avec les différentes
épenthèses possibles dans les langues du monde, tant du point de vue de la nature du son
épenthésé que de leur position dans la syllabe ou des raisons invoquées à leur présence.
Dans la section suivante, je vais m'intéresser plus particulièrement à l'épenthèse
consonantique en français : quelles consonnes sont insérées ? Dans quelles positions ? Pour
répondre à quelles raisons ?
3. Les épenthèses en français
Le corpus élaboré dans la partie II de cette thèse porte sur les épenthèses en français
dans un contexte très particulier : à la frontière dérivationnelle entre radical et suffixe. Ce n'est
cependant pas le seul cas d'épenthèse recensé en français. Dans cette section seront
répertoriées les données concernant le français d'une façon plus large, ce qui inclut les
88
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
épenthèses observées en diachronie comme celles attestées dans certaines variétés régionales
de français.
Je distinguerai ici trois sections : les consonnes épenthésées au sein de groupes
consonantiques, les épenthèses "syntaxiques" et celles qui apparaissent à une frontière interne
de mot.
3.1. Au sein d'un groupe consonantique
L'épenthèse présentée ici intervient entre le latin et l'ancien français (Bourciez 1967 :
195 ; 188 ; 162, Fouché 1961 : 822-823), lorsque sont mises en contact certaines consonnes
du fait de la chute de la voyelle intermédiaire. J'ai déjà présenté ce cas en section 2.2.1.2 lors
du passage en revue des épenthèses de consonnes à l'intérieur de groupes consonantiques,
aussi ne donnerai-je ici que quelques illustrations :
(79)
(a) derrière nasale
(b) après liquide
(c) après [s] ou [z]
contexte déclencheur
m_r
m_l
n_r
l_r
z_r
s_r
latin
cam(e)ra
sim(u)lare
cin(e)re
mol(e)re
co(n)s(ue)re
*ess(e)re
ancien français
chambre
sembler
cendre
moldre
cosdre
estre
La chute de la voyelle post-tonique dans les proparoxytons a mis en contact, entre
autres groupes consonantiques, des séquences de deux sonantes dont la deuxième est une
liquide, ou de fricatives suivie de la sonante [r]. Selon l'analyse classique, la langue ne
tolérant pas de telles combinaisons, elle insère une consonne occlusive dont le lieu
d'articulation et le voisement sont dictés par la première consonne du groupe dans lequel elle
s'insère.
Un premier groupe consonantique brille par son absence de ce phénomène
d'épenthèse, alors qu'il s'agit bien de deux consonnes sonantes : [r_l]. Le groupe
consonantique s'est maintenu tel quel en français (Fouché 1961 : 800 cite par exemple urler),
ou "changer" le [l] en [n] (Bourciez 1971 : 186 ; poster(u)la > poterne) plutôt que
d'épenthéser l'occlusive dont le lieu d'articulation et le voisement correspondrait à ceux de la
première consonne du groupe : [d]. Ceci semble indiquer que la séquence *[dl] est "davantage
encore" prohibée que la séquence [rl], que l'on trouve par exemple dans merle du latin
mer(u)lu ou *ur(u)lare > urler. Bourciez (1971 : 153) note que "quand ils sont de constitution
89
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
tardive, le groupes tl et dl, qui n'étaient pas originaires en latin, ont éprouvé en français un
effacement de la dentale par assimilation".
On ne trouve pas non plus trace du contexte [n_l], partenaire manquant de la
combinaison des nasales avec les liquides, les trois autres [m_r], [m_l] et [n_r] étant attestés.
Cette absence est encore une fois imputable à l'interdiction du groupe *dl dans la langue.
Reprenons le cas du latin spinula présenté dans le cadre de l'analogie (section 2.2.5.2). Après
la chute de la voyelle post-tonique [u], les deux consonnes sous intérêt ici se sont retrouvées
en contact. Il y a alors bien eu épenthèse, de façon à casser ce groupe interdit ; mais
l'épenthèse a été de vélaire et non de dentale : *[tl] est interdit par la langue. Fouché (1961 :
823) établit une étape intermédiaire -ndl-, "le groupe insolite ayant été remplacé par -gl-".On
obtient donc épingle et non *épintle.
Un troisième cas de figure est absent du phénomène de l'épenthèse : les fricatives
suivies de [l] ([z_l], [s_l]). Le cas n'est pas résolu par l'épenthèse mais par la chute en français
moderne de la fricative (Fouché 1961 : 744 ; 811) : ins(u)la > île. Bourciez (1971 : 186)
indique que le [l] s'est parfois changé en [n] : pess(u)lu > pesle > pêne.
Le tableau suivant récapitule ces différents cas de figure :
(80)
_r
_l
sonante non cor __
coronale non son __
coronale sonante __
épenthèse de consonne occlusive, épenthèse de consonne occlusive, épenthèse de consonne occlusive,
lieu et voisement de la sonante
lieu et voisement de la sonante
lieu et voisement de la sonante
cam(e)ra > chambre
*ess(e)re > être
cin(e)re > cendre
résultat avec épenthèse : *tl ou *dl
épenthèse de consonne occlusive,
r_l : maintien du groupe
lieu et voisement de la sonante
chute de la première consonne
mer(u)lu > merle
sim(u)lare > sembler
ins(u)la > île
n_l : épenthèse de consonne vélaire
spin(u)la > épingle
Dans chacun des cas où l'épenthèse consonantique n'est pas observée, on constate que
la réalisation attendue aurait été *tl ou *dl, groupes consonantiques interdits par la langue.
Pour éviter ces séquences *tl et *dl, le français recourt à d'autres stratégies : la chute du [s]
dans les groupes [sl], l'épenthèse d'une vélaire dans [nl], le maintien du groupe [rl]. Ce n'est
pas le caractère "sonant" de la première consonne (qui serait à justifier pour [s] et [z]), ni sa
coronalité, qui jouent un rôle dans l'interdiction de l'épenthèse, mais c'est le groupe
consonantique que l'on obtiendrait – *tl ou *dl – qui justifie un traitement différent par la
langue.
90
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Ce cas d'épenthèse interconsonantique en français concerne la diachronie. En
revanche, les épenthèses syntaxiques et celles à la frontière morphologique sont actuellement
observables en français. Il est à noter que l'on ne rencontre pas d'épenthèse intérieure de
morphème en hiatus.
3.2. Epenthèses syntaxiques
J'entends ici par épenthèse syntaxique une épenthèse de consonne qui apparaît à la
frontière entre deux mots. Je distinguerai les épenthèses en français "régional" des épenthèses
en français "standard", les deux appellations étant utilisées davantage en tant qu'étiquettes
distinguant deux variétés de français qu'en tant que qualificatifs à comprendre dans leur sens
littéral (cf. section II [4] 1 pour une discussion sur le français "standard" et ses variations).
3.2.1. En français "régional"
Sont présentés ici les deux cas rassemblés par Morin (1982) en ce qui concerne
l'épenthèse de [l] : le français québécois et certains parlers de l'est de la France.
En français québécois, un [l] est épenthésé après on et ça, comme on peut en trouver
l'illustration dans le tableau suivant :
(81)
on
ça
a
b
c
d
on [l] avait un téléphone, on [l] avait encore des frères
dans ce temps-là, on [l] allait pas à l'hôpital
si vous [l] êtes satisfait
ça [l] a pour effet, ça [l] arrive souvent
Selon son analyse, ce [l] est au moins dans certains cas une consonne de liaison due à
l'analogie, dans d'autres "une manifestation d'un [l] agglutiné au verbe suivant" (1982 : 41),
donc d'une consonne sous-jacente. Précisons que cette épenthèse se produit toujours en hiatus,
et qu'elle est également attestée à l'intérieur de mots composés : une lampe à [l] huile (cf.
section 2.2.4.2.2).
Cependant, une analyse concurrente concernant ces [l] peut être envisagée. Morin luimême indique en effet qu'il est possible d'attribuer les épenthèses de [l] à des pronoms
clitiques dans l'ensemble des cas présentés ci-dessus, ou à un déterminant dans le cas des mots
composés. Il envisage également de considérer ce [l] comme "une consonne de liaison ou un
segment agglutiné au mot qui suit" (Morin 1982 : 10).
91
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
La validité de ce [l] en tant qu'épenthèse consonantique n'est donc pas certifiée. De
plus, j'ai démontré que [l] est la consonne la moins fréquente parmi les consonnes épenthésées
dans les langues du monde (cf. section 2.1).
Outre le français québécois, Morin (1982 : 29) présente un autre cas de liaison
syntaxique après le pronom ça, en [z] ou [l]. Il indique en effet qu'"on note une consonne de
liaison z après ça dans de nombreux parlers de l'est de la France […]. Claude Poirier nous
signale un l de liaison après ça dans le centre de la France au XIXème siècle (Jaubert, 1864)".
Cependant, le manque de données ne permet pas d'évaluer la réalité de cette épenthèse
ni d'attribuer la nature de la consonne épenthésée au contexte environnant.
En dehors de ces cas, somme toute restreints puisque se produisant uniquement
derrière les pronoms sujets ça et on, le français présente de nombreuses attestations
d'épenthèses consonantiques à la frontière entre deux mots.
3.2.2. En français "standard"
Je présenterai ici les différents cas syntaxiques recensés en y adjoignant les hypothèses
de justification d'ordre extralinguistique. J'aborderai l'aspect linguistique de cette épenthèse
dans la partie III, au chapitre 10.
Deux consonnes sont relevées en épenthèse syntaxique en français, toutes deux des
coronales : l'occlusive non-voisée [t] et la fricative voisée [z].
L'épenthèse syntaxique en français est courante, et souvent stigmatisée. On la
rencontre ainsi de façon récurrente (a) dans les cas d'inversion du sujet devant clitique à
initiale vocalique, l'épenthèse étant d'ailleurs indiquée dans l'orthographe (cf. partie III
chapitre [10]).
Si les autres contextes syntaxiques d'épenthèse en français ne sont pas normativement
autorisés, ils sont néanmoins bien réels : (b) entre verbe et préposition ; (c) entre participe
passé et verbe ; (d) entre deux pronoms ; (e) entre pronom et adverbe ; (f) et (g) entre verbe et
préposition.
92
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
(82)
a
b
c
d
e
f
g
y a-t-il
partira-t-il
les brouillards qui se sont formés-t-au lever du jour (Wetzels 1987 : 285)
si tu ne vas pas à Lagardère, Lagardère ira-t-à toi
comme le président de la république l'avait laissé-t-entendre (Wetzels 1987 : 285)
donne-moi-z-en (au lieu de donne-m'en)
elle n'est pas là-z-aujourd'hui
Malbrough s'en va-t-en guerre
Luc Ferry met [z] en garde (21/05/2003, journal radio)
Trois types de motivation peuvent être invoquées pour justifier de ces épenthèses
syntaxiques : l'hypercorrection, l'analogie et la métathèse. On distinguera, suivant notamment
(McMahon 2002), deux types d'analogie : l'analogie proportionnelle ou "four-part analogy", et
l'analogie paradigmatique ou nivellement ("paradigmatic levelling")22. Pour elle, "four-part
analogy typically takes a regular pattern and extends it to forms which were previously
irregular, paradigmatic levelling regularises the forms of a single morpheme" (2002 : 2) et elle
précise en outre que l'"hypercorrection can be seen as a variant of four-part analogy" (2002 :
1).
Ainsi en ce qui concerne les cas d'inversion du sujet (a), une analyse possible serait
d'identifier un phénomène d'analogie proportionnelle avec les verbes comportant une
consonne sous-jacente à la finale : partira-t-il prendrait un [t] en hiatus parce que prend-il se
prononce avec un [t], alors que dans leur forme affirmative aucun d'entre eux ne manifeste de
consonne à la finale : il partira, il prend [p]. Dans le cas de donne-moi-z-en, l'épenthèse se
ferait par analogie, proportionnelle également, avec le modèle de prends-en et la réfection du
pronom moi complet.
L'analogie serait dans cette optique à l'œuvre également dans le cas de Lagardère (b) :
après le verbe un [t] est épenthésé parce que le verbe est à la troisième personne ; il y a
toutefois fort à parier que l'analogie se double d'hypercorrection à cet endroit, attendu que ce
type de frontière lexicale bloque, en français normatif, la liaison : il rit à mes plaisanteries se
réalise avec l'hiatus et non il rit [t] à mes plaisanteries. Ceci semble donc étayer l'association
entre hypercorrection et analogie proportionnelle avancée par McMahon (2002 : 1).
Les épenthèses du type de celle de (g) font également intervenir à la fois l'analogie par rapport à la forme passée, reprise d'ailleurs plus loin dans le journal radiophonique cité et l'hypercorrection, mais cette fois on se situe dans un cas de nivellement puisqu'il s'agit
22
Cette bipartition se retrouve chez Kiparsky (1982 : 41-43) sous les étiquettes de leveling, "with the result that
allomorphs of some morphemes become more similar to each other or merge completely", et de polarisation, "in
which existing alternations spread to new instances".
93
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
d'harmoniser les réalisations en ce qui concerne un même morphème, celui du verbe mettre à
la troisième personne : Luc Ferry a mis [z] en garde présente une liaison en [z], la même est
donc réalisée au présent.
Pour les trois cas restants - les brouillards qui se sont formés-t-au lever du jour, le
président de la république l'avait laissé-t-entendre, elle n'est pas là-z-aujourd'hui - on
remarque que le mot précédent celui suivi de la prétendue épenthèse se termine précisément
par la consonne épenthésée, flottante. Il est donc possible que cette "épenthèse" soit en réalité
une métathèse, probablement due à de l'hypercorrection.
Les épenthèses syntaxiques sont donc possiblement justifiables par des facteurs
extralinguistiques, et le fait même qu'il s'agisse toujours de consonnes coronales serait dû sous
cette hypothèse soit au contexte de troisième personne du verbe, soit aux consonnes sousjacentes, verbales là encore ou marques de pluriel. Ces épenthèses ne sembleraient donc pas
avoir de rapport avec le caractère particulier des coronales. Je proposerai cependant une
analyse concurrente en ce qui concerne les cas (82)(a) et (d) dans la troisième partie de la
thèse, chapitre 10.
Un autre type de frontières déclenche également des épenthèses en français ; il s'agit
des frontières morphologiques intérieures de mot.
3.3. Epenthèses à la frontière morphologique interne
On peut distinguer quatre types de frontières à l'intérieur du mot :
- la frontière entre deux éléments d'un composé, de type hygia#phone ou chemin#de#fer.
- la frontière entre préfixe et radical : in#actif, dé#faire.
- la frontière entre radical et suffixe23 : joli#ment, journal#isme.
- la frontière entre radical et désinence : jou#ait, crie#ra.
De ces quatre frontières, seules deux vont faire l'objet d'une section ici. En effet, je n'ai
pas trouvé d'attestation d'épenthèse à la frontière entre les deux éléments d'un composé endehors de celle relevée par Morin (1982) en français québécois (cf. section 3.2.1), et pour
celle-ci le statut de la consonne en tant qu'épenthèse est loin d'être assuré. Aussi cette frontière
peut-elle être considérée comme neutre en regard de l'épenthèse.
23
J'emploie le terme de suffixe pour ce qui est du domaine de la dérivation, et celui de désinence pour ce qui
concerne la flexion (cf. section II [4] 3.3 pour une présentation précise de la dérivation par rapport à la flexion).
94
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
D'autre part, la frontière entre radical et désinence n'est pas toujours nettement
délimitée, et les éventuelles épenthèses qu'on y trouve (numérotais, blablatera, etc) sont
également présentes dans la forme verbale infinitive correspondante (numéroter, blablater).
Le statut de cette dernière n'est pas claire (cf. sections II [4] 3 et [3] 2) : s'agit-il d'une forme
dérivée ou d'une forme à laquelle est attachée une désinence flexionnelle ? En ce qui concerne
la flexion nominale, c'est essentiellement le féminin de l'adjectif (grande, longue) et de
certains substantifs (marchande, savante) qui fait apparaître des consonnes ; l'analyse
générale du phénomène consiste cependant à considérer que ces consonnes sont présentes
dans la forme lexicale de la base mais ne sont pas réalisées au masculin, alors que le
morphème du féminin leur apporte une position phonologique leur permettant de se réaliser.
Il ne s'agit pas d'épenthèse (cf. par exemple Apothéloz 2002 : 36-38).
Les deux sous-sections s'intéresseront donc ici à la frontière entre préfixe et radical et
à celle entre radical et suffixe.
La revue des épenthèses dans les langues du monde (section 2) a permis de mettre en
évidence la prépondérance des épenthèses aux deux frontières dérivationnelles. Le
conditionnement créé par la frontière se double d'un impératif de positionnement en hiatus.
Retrouve-t-on ce même doublet en français ?
3.3.1. Entre préfixe et radical
Un rapide survol des dérivés préfixaux du français pourrait laisser penser que le
français connaît des épenthèses consonantiques de consonnes à la frontière entre préfixe et
radicaux. Mettons en effet en regard des paires de dérivés comme défaire / déshabituer et
tricyclique / trisaïeul.
Dans le premier cas, il y a bien apparition d'un [z] dans le deuxième mot, le préfixe
étant pourtant le même (même type de base, même signifié), lorsque la frontière se situe en
hiatus. Il serait pourtant hâtif de conclure à une épenthèse : si tel était le cas, tout hiatus
correspondant à une frontière entre préfixe et radical devrait se voir adjoindre cette consonne
épenthétique. Or de nombreux dérivés français comme préavis ou rééditer viennent invalider
cette hypothèse. De plus, [z] n'étant ni une consonne épenthétique dans les langues du monde,
ni la seule consonne possible en français, il faudrait encore expliquer pourquoi c'est cette
consonne qui apparaît dans ce contexte et non [t], nettement plus répandu dans les langues en
95
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
général, et aussi en français, comme on va le voir dans la section 3.3.2. Le [z] appartient donc
au préfixe en tant que consonne sous-jacente (cf. Apothéloz 2002 : 36), qui ne se manifeste en
surface que devant voyelle initiale de base. Il s'agit d'une propriété lexicale de chaque
préfixe : /dez/ comporte la consonne flottante, mais non /re/ ou /pre/.
Le cas est identique en ce qui concerne la deuxième paire de mots proposée ici
(tricyclique / trisaïeul), bien que l'on puisse trouver en français des dérivés formés à partir de
bases à initiale vocalique et de ce même préfixe tri, sans que ce soit l'allomorphe avec [z] qui
surgisse en surface : trialcool, triacide, triathlon, triatomique ; trièdre, triennal, triester ;
triode, trionyx en forment la liste exhaustive (Nouveau Petit Robert 1993).
Deux remarques sont à faire à ce propos : certains de ces mots sont posés par le Robert
comme facultativement réalisables avec un [j] à la frontière (trionyx, trièdre, triathlon),
d'autres avec [j] "obligatoire" (triode, triennal), d'autres enfin avec [j] "interdit" (triester,
triacide, trialcool, triatomique), ce qui indique que la frontière ne "réclame" pas
nécessairement le remplissage par une consonne épenthétique d'une part, ni que celle-ci soit
systématiquement la même le cas échéant. On ne peut pas non plus conclure, à partir du
corpus de termes en tri- sans épenthèse, à une distribution régulière de l'apparition de jod.
D'autre part, il s'agit dans tous les cas de mots savants, ce qui signifie que la formation a été
possiblement réfléchie et non spontanée, entraînant un choix délibéré de la forme sans [z].
Aussi semble-t-il qu'il faille reconnaître à la lacune distributionnelle de l'allomorphie entre triet tri[z]- des raisons purement extérieures à la langue et non le fait d'une épenthèse pour
laquelle il faudrait supposer un conditionnement idiosyncratique, un marquage au cas par cas
dans le lexique.
Cette absence d'épenthèse entre préfixe et radical disqualifie ce type de frontière
comme élément déclencheur en français. Il reste à examiner maintenant l'épenthèse à la
frontière entre radical et suffixe ; la section suivante en propose une présentation générale.
3.3.2. Entre radical et suffixe
L'insertion d'une consonne dans la réalisation d'un dérivé entre le radical et le suffixe,
tout comme pour les consonnes apparaissant à la frontière entre préfixe et radical, est
susceptible de recevoir une explication en termes d'allomorphie suffixale, de suffixes distincts
ou de réalisation de la consonne sous-jacente de la base.
96
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Plénat (1999) pose ce problème de la distinction entre une consonne, devant un
suffixe, qui relèverait d'une épenthèse, de celle appartenant à un suffixe à initiale
consonantique. C'est le cas par exemple des suffixes -ingue (sourdingue sur sourd, follingue
sur fol, rapidingue sur rapide, etc.), -if (largif sur large, furaxif sur furax, orthodoxif sur
orthodoxe, etc.) ou -oche (valoche sur valise, Césaroche sur César, baloche sur ballotine,
etc.), que l'on peut mettre en relation respectivement avec -dingue (loufdingue pour louf,
buffedingue pour buffet, foldingue pour fol, etc.), -tingue (louftingue pour louf, mouftingue
pour mouflet, mochetingue pour moche, etc.), -zingue (chiottesingues sur chiottes, papezingue
pour papier, cabzingues pour cabinets, etc.), -lingue (burlingue) ; -sif (booksif sur book, paxif
sur paquet, pecsif sur pécore, etc.), -pif (beaujolpif sur beaujolais), -sif (pognzif sur pognon,
trognezif sur trognon, beignzif sur baigneur, etc.), -gif (dargif sur darrière, vergif sur verni) ; toche (fastoche, vachetoche, mastoche, etc.), -boche (Alboche pour Allemand, dégueulboche
pour dégueulasse, Italboche pour Italien, etc.), -doche (valdoche), -loche (amerloche pour
américain, burloche pour bureau, dirloche pour directeur, etc.). Comment être sûr qu'il s'agit
bien de variantes d'un même suffixe et non d'autant de suffixes ? Pour Plénat (1999 : 102), "si
ce sont vraiment des variantes, la question se pose aussi de déterminer le conditionnement de
leurs formes et de leur répartition. Ces questions sont malaisées, dans la mesure surtout où les
données font en général cruellement défaut".
Deux contextes sont envisagés ici, selon que le radical se termine par une consonne ou
par une voyelle. Trouve-t-on des épenthèses consonantiques dans les deux cas ?
3.3.2.1. Après consonne : Plénat (1997, 1999)
La logique veut que l'on envisage les deux options théoriquement possibles après
consonne : devant consonne et devant voyelle. La littérature ne répertorie pas d'épenthèse
consonantique à la frontière suffixale au sein d'un groupe de consonnes, aussi doit-on se
tourner dès à présent vers le deuxième contexte : C_V.
3.3.2.1.1. Présentation des données
Plénat (1997) s'est intéressé aux dérivés en -Vche (où V indique un ensemble de
voyelles possibles : -oche, -uche, etc), tandis que Plénat (1999) a mis en évidence la
97
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
distribution des allomorphes de suffixes -ingue et -if. Ces suffixes se voient précédés d'une
consonne potentiellement épenthétique, après la dernière consonne du radical (maintenue).
Les trois suffixes étudiés appartiennent à la catégorie des suffixes évaluatifs et se
concatènent à des bases nominales, adjectivales ou verbales, voire adverbiale, soit par simple
concaténation, soit par troncation de la rime finale, mais sans changer la catégorie ni la
capacité référentielle de la base.
(83)
-(C)ingue
-(C)if
-(C)Vche
concaténation
simple
troncation de la
rime de la base
concaténation
simple
troncation de la
rime de la base
concaténation
simple
troncation de la
rime de la base
base verbale
base nominale
base adjectivale
base adverbiale
roul(er)
> automobile
> sourd > sourdingue
roulingu(er)
automobilingue
pardessus
> dégourdi
> rapidement >
pardingue
dégourdingue
rapidingue
fort > fortif
cartable > cartif
bav(er)
bavoch(er)
> César > césaroche
valise > valoche
chiatoire > chiatif
fort > fortiche
métallique
métalloche
> dorénavant >
dorénavuche
Les cases restées vides ne le seraient que par manque d'illustration et non par
impossibilité logique. Par ailleurs, les dérivés à l'aide de suffixes évaluatifs sur des bases
verbales ou adverbiales sont tout de même minoritaires : ce sont essentiellement les noms et
les adjectifs qui se voient concaténer ce type de suffixes. Enfin, le mode de concaténation
favori est la substitution à la rime de la base plutôt que la concaténation simple.
Ces suffixes sont attestés également avec différentes consonnes à l'initiale :
- en ce qui concerne le suffixe -ingue sont attestées les finales complexes -dingue, -tingue, lingue et -zingue ;
- le suffixe -if apparaît avec les finales complexes -zif, -sif, -gif, -chif, -bif et -pif.
- pour le suffixe -(V)che, on trouve notamment les finales complexes en -t(V)che, -d(V)che, l(V)che, -m(V)che24.
Ces finales complexes, comme les finales simples, apparaissent dans le cas de la
concaténation simple comme dans celui de la troncation de la base ; on peut en voir
l'illustration dans le tableau suivant :
24
Etant donné que le suffixe -Vche comporte de plus une alternance vocalique pouvant compliquer la
présentation, j'exposerai plus particulièrement ici le cas des suffixes -ingue et -if ; les données concernant le
suffixe -Vche ne sont pas exhaustives mais revêtent simplement une valeur illustrative.
98
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
suffixe
suffixe
-[t] _
-[d]_
rif
> louf >
concaténariftingue loufding
tion simple
ue
mouflet buffet >
troncation
> mouf- buffedin
rime base
tingue
gue
concaténa/
/
tion simple
/
/
troncation
rime base
-(C)Vche
-(C)if
-(C)ingue
(84)
vache >
concaténavachetion simple
toche
facile > valise >
troncation
fastoche valdoche
rime base
suffixe
-[s] _
/
/
suffixe
-[z] _
chiottes >
chiottezingues
tacot
>
taczingue
suffixe
-[] _
/
suffixe
-[] _
/
suffixe
-[b] _
/
suffixe
-[p]_
/
suffixe
-[l] _
/
/
/
/
bureau >
burlingue
noir >
noircif
paquet > pognon > plumard darrière
paxif
pognzif
> plume > dargif
chif
/
/
/
/
/
/
/
/
/
beaujolais >
beaujolpif
dégueulasse >
dégueul
pif
/
/
Allemand >
Alboche
/
américain
>
amerluche
Les barres obliques indiquent que la consonne posée en en-tête de colonne n'est pas
attestée avec le suffixe considéré. L'absence d'exemple ou de barre oblique renvoie à un
simple manque d'illustration mais non à une impossibilité de fait ; en effet, la concaténation
sans substitution de suffixe étant la variante marquée de ces dérivations, certaines cases ne
sont pas remplies en regard de la concaténation simple.
La présence d'une finale simple (-ingue, -if, -Vche) ou d'une finale complexe (-Cingue,
-Cif, CVche, dans lesquelles C renvoie à une consonne de l'inventaire possible pour chaque
suffixe), ainsi que dans une certaine mesure le choix de la troncation (fastoche) plutôt que de
la concaténation simple (vachetoche), sont prédictibles à partir de la nature des consonnes
finales ou internes de base. Ainsi le morphème -ingue apparaît sous la forme simple si la
dernière consonne ou la consonne interne de la base est une coronale voisée orale (sourdingue
sur sourd, lazingue sur lasagne, follingue sur fol), mais sous une forme à initiale
consonantique si aucune consonne interne ou finale de la base n'appartient à cette classe25
(buffedingue sur buffet, burlingue sur bureau). Le morphème -if est présent sans consonne
25
Cette règle semble néanmoins associée à une contrainte selon laquelle "la coronale qui précède -ingue doit en
fait être la tête de l'attaque de la syllabe finale du dérivé" (Plénat 1999 : 111). Aussi dans une base comme
mornifle, bien qu'il y ait présence d'une coronale orale voisée ([l]), le dérivé n'est pas morniflingue mais
morningue, et ce bien que [n] ne fasse pas partie de cet ensemble des coronales orales voisées. De même, la base
mouflet ne donnera que facultativement mouflingue ; on trouvera également mouftingue.
Une autre explication (Plénat 1999 : 112) tient au fait que le suffixe soit attaché à un groupe consonantique
(syllabé en "coda-attaque" ou en "attaque branchante"), et ce même si la consonne finale ne fait pas partie de
l'inventaire des consonnes attestées devant -ingue (alpague > alpingue, poitrinaire > poitringue).
99
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
ajoutée à son initiale si l'une des consonnes de la base autre que l'initiale appartient à
l'ensemble {/t/, /s/, /z/, //, //} (cartif sur cartable, torchif sur torchon).
Le tableau ci-dessous exemplifie les finales de bases attestées devant les terminaisons
simples (hors finales en groupes consonantiques, nécessairement suivies de la variante
simple) :
(85)
base en -[t]
-ingue
smart >
smartif
-if
base en -[d] base en -[s]
sourd >
/
sourdingue
/
pensionnaire
> pensif
base en -[z] base en -[] base en -[] suffixe -[l]
lasagne >
/
/
fol >
lazingue
follingue
rasoir >
torchon >
dragée >
/
rasif
torchif
dragif
Le tableau suivant propose une schématisation de la distribution entre les deux grandes
catégories d'allomorphes : avec et sans consonne initiale.
(86)
-(C)ingue
-(C)if
allomorphe à initiale vocalique
allomorphe à initiale consonantique
finale ou consonne interne de la base = finale ou consonne interne de la base = autres
coronale voisée orale hors /r/
consonnes
ou groupe de deux consonnes
finale ou consonne interne de la base = finale ou consonne interne de la base = autres
coronale orale hors {/d/, /l/}
consonnes
Il s'agit là d'une répartition schématique, qui masque les irrégularités observées. Ainsi
en ce qui concerne le suffixe -ingue par exemple, si la situation est relativement claire pour les
occlusives et les fricatives, elle l'est moins pour les sonantes.
Commençons par les obstruantes : coronales voisées orales, elles sont suivies de
l'allomorphe simple, mais de l'allomorphe à initiale consonantique après toute autre consonne.
Or Plénat (1999 : 112 note 12) cite les exceptions suivantes : laubingue sur laubé "beau" et
popingue sur Popincourt d'une part, prouvant que d'autres consonnes occlusives peuvent être
suivies de l'allomorphe simple ; batingues sur Batignolles et crassingue sur crasseux d'autre
part, indiquant que les coronales non voisées sont également attestées avec la variante simple.
Les sonantes, quant à elles, sont largement irrégulières. En effet, des trois sonantes
coronales du français (/n/, /l/ et /r/), seule /r/ est obligatoirement suivie de l'allomorphe à
initiale consonantique26 (bureau > burlingue, tiroir > tirlingue). /l/ est parfois suivi de
l'allomorphe simple (follingue sur folle, seulingue sur seul), mais il est également attesté avec
la finale à initiale consonantique (foldingue sur fol, valdingue sur valise) et les deux
26
Sur les six dérivés de l'inventaire proposé par Plénat (1999 : 114), trois (burelingue, carelingue,
politburlingue) sont formés à partir de bases en -[o]. Peut-on y voir 1. une trace de l'étymologie des bases
(bureau < burel, carreau < quarrel) ou 2. une émanation du [o] ?
100
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
attestations comportant /n/ à la finale (hors groupe consonantique) de la base se répartissent
équitablement entre l'allomorphe simple (ciningue sur cinéma) et l'allomorphe à initiale
consonantique (fouinzingue sur fouinard).
Admettons néanmoins cette répartition schématique, indicatrice des grandes
tendances, de façon à suivre l'argument.
Outre la présence même d'une consonne en initiale de suffixe, la nature de cette
consonne est prédictible en fonction du contexte, plus précisément en fonction de la dernière
consonne du radical (base entière ou tronquée) à laquelle elle s'adjoint : "la consonne initiale
d'une finale complexe est une occlusive quand la consonne qui la précède est une fricative, et
vice versa, /r/ sélectionne /l/ avec -ingue et une fricative avec -if, /l/ paraît sélectionner /d/
avec -ingue et /b/ ou /p/ avec -if." (Plénat 1999 : 122-123 ; 104-107 pour le détail concernant
le suffixe -Vche, 113-114 pour -ingue, 119-120 pour -if).
Tournons-nous maintenant vers le commentaire de ces données : la finale simple et
celle à initiale consonantique sont-elles allomorphiques ou faut-il supposer l'insertion d'une
consonne épenthétique dans le cas de la finale complexe ?
3.3.2.1.2. Analyse des données
Bien que la distribution des deux formes du suffixe soit prédictible à partir de la base,
ou plus précisément de la nature de la consonne de la base à laquelle le suffixe se concatène,
Plénat (1999 : 123) rejette l'hypothèse de la distribution complémentaire de deux allomorphes,
l'un à initiale vocalique, l'autre à initiale consonantique, pour la raison suivante : c'est toujours
la même consonne qui apparaît devant le suffixe, qu'elle soit directement une de celle de la
base ou qu'elle provienne du suffixe27 ; de ce fait, "le principe qui préside aux choix de la
consonne qui sera amenée à précéder les finales -ingue et -if est le même dans les finales
simples et dans les finales complexes. (…) Si, en effet, le répertoire des suffixes comportait
les variantes complexes à côté des variantes simples, il faudrait que la constitution des
premières obéisse à une règle de structure morphématique, tandis que la répartition des
variantes simples obéirait à une règle régissant la sélection du radical dans la lexie de base.
27
Il ne convainc pas complètement Apothéloz (2002 : 94) puisque celui-ci, bien que citant Plénat (1999),
considère qu'"on peut voir dans ces ajouts soit des épenthèses soit un fait de variation allomorphique sur le
suffixe". Toutefois, Apothéloz ne propose aucun argument en faveur de l'une ou de l'autre explication.
101
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Les deux mécanismes seraient différents, et ce serait un hasard qu'ils sélectionnent les mêmes
consonnes".
Cependant, et comme Plénat le note lui-même, on constate des exceptions à cette règle
qui veut que l'on trouve les mêmes consonnes devant la voyelle initiale de suffixe, qu'elles
soient finales de base ou initiales de suffixe. A commencer par les bases à finale complexe,
qui préfèreront concaténer le suffixe à une autre consonne du radical n'appartenant pas à
l'ensemble autorisé plutôt que derrière le groupe consonantique (cf. note 19 ; Plénat 1999 :
112) : le dérivé de mornifle n'est pas morniflingue mais morningue, alors que le [n] ne fait pas
partie de l'inventaire des consonnes autorisées ; alpague donnera alpingue, bien que [p] ne
soit même pas coronale.
La distribution est encore moins nette en ce qui concerne le suffixe -if : "l'ensemble
des consonnes licites devant la finale simple -if ne coïncide pas exactement avec celui des
consonnes initiales des finales complexes en -C+if" (1999 : 122). Il faut cette fois envisager la
régularité par la négative : les coronales orales qui sont interdites devant la finale simple -if
sont les mêmes que les coronales orales qui ne peuvent être initiales de la finale complexe C+if (cf. Plénat 1999 : 122).
Si l'identité n'est pas complète entre les consonnes possibles devant la finale simple
des suffixes et celles présentes à l'initiale de la finale complexe, alors l'argument contre la
distribution complémentaire d'allomorphes perd de sa vigueur, sans pour autant être rejeté.
Un deuxième problème est soulevé par l'analyse de la première consonne de finale
complexe en tant que consonne épenthétique. En effet, supposer la consonne épenthétique,
dans les cas exposés ci-dessus, devant le suffixe, revient à supposer soit l'insertion d'une
position consonantique vide (puisque le contenu mélodique est prédictible par le contexte)
après consonne, soit la présence d'une position consonantique vide à l'initiale du suffixe.
L'insertion d'une position consonantique après une consonne pouvant être syllabée en
attaque de la syllabe suivante semble difficile à soutenir : universellement, les syllabes sont
préférentiellement de la forme CV, l'attaque étant remplie en priorité sur la coda de la syllabe
précédente (sauf en cas de liaison sans enchaînement, cf. Encrevé 1988a). La mélodie seule
peut-elle être considérée comme suffisante pour déclencher une épenthèse de position ? Il
semble qu'il s'agisse alors d'un cas unique dans les langues du monde, dans lesquelles la
mélodie n'est jamais un motif suffisant à l'épenthèse ; elle s'adjoint à un hiatus, associé
éventuellement à une frontière morphologique. Il y a effectivement ici frontière
102
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
morphologique, mais elle ne peut jouer de rôle dans l'apparition de la position puisque la
même frontière dans certains cas est suivie de l'allomorphe à initiale vocalique. Par ailleurs, il
n'y a pas d'hiatus disponible, donc pas de contrainte liée à la structure de la syllabe (cf. section
2.2). Aussi semble-t-il qu'il faille rejeter l'hypothèse d'une insertion de position consonantique
avant le suffixe.
Si la position est présente à l'initiale du suffixe, mais non reliée à du matériel
mélodique, cela explique que l'épenthèse puisse se produire après consonne : la mélodie
générée par le contexte vient s'adjoindre à une position déjà existante mais vide (cf. section
3.3.2.1.1), comme l'illustre la représentation de burlingue ci-dessous :
A
N
C
As
Ns
Cs
|
|
|
|
|
|
b
y
r
l


×
Par ailleurs se pose la question de la chute de la voyelle [o] de bureau. Pourquoi la
voyelle devrait-elle impérativement chuter alors que le suffixe fournit une position
consonantique pouvant "résoudre l'hiatus" à la frontière morphologique ? A quoi serait due la
nécessité du contact des deux consonnes ? Elle ne peut venir d'une contrainte portant sur la
structure de la syllabe, attendu qu'une syllabe avec coda correspond à une situation marquée
par rapport à une syllabe sans coda.
Intéressons-nous enfin à la mélodie. Qu'est-ce qui est exactement épenthésé si la
position consonantique est présente à l'initiale du suffixe ? Pour le suffixe -ingue, toutes les
consonnes possibles à l'initiale du suffixe sont des coronales orales, ce qui correspond à une
des catégories de consonnes épenthétiques observées dans les langues du monde (cf. section
2.1). Le voisement n'est pas propre à toutes les épenthèses possibles, aussi sera-t-il difficile de
prédire sa provenance : s'il arrivait par l'épenthèse ou était présent dans le lexique, attaché à la
position consonantique "vide", on ne trouverait pas d'allomorphe à initiale sourde ; or -tingue
est une des terminaisons possibles. On ne peut pas davantage considérer qu'il est donné par la
consonne finale de la base, ni qu'il est produit par dissimilation, puisque l'on trouve des
consonnes sourdes aussi bien que sonores devant les terminaisons à initiale consonantique. En
103
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
ce qui concerne le suffixe -if, les consonnes présentes à son initiale ne sont pas
nécessairement des coronales puisque l'on trouve également les labiales [p] et [b] ; faut-il
alors considérer qu'une labiale peut être épenthésée ex nihilo, alors qu'il semble qu'aucun cas
n'est relevé dans les langues du monde ?
Considérons un instant l'hypothèse de la troncation. Le suffixe serait présent dans le
lexique sous sa forme longue, par exemple -Cingue dans laquelle C serait spécifiée coronale
voisée orale (mettons de côté le cas de -tingue pour suivre l'argument). Dans ce cas, il y aurait
troncation de la consonne initiale de suffixe (ou assimilation au mode d'articulation de la
consonne finale de base puis troncation de celle-ci) lorsqu'elle est en contact avec la même
consonne finale de base : pard(essus) + -C[coronale
voisée orale]ingue
met en contact deux
consonnes coronales voisées, l'une des deux disparaît28. Cependant, cela indiquerait un certain
"masochisme" de la part du suffixe, qui tantôt sélectionne les bases qui vont lui permettre de
ne pas réaliser sa consonne initiale, tantôt se concatène à des bases consonantiques qui lui
permettent de la réaliser et définit son mode articulatoire par dissimilation avec celui de ces
bases. Pourquoi deux mécanismes différents ? Pourquoi ne pas procéder par dissimilation
après une consonne coronale voisée orale ?
Tâchons à présent d'établir le bilan de l'analyse.
3.3.2.1.3. Bilan
Il semble que l'hypothèse d'une épenthèse ne soit pas pleinement satisfaisante. En
effet, l'apparition d'une épenthèse consonantique est mise à mal par le manque de
prédictibilité fiable de ses occurrences d'une part, étant donné qu'après une même consonne
finale de base peut ou non avoir lieu une épenthèse, et la difficulté d'attribuer l'insertion de la
position consonantique à la mélodie d'autre part. Si la position squelettale est donnée par le
suffixe, alors se pose la question de la troncation de la base après consonne : pourquoi celle-ci
doit-elle impérativement se terminer par une consonne ?
28
On peut également supposer qu'il n'y a pas troncation mais consonne géminée (Ségéral & Scheer 1999b) en
forme sous-jacente, qui se réalise simple en surface. La discussion à ce sujet n'est pas pertinente pour la
démonstration ici.
104
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
Si l'on rejette l'hypothèse d'une épenthèse, étudions alors l'éventualité d'une
distribution complémentaire entre un allomorphe à initiale vocalique et un allomorphe dont
l'initiale comporte une position consonantique (syllabée en attaque) vide, ou contenant la
spécification du lieu d'articulation coronal, ainsi que les indications de voisement et d'oralité.
La répartition entre les deux s'établit en fonction de la consonne du radical à laquelle ils se
concatènent. Autant l'épenthèse ne peut pas être dictée par la seule mélodie, autant ce seul
paramètre peut déterminer le choix de l'un ou l'autre des allomorphes.
Ainsi pour le suffixe -ingue, c'est la variante à initiale consonantique qui est choisie
après une consonne coronale voisée orale, et la variante à initiale consonantique après toute
autre consonne. La détermination de la nature mélodique de la consonne qui apparaît en
surface dépend crucialement de la consonne à laquelle elle est directement concaténée, et
s'établit par dissimilation : fricative après une occlusive, occlusive après une fricative, /l/
après l'autre liquide du français /r/. Dans le cas de ce suffixe, l'inventaire des consonnes
attestées devant l'allomorphe à initiale vocalique est le même que celui des consonnes
observées dans la variante complexe, à une exception près : [t] est possible dans
l'allomorphe à initiale consonantique, mais [t] ne se manifeste jamais en fin de radical devant
l'allomorphe à initiale vocalique.
Puisque d'une part il s'agit d'allomorphes ; puisque d'autre part le contexte permet de
prédire à la fois le fait qu'ils comportent une consonne initiale et la nature de cette consonne,
alors il ne s'agit pas d'épenthèses ex nihilo. Certes la consonne n'est pas étymologique, certes
il est difficile de concevoir qu'elle est sous-jacente étant donné la multiplicité des consonnes
possibles. Elle constitue cependant une émanation directe du contexte en ce qui concerne sa
nature (par dissimilation), et la présence même de l'allomorphe à position initiale
consonantique dépend de la mélodie.
Les données et l'analyse proposées par Plénat ont permis d'évaluer la possibilité
d'épenthèse consonantique derrière une consonne à la frontière morphologique qui nous
intéresse. On peut douter qu'il s'agisse d'une épenthèse, étant donné que l'on ne peut exclure la
possibilité qu'il s'agisse en réalité d'allomorphes distincts, l'un à initiale vocalique, l'autre
présentant une position consonantique à l'initiale, dont le remplissage mélodique serait assuré
par le contexte. Il y a donc bien épenthèse, mais non ex nihilo. Parce que les épenthèses
105
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
présentées ici ne sont pas ex nihilo, ces données ne rentrent pas dans le cadre empirique que je
me suis donné.
L'analyse du corpus établi dans la partie II aux chapitres 5 et 6 permettra de conclure
quant à la présence d'une épenthèse dans un environnement partiellement consonantique :
peut-on considérer par exemple qu'un terme comme médiumnique (médium + ique) constitue
un cas d'épenthèse consonantique ?
Je viens d'exposer les cas possibles d'épenthèse après consonne en français.
Cependant, la section 2 a montré que dans les langues considérées, c'est après une voyelle, et
plus précisément en hiatus, que l'on atteste la plupart des épenthèses consonantiques. Je vais
montrer dans la partie suivante que le français comporte également des épenthèses dans ce
contexte précis, bien qu'il ne s'agisse aucunement d'une condition nécessaire. Dans la
troisième partie de cette thèse en effet, je démontrerai que l'hiatus n'est pas la condition
déterminante de l'épenthèse consonantique.
3.3.2.2. Après voyelle
L'épenthèse à la frontière suffixale après voyelle concerne potentiellement deux cas de
figure : l'hiatus vocalique, ou la position devant consonne (V_C). Cependant, ces cas ne sont
bien souvent pas distingués, pour les raisons invoquées dans le paragraphe 3.3.2.2.2.
Dans les deux sections suivantes, je précise simplement quels cas sont concernés,
puisque les données seront évaluées et analysées dans la troisième partie de la thèse.
106
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
3.3.2.2.1. En hiatus
Il s'agit de cas de type absolutiste (absolu + iste) ou noyautage (noyau + age), c'est-àdire dans lesquels une base à finale vocalique est concaténée à un suffixe à initiale vocalique.
Les ouvrages sur la dérivation suffixale en français (Gruaz 1988, Corbin 1987, Dubois &
Dubois-Charlier 1999, Apothéloz 2002 par exemple) en font état, sans dégager de généralité à
leur sujet29. Je montrerai en partie III qu'il ne s'agit que d'un des contextes possibles d'une
épenthèses consonantiques, et non du contexte déclencheur.
3.3.2.2.2. Devant consonne
Etant donné que ce contexte correspond souvent, graphiquement parlant, à la frontière
gauche d'un -e (-erie, -ement), l'épenthèse n'est pas distinguée des cas en hiatus dans les
manuels de lexicologie. Entrent également dans cette catégorie les dérivés formés à partir de
suffixes à initiale en glide, type cacaotier (cacao + ier). L'analyse proposée dans la partie III
montrera qu'il s'agit effectivement d'un phénomène unique, mais non pour de simples raisons
graphiques.
3.4. Bilan sur le français
En français, les deux endroits où l'épenthèse consonantique est susceptible de se
produire sont la frontière entre deux mots et la frontière suffixale. Entre deux mots, la
présence d'un hiatus est une condition déterminante, alors qu'il ne semble pas que ce soit le
cas à la frontière suffixale : une consonne peut être présente en début de suffixe comme en fin
de base. Cette dernière affirmation sera réévaluée à la lumière du corpus et du questionnaire
élaborés en partie II et analysés en partie III [11].
29
Apothéloz (2002 : 92) ne parle d'épenthèse qu'à l'occasion de l'étude des suffixes diastratiques, c'est-à-dire
dans le cas où ces suffixes introduisent une variation "liée à la différence des 'registres' de la parole". Pour
autant, il ne dit pas formellement que les épenthèses ne se rencontrent qu'avec ce type de suffixe, mais plutôt que
ce type de suffixes s'accompagne parfois d'épenthèses.
107
Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités
3.5. Bilan du chapitre 1
Au terme de ce premier chapitre, nous avons dans notre escarcelle :
- une définition rigoureuse à la fois de l'épenthèse telle qu'elle est conçue dans cette thèse, et
des variétés de français auxquelles celle-ci va s'intéresser.
- une liste des consonnes attestées en épenthèse dans les langues du monde, en fonction de
leur fréquence et des contextes où elles sont attestées, ainsi qu'un inventaire des causes
invoquées pour l'apparition d'une épenthèse. A cette occasion, la motivation "résolution
d'hiatus" a été réévaluée à la baisse.
- une idée plus précise des endroits où peut se produire une épenthèse consonantique en
français, et de ceux où elle n'est jamais attestée : les épenthèses en français ne sont pas
circonscrites aux hiatus, on les rencontre également après consonne.
Il s'agit maintenant de compléter ce bagage par l'étude de l'implémentation dans les
analyses phonologiques du phénomène de l'épenthèse (chapitre 3), et par celle de la
représentation des consonnes coronales (chapitre 2).
En effet, nous avons vu à l'occasion de l'inventaire des consonnes dans les langues du
monde leur fréquence dans les cas d'épenthèse : après les glottales, elles constituent la
deuxième catégorie de consonnes épenthésées en termes quantitatifs, et la première en termes
qualitatifs. En ce qui concerne le français, nous avons pu observer que les épenthèses
syntaxiques étaient soit en [t], soit en [z], c'est-à-dire une consonne coronale à chaque fois ; et
si l'on n'a pas encore établi de corpus fiable en ce qui concerne la frontière suffixale, on peut
tout de même risquer une première observation avec Plénat (1999 : 128) : "la consonne
insérée est la plupart du temps une coronale".
108
Chapitre 2 – Le caractère particulier des consonnes coronales
Chapitre 2.
Le caractère particulier des consonnes coronales :
phonétique, phonologie, théories
Dans ce chapitre je présenterai en premier lieu la structure phonétique des coronales,
puis m'intéresserai à la particularité de leur statut, avant d'observer la façon dont différentes
théories phonologiques ont choisi de représenter - ou non - ce statut particulier des coronales.
1. Les coronales : quelques faits phonétiques
Une mise au point préalable de ce qui est exactement recouvert sous le nom de
"coronale" s'impose. Il s'agira de distinguer dans un premier temps son acception purement
phonétique du sens que les phonologues lui confèrent.
Je commencerai par présenter les coronales du point de vue acoustique avant de les
envisager sous leur aspect articulatoire.
1.1. Les coronales en phonétique acoustique.
Jakobson, Fant & Halle (1952) observent que les voyelles d'avant et les consonnes
coronales se caractérisent par "a concentration of energy in the upper (vs. lower) frequencies
of the spectrum" (Hume 1994 : 52). "The number of studies investigating the acoustic
correlates of coronal consonants is more limited than that of vowels. Nonetheless, the studies
that have been done support the general claim that a coronal consonant is distinguished from
its noncoronal counterpart by a greater concentration of energy in the upper frequencies."
(Hume 1994 : 53). Ceci se vérifie pour les fricatives (Strevens 1987), mais pour les occlusives
le spectre seul ne suffit pas à distinguer les différents lieux d'articulation, il faut s'intéresser
plus particulièrement au "burst release to the onset of voicing " pour distinguer les coronales
des autres lieux d'articulation (Lahiri et al. 1984). D'autres ouvrages ne distinguent pas
particulièrement les coronales des autres lieux d'articulation, cf. par exemple Leoni & Maturi
(1995 : chapitre 3).
109
Chapitre 2 – Le caractère particulier des consonnes coronales
Acoustiquement parlant donc, les coronales se distinguent par une concentration
d'énergie dans les hautes fréquences du spectre plus grande que pour les non coronales, sans
que la distinction soit cependant flagrante pour les consonnes. En effet, ce seul critère n'est
pas suffisant, au moins pour les occlusives.
Après cette incursion du côté de la phonétique acoustique, abordons maintenant l'étude
des coronales sous l'angle de la phonétique articulatoire.
1.2. Phonétique articulatoire : lame de la langue.
Deux critères articulatoires déterminent un son : le lieu d'articulation, et l'articulateur
mobile qui vient s'y placer. La coronalité d'une consonne se définit prioritairement en fonction
de l'articulateur concerné : une consonne est coronale si son articulation met en jeu la pointe
et la lame de la langue (Keating 1991 : 30, Ladefoged 1982, 1989, Ladefoged & Maddieson
1995 : 11 ; 20, Paradis & Prunet 1991 : 12)30.
Pour être plus précise, est coronale pour eux toute articulation pour laquelle la lame de
la langue est élevée par rapport à sa position neutre et non-coronale toute articulation pour
laquelle la lame reste en position neutre (cf. Chomsky & Halle 1968).
Cependant, tous les linguistes ne s'accordent pas sur ce qu'est exactement la lame de la
langue. Le problème est essentiellement dû au fait qu'il n'y a pas de marque physique
permettant de décider avec certitude de la frontière entre la lame et le dos de la langue.
Keating (1991 : 30) reprend Catford (1977 : 143) et constate avec lui que deux traditions
s'affrontent :
- pour la phonétique anglaise, la lame ("blade") est "the part that lies opposite the teeth and
alveolar ridge when the tongue is at rest", ce qui correspond à la pointe ("tip") augmenté de 10
à 15 mm environ. C'est à cette école que se rattachent Keating et Catford.
- pour la science de la parole américaine (Daniloff 1973 : 173), c'est cette partie entière qui
constitue la pointe, la lame se situant plus en arrière.
Ladefoged définit la pointe (ou apex) et la lame comme les parties les plus mobiles de
la langue (1982 : 4), ce qui reste là encore sujet à interprétation, puis la lame de façon plus
précise comme la partie qui n'est pas attachée au "plancher" de la bouche (1989), ce qui
30
Hume (1994 : 25-30) ajoute à cette définition l'avant de la langue, optionnellement : "[coronal] can be
implemented by the tip, blade and/or front of the tongue", de façon à inclure l'articulation des voyelles d'avant,
qui ne font pas l'objet de la présente étude. Ce plus, cette distinction rejoint celle concernant les palatales, cf.
plus bas.
110
Chapitre 2 – Le caractère particulier des consonnes coronales
correspondrait selon lui à un espace d'un centimètre au maximum. Ladefoged & Maddieson
(1995 : 10-11) reprennent ces notions : pointe et lame sont les parties les plus mobiles de la
langue et sont situées en avant du frenulum, c'est-à-dire de la partie attachée au bas de la
bouche. Ces deux parties de la langue ont des attributions dans l'articulation bien spécifiques,
mais du fait de leur proximité ne peuvent pas jouer toutes deux de rôle majeur dans
l'articulation d'un même son. L'apex est la partie de la langue qui au repos est verticale, c'està-dire parallèle aux incisives, augmentée d'environ deux millimètres. Derrière cette pointe, la
partie de la langue située sous le centre de l'arcade alvéolaire lorsque la langue est au repos est
la lame ; le centre de l'arcade alvéolaire se définit comme le point d'inclinaison maximale de
la courbure de cette partie du milieu de la section sagittale du conduit vocal situé derrière les
dents du haut.
Le schéma ci-dessous, repris de Ladefoged & Maddieson (1995 : 12), récapitule les
cinq groupes de structures mobiles formant les articulateurs actifs du conduit vocal, au-dessus
de la glotte.
111
Chapitre 2 – Le caractère particulier des consonnes coronales
1.3. Lieux d'articulation des coronales
Le lieu d'articulation intervient également dans la définition de la coronalité ; là
encore, les choses ne sont pas aussi simples qu'il y paraît au premier abord, les avis divergent
quant aux lieux d'articulation à retenir. En effet, si tous les linguistes s'accordent à dire que les
coronales sont articulées au niveau des dents et des alvéoles (Ladefoged & Maddieson 1995 :
19), les avis divergent en revanche quant au fait d'introduire le palais parmi les lieux
d'articulation concernés.
Pour Ladefoged & Maddieson (1995 : 31) "When places of articulations are grouped
according to the active articulator used, palatal articulations, which use the body of the tongue
rather than the blade, fall outside the Coronal class of articulations. Rather, they are connected
to the velar and uvular places." Ils suivent en cela Chomsky & Halle (1968 : 304 : "the socalled dental, alveolar, and palato-alveolar consonants are coronal, as are the liquids
articulated with the blade of the tongue"), Chomsky & Halle eux-mêmes reprenant en grande
partie sous le trait [coronal] le trait acoustique [-grave] de Jakobson, Fant & Halle (1952).
Halle & Stevens (1979 : 346) ou Keating (1991 : 30) englobent pourtant davantage de
lieux d'articulation : "among the generally recognized coronal places of articulation are dental,
alveolar, palato-alveolar, retroflex, and palatal. (...) The IPA also includes another place using
the tongue blade, alveolo-palatal. Ladefoged & Maddieson (1986) add two less common
coronal places, linguolabial and interdental." (Keating 1991 : 30). Cette dernière ajoute que
les affriquées et les liquides sont presque invariablement coronales, et que les voyelles
fermées le sont probablement aussi. Les articulations non coronales sont alors les suivantes :
bilabiales, labiodentales, vélaires, uvulaires, pharyngales.
Elle reconnaît cependant que les alvéo-palatales et les palatales sont souvent
considérées comme non coronales, par Maddieson (1984) ou Chomsky & Halle (1968), mais
"both of these are now standardly considered coronal by phonologists" (note 2 p.47). Ceci
semble confirmé par Rubin (2000 : 103), pour qui le terme de "coronal" remonte certes à
Chomsky & Halle (1968) pour son utilisation en phonologie générative mais s'est modifié
depuis pour inclure également les palatales à cet ensemble comprenant déjà les alvéolaires et
les dentales.
Ladefoged & Maddieson (1995 : 31) résument ainsi la situation : "The problem is
further complicated by the fact that there are large individual anatomical differences in the
coronal region, making it hard to make precise remarks about articulation. Keating & Lahiri
112
Chapitre 2 – Le caractère particulier des consonnes coronales
(1993), who have summarized articulatory descriptions based on x-rays of speech sounds in
the palatal and velar regions, note that different sources provide quite different articulatory
pictures of what are claimed to be the same sound."
C'est le lieu d'articulation palatal qui pose problème : les consonnes palatales sontelles ou non des coronales ? Il s'agit du point d'achoppement principal des linguistes en ce qui
concerne les coronales ; d'ailleurs, Hall (1997) commence son ouvrage sur les coronales par
un chapitre sur "the status of palatals". En ce qui concerne la présente thèse cependant, le
débat n'a pas lieu d'être puisque les palatales ne se manifestent jamais en épenthèse dans
aucune langue répertoriée (cf. partie précédente). En français, la seule consonne palatale
éventuellement concernée par la discussion serait le //, et celle-ci n'apparaît jamais en
épenthèse. Aussi me contenterai-je de mentionner les deux approches sans prendre parti. Pour
une comparaison plus détaillée, cf. Hume (1994 : 30-39) et Hall (1997 : 6-22).
Le tableau suivant récapitule les articulations consonantiques selon qu'elles participent
de la prononciation des consonnes coronales ou non :
(87)
consensuelles
coronales
dentale
alvéolaire
post-alvéolaire (=palato-alvéolaire)
sub-apical palatal (=rétroflexe)
(linguo-labial)
(interdental)
sujettes à caution
non coronales
bilabiale
labio-dentale
vélaire
uvulaire
pharyngale
épiglottal
glottal
alvéo-palatales
palatales
Le schéma suivant, emprunté à Ladefoged & Maddieson (1995 : 13), rappelle les neuf
régions du conduit vocal qui peuvent être considérées comme des cibles pour les articulateurs
mobiles (la glotte ne le pouvant pas). Les lignes numérotées indiquent quelques-uns des dixsept composants articulatoires distingués dans la description articulatoire des sons du langage,
y compris celui correspondant à la glotte.
113
Chapitre 2 – Le caractère particulier des consonnes coronales
Le schéma ci-dessous (Ladefoged & Maddieson 1995 : 14) permet de mieux apprécier
les articulations impliquant la pointe et la lame de la langue, donc impliquées dans la
détermination des coronales.
114
Chapitre 2 – Le caractère particulier des consonnes coronales
Observons plus en détail les différentes classes de coronales ; pour ce faire, je
conserverai la méthode de classement de Keating (1991), tout en gardant à l'esprit que seules
les trois premières catégories mentionnées sont consensuelles parmi les linguistes.
1.3.1. Coronales antérieures
Cette première classe rassemble les consonnes pour lesquelles l'articulation, qu'elle
soit occlusion ou constriction, se situe sur les dents du haut, la partie avant des alvéoles ou sur
la lèvre supérieure.
Pour illustrer cette première catégorie de coronales, les schémas ci-dessous
représentent (a) une occlusive dentale (apico-laminale), (b) une nasale apico-alvéolaire
(Keating 1991 : 33, d'après Simon 1967).
Le deuxième groupe de coronales distingué est l'ensemble des coronales palatoalvéolaires.
1.3.2. Coronales palato-alvéolaires
Dans cette seconde classe sont regroupées les consonnes articulées sur ou près du coin
de l'arcade alvéolaire (Keating 1991 : 34 : "are at or near the corner of the alveolar ridge").
Sur le schéma suivant (Keating 1991 : 34, d'après Ladefoged & Maddieson 1986) est
ainsi représentée l'articulation d'une fricative palato-alvéolaire en anglais,).
115
Chapitre 2 – Le caractère particulier des consonnes coronales
Après les coronales antérieures et les coronales palato-alvéolaires, un troisième sousensemble de coronales est constitué par les rétroflexes.
1.3.3. Coronales rétroflexes
Les rétroflexes sont articulées en roulant la lame de la langue de façon à ce que la
pointe ou le dessous de la langue forme une constriction avec le palais, au niveau de l'arcade
alvéolaire ou, plus communément, derrière le coin, comme on peut en voir deux illustrations
sur les schémas suivants (Keating 1991 : 35) correspondant à (a) l'articulation d'une occlusive
sublaminale en tamil (langue sud-dravidienne parlée en Inde ; d'après Ladefoged &
Maddieson 1986) et (b) à celle d'une fricative apicale en serbe (d'après Miletic 1960).
Les deux catégories restantes sont celles mentionnées plus haut qui sont sujettes à
discussion : les consonnes alvéo-palatales et les consonnes palatales sont-elles réellement des
coronales ?
116
Chapitre 2 – Le caractère particulier des consonnes coronales
1.3.4. Coronales alvéopalatales
Selon Keating 1991, ce sont fréquemment des nasales et des latérales, également des
fricatives et des affriquées. Le plus souvent, elles impliquent la lame de la langue approchant
le coin de l'arcade alvéolaire. Sur les schémas suivants (Keating 1991 : 36) on peut apprécier
l'articulation alvéopalatale de quelques consonnes fricatives polonaises (a et b ; d'après
Wierzchowska 1967, 1980), et mandarine (d'après Ohnesorg & Svarny 1955).
Terminons l'inventaire des catégories de consonnes potentiellement considérées
comme coronales par les palatales.
117
Chapitre 2 – Le caractère particulier des consonnes coronales
1.3.5. Coronales palatales
Keating (1988), repris dans Keating (1991),
définit le lieu d'articulation des palatales comme "near a
large part of the hard palate, between the alveolar ridge
and the roof of the mouth". Elle précise que la
constriction est très longue, et que ni la pointe ni la partie
de la lame qui y est accolée ne sont impliquées dans
l'articulation. Par exemple, le schéma ci-contre (Keating
1991 : 38, d'après Hala 1962) présente l'articulation
d'une occlusive nasale palatale en tchèque.
Le tableau suivant récapitule les différentes articulations des consonnes coronales en
fonction du classement établi par Keating (1991), en les illustrant des symboles
consonantiques les plus courants31.
(88)
coronales
dentale
sons concernés
classement
t, d, n, , 
t, d, n, l, r, , 
t, d, n, t, d, n, s, z
coronales
antérieures
t, d, n
t, d, n
t, d, n, , 
coronales
palatoalvéolaires
alvéolaire
(linguo-labial)
(interdental)
consensuelles
post-alvéolaire
(=palatoalvéolaire)
sub-apical palatal , , , , , , , 
(=rétroflexe)
alvéo-palatales
, 
sujettes à
caution
palatales
c, , , , (j)
rétroflexes
coronales
alvéopalatales
coronales palatales
31
Les diacritiques sont les symboles de l'API (1993) correspondant aux spécifications suivantes :
linguo-labiale
dentale


rétractée
apicale


laminale

118
Chapitre 2 – Le caractère particulier des consonnes coronales
Après ce bref rappel de ce que recouvre la catégorie des coronales sous son aspect
phonétique, acoustique comme articulatoire, la section suivante propose d'étudier le statut
particulier des consonnes coronales par rapport aux consonnes des autres lieux d'articulation.
2. Le statut particulier des coronales : phonologie
Les coronales ne forment pas une classe à part des autres consonnes du point de vue
phonétique strict, en ce sens que si quantitativement elles s'imposent en effet, elles n'ont rien
d'extraordinaire du point de vue qualitatif (formants). En revanche, la phonologie leur
reconnaît un statut particulier, et ce pour plusieurs raisons relatives à leur fréquence dans les
langues du monde, à leur transparence, à leur propension à subir l'assimilation ou la
neutralisation, et à leur comportement dans les chutes, les cooccurrences et les phénomènes
d'aphasie.
2.1. Fréquence
Le caractère singulier des coronales s'observe tout d'abord en fonction de la fréquence
à laquelle elles s'observent dans les langues, à l'intérieur de chaque langue comme au sein de
l'inventaire universel des sons, mais également dans le discours et dans leur liberté
distributionnelle.
2.1.1. Dans les langues du monde
Une première remarque à leur propos est que pratiquement toutes les langues (endehors du hawaïen, cf. notamment Paradis & Prunet 1991, Kean 1975 et Maddieson 1984) ont
des consonnes coronales, mais toutes n'ont pas des labiales ou des dorsales32 (Paradis &
Prunet 1991 : 11).
Cette première observation fait des coronales les consonnes les plus fréquentes dans
les langues du monde. Selon Paradis & Prunet (1991 : 1), la coronale nasale la plus fréquente
est le /n/ présent dans 316 langues sur les 317 répertoriées par Maddieson (1984), la coronale
fricative la plus représentée est le /s/ que l'on trouve dans 266 langues sur 317 (Maddieson
1984 : 41) ; quant aux liquides, ce sont des coronales "in the overwhelming majority of the
languages". De plus, ce sont selon Paradis & Prunet (également Stemberger & Stoel-Gammon
32
Keating (1991) se montre plus réservée : "It should be noted that labial and velar categories are also almost
universal"
119
Chapitre 2 – Le caractère particulier des consonnes coronales
1991 : 186, Stoel-Gammon 1985 : 509, Vihman et al. 1986 : 26) les premières consonnes
acquises par les enfants avec les labiales, sans qu'il soit cependant possible de les départager.
De la même manière van de Weijer (1994 : 26), reprenant les données de Nartey (1979) et de
Maddieson (1984), établit la fragile prépondérance des coronales sur les labiales si l'on
considère l'inventaire occlusif suivant :
(89)
segment
nombre de langues où le segment en
question existe sur 317
lieu d'articulation
292
284
276
41
52
30
coronal
vélaire
labial
uvulaire
palatal
rétroflexe
190
180
200
5
28
24
coronal
vélaire
labial
uvulaire
palatal
rétroflexe
non-voisé
t
k
p
q
c

voisé
d

b

j

Les coronales dans leur ensemble, c'est-à-dire en incluant les rétroflexes (et
éventuellement les palatales) sont majoritaires, mais au sein des occlusives voisées, /b/ est
plus fréquente que /d/.
2.1.2. Au sein d'une langue
Cette grande quantité de coronales au sein des langues du monde se double d'une
fréquence intralinguistique marquée.
Paradis & Prunet (1991 : 10-11) précisent en effet que le nombre de consonnes
coronales dans l'inventaire consonantique d'un système donné est plus élevé que le nombre de
consonnes d'autres lieux d'articulation. Ainsi en anglais compte-t-on treize consonnes
coronales (dont sept alvéolaires) pour cinq labiales et deux vélaires. Le français compte quant
à lui neuf coronales (dont sept dentales) pour cinq labiales et deux vélaires. Il est regrettable
que les auteurs n'aient pas fourni l'inventaire des consonnes qu'ils classent parmi les
coronales, dans le sens où ceci permettrait d'une part de savoir où ils classent les palatales,
donc //, d'autre part d'identifier la septième dentale : s'agit-il du /r/ cité par Paradis & El
120
Chapitre 2 – Le caractère particulier des consonnes coronales
Fenne & El Fenne (1992) ? Prince & Smolensky (1993 : 109) présentent l'inventaire
phonologique du lardil, langue pama-nyungienne d'Australie parlée sur l'île Mornington (cf.
notamment Hale 1973), qui sur 17 consonnes (dont 3 approximantes) compte 12 coronales
(dont 2 approximantes) se répartissant en lamino-dentales (t, d), apico-alvéolaires (t, n, l, r),
lamino-alvéolaires (tj, nj, j) et rétroflexes (, ) contre trois labiales (en comptant le glide w) et
deux vélaires.
Un troisième type de fréquence particularise les coronales dans les langues du monde.
2.1.3. Dans l'inventaire des sons
Une troisième distinction des coronales par rapport aux consonnes d'autres lieux
d'articulation concerne leur fréquence dans l'inventaire universel des sons : selon Paradis &
Prunet (1991 : 11), l'Alphabet Phonétique International recense trois fois plus de coronales
que de labiales ou de vélaires. Keating (1991 : 29) illustre ceci par l'analyse de l'inventaire
consonantique de Maddieson (1984) : sur 20 consonnes, 10 sont coronales.
2.1.4. Dans le discours
De plus, les coronales sont les consonnes qui se manifestent le plus souvent dans le
discours. Fry (1947), repris par Paradis & Prunet (1991), a ainsi montré que les cinq
consonnes les plus fréquentes dans un corpus conversationnel d'anglais britannique (variété
du sud) étaient toutes des coronales (dans l'ordre décroissant n, t, d, s et l).
Ferreres (1990) a relevé dans un corpus d'espagnol argentin, parmi les consonnes,
69,62% de coronales (/s/ le plus fréquent, // le moins), 18,45% de labiales, 11,21% de
vélaires.
2.1.5. Dans leur distribution
Enfin, selon Szigetvári (1994 : 193-194) "the general tendency seems to be that
coronal consonants are freer in their distribution than others". En effet, il relève pour l'anglais
une forte majorité de terminaisons consonantiques en coronales par rapport aux autres types
121
Chapitre 2 – Le caractère particulier des consonnes coronales
de consonnes possibles, comme on peut le voir dans le tableau suivant33, réalisé à partir d'un
ensemble de 24000 mots :
(90)
labiales
p
_#
dont r_#
l_#
[+nasal]_#
s_#
f_#
p_#
k_#
406
12
8
43
11
0
0
coronales
b
106
18
3
0
-
t
3521
141
62
658
305
43
50
129
vélaires
d
1259
237
123
285
-
k
1416
88
13
70
33
0
0
-
g
159
42
0
0
-
Ce tableau met en lumière la forte représentation des coronales à la finale de mots,
notamment par rapport aux labiales mais également par rapport aux vélaires, et ce y compris
après une autre consonne, quel que soit son lieu d'articulation. Par ailleurs, on notera que les
consonnes non voisées sont plus représentées à la finale, tous lieux d'articulation confondus,
que leurs partenaires voisés.
Ce dernier argument conclut cette première approche de la spécificité des coronales
par le biais de leur fréquence.
2.1.6. Bilan sur la fréquence
Les coronales sont toujours mises en valeur par rapport aux autres catégories de
consonnes, et ce, quel que soit le type de fréquence observé. De plus, dans tous ces types de
fréquences, ce sont toujours les dentales et les alvéolaires qui se distinguent au sein de cette
classe des consonnes coronales.
Bien entendu, toutes ces fréquences sont en partie corrélées : c'est parce que les
coronales sont les phonèmes consonantiques les plus nombreux à disposition que la
probabilité de les trouver dans la presque totalité des langues est plus élevée que pour d'autres
consonnes, et c'est parce que, dans une langue donnée, on trouve davantage de phonèmes
coronaux que de phonèmes consonantiques d'autres lieux d'articulation, que les coronales
33
Les - indiquent les articulations "which are excluded by 'strong' principles: a difference in voicing, or a
prohibition of geminates; while '0' appears in those boxes where nothing seems to exclude the group, yet it does
not occur." (Szigetvári 1994 : 193).
122
Chapitre 2 – Le caractère particulier des consonnes coronales
seront réalisées plus souvent à l'oral. Aussi ne pouvons-nous nous limiter à cette
prépondérance quantitative pour fonder un raisonnement sur le statut particulier des
coronales.
Tournons-nous donc vers une deuxième particularité des coronales, relative à leur
transparence.
2.2. Transparence
Les coronales34 sont transparentes à certaines règles (Paradis & Prunet 1989b), c'est-àdire qu'elles autorisent un trait à se propager à travers elles comme si elles n'étaient pas là.
Pour reprendre les termes de McCarthy & Taub (1992 : 368), "sometimes coronal consonants
are special by virtue of phonological inactivity or invisibility". Paradis & Prunet (1989b : 317,
1990, 1991 : 10) illustrent cette affirmation par une propagation vocalique dans plusieurs
langues d'Afrique de l'ouest, propagation possible uniquement à travers des coronales et
bloquée lorsque ce sont des non-coronales qui interviennent.
Observons pour illustrer notre propos le comportement des coronales dans le
paradigme verbal du fula. En fula (Paradis & Prunet 1989b : 324-325), le système verbal
comprend vingt-et-une marques suffixales exprimant l'aspect (perfectif et imperfectif) et la
voix (active, passive et intermédiaire). Les aspects perfectif et imperfectif couvrent en réalité
sept sous-aspects, indicés numériquement (perfectifs 1, 2 et 3 ; imperfectifs 1, 2, 3 et 4).
Le tableau ci-dessous récapitule les vingt-et-une marques suffixales résultant de la
combinaison des sept sous-aspects avec les trois voix du fula :
(91)
perfectif
P1
P2
P3
imperfectif
I1
I2
I3
/
i
ii
i
ii
iima
a
aa
aama
/
a
at
o
oo
oto
e
ee
ete
I4
ata
otoo
etee
34
actif (A)
intermédiaire (M)
passif (P)
Les glottales sont également réputées pour leur transparence.
123
Chapitre 2 – Le caractère particulier des consonnes coronales
Observons tout d'abord les suffixes perfectifs. On remarque que le /m/ dans les formes
P3M et P3P ne présente pas le même cas de propagation de voyelle. La forme P3M ne
demande pas d'explication, dans le sens où ce n'est pas la même voyelle qui est réalisée,
attestant bien de la réalité d'un suffixe -ma ; la forme P3P est quant à elle analysée comme
deux suffixes en contact "which happen to have the same vowel" (Paradis & Prunet 1989 :
324), en l'occurrence le suffixe -a de P2P avec -ma identifié en P3M.
Tournons-nous vers l'imperfectif. Quelle serait la forme du suffixe I3, puisque la
dernière voyelle est différente pour chaque voix ? En fait, les voyelles de part et d'autre de la
coronale sont identiques, il y a propagation de la mélodie de la première voyelle sur les autres
positions vocaliques du suffixe, et ce à travers la consonne coronale. Celle-ci est donc
transparente à l'harmonie vocalique.
Pour le paradigme nominal, ce sont les marqueurs nominaux qui offrent un cas de
transparence. En futankoore, dialecte fula parlé en Mauritanie et au Sénégal, ces marqueurs
sont obligatoirement suffixés aux noms et aux adjectifs et peuvent chacun se présenter sous
quatre formes en fonction de contraintes phonologiques et morphologiques. Paradis & Prunet
(1989a : 329-334) présentent le cas des marqueurs -ru, -re et -ri qui alternent respectivement
avec les formes -uru, -ere et -iri, dans lesquelles les voyelles sont identiques de chaque côté
du /r/ :
(92)
(a)
(b)
-rV
-VrV
am-re
sof-ru
caak-ri
woj-ere
woot-uru
kes-iri
*woj-re
*woot-ru
*kes-ri
"tortue"
"poussin"
"couscous"
"lièvre"
"unique"
"nouveau"
Les séquences en (a) sont formées à partir de radicaux se terminant par une consonne
non coronale, au contraire des séquences sous (b).
Le principe de contour obligatoire interdit des séquences de deux consonnes de même
lieu d'articulation ne partageant pas leur nœud de place, c'est pourquoi on peut penser que
lorsque la consonne finale de radical est une coronale, elle ne peut pas se trouver en relation
immédiate avec le -r- du suffixe. L'analyse proposée par Paradis & Prunet (1989a) est la
suivante : le -r- du suffixe est géminé dans le lexique ; lorsqu'il est en contact avec une
consonne finale de radical coronale, il "libère" la première position de façon à permettre à une
124
Chapitre 2 – Le caractère particulier des consonnes coronales
voyelle de se réaliser. C'est la voyelle finale de radical qui se propage à travers /r/ pour
apporter de la mélodie à cette position. /r/ se comporte donc exactement comme s'il n'était pas
présent en regard de cette propagation.
Il reste à démontrer que cette propagation ne fonctionne pas à travers une consonne
non-coronale. Si l'on ajoute le marqueur -e, à initiale non-coronale, à un radical comportant
deux consonnes finales, le nouveau noyau créé entre le radical et le suffixe n'est pas rempli
par une propagation de la voyelle suffixale mais une épenthèse de /u/ :
(93)
singulier
jolf-o (o)
awl-o (o)
/jolf/
/awl/
pluriel
jolf-u-e
awl-u-e
glose
"Wolof"
"griotte"
Un dernier cas de transparence des coronales en fula est présenté par Paradis & Prunet
(1989a : 334-338). Deux voyelles peuvent être épenthésées pour éviter des attaques ou des
codas branchantes, interdites en fula : [i] avant un suffixe verbal suivant deux consonnes, [u]
après un domaine verbal (radical verbal plus suffixes dérivatifs) se terminant par deux
consonnes, avec une préférence pour le [u] si les deux sont possibles (cf. c) :
(94)
(a)
radical seul
(b) dérivé
(c)
insertion de [u]
dojj-u
ekk-u
*ojj-u-n, *ojj-n-u
*ojj-u-t, *ojj-t-u
wor--u
as-t-u
aam-t-u
insertion de [i]
*dojj-i
*ekk-i
ojj-i-n
ojj-i-t
*wor-i-, *wor--i
*as-i-t, *as-t-i
*aam-i-t, *aam-t-i
glose
"tousse !"
"enseigne !"
"faire tousser"
"tousser à nouveau"
"devenir infecté"
"refaire"
"manger à nouveau"
Paradis & Prunet (1989a : 338-341) proposent également un argument pour la
transparence des coronales, non plus basé sur la propagation de voyelle à travers des
coronales mais sur la fusion de voyelles dans le même contexte. En guere zibiao, langue
niger-congolaise krou parlée en Côte d'Ivoire, les mots bisyllabiques qui ne sont ni composés,
ni empruntés ne peuvent comporter deux voyelles non hautes (Contrainte de Hauteur). De
plus, si une consonne est présente entre les noyaux de chacune des syllabes, c'est toujours une
coronale.
Le tableau ci-dessous récapitule les quatre cas de figure observés, en fonction des
voyelles des deux syllabes et de la présence d'une attaque dans la deuxième syllabe :
125
Chapitre 2 – Le caractère particulier des consonnes coronales
(95)
voyelles différentes
radical CVV
voyelles identiques
au moins une voyelle haute
radical CVCV
aucune voyelle haute
me
lua
w
baa
dçç
"langue"
"sol"
"brûle !"
"manioc"
"semaine"
y
ne
nin
nimi
wçç
"sécher"
"porcelaine"
"lait"
"animal"
"laver"
bee
"pendre"
Les séquences de voyelles identiques dans un radical CVV ne correspondent pas à la
contrainte de hauteur qui veut qu'un mot ne puisse comporter deux voyelles non hautes. Il faut
donc supposer que ces voyelles partagent leurs traits concernant le lieu d'articulation35.
En ce qui concerne les radicaux de type CVCV, cette contrainte de hauteur n'est pas
nécessairement respectée lorsque l'attaque de la deuxième syllabe est une coronale ; ou plus
précisément, à chaque fois qu'elle n'est pas respectée, l'attaque de la deuxième syllabe s'avère
être une coronale. Il semble donc que le traitement puisse être le même que pour les radicaux
de type CVV : les voyelles partagent leurs traits concernant le lieu d'articulation "par-dessus"
la consonne coronale les séparant.
En guere donc, les voyelles peuvent partager des traits de lieu d'articulation pourvu
que la consonne qui les sépare soit une coronale, ce qui là encore milite pour la transparence
des consonnes coronales.
En mau (ou mawukakan), langue niger-congolaise du groupe mandé également parlée
en Côte d'Ivoire, les seules consonnes transparentes aux voyelles sont les coronales [l] et [r]
(Paradis & Prunet 1989 b : 341-344). Les tons dans cette langue sont prévisibles : un ton bas
est toujours associé à la première syllabe, un ton haut toujours aux autres syllabes (a), ou un
ton modulé sur les monosyllabes (b). Cependant, quand un mot commence par deux voyelles
identiques adjacentes (une voyelle longue en surface), celle-ci prend le ton bas (c) ; de même,
quand les deux premières voyelles d'un mot sont identiques et séparées par une coronale,
toutes deux prennent le ton bas (d).
35
L'analyse est proposée en Géométrie des Traits (cf. section 3), dans laquelle ce partage des traits se traduit pas
la fusion sous-jacente du nœud de place des voyelles. En revanche, il n'est pas fait mention de la représentation
précise du suffixe, ni n'est précisé laquelle des deux voyelles propage ses traits à l'autre. Ce n'est pas important
dans la démonstration ici, puisque c'est la transparence des coronales qui est à démontrer.
126
Chapitre 2 – Le caractère particulier des consonnes coronales
(96)
a.
disyllabe "normal"
b.
monosyllabe "normal"
c.
deux premières V identiques
d.
V coronale V
lona
safina
ye
wo
iiwii
heejabu
bçlçti, bçrçti
"coq"
"savon"
"gourde"
"trou"
"soufre"
"protection"
"fil"
salaba, saraba
"faible"
Tout se passe donc exactement comme si les liquides coronales n'étaient pas là.
Lorsque les deux premières voyelles d'un mot sont identiques, il n'y a qu'une mélodie
vocalique dans le lexique, comme l'indique le fait que le ton est le même sur les deux
voyelles. Cette mélodie vocalique se propage sur la position vocalique inoccupée36, et ce qu'il
y ait une consonne coronale entre les deux ou aucune consonne.
Tous ces exemples illustrent le caractère transparent des consonnes coronales. Il est
cependant à noter que les vélaires se comportent parfois également comme si elles étaient
transparentes à certaines règles, ce qui en fait sur ce point des concurrentes des coronales (cf.
notamment van der Hulst & Smith 1990, Trigo 1988).
Les consonnes laryngales sont également transparentes dans nombre de langues,
comme l'illustrent notamment Gafos & Lombardi (1999 : 82) en kashaya (Buckley 1994)
mais également en mazahua otomi, langue oto-mandéenne parlée au Mexique (Steriade 1995,
Spotts 1953) ; en finnois et en yurok, langue quasiment éteinte du nord ouest californien
(Collinder 1965) ; en arbore, langue afro-asiatique parlée en Ethiopie ; en nez perce, langue
amérindienne parlée dans le nord de l'idaho ; en mohawk, langue iroquoise parlée notamment
dans la région de l'Ontario au Canada ; en tojolabal, langue maya parlée au Mexique, etc
(Steriade 1987). "If only one Place is transparent in a language, it is Pharyngeal (this includes
/h, / (…)); and if Coronal is transparent, then Pharyngeal is also transparent." (Gafos &
Lombardi 1999 : 83)
Le caractère particulier des coronales du fait de leur transparence est donc à
relativiser : les coronales sont plus transparentes que les labiales, sans doute plus que les
vélaires, mais moins que les pharyngales. Ceci est sans doute à relier au fait que parmi les
36
Il n'importe pas ici de connaître le sens de propagation, mais Paradis & Prunet (1989b : 343) penchent pour la
deuxième voyelle sur la première, soit de droite à gauche.
127
Chapitre 2 – Le caractère particulier des consonnes coronales
consonnes épenthétiques, les pharyngales sont également en concurrence avec les coronales,
cf. plus haut.
Parallèlement à la transparence des coronales aux voyelles, il est intéressant d'observer
l'analyse de Broselow (à paraître) à propos des épenthèses en selayarese : "only r, l, s trigger
epenthesis (of a vowel) in selayarese loans because epenthesis can take place only after
'transparent' consonants". Les coronales sont selon elle plus susceptibles d'accepter des traits
vocaliques que les consonnes labiales ou dorsales.
2.3. Assimilation
Les coronales subissent plus souvent des assimilations que les autres lieux
d'articulation. Kiparsky (1985 : 97-98) observe en effet que les coronales sont les consonnes
les plus susceptibles de s'assimiler en ce qui concerne le lieu d'articulation ; cette propension à
l'assimilation se manifeste par la propagation des traits de lieu de la consonne suivante sur la
consonne coronale précédente. Ainsi en catalan, pour reprendre l'exemple de Kiparsky (cf.
également Herrick 1999 : 28-29), les consonnes nasales s'assimilent-elles au lieu d'articulation
de la consonne immédiatement à leur droite dans les proportions suivantes : /n/ est toujours
assimilée par la consonne suivante (Herrick 1999 : 28 précise "except when the following
consonant is palatal (…) full assimilation to lamino-palatals, but assimilation is only partial to
palatals"), /m/ seulement si ladite consonne est une labiodentale, // et // jamais.
(97)
/n/
/m/
//
//
alvéolaire "témoin"
labiale
so[n] amics
so[m] pocs
"ils sont amis"
"ils sont peu"
labio-dentale
so[] felios
"ils sont heureux"
dentale
so[n] dos
"ils sont deux"
alvéolaire
postalvélaire
so[n] sincers
so[n] rics
"ils sont sincères"
"ils sont riches"
laminopalatale
so[n,] [d]ermans
"ils sont frères"
palatale
so[n,] []iures
"ils sont libres"
vélaire
so[] rans
"ils sont grands"
so[m] amics
so[m] pocs
so[] felios
"nous sommes amis"
"nous sommes peu"
"nous sommes heureux"
so[m] dos
a[] feli
ti[] pas
"nous sommes deux"
"bonne année"
"j'ai du pain"
128
Chapitre 2 – Le caractère particulier des consonnes coronales
L'assimilation dentale en coréen, présentée par Cho (1988 : 44, 1991 : 171)
notamment, est également une parfaite illustration de l'assimilation des consonnes dentales
par la consonne suivante en termes de lieu d'articulation :
(98)
/kotpalo/
[kopparo]
"droit, direct"
/pat/ + /ko/
[pakko]
"recevoir et"
/kt/ + /ci/
[kcci]
"nous laisse découvrir"
intramorphématique
/hankan/
[hakan]
"la rivière Han"
intermorphématique
/han/ + /bn/
[hambn]
"une fois"
intramorphématique
coronale orale
coronale nasale
intermorphématique
En revanche, les labiales et les dorsales ne s'assimilent pas aux coronales (Iverson &
Kim 1987 : 186 ; cf. également Rice 1996 : 494-495) :
(99)
papto
kato
papto
kado
*patto
*kando
"le riz aussi"
"voleur"
Ce même constat est fait par Paradis & Prunet (1991 : 9) : les assimilations ayant pour
cible les consonnes non coronales sont beaucoup moins fréquentes que celles concernant les
coronales, et n'intéressent souvent que celles-ci.
Citons encore l'assimilation des coronales dans certaines langues couchitiques de l'est
parlées en Ethiopie : en qafar, dialecte du nord, pourvu que ce soient des obstruantes ; en
oromo, dialecte wellegga, en ce qui concerne les occlusives alvéolaires et palatales ; en bayso
ou baiso pour toutes les coronales autres que [] (Garrett & Blevins 2003 : 17).
Les travaux en acquisition confirment ces résultats : les coronales, en tant que
consonnes plus simples, sont assimilées aux labiales et aux vélaires dans le discours enfantin.
Stemberger & Stœl-Gammon (1991 : 189-191) présentent une étude portant sur des
substitutions consonantiques chez des enfants entre neuf mois et deux ans apprenant l'anglais.
Sont distinguées les substitutions de lieu d'articulation contextuelles (donc les harmonies
consonantiques : duck "canard" prononcé [ak]) de celles indépendantes du contexte (dans
lesquelles un enfant remplace systématiquement un son par un autre : les vélaires par les
alvéolaires, cow "vache" prononcé [da:] alors qu'aucune alvéolaire n'est disponible dans le
contexte.). Le tableau suivant présente les résultats des substitutions consonantiques
constatées :
129
Chapitre 2 – Le caractère particulier des consonnes coronales
(100)
substitution
alvéolaire Æ vélaire
vélaire Æ alvéolaire
bidirectionnelle
alvéolaire Æ labiale
labiale Æ alvéolaire
bidirectionnelle
vélaires
labiales
total
harmonie
19
1
3
18
2
4
47
non contextuelle
1
24
3
1
4
2
35
total
20
25
6
19
6
6
82
Comme on le constate ici, Stemberger & Stœl-Gammon (1991 : 189-191) ont relevé
seulement 3 cas d'harmonie d'une vélaire ou d'une labiale vers une alvéolaire, contre 37 où
c'est l'alvéolaire qui s'assimile. En revanche, dans le cas des substitutions non contextuelles,
c'est l'articulation coronale qui est prioritairement choisie : 28 attestations en coronales contre
2 pour les labiales et les vélaires réunies. Il semble donc que les coronales là encore se
comportent comme les éléments les plus simples puisqu'elles subissent l'assimilation
consonantique d'une part, et sont utilisées comme consonnes par défaut d'autre part.
Béland & Favreau (1991 : 210) offrent des analyses comparables, sur le français, mais
émettent une réserve quant à la nature de la coronale impliquée : les occlusives et les sonantes
coronales subissent davantage l'assimilation par une labiale que les fricatives. L'assimilation
d'une labiale par une coronale (/swaf/ réalisé [swas]) est quant à elle plus souvent observée
pour les fricatives que l'assimilation inverse. Le tableau ci-dessous présente les données
numériques pertinentes :
coronale Æ labiale
(101)
/t, d, n, l, r/
/s, z/
/, /
total
10
3
0
13
labiale Æ coronale
2
5
5
12
total
12
8
5
25
Considérons une troisième étude relative aux assimilations consonantiques. Gaskell et
al. (1995), reprenant une étude sur l'anglais de Marslen-Wilson & Nix (1992) et Nix et al.
(1993), mettent en évidence le caractère marqué des coronales en regard de l'assimilation à
travers la comparaison de la perception de deux phrases, l'une (a) comportant un segment
vélaire en surface, l'autre (b) un segment coronal :
(102)
(a)
(b)
They thought the lake cruise was rather boring
They thought the late train was rather boring
130
Chapitre 2 – Le caractère particulier des consonnes coronales
La première séquence est ambiguë : s'agit-il d'un /k/ ou d'un /t/ dans le lexique, de lake
ou de late ? Les sujets à qui ces phrases ont été présentées ont donné à 80% une réponse avec
une coronale pour (b), mais seulement 55% ont identifié un /k/ dans (a)."There is no such
ambiguity in (b), since assimilation from non-coronal to coronal place does not occur. For
example, the /k/ in lake cannot assimilate to the /t/ in train to give late train. The only
phonologically viable reading of the critical word is therefore late. (...) for English speakers
coronal surface segments are reliable indicators of an underlying coronal segment and are
treated as such during speech perception. Labial and velar surface forms, since they can occur
as the product of the assimilation of an underlying coronal segment, must be treated as more
ambiguous, at least until their following context is known." D'autres simulations conduites par
Gaskell, Hare & Marslen-Wilson (1995 simulations 1 et 3) ont également mis en valeur le
comportement particulier des coronales par rapport aux consonnes des deux autres grands
lieux d'articulation, à savoir les labiales et les coronales.
D'une manière générale, les harmonies consonantiques consistent "almost exclusively
of coronal harmony" (Paradis & Prunet 1991 : 2), si l'on excepte celles impliquant les
consonnes laryngales.
La particularité des coronales a été jusqu'à présent mise en évidence à travers leur
fréquence dans les langues du monde, leur transparence face à certains phénomènes
d'harmonies consonantiques ou au travers des processus d'assimilation. Elle peut également
être mise en évidence dans des cas de neutralisation.
2.4. Neutralisation
En coda, on observe généralement que les segments complexes se simplifient, que ce
soit du point de vue du mode comme du lieu d'articulation (cf. par exemple Trubetzkoy 1939).
Ainsi le carrier, langue amérindienne athapaskan, illustre le propos en ce qui
concerne le mode articulatoire : dans cette langue comportant trois séries d'occlusives
(aspirées, glottalisées et simples), seule la série simple existe en coda (cf. Cook 1976 : 6).
Pour Paradis & Prunet (1991 : 9), les cas de neutralisation peuvent également
contribuer à mettre en évidence la particularité des coronales par rapport aux consonnes des
autres lieux d'articulation. Ainsi de Lacy (2002a : 192, 268-283) est même plus affirmatif :
131
Chapitre 2 – Le caractère particulier des consonnes coronales
"the output of neutralization is shown to always be glottals or coronals, never labials or
dorsals", comme le récapitule le tableau suivant (cf. de Lacy 2002a : 268) :
(103)
Input
/vélaire/
/labiale/
/coronale/
/glottale/
neutralisation en
[glottale]
ou
[coronale]
[glottale]
ou
[coronale]
[glottale]
[coronale]37
Une illustration de la neutralisation des vélaires en coronale se trouve en yecuatla,
langue amérindienne totonac parlée au Mexique dans laquelle un phonème // se neutralise en
[n] (cf. de Lacy 2002a : 272, MacKay 1994 : 33).
Dans un langage secret taiwanais, les occlusives labiales et dorsales se neutralisent en
[t] dans les codas des mots rédupliqués, "despite the fact that [] is available" (de Lacy
2002a : 272-273, cf. également Li 1985). Ce langage fonctionne de la manière suivante :
Chaque mot est rédupliqué de telle sorte que :
- la première consonne de la base est remplacée par un [l] si la voyelle suivante est orale, [n]
si la voyelle suivante est nasale : /be/ sera rédupliqué [le-bi] ;
- la voyelle rédupliquée est neutralisée en [i] (cf. exemple précédent) ;
- la coda rédupliquée est neutralisée en [t] : /tsap/ sera réalisé [lap tsit] avec [t] dans la coda de
la forme rédupliquée et non [p] comme dans la forme de base.
Le tableau suivant fournit quelques illustrations :
37
La neutralisation des coronales en occlusive glottale est attestée dans les langues, par exemple en kashaya,
langue amérindienne de la famille poroane parlée en Californie du Nord (Oswalt 1961, Buckley 1994, 2000) :
/mahsan + th/ "il n'est pas en train de l'emmener" est réalisé [mahsath]. Lorsque la consonne finale de radical
n'est pas coronale, le morphème est infixé et non suffixé, aucune consonne ne subissant alors de neutralisation :
/sima:q + ta/ "aller dormir" est réalisé [simataq].
132
Chapitre 2 – Le caractère particulier des consonnes coronales
(104)
(a)
radicaux à finale vocalique
/be ts’ai/
Æ
[le-bi lai ts’i]
Æ
/e hiau/
[le i liau hi]
(b) radicaux à finale consonantique : neutralisation en coronales
Æ
dentale
/t’at/
[lat t’it]
coda
Æ
labiale
/tsap ap/
[lap tsit lap it]
orale
Æ
vélaire
/pak k’ak/
[lak pit lak k’it]
coda
nasale
dentale
labiale
/tsin t’iam/
/kam tsia/
Æ
Æ
vélaire
/p’ç hç/
Æ
"acheter de la nourriture, aller
au marché"
"capable"
"frapper"
"dix boîtes"
"peler, ouvrir"
[lin tsin liam t’in]
[lam kin lia tsi]
"très fatigué"
"canne à sucre"
[lç p’in lç hin]
"flatus ventritus"
La section suivante aborde la particularité des coronales sous l'angle de l'inventaire
phonologique d'une langue donnée.
2.5. Marque et implication
Rice (1999a : 3) mentionne l'implication par rapport à la marque (cf. chapitre 2) : "a
feature X is more marked than a feature Y if the presence of X implies the presence of Y". Il
semble que dans les langues contenant des coronales et des non-coronales dans leur
inventaire, la présence de celles-ci présuppose la présence de celles-là, sans que cette relation
soit réciproque. "All Australian languages with final labials and/or dorsals have final
coronals" (Rice 1999a : 3) .
Cette hypothèse est cependant à relativiser en ce qui concerne les coronales, dans le
sens où l'on a vu (section 2.1.1.) que les coronales étaient précisément présentes dans toutes
les langues du monde étudiées sauf une.
2.6. Chute
L'argument de la chute des consonnes d'un lieu d'articulation par rapport à un autre est
plus nuancé dans les faits (tantôt les coronales sont les seules à chuter, tantôt elles sont les
seules à se maintenir), mais il concourt à mettre en lumière le comportement singulier des
consonnes coronales.
Szigetvári (1994 : 195-196) s'intéresse à la chute des consonnes coronales devant le
morphème suffixal du nominatif singulier (-s), en grec et en latin. Il ne s'agit pas
d'assimilation puisque les segments entourant la coronale ne sont pas modifiés par sa
133
Chapitre 2 – Le caractère particulier des consonnes coronales
disparition, ni de neutralisation puisqu'elle ne laisse aucune trace. Cette chute ne se produit
qu'à la suffixation avec les coronales et non avec les labiales ni les vélaires, qui sont suffixées
sans aucune modification autre que le voisement.
(105)
radicaux
labiales
radicaux
vélaires
radicaux
coronales
morphèmes
gūp-s
en phleb-s
grec classique
réalisation
glose
gūps
"vautour"
phleps
"veine"
onukh-s
korak-s
en aig-s
pharu[]g-s
sark-s
ornīth-s
kharit-s
nukt-s
en gigant-s
lampād-s
rhīn-s
hal-s
martur-s
morphèmes
onuks
koraks
aiks
pharu[]ks
sarks
ornīs
kharis
nuks
gigās
lampās
rhīs
hals
martus
réalisation
"ongle"
"corbeau"
"chèvre"
"gorge"
"peau"
"oiseau"
"merci"
"nuit"
"géant"
"torche"
"nez"
"sel"
"témoin"
glose
morphèmes
op-s
trab-s
urb-s
hiem-s
duc-s
arc-s
rēg-s
latin
réalisation
ops
tra[p]s
ur[p]s
hiems
du[ks]
ar[ks]
rē[ks]
glose
"pouvoir"
"bois"
"ville"
"hiver"
"chef"
"fort"
"roi"
pariet-s
pont-s
art-s
custōd-s
frond-s
sanguin-s
flōr-s
pariēs
pons
ars
custōs
frons
sanguis
flōs
"mur"
"pont"
"art"
"garde"
"feuillage"
"sang"
"fleur"
morphèmes
réalisation
glose
Lorsqu'une base se terminant par une labiale ou une vélaire est concaténée avec le
suffixe -s, la consonne finale radicale perd le cas échéant son voisement. En revanche, lorsque
c'est une coronale qui se trouve en finale de la base, elle chute devant le morphème -s ; la
seule exception à cette chute est le [l] en grec classique, qui se maintient sans modification.
Les coronales montrent bien un comportement particulier par rapport aux consonnes des
autres lieux d'articulation.
De Lacy (2002a : 192) cite quant à lui des cas où seules les dorsales et les labiales
chutent, et considère que "the lack of cases where coronals delete but labials and dorsals
survive is argued to show that there are no constraints that ban coronals without also banning
labials and dorsals." Les langues qu'il présente sont le lardil et le nunggubuyu, toutes deux des
langues australiennes ; le tableau ci-dessous (Hale 1973 : 424-425, de Lacy 2002a : 244)
illustre la chute des consonnes non coronales en lardil :
134
Chapitre 2 – Le caractère particulier des consonnes coronales
(106)
labiales
laminodentale
apicoalvéolaires
[ipii]
[mukuni]
[kurumpu]
[taawu]
[ipiipi-n]
[mukuni-n]
[kurumpuw-an]
[taawuta-n]
nominatif
non-futur
Æ
Æ
Æ
Æ
/t/
/n/
Æ [t]
Æ [n]
Æ [l]
/japuti/
/pien/
"serpent"
"femme"
[japut]
[pien]
[japuti-n]
[pieni-n]
/kentapali/
"dugong"
[kentapal]
[kentapali-n]
Æ []
Æ []
/pe:/
"variété d'arbre"
[pe:]
[pe:-in]
/kiua/
"booby"
[kiu]
[kiua-n]
/mijai/
"variété de lance"
[mija]
[mija-in]
/taputi/
"frère aîné"
[tapu]
[taputi-n]
/aluki/
/pee/
"histoire"
"vagin"
[alu]
[pee]
[aluki-n]
[peei-n]
//
rétroflexes
"morue de roche"
"nullah"
"lance 'tata'"
?
glose
/p/
/m/
/w/
/t/
/l/
//
//
ø
ø
ø
ø
forme sousjacente
/ipiipi/
/mukunima/
/kurumpuwa/
/taawuta/
laminoalvéolaire
/t/
Æ []
Æ ø
dorsales
/k/
//
Æ ø
Æ ø
Si la dernière consonne est suivie d'une voyelle, elle entraîne celle-ci dans sa chute à la
finale de mot ; par exemple, /ipiipi/ "morue de roche" se réalise [ipii], donc sans la dernière
syllabe, en finale de mot, mais [ipiipi-n] quand il est suivi d'un autre morphème.
Seules les consonnes apico-alvéolaires et rétroflexes ne chutent pas à la finale38. Le
maintien ne concerne donc que des coronales, mais non toutes les coronales puisque les
lamino-dentales et les lamino-alvéolaires chutent.
De ces deux exemples, l'un attestant la chute des coronales associée au maintien des
labiales et des vélaires, l'autre attestant le contraire, à savoir la chute des labiales et des
vélaires et le maintien (d'une partie) des coronales, on retire un nouvel argument en faveur de
la spécificité des coronales, sans que l'on puisse pour autant déduire un comportement général
– chute ou maintien – d'une catégorie de consonnes par rapport à une autre.
Un septième argument vient soutenir la thèse de la spécificité des coronales. Il porte
sur les occurrences possibles de consonnes de même lieu d'articulation à l'intérieur d'un mot
dans les langues gabaritiques.
38
Précisons tout de même que la rétroflexe [] est réalisée [] comme on peut le voir dans le tableau.
135
Chapitre 2 – Le caractère particulier des consonnes coronales
2.7. Cooccurrence
Dans les langues gabaritiques, il existe une restriction quant à la nature des consonnes
dans un mot. Ainsi, si en français un terme comme latéral [lateral], comportant quatre
consonnes coronales, est possible, ce ne sera pas le cas dans les langues sémitiques.
Buckley (2001) a quantifié les restrictions de ce type en tigrigna, langue éthiopienne
(cf. chapitre 1) gabaritique, ce qui lui a permis de mettre en exergue le caractère particulier
des coronales par rapport aux autres consonnes en regard de leur distribution à l'intérieur
d'une racine.
A partir d'un corpus de 2744 racines verbales bilitères, trilitères et quadrilitères issues
du dictionnaire de Bassano (1918), "the most complete dictionary of Tigrinya available at
present" (Buckley 2001 : 110), il a étudié la cooccurrence de consonnes homorganiques
adjacentes ou dans la même racine, par rapport au nombre théorique possible, c'est-à-dire au
nombre de racines attendues si la distribution des consonnes était totalement libre.
(107)
gutturales
vélaires
labiales
total noncoronales
coronales
obstruantes
coronales
sonantes
total coronales
cooccurrences de consonnes homorganiques
adjacentes
O (racines
E (racines
rapport
effectives)
attendues)
O/E
0
78
0.00
1
125
0.01
2
132
0.02
cooccurrences de consonnes
homorganiques non-adjacentes
O (racines
E (racines
rapport
effectives)
attendues)
O/E
6
49
0.12
10
73
0.14
18
68
0.26
3
335
0.009
34
190
0.18
65
242
0.27
112
162
0.69
27
261
0.10
106
140
0.76
92
503
0.18
128
202
0.63
Les cooccurrences de consonnes de même lieu d'articulation sont proscrites,
particulièrement si elles sont adjacentes, et il est vrai que les gutturales, les vélaires et les
labiales en attestent très peu de cas. Le total des attestations des trois lieux d'articulation
cumulés est trente fois moindre que celui des seules coronales en ce qui concerne deux
consonnes adjacentes, et encore quatre fois moindre lorsque les consonnes sont séparées par
une consonne intermédiaire. Il est vrai que le nombre de racines à coarticulation attendu est
plus élevé pour les coronales que pour les consonnes des autres lieux d'articulation, aussi estce le rapport entre les racines effectives et les racines attendues qui est réellement révélateur
d'une tendance. Là encore, les coronales manifestent une cooccurrence vingt fois supérieure à
136
Chapitre 2 – Le caractère particulier des consonnes coronales
celle des consonnes des autres lieux d'articulation confondus lorsqu'il s'agit de séquences
comprenant deux consonnes adjacentes de même lieu d'articulation, et encore 3.5 fois
supérieure lorsque les consonnes ne sont pas adjacentes.
On notera par ailleurs que parmi les coronales, les obstruantes sont plus souvent
observées au sein d'un même mot lorsqu'elles sont adjacentes, alors que ce sont les sonantes
qui seront attestées de manière privilégiée si les consonnes sont séparées par une consonne
intermédiaire.
Outre le fait que l'adjacence des consonnes est un facteur "aggravant" quant au
manque de cooccurrences de deux consonnes homorganiques, ce qui est intéressant de relever
pour notre propos est que les coronales sont les consonnes les plus susceptibles de se trouver
en plusieurs exemplaires dans une même racine, alors même qu'une telle intimité est interdite
ou fortement déconseillée dans la langue.
Ceci est conforté lorsque l'on regarde plus précisément les cooccurrences des
consonnes non seulement homorganiques, mais identiques. "Adjacent identical consonants are
absolutely prohibited (so this again excludes biliterals), but the following roots illustrate the
fact that identical consonants do occur in nonadjacent positions" (Buckley 2001 : 126). Le
tableau suivant décompose les résultats du tableau ci-dessus deuxième partie :
(108)
gutturales
vélaires
labiales
total noncoronales
coronales
obstruantes
coronales
sonantes
total coronales
cooccurrences de consonnes identiques nonadjacentes
O (racines
E (racines
rapport
effectives)
attendues)
O/E
0
16
0.00
1
14
0.07
2
22
0.09
cooccurrences de C non-identiques de
même classe non-adjacentes
O (racines
E (racines
rapport
effectives)
attendues)
O/E
6
33
0.18
3
59
0.05
16
46
0.35
3
52
0.06
25
138
0.18
7
30
0.23
105
132
0.80
2
43
0.05
104
97
1.07
9
73
0.12
209
229
0.91
Deux coronales obstruantes identiques ont vingt fois plus de chances de se trouver en
contact dans la même racine que deux gutturales, deux vélaires ou deux labiales identiques.
On remarquera cependant que les labiales sont davantage susceptibles de subir cette intimité
que deux coronales sonantes (0.09 contre 0.05). Si l'on observe maintenant le comportement
des consonnes non-identiques non-adjacentes, le caractère relativement libre des coronales,
137
Chapitre 2 – Le caractère particulier des consonnes coronales
obstruantes comme sonantes, est encore une fois mis en lumière : "as usual, among the
coronals the prohibition is weaker".
L'étude de la cooccurrence de segments homorganiques, voire identiques, a une fois de
plus mis en exergue un comportement particulier des coronales par rapport aux autres
consonnes, fussent-elles glottales.
La section suivante envisage un huitième argument en faveur de la spécificité des
coronales : le choix d'un allomorphe en fonction de la dernière consonne radicale (qui n'est
pas sans rappeler les données fournies par Plénat sur la dérivation à l'aide de suffixes
évaluatifs détaillées dans le chapitre 1 section 3).
2.8. Dérivation ?
Buckley (2000) mentionne une autre particularité des consonnes coronales, en rapport
cette fois avec leur position dans le mot. En kashaya, langue amérindienne pomœnne parlée
en Californie du nord, le morphème d'"acte pluriel" connaît plusieurs allomorphes, pour
lesquels la détermination est partiellement définie dans le lexique, mais dont la position
relative dans le mot dépend du dernier son du radical. En ce qui concerne l'allomorphe [ta] :
a - si le radical se termine par une consonne coronale, l'allomorphe [ta] est suffixé ;
b - si le radical se termine par une consonne non coronale, l'allomorphe [ta] est infixé.
(109)
nature de la consonne
finale du radical
l
coronales
n
non
m
coronales q
radical
dahqotolditanbilaqhamsima:q-
radical +
allomorphe infixal
bilaqha-ta-msima-ta-q
radical + allomorphe
suffixal
dahqotol-taditan-ta
glose
"échouer"
"contusionner"
"nourrir"
"aller dormir"
Ces données ne suffisent cependant pas à prouver qu'il s'agit d'une particularité des
consonnes coronales par rapport aux autres types de consonnes : la détermination contextuelle
peut être dans le cas présent liée à l'identité de la consonne du morphème dérivationnel, qui
requerrait une consonne de même lieu d'articulation à sa gauche pour être suffixé. Il serait
donc nécessaire de contrôler que d'autres allomorphes ou d'autres morphèmes dérivationnels
commençant par une consonne d'un autre lieu d'articulation sont soumis au même
conditionnement. Si un morphème se réalisant [ba] ou [ka] se comporte de la même manière
que [ta], à savoir suffixé derrière une consonne coronale et infixé si le radical se termine par
138
Chapitre 2 – Le caractère particulier des consonnes coronales
une consonne autre que coronale, alors la particularité des coronales est une fois encore mise
en exergue. Si au contraire un morphème de réalisation [ba] se comporte parallèlement à [ta]
mais en fonction de la labialité de la dernière consonne radicale, c'est-à-dire qu'il sélectionne
les finales labiales pour l'allomorphe suffixal et réserve l'allomorphe infixal aux bases dont les
finales ne sont pas coronales, alors les coronales ne sont pas spécifiques par rapport aux
consonnes des autres lieux d'articulation. Buckley (2000) ne donne pas dans son article
d'information permettant de statuer de manière définitive sur le statut des coronales en
kashaya.
L'argument dérivationnel n'est ici pas complet, mais il est serait intéressant de l'évaluer
au moyen des données manquantes de façon à déterminer s'il s'agit là d'un critère de plus
permettant de distinguer les coronales des autres consonnes.
Le dernier argument présenté ici concerne les coronales en regard de l'aphasie.
2.9. Aphasie
L'aphasie est définie par Pellat (1995) comme un "trouble du langage (atteinte des
règles linguistiques nécessaires à l'expression et à la compréhension) en rapport avec une
lésion cérébrale (hémisphère gauche chez le droitier)". J'envisagerai ici l'apport de l'aphasie
dans la discussion sous trois angles différents : la substitution, la syncope et l'épenthèse dans
le discours aphasique.
2.9.1. Substitution
Le statut particulier des coronales dans le discours aphasique a été mis en exergue par
Puel et al. (1980 : 253) dans une étude portant sur les erreurs de substitution produites par un
patient de langue française atteint d'anarthrie39. Les segments alvéodentaux /t/, /d/, /s/ et /z/
étaient significativement les plus fréquemment employés en substitution d'autres segments.
39
L'anarthrie se manifeste par la difficulté à synchroniser les mouvements nécessaires pour réaliser les sons,
ceux réalisés étant parfois altérés. Exemples : [pø] pour [blø], [pati] pour [pati], etc.
139
Chapitre 2 – Le caractère particulier des consonnes coronales
2.9.2. Syncope
Les coronales sont les consonnes les plus fréquemment syncopées dans le discours
aphasique de locuteurs de langue française, selon Béland & Favreau (1991 : 214-216). Ceuxci présentent une comparaison des syncopes consonantiques à partir de deux corpus.
Le corpus A (Béland, 1985) porte sur 58 locuteurs français, la moitié d'entre eux étant
aphasiques ; les tâches proposées consistaient en la répétition et la lecture à voix haute de 321
mots.
(110)
résultats corpus A
initiale de mot
dans les mots de départ
syncopées
intervocalique
dans les mots de départ
syncopées
finale de mot
dans les mots de départ
syncopées
labiales
coronales
vélaires
total
40.5%
17.8%
48.9%
78.5%
10.4%
3.6%
99.8 %
99.9 %
33.5%
0
58.3%
100%
8.02%
0
99.82 %
100 %
12.06%
5.6%
79.3%
79.2%
8.6%
15.1%
99.96 %
99.9 %
Les sujets aphasiques réalisent systématiquement la syncope des coronales fournies
dans les mots de départ à l'intervocalique, qu'on leur demande de lire ou de répéter. En
revanche, ils ne syncopent aucune labiale ni aucune vélaire dans cette même position. Les
résultats à l'initiale de mot et à la finale sont moins impressionnants mais tout aussi
révélateurs : près de quatre consonnes sur cinq syncopées sont coronales dans chacun de ces
deux contextes, mais moins d'une labiale ou d'une vélaire sur cinq. En outre, on notera que les
vélaires sont davantage syncopées en finale que les labiales, mais que celles-ci sont moins
maintenues à l'initiale que les vélaires.
Le corpus B (Favreau, 1989) a été construit à l'aide de quatre sujets aphasiques, ayant
pour tâche de répéter 144 mots dont 96 réels.
(111)
résultats corpus A
initiale de mot
dans les mots de départ
syncopées
intervocalique
dans les mots de départ
syncopées
finale de mot
dans les mots de départ
syncopées
labiales
coronales
vélaires
total
52.4%
0
39%
100%
8.5%
0
99.9 %
100 %
28.7%
0
62%
0
9.2%
0
99.9 %
5.4%
0
86.4%
85.7%
8.1%
14.2%
99.9 %
99.9 %
140
Chapitre 2 – Le caractère particulier des consonnes coronales
Cette fois-ci c'est l'initiale de mot qui distingue les coronales : toutes les syncopes
réalisées dans cette position concernent les coronales. A l'intervocalique en revanche, les
coronales ne déclenchent aucune syncope, au même titre que les deux autres catégories de
consonnes. En finale, les coronales syncopées représentent plus de 85 % de l'ensemble des
consonnes syncopées (on remarquera d'ailleurs que les 15 % restants concernent les vélaires
mais aucune labiale).
Dans les deux corpus, il ressort que les syncopes les plus fréquentes sont le fait des
coronales, sans que l'on puisse distinguer plus précisément un contexte particulier puisque
dans un cas c'est l'intervocalique qui semble favoriser la syncope, dans l'autre c'est l'initiale de
mot.
Outre par le biais de la substitution et de la syncope, l'aphasie témoigne du
comportement particulier des coronales dans les phénomènes d'épenthèse.
2.9.3. Epenthèse
Béland & Favreau (1991 : 212) ont mis en parallèle les fréquences des épenthèses
labiales, coronales et vélaires40, attendues (selon le nombre de coronales par rapport à
l'ensemble des consonnes du français, soit (9/17) x 100) et observées dans le discours
aphasique :
(112)
labiales
coronales
vélaires
attendues
observées
à l'initiale de mot
29.4%
52.9%
17.6%
22.4%
4.1%
à l'intervocalique41
7%
en finale de mot
7.3%
total
12.8%
73.5%
ex : hublot [tublo]
81.3%
ex : union [ynit]
81.3%
ex : aspect [aspn]
79.7%
11.6%
7.3%
7.5%
On constate davantage de coronales qu'il n'était prévu, particulièrement à
l'intervocalique et à la finale, et corollairement moins de labiales et de vélaires. Le tableau
40
Les épenthèses de // et /h/ ne sont pas prises en compte.
Le fait que l'intervocalique corresponde à un hiatus intérieur de morphème n'est pas clairement indiqué mais
ressort des exemples fournis par les auteurs.
41
141
Chapitre 2 – Le caractère particulier des consonnes coronales
met également en relief le comportement particulier des labiales à l'intervocalique : elles sont
fort peu présentes, alors que les vélaires sont comparativement plus représentées.
De la même manière, il est possible de distinguer à l'intérieur de la classe des
coronales la sous-classe la plus représentée :
(113)
attendues
observées
à l'initiale de mot
à l'intervocalique
en finale de mot
total
/t, d, n, l, r/42
55.55%
22.22%
/s, z/
22.22%
/, /
88.88%
97.1%
51.4%
79.2%
5.55%
0
37.1%
14.2%
5.55%
2.9%
11.4%
6.6%
Cette ramification des données permet de mettre en exergue la prépondérance, dans un
discours aphasique, des épenthèses de coronales antérieures non fricatives par rapport aux
fricatives antérieures et aux post-alvéolaires, à l'initiale et à l'intervocalique. En revanche, en
finale de mot ces coronales sont moins représentées que prévu, au profit des fricatives
antérieures /s/ et /z/. Quoi qu'il en soit, ce sont les fricatives antérieures qui ont la préférence
quand il s'agit d'épenthèse.
42
On remarquera que /r/ fait partie de l'inventaire pris en compte ici, alors que je l'ai exclu de l'analyse.
Cependant, les résultats étant massifs, je ne pense pas que sa prise en compte les remette en question.
142
Chapitre 2 – Le caractère particulier des consonnes coronales
2.10. Bilan sur la singularité des coronales
Le tableau ci-dessous récapitule les motifs répertoriés pour l'établissement de la
singularité de la classe des coronales en regard des consonnes des autres lieux d'articulation.
(114)
critère
fréquence dans les
langues du monde
fréquence
intralinguistique
section
2.1.1.
2.1.2.
fréquence dans
l'inventaire
détail
les coronales sont présentes dans toutes les langues répertoriées, en dehors du
hawaïen.
dans une langue donnée, beaucoup plus de lieux d'articulation sont distinctifs au
sein de la classe des coronales que dans les autres.
trois fois plus de coronales que de labiales ou de vélaires sont dénombrées dans
2.1.3.
l'API.
2.1.4.
les consonnes les plus attestées dans le discours sont les coronales.
universel des sons
dans le discours
dans leur
distribution
transparence
assimilation
neutralisation
marque et
implication
chute
2.1.5.
2.2.
2.3.
2.4.
2.5.
2.6.
co-occurrence
les coronales sont bien plus susceptibles de se trouver en finale de mot que les
autres catégories de consonnes.
les coronales sont transparentes à la propagation, au contraire des labiales et des
vélaires.
les coronales sont les consonnes les plus souvent assimilées dans les langues, y
compris lors de l'acquisition.
les neutralisations s'observent en coronales ou glottales, jamais en labiales ou en
vélaires.
la présence de consonnes non coronales dans une langue suppose celles des
coronales, mais la réciproque n'est pas vraie.
les coronales sont soit les seules à chuter, soit les seules à se maintenir dans une
langue et dans une position données.
dans les langues gabaritiques, alors que les séquences de deux consonnes
2.7.
homorganiques au sein d'un même mot sont prohibées, on en trouve tout de
même s'il s'agit de coronales.
dérivation
substitution dans
l'aphasie
syncope et aphasie
épenthèse et
aphasie
2.8.
2.9.1.
2.9.2.
2.9.3.
les coronales sélectionneraient des allomorphes particuliers.
les coronales sont plus souvent employées en substitution à d'autres segments
que les consonnes des autres lieux d'articulation.
les coronales sont les consonnes les plus souvent syncopées, quelle que soit leur
position dans le mot.
les coronales sont les consonnes les plus souvent épenthésées, où que l'épenthèse
se situe dans le mot.
143
Chapitre 2 – Le caractère particulier des consonnes coronales
Chaque motif d'isolation des coronales par rapport aux autres types de consonnes
(labiale et vélaire) est insuffisant, pris séparément, pour cataloguer les coronales comme les
consonnes les moins marquées : ce sont les plus fréquentes mais pas dans tous les types de
fréquences, ce sont les premières acquises mais à égalité avec les labiales, les coronales sont
transparentes mais les vélaires peuvent l'être aussi… C'est le faisceau de particularités centré
sur les consonnes coronales plus que la valeur de chaque motif pris séparément qui permet de
placer, dans les langues du monde, les coronales en concurrence avec le coup de glotte pour le
titre de "consonne la moins marquée".
La particularité des coronales étant maintenant établie, examinons à présent la manière
dont les théories phonologiques ont choisi de l'implémenter, ou au contraire de ne pas la
représenter.
3. Le statut particulier des coronales : les théories génératives
La phonologie générative a pour acte de naissance The Sound Pattern of English de
Chomsky & Halle (dorénavant SPE) en 1968. Le générativisme s'appuie sur le
distributionnalisme mais en rejette la notion de corpus fini pour lui substituer une approche
dynamique, basée sur la capacité de création de toute langue. La phonologie générative
prolonge la syntaxe générative transformationnelle (Chomsky 1965).
Le SPE sera a son tour remis en question au sein même de la phonologie générative,
non pour ce principe de dynamisme de la langue, mais pour les notions de linéarité des
représentations et de règles cycliques d'une part, de manque de structuration interne des
éléments d'autre part. Pour reprendre les termes de Durand & Katamba (1995 : XIII), "during
the 1970s and the 1980s a fairly radical reconfiguration of the fields of phonology took place,
largely against the backdrop of Chomsky & Halle The Sound Pattern of English (1968)".
On date généralement le début "officiel" des théories phonologiques autosegmentales
à Goldsmith (1976).
La plupart des théories phonologiques post-SPE supposeront en effet plusieurs
niveaux ou lignes autosegmentales (ligne tonale, niveau squelettal indiquant les positions,
niveau mélodique, etc.) et tenteront de déduire directement les représentations phonétiques
des structures phonologiques. Elles s'inscrivent à la fois dans le cadre des approches
144
Chapitre 2 – Le caractère particulier des consonnes coronales
multilinéaires et dans celui des théories "Principes et Paramètres", selon lesquelles chaque
langue possède un système phonologique propre mais qui s'inscrit en même temps à l'intérieur
d'un schéma universel unique.
A cette étape de l'exposé nous nous intéressons à la structure interne des segments,
pour tâcher de définir si les théories phonologiques à notre disposition font état de cette
particularité des coronales établie plus haut. C'est pourquoi je n'aborderai pas dans cette partie
des théories comme la Phonologie Lexicale, qui n'est pas une théorie de la substance
mélodique. Je commencerai par un rappel rapide des traits saillants de Chomsky & Halle
(1968) pertinents pour la discussion, avant de discuter plus précisément plusieurs cadres
théoriques postérieurs.
3.1. Chomsky & Halle (1968)
L'entrée lexicale d'un terme ne doit comporter que les éléments informatifs, ce qui
relève d'un phénomène régulier doit en être exclu. Cette idée sera plus tard reprise par la sousspécification, cf. section 3.2.2. D'autre part, il faut trouver un moyen de référer aux classes
naturelles de sons de manière simple. De ce fait, la primitive postulée par Chomsky & Halle
(1968) n'est pas le phonème, mais le trait distinctif ; le phonème en effet n'est plus vu comme
une entité indivisible mais comme une matrice de traits.
Les traits distinctifs se manifestent à trois niveaux de la grammaire de Chomsky &
Halle (1968) : la structure de surface (assignée par la syntaxe), la composante phonologique
(ensemble de règles assignant une interprétation phonétique contextuelle aux représentations
générées par la structure de surface), l'interprétation phonétique. Ces traits, toujours présents
dans la matrice correspondant à un phonème, sont binaires car classificatoires : un son
appartient ou non à la classe naturelle correspondante.
Chomsky & Halle reprennent en cela la théorie des traits distinctifs de Jakobson
(1941) basée sur les principes de binarité des traits et de distinction entre les traits
phonétiques - potentiellement redondants - et les traits phonologiques - distinctifs ; parmi
l'ensemble des traits universels, donc appartenant à la grammaire universelle, seul un petit
nombre permet de différencier les phonèmes d'une langue donnée. Jakobson avait dressé un
inventaire de douze traits distinctifs, définis en termes acoustiques. Chomsky & Halle quant à
eux définissent un peu plus d'une dizaine de traits sur la base de corrélaires articulatoires et
non plus acoustiques, sans pour autant donner à cet aspect phonétique des traits sa pleine
145
Chapitre 2 – Le caractère particulier des consonnes coronales
valeur : la phonologie s'occupant des représentations structurales, il est nécessaire de
simplifier le répertoire des traits par rapport à la phonétique. Cette simplification passe par
l'élimination des traits redondants (par exemple, les traits [oral] et [nasal] étant en distribution
complémentaire, on peut en supprimer un).
En ce qui concerne les traits relatifs au lieu d'articulation des consonnes, Chomsky &
Halle (1968) retiennent les traits antérieur, coronal, haut et arrière, définis de la manière
suivante :
- antérieur : est [+antérieur] un son pour lequel le principal obstacle au passage de l'air n'est
pas plus en arrière dans la bouche que les alvéoles. Les labiales, dentales et alvéolaires sont
[+antérieur] ; à partir des post-alvéolaires ([t],[d]), les consonnes sont [-antérieures].
- coronal : le trait [+coronal] caractérise les phonèmes réalisés avec un relèvement de la
langue dans la cavité buccale par rapport à la position neutre. Seront donc [+coronales] les
consonnes dentales, alvéolaires et post-alvéolaires, et [-coronales] les labiales, palatales,
vélaires, uvulaires et pharyngales.
- haut : si un son est articulé la masse de la langue relevée au maximum dans la bouche, il sera
[+haut]. Les consonnes post-alvéolaires, palatales et vélaires sont alors [+haut].
- arrière : lorsque la masse de la langue est ramenée en arrière de la bouche comme pour les
vélaires, les sons sont [+arrière].
Pour les consonnes on obtient les définitions de classes naturelles en traits suivantes :
+ant
(pharyngales)
(uvulaires)
vélaires
palatales
postalvéolaires
alvéolaires
dentales
bilabiales
labio-dentales
(115)
-ant
-cor
+cor
-haut
-cor
+haut
-arr
-haut
+arr
Dans ce modèle, les coronales ne se voient pas attribuer un statut particulier en ce qui
concerne le nombre de traits présents dans la matrice, mais elles se distinguent tout de même
par l'apparition d'un trait qui leur est propre. On remarquera à cet endroit d'une part que
Chomsky & Halle (1968) excluent les palatales de l'ensemble des coronales, d'autre part qu'ils
ne fournissent pas de moyen pour distinguer entre les dentales et les alvéolaires.
146
Chapitre 2 – Le caractère particulier des consonnes coronales
Je vais considérer dans ce qui suit quatre théories, plus ou moins directement inspirées
de Chomsky & Halle (1968), qui se sont développées dans les années 80. Au niveau
infrasegmental, c'est-à-dire en ce qui concerne l'organisation interne des segments, ces
théories ont pour point commun l'objectif de fédérer certains traits, contrastant en cela avec
les traits "en vrac", non classés, de SPE. Comme le récapitulent Anderson & Ewen (1987 :
255) dans leur ouvrage de présentation de la Phonologie de Dépendance, "the framework of
SPE is minimally componential in that there is no attempt to organise the phonological
primitives into subgroupings within the segmental feature matrix, nor is there any variety in
the type of relationships holding between the primitives in the model; i.e. all segments are
characterised by an unordered set of features, each of which can have only the value '+' or '-'
at least phonologically."
Ces quatre théories ne sont pas sur un pied d'égalité en ce qui concerne leur héritage
par rapport à Chomsky & Halle (1968). En effet on distinguera d'une part la Géométrie des
Traits (Clements 1985), beaucoup plus directement enracinée dans Chomsky & Halle (1968)
et qui a en gardé la notion de traits distinctifs, et d'autre part la Phonologie des Particules
(Schane 1984), la Phonologie de Dépendance (Anderson & Ewen 1987) et la Phonologie de
Gouvernement (Kaye et al. 1985, 1990), qui ont préféré des primitives monovalentes aux
traits binaires exploités dans le modèle de 1968.
(116)
Primitives polyvalentes,
en traits distinctifs
Géométrie des Traits
Clements (1985)
Primitives monovalentes, plus grandes que de simples traits
Phonologie des
Particules
Schane (1984)
Phonologie de
Dépendance
Anderson & Ewen (1987)
Phonologie de
Gouvernement
Kaye & al. (1985)
Nous allons commencer avec la Géométrie des Traits, considérée comme le modèle
standard, et passerons dans un deuxième temps aux cadres, minoritaires, privilégiant les
primitives monovalentes.
3.2. Géométrie des Traits
Cette présentation du cadre s'organisera de la manière suivante : dans un premier
temps, j'expliciterai le fonctionnement du cadre au niveau suprasegmental, c'est-à-dire de la
structure interne des éléments, en mettant en évidence les particularités de la Géométrie des
Traits. Dans une deuxième partie, je présenterai la théorie de la sous-spécification qui, si elle
147
Chapitre 2 – Le caractère particulier des consonnes coronales
n'est pas partie intégrante du modèle et se trouve d'ailleurs dans d'autres cadres, joue un rôle
important dans la représentation des éléments en Géométrie des Traits.
3.2.1. Structure interne des éléments
La Géométrie des traits (Clements 1985, 1993, Sagey 1986, Clements & Hume 1995)
a été développée en réaction à deux imperfections de Chomsky & Halle (1968) : le caractère
amorphe et non structuré des traits à l'intérieur des matrices, et la surgénération du système,
capable de rendre compte des phénomènes possibles comme de ceux qui ne sont jamais
attestés. "What has been lacking, in other words, is an adequate way of capturing the notion
natural class of features - features that tend to function together as units, to the exclusion of
others, in linguistic rules." (Clements 1987 : 30). Ce cadre phonologique a vu le jour dans les
années 80, plus précisément avec Clements (1985).
Les traits distinctifs constituent donc dans ce cadre un ensemble hiérarchiquement
organisé : certains traits fonctionnent ensemble, c'est-à-dire que si un processus phonologique
(assimilation par exemple) en modifie un, d'autres seront automatiquement touchés. Les traits
se propageant ou s'effaçant en groupe doivent donc constituer un nœud à un niveau supérieur.
"If we find that certain sets of features consistently behave as a unit with respect to certain
types of rules of assimilation or resequencing, we have good reasons to suppose that they
constitute a unit in phonological representation, independently of the actual operation of the
rules themselves." (Clements 1985 : 226). C'est pourquoi les traits sont regroupés en "nœuds"
en fonction de leur degré d'intimité dans les processus phonologiques, ce qui aboutit à une
représentation en arbres dans lesquels "segments are represented in terms of hierarchicallyorganized node configurations whose terminal nodes are feature values, and whose
intermediate nodes represent constituents" (Clements & Hume 1995 : 249). Les éléments
terminaux, c'est-à-dire les traits, ne sont pas ordonnés et sont placés à des niveaux séparés
(Clements & Hume 1995 : 249-251).
Il existe une structure universelle qui regroupe les traits en nœuds de classe43 ("class
nodes", Clements 1985), qui à leur tour se hiérarchisent pour former un segment. Clements &
Hume (1995 : 270) justifient ainsi la création d'un nœud de place : "In rules of place
assimilation, the oral tract place features [labial], [coronal] and [dorsal] and their dependents
spread as a single unit, independently of stricture features such as [continuant], [vocoid], and
43
Egalement appelés nœuds organisants ("organising nodes", Avery & Rice 1989).
148
Chapitre 2 – Le caractère particulier des consonnes coronales
[sonorant]. We may capture this fact by grouping them under a single place node". Si l'on
reprend l'assimilation en catalan développée dans la partie précédente dans cette optique, le
but de la Géométrie des Traits est donc de rendre compte du fait que la nasale coronale
s'assimile du lieu d'articulation de la consonne suivante – labiale, labio-dentale, coronale,
vélaire – mais pas son mode d'articulation : elle ne perd pas pour autant sa nasalité ni son
voisement, comme on peut le constater dans le tableau illustratif suivant :
(117)
/n/
alvéolaire "témoin"
labiale
so[n] amics
so[m] pocs
"ils sont amis"
"ils sont peu"
labio-dentale
so[] felios
"ils sont heureux"
alvéolaire
vélaire
so[n] sincers
so[] rans
"ils sont sincères"
"ils sont grands"
Cette représentation hiérarchique fait la prédiction que certains traits fonctionneront
toujours ensemble et d'autres jamais, ce qui restreint l'inventaire des processus phonologiques
possibles.
Les nœuds de classe sont unaires ou monovalents : soit ils sont présents, soit ils sont
absents, étant entendu que ne peut se propager que ce qui est présent. Les traits en revanche
comportent deux valeurs : + et - (ce qui a été vivement critiqué du fait que cette prétendue
binarité cache en réalité un système à trois possibilités : absence du trait, valeur + et valeur - ;
cf. section 1.1.1). Enfin, cette organisation des traits se retrouve à tous les niveaux de la
dérivation, ce qui signifie que les règles phonologiques ne peuvent pas créer de nouveaux
types d'organisation de traits. La hiérarchie des traits opère comme un gabarit définissant la
bonne formation des segments tout au long de la dérivation.
La représentation d'un segment en Géométrie des Traits, une fois ces quelques idées de
base établies, ne fait pas l'unanimité : tous les linguistes de ce cadre en effet ne reconnaissent
pas les mêmes nœuds, ni ne sont d'accord quant aux traits à exploiter, notamment en ce qui
concerne le lieu de place (cf. notamment Yip 1989 : 349). Je présenterai ici un cadre général,
adapté de Sagey (1986 : 12), qui permettra de suivre la discussion :
149
Chapitre 2 – Le caractère particulier des consonnes coronales
(118)
X
nœud racine
[continu]
[consonantique]
nœud laryngal
[spread]
[constr]
[slack]
[stiff]
nœud supralaryngal
palais mou
[nasal]
nœud de place
labial
[arrondi]
coronal
dorsal
[antérieur]
[distribué]
[haut]
[bas]
[arrière]
X indique le point squelettal lié au constituant syllabique auquel se rattache la
structure : la Géométrie des Traits utilise une représentation standard de la syllabe, à savoir
une attaque suivie d'une rime, elle-même comprenant un noyau suivi d'une coda, facultative.
Chaque nœud syllabique terminal domine une unité du niveau squelettal, qui à son tour
domine le nœud racine44 (RN).
44
Celui-ci est considéré dans certaines versions du modèle (McCarthy 1988, Yip 1989) comme constitué des
traits [sonant] et [consonantique]. Que cela soit le cas ou non n’est cependant pas pertinent pour cette
présentation.
150
Chapitre 2 – Le caractère particulier des consonnes coronales
(119)
syllabe
attaque
rime
noyau
coda
|
|
X
X
X
|
|
|
RN
RN
RN
Toutes les branches majeures de l'arbre sont issues du nœud racine : les nœuds
laryngal et suprasegmental, sur lesquels je vais revenir, et les traits [continu] et
[consonantique], qui ne sont pas dominés par des constituants articulatoires puisqu'ils ne sont
pas exécutés par un articulateur particulier. [-continu] indique s'il s'agit d'un élément occlusif,
[+continu] renvoie à un élément fricatif, sonant ou vocalique. De la même manière, le trait
[consonantique] prendra la valeur positive pour une consonne, négative pour une voyelle.
Le nœud laryngal (LN) domine les traits correspondant aux modes articulatoires. Ainsi
domine-t-il [spread glottis], qui caractérise les segments aspirés s'il prend la valeur positive, et
[constricted glottis], positif pour les éjectives et les implosives. Le voisement est quant à lui
exprimé par les deux traits [slack] et [stiff], correspondant respectivement à voisé et non
voisé, également dominés par le nœud laryngal.
Le nœud supra-laryngal fédère le nœud palais mou, dominant le trait [nasal], et le
nœud de place. Ce dernier va déterminer le lieu d'articulation du segment considéré, les traits
qu'il domine "changing the shape of the resonator" (Sagey 1986 : 15). Dans le modèle
présenté ici sont distingués trois sous-nœuds :
- le nœud labial, indiquant s'il est impliqué que l'articulateur effectif du segment considéré est
constitué par les lèvres (cf. Clements & Hume 1995 : 252) ; ce nœud domine le trait [arrondi],
qui prend la valeur positive dans le cas d'un segment arrondi.
- le nœud dorsal, présent si c'est le corps de la langue l'articulateur effectif ; trois traits
viennent préciser l'articulation d'un segment dorsal : [haut] pour les sons articulés avec le
corpus de la langue relevé par rapport à la position neutre, [arrière] et [bas] prenant la valeur
positive respectivement pour les sons articulés la langue en arrière ou en bas par rapport à sa
position neutre.
151
Chapitre 2 – Le caractère particulier des consonnes coronales
Il faut noter à cet endroit que nombre de géomètres (Paradis & Prunet 1989, Hall 2001
par exemple) choisissent de rassembler les nœuds labial et dorsal en un seul, le nœud
périphérique, du fait que "labials and velars form a natural class" par contraste avec celui des
coronales (Hall 1997 : 25-26). Je reviendrai sur ce nœud périphérique un peu plus loin dans
l'exposé.
- le nœud coronal (impliquant l'avant de la langue, soit l'apex et la lame, cf. partie phonétique)
dominant les deux sous-distinctions que sont l'antériorité et la distributivité.
Les règles phonologiques en Géométrie des traits sont essentiellement de trois types
(parfois davantage selon les différentes versions de la théorie, mais cela ne change rien aux
buts de cette présentation) :
- propagation (cf. Avery & Rice 1989 : 181, Clements & Hume 1995 : 257-259) : un nœud
peut se propager d'un segment A vers un segment B si et seulement si une cible structurale est
présente dans le segment B, c'est-à-dire si une position vide peut l'accueillir. B aura alors tout
(assimilation totale) ou partie (assimilation partielle) des traits de A, selon que le nœud qui
s'est propagé est plus ou moins haut dans la représentation. Ainsi si le nœud supralaryngal
(SLN) d'un segment A se propage sur un segment B, celui-ci héritera-t-il non seulement du
lieu d'articulation mais également du caractère nasal (ou non) du segment A ; en revanche, si
seul le nœud de place (PN) par exemple se propage sur le segment B, celui-ci gardera son
mode articulatoire et ne se verra imposé que le lieu d'articulation du segment A.
- fusion : peuvent fusionner deux nœuds identiques d'un segment A et d'un segment B à
condition que les nœuds secondaires, "en-dessous", soient également identiques. ; "both nodes
do not dominate different secondary nodes" (Avery & Rice 1989 : 181).
- déliaison (cf. Clements & Hume 1995 : 261-263, Avery & Rice 1989 : 182) : dans des
positions neutralisantes, par exemple en coda, certains nœuds peuvent se délier, étant par la
suite "deleted through a general convention". La déliaison explique notamment les cas de
dissimilation (cf. Clements & Hume 1995 : 262-263 pour une illustration). Elle peut
s'accompagner de l'effacement du trait délié, puis d'une insertion par défaut dans les cas de
neutralisation (Clements & Hume 1995 : 264).
Par ailleurs, entre le lexique et la réalisation phonétique d'un segment sous-spécifié,
trois types de règles peuvent rendre compte du remplissage d'un segment sous-spécifié (cf.
Keating 1988).
152
Chapitre 2 – Le caractère particulier des consonnes coronales
- Le premier comprend les règles de remplissage, s'appliquant indépendamment de tout
contexte et se basant sur les valeurs des autres traits déjà présentes dans la matrice du
segment. C'est ce type de règles qui s'occupe de la redondance phonétique : si un segment est
sonant, alors il est nécessairement [+voisé] ; autre possibilité : si seuls les segments [+voisés]
sont sous-jacents, ceux qui ne sont pas spécifiés seront [-voisés].
- Le second type de règles sera formé de l'ensemble des règles de position. Il s'agit des règles
qui déterminent la valeur des traits en fonction de la place du segment considéré dans la
chaîne ou dans la structure de la syllabe, mais sans faire référence au contexte mélodique.
L'exemple de Keating (1988) est emprunté à Stevens et al. (1986) : [+spread glottis]
déclenche [-voisé] en anglais en début de syllabe ou de mot, et [+nasal] provoque [+voisé] à
l'intervocalique, quelles que soient les voyelles du contexte.
- Les règles contextuelles remplissent quant à elles les valeurs des traits d'un segment
précisément en fonction des valeurs des segments voisins pour ces mêmes traits. Ce sont les
règles qui opèrent dans les cas d'assimilation et de dissimilation. C'est dans cette catégorie que
l'on trouvera par exemple la règle qui assigne la valeur positive au trait [vélaire] d'une
consonne en contact avec une voyelle d'arrière.
Après cette mise en place du cadre de la Géométrie des Traits dans l'optique de rendre
compte de la manière dont il représente les coronales et leur statut particulier, intéressonsnous un instant au concept de sous-spécification, qui va permettre précisément de distinguer
les coronales des autres classes de consonnes.
3.2.2. La sous-spécification
Le principe de sous-spécification d'un segment n'est pas obligatoirement lié à la
Géométrie des Traits. Dès 1975 par exemple, Kean (1975 : 48) propose une théorie
universelle de la marque dans laquelle /t/ est universellement la consonne la moins marquée,
et coronal l'articulation non-marquée.
Par ailleurs, tous les phonologues travaillant en Géométrie des Traits ne reconnaissent
pas la sous-spécification : outre Hall (1997 : 30-32) par exemple qui récuse explicitement
l'idée de la sous-spécification des coronales, Lightner (1963) et Stanley (1967) parmi d'autres
rejettent le principe même de sous-spécification du fait que "to omit specifications entailed
allowing binary features to create a ternary contrast among segments". Pour ces derniers, la
153
Chapitre 2 – Le caractère particulier des consonnes coronales
sous-spécification cache en réalité une opposition à trois degrés : valeur positive liée à un
trait, valeur négative, ou absence du trait.
Bien que la notion de sous-spécification soit indépendante du cadre de la Géométrie
des Traits, c'est ce cadre qui l'a majoritairement exploitée. En Géométrie des Traits, la sousspécification est intimement liée au contrôle des valeurs des traits.
La sous-spécification, selon Archangeli (1988), part du principe qu'un des critères
d'évaluation d'une bonne grammaire est le fait que seules les propriétés idiosyncratiques sont
listées dans le lexique (cf. entre autres Chomsky & Halle 1968 "Underlying representations
may not contain the specification of predictable information" ; également Mohanan 1991 :
285). Dans le lexique d'une "bonne grammaire" donc, il ne faudrait pas trouver d'élément
prévisible ("There is […] general consensus among most proponents of underspecification
that redundant feature values are absent underlyingly" Hume 1994 : 21). De ce fait, la sousspécification est à la fois théoriquement possible et empiriquement désirable (Archangeli
1988). Pour Hall (2001 : 17ss), les représentations sous-spécifiées cumulent au moins les
deux atouts suivants : "(i) underspecification allows one to eliminate redundancies and (ii)
underspecification explains transparency to spreading and the failure to initiate spreading". En
ce qui concerne ce dernier point, un trait non spécifié dans le lexique ne pourra en effet pas se
propager, précisément parce qu'il n'est pas présent dans le lexique : comment propager un
élément absent ? De la même manière, comment un élément absent pourrait-il déclencher une
propagation ?
Selon Archangeli & Gagnon (1984 : 174), la consonne par défaut en français est /t/,
"the universally unmarked segment." Béland & Favreau (1991 : 211) cependant, s'appuyant
sur des données relatives au discours aphasique, considèrent que "there is no obvious
epenthetic consonant segment" en français.
On distinguera trois approches de la sous-spécification développées parallèlement à la
Géométrie des Traits :
- la sous-spécification radicale, selon laquelle seuls les traits marqués à l'intérieur d'une
théorie universelle de la marque sont présents.
- la spécification contrastive, basée sur la notion de redondance à l'intérieur d'un système
phonologique donné.
- la spécification contrastive modifiée, héritière des deux variantes précédentes.
154
Chapitre 2 – Le caractère particulier des consonnes coronales
3.2.2.1. Sous-spécification radicale et marque
Sous cette approche (Kiparsky 1982, 1985, Archangeli 1984, 1988, Pulleyblank 1988,
Grignon 1984, Archangeli & Pulleyblank 1986, Paradis & Prunet 1989, Mohanan 1991,
Steriade 1995), la sous-spécification se rattache à la notion de marque, élaborée à l'intérieur
d'une théorie de la marque universelle et non intralinguistique.
3.2.2.1.1. La notion de marque
La notion de marque, bien que souvent exploitée en phonologie depuis sa définition
par l'école de Prague (cf. Brandão De Carvalho 1997 pour une présentation de l'historique et
de la problématique de la marque), n'est pas si aisée à définir que son utilisation très répandue
le laisserait penser. Rice (1999a : 3) a recensé dans la littérature, de Jakobson et Troubetzkoy
aux ouvrages actuels, les expressions suivantes liées à la notion de marque :
(120)
marked
less natural
more complex
more specific
less common
unexpected
not basic
less stable
appear in few grammars
later in language acquisition
subject to neutralization
early loss in language deficit
implies unmarked feature
harder to articulate
perceptually more salient
unmarked
more natural
simpler
more general
more common
expected
basic
stable
appear in more grammars
earlier in language acquisition
result of neutralization
late loss in language deficit
implied by marked feature
easier to articulate
perceptually less salient
La plupart de ces expressions mériteraient à leur tour une définition, tant leur degré de
précision est faible ou sujet à interprétation : qu'est-ce qu'un trait "attendu" ? Comment définir
ce qui est "naturel" ? Rice récapitule les principaux "diagnostics" phonologiques qui
permettent de déterminer les relations de marque à l'intérieur d'une classe de traits :
- la neutralisation, par exemple du voisement en coda : les éléments se neutralisent en
l'élément le moins marqué (cf. section 2.4 pour l'illustration en regard du lieu d'articulation) ;
- l'épenthèse et la réduplication : l'absence des éléments épenthésés des formes sous-jacentes
"makes such segments excellent candidates for unmarked features as insertion might be
expected to provide the least marked features" (Rice 1999a : 4). Cependant, la variation que
l'on peut trouver dans certaines langues en ce qui concerne la réalisation de l'élément
155
Chapitre 2 – Le caractère particulier des consonnes coronales
épenthésé fragilise partiellement l'épenthèse et la réduplication en tant qu'indicateurs
d'éléments non-marqués : "briefly, epenthetic vowels can be front, central, or back in place
and high, mid, or low in height; epenthetic consonants are drawn from laryngeal, coronal, and
velar places of articulation; they can be obstruents or sonorants. Clearly, the emergence of the
unmarked does not yield a single clear statement on any dimension" (Rice 1999a : 6) ;
- les asymétries dans l'assimilation : "the marked features within a class are active - these
features transmit; the unmarked features, on the other hand, are passive, or inert - these do not
transmit to other segments but are overridden by other features" ;
- la chute et la coalescence, processus dans lesquels "marked features within a class are
maintained and unmarked features lost".
- l'assimilation non locale : les traits non-marqués peuvent être transparents à l'assimilation, ce
qui aboutit à une assimilation à distance, alors que les traits marqués bloquent cette
assimilation.
Cependant, la classification d'un trait en tant que marqué ou non-marqué n'est pas si
simple qu'il peut sembler au premier abord, du fait que "the unmarked feature within a class is
not constant". La valeur d'un trait dépend en effet :
- de la position du phonème correspondant à ce trait dans la syllabe, dans le pied, dans le
morphème ou dans le mot notamment ;
- du système dans lequel il se trouve en relation ;
- à l'intérieur de deux systèmes identiques en termes d'inventaire, ce n'est pas toujours le
même trait qui sera non-marqué selon les diagnostics phonologiques établis plus haut ;
- à l'intérieur d'un système, il se peut que tous les traits se comportent de manière équivalente
et qu'on ne puisse pas identifier de contraste de marque.
Les réserves émises ci-dessus pourraient donner l'impression que n'importe quel lieu
ou mode articulatoire est potentiellement non-marqué. Ce n'est cependant pas le cas, les
classes de traits pouvant être non-marquées étant dépendantes du nombre d'éléments en
opposition à l'intérieur de chacune. Rice (1999a : 6) indique le ou les lieu(x) possiblement
non-marqués en fonction du nombre de lieux d'articulation tolérés par la langue pour une
classe donnée, en se basant sur des tests phonologiques "attempting to abstract away from
positional effects"45 :
45
Rice ne donne pas de précision quant à la nature de ces tests phonologiques.
156
Chapitre 2 – Le caractère particulier des consonnes coronales
(121)
lieu consonantique 1
lieu consonantique 2
lieu consonantique 3
lieu consonantique 4
mode d'articulation
unités possibles
coronal, vélaire
coronal, labial
coronal, labial, dorsal (laryngal)
coronal, labial, vélaire (laryngal)
occlusif, continu
unités possiblement non marquées
coronal, vélaire
coronal, labial
coronal (laryngal)
vélaire (laryngal)
occlusif, continu
En ce qui concerne les consonnes, Rice distingue quatre types de classes en regard du
lieu d'articulation, numérotés respectivement 1, 2, 3 et 4, et un pour le mode articulatoire des
obstruantes.
Dans les cas où seules deux classes de traits sont possibles, comme c'est le cas pour les
lieux consonantiques 1 et 2 et le mode articulatoire, chacun des éléments de l'opposition peut
se positionner comme non-marqué. Ainsi dans le cas du lieu consonantique 1, le trait coronal
comme le trait vélaire peuvent-ils compter comme l'élément non-marqué dans une langue
donnée, sans qu'il soit possible de déterminer au moyen des tests phonologiques lequel est le
plus susceptible de l'être. La situation est la même lorsque coronal s'oppose à labial ou
occlusif à continu. "Given a binary opposition between features [X] and [Y] of class [Z],
either [X] patterns as marked and [Y] as unmarked, or vice versa".
Dans les cas où l'opposition se joue entre plusieurs classes en revanche, comme pour
les lieux consonantiques 3 et 4, toutes ces classes ne sont pas sur un pied d'égalité au regard
de la marque : les tests phonologiques mettent en effet en évidence la primauté d'un élément,
en terme de manque de marque, sur les autres. En ce qui concerne le lieu d'articulation 3,
l'élément non marqué sera le trait coronal, mais ce sera le trait vélaire pour le lieu
d'articulation 4. On notera à cet endroit que la distinction entre dorsales et vélaires, sur
laquelle repose la différenciation de ces deux situations, correspond à celle exposée dans Rice
(1996) discutée plus bas. Une seconde remarque s'impose ici : les laryngales sont mises entre
parenthèses par Rice, et sont absentes des relations de marque ("ignoring laryngeal"), sans
qu'une explication soit donnée pour cette mise à l'écart. C'est pourtant un des points
d'achoppement majeur des phonologues quant il s'agit de marque liée au lieu d'articulation :
les consonnes laryngales sont moins marquées dans les langues du monde que les consonnes
coronales, aussi peut-on se demander quelle est la motivation pour ne pas postuler le trait
laryngal comme non-marqué dans un système le comprenant.
La notion de marque peut se définir universellement comme à l'intérieur d'un système
donné, au moyen d'un certain nombre de critères dont la mise en commun permet de
distinguer les classes de consonnes, voire la consonne, les moins marquées. Pour autant, la
157
Chapitre 2 – Le caractère particulier des consonnes coronales
détermination des consonnes non marquées comme l'implémentation de la marque au sein
d'un modèle phonologique ne sont pas consensuelles.
Intéressons-nous à cette approche de la sous-spécification qui se base sur la notion de
marque, c'est-à-dire la sous-spécification radicale.
3.2.2.1.2. Sous-spécification radicale
Si la valeur d'un trait est universellement prédictible, donc non-marquée, elle ne sera
pas spécifiée dans les représentations sous-jacentes ; une valeur de trait marquée, en revanche,
le sera (cf. Paradis & Prunet 1989a : 319 ; 1991 : 5 ; Hume 1994 : 21). Pour reprendre
Archangeli (1988 : 190), "all and only unpredictable features are specified".
Dans ce modèle donc, n'apparaissent que les nœuds et traits informatifs d'un point de
vue universel. L'association d'un nœud N implique le rattachement de N à un nœud
immédiatement supérieur dans la hiérarchie des traits. Si un tel nœud n'existe pas dans la
représentation du segment considéré, il est généré de façon à ce que tous les nœuds d'une
représentation soient reliés.
En Géométrie des Traits version "sous-spécification radicale", les coronales sont les
consonnes non-marquées, en vertu de leur transparence par rapport aux voyelles (cf. section
2.2). Elles ne comportent donc jamais de Nœud de Place, quelle que soit la langue considérée,
ce qui permet à Paradis & Prunet (1989a : 319) de formuler le principe suivant :
(122)
Coronal Underspecification Principle (CUP)
Unmarked coronals universally lack a Place node.
On retiendra ici qu'il s'agit d'un principe et non d'un paramètre, celui-ci n'étant valable
que pour un sous-ensemble de langues. C'est là une revendication clairement exprimée par
Paradis & Prunet (1989a : 342).
Ce caractère universel pose problème lorsqu'à l'intérieur d'une même langue on trouve
différents types de coronales, et qu'il faut donc utiliser les traits inférieurs au nœud Coronal, à
savoir [antérieur] et [distribué] dans le modèle présenté ci-dessus, voire également [strident] :
comment les distinguer s'il n'y a pas de Nœud de Place ? Le principe CUP énoncé en (122) est
158
Chapitre 2 – Le caractère particulier des consonnes coronales
alors modifié pour ne porter que sur les coronales antérieures, dans le cas où une langue
comporte plusieurs types de coronales, ce qui rejoint en partie le modèle de Spécification
Contrastive Modifiée (qui sera discuté en section 3.2.2.3) .
Plus loin dans la dérivation, une règle de spécification coronale permettra d'aboutir à la
réalisation phonétique correcte en interprétant le nœud de Place (PN) vide :
(123)
Coronal Specification Rule (CSR)
[O Place] Æ Coronal
A l'intérieur de cette classe déjà particulière des coronales, /t/ est la consonne non-
marquée, soit "the least specified member of the least specified class of consonants" (Paradis
& Prunet 1989a : 321-322), ce qui signifie que [+antérieur] est également sous-spécifié, donc
absent de la représentation. Nous obtenons pour /t/ la représentation suivante, dans la version
de la Géométrie des Traits exploitée par Paradis & Prunet qui se caractérise notamment par
l'attribution du trait [consonantique] au nœud supralaryngal :
(124)
X
|
RN
|
SLN
|
[+cons]
La représentation de /d/ sera un peu plus complexe puisqu'elle fait intervenir le nœud
laryngal :
(125)
X
|
RN
LN
|
[+voisé]
SLN
|
[+cons]
Les fricatives /s/ et /z/ auront les représentations suivantes :
159
Chapitre 2 – Le caractère particulier des consonnes coronales
(126)
/s/
X
|
RN
[+cont]
SLN
|
[+cons]
/z/
X
|
RN
LN
|
[+voisé]
[+cont]
SLN
|
[+cons]
Quant aux sonantes :
(127)
/n/
X
|
RN
|
SLN
/l/
X
|
RN
|
SLN
[+nas] [+cons]
[+son] [+cons]
Ce qui distinguera les glottales des coronales sera le nœud supralaryngal, absent chez
celles-là mais présent chez celles-ci (Paradis & Prunet 1991 : 21 ; Bessel 1992 : 56). Nous
aurons donc les représentations suivantes pour [] et [h] :
(128)
//
X
|
RN
/h/
X
|
RN
|
LN
|
[+voisé]
"Thus, the prediction is that glottal epenthesis will be more frequent than coronal
epenthesis, and coronal epenthesis more frequent than labial or velar epenthesis" (Paradis &
Prunet 1991 : 21).
Cependant, cette prédiction ne peut se prétendre intrinsèque à la théorie, dans le sens
où la théorie n'a fait qu'encoder l'observation empirique de la marque des glottales et des
coronales par rapport aux consonnes des autres lieux d'articulation. Son statut de "prédiction"
est donc à relativiser : il ne s'agit pas d'une prédiction à proprement parler mais plutôt d'une
160
Chapitre 2 – Le caractère particulier des consonnes coronales
observation, modérée puisque Paradis & Prunet indiquent simplement une tendance ("more
frequent") et non un donné falsifiable.
Dans cette perspective, il ne semble donc plus surprenant que ce soient les coronales
qui apparaissent lors d'épenthèses en français puisque le français ne comporte pas de
glottales46 dans son inventaire phonologique, y compris lors d'épenthèses syntaxiques (y a-t-il,
j'ai trop [z] envie, donne moi [z] en, etc., cf. chapitre 1 section 3).
Après la sous-spécification radicale liée à la notion de marque, tournons-nous vers une
deuxième approche de la sous-spécification, la spécification contrastive.
3.2.2.2. Spécification contrastive
L'idée de sous-spécification dans cette optique (Steriade 1987, Clements 1987, 1988,
Mester & Itô 1989) est liée à la redondance à l'intérieur d'un système. Il ne s'agit plus de
déterminer la sous-spécificité d'une valeur pour un trait d'un segment donné par rapport au
système universel mais par rapport au système phonologique d'une langue particulière. On
retrouve ici la philosophie structuraliste selon laquelle un élément n'a de valeur que dans les
relations qu'il entretient avec les autres éléments du système. La sous-spécification découle du
fait que si l'on décrit le système phonologique d'une langue, certains traits vont être
redondants à l'intérieur de ce système (Spencer 1996 : 123, également Hall 2001 : 20-21).
Cette fois, "all and only contrastive features are specified" (Archangeli 1988 : 190).
Paradis & Prunet (1991 : 7) illustrent cette définition en prenant l'exemple d'une
langue L comportant dans son inventaire phonologique les consonnes /p/, /b/ et /g/, mais où
manque /k/. Dans cette situation, /p/ serait spécifié [-voisé], /b/ [+voisé] mais /g/ resterait nonspécifié pour le voisement puisqu'il n'est pas confronté à sa contrepartie phonétique. Au
contraire de la sous-spécification radicale, l'unité primitive phonologique dans ce modèle n'est
pas le trait mais le segment, si bien qu'un trait peut fonctionner pour un segment (dans
l'exemple ci-dessus, /p/ et /b/ sont spécifiés pour le trait de voisement) mais rester inerte pour
un autre (ici /g/).
46
Bien que l'on puisse en relever phonétiquement, selon les locuteurs et les contextes. Cf. Encrevé (1988 : 32-41,
également Plénat 1999 : 128, Tranel 1981 : 310, Dell 1973 : 256 note 72) : "c'est bien le coup de glotte qu'utilise
le français au niveau post-lexical pour éviter certaines configurations fâcheuses [bien qu'il n'appartienne] pas à
l'ensemble des phonèmes qui sert à bâtir les items lexicaux".
161
Chapitre 2 – Le caractère particulier des consonnes coronales
Tout comme dans le modèle précédent en revanche, la valeur marquée d'un trait est
spécifiée dès le lexique, la valeur non-marquée en est absente et sera fournie au cours de la
dérivation par une règle. Si un segment comporte un trait non spécifié, le segment entier est
considéré comme sous-spécifié. Autrement dit, un segment sous-spécifié est un segment dont
tous les traits ne sont pas spécifiés.
Dans cette version de la sous-spécification, les coronales n'ont pas de statut particulier,
puisqu'on les envisage d'un point de vue non pas universel mais systémique : une coronale
s'oppose à une labiale de la même façon qu'une labiale s'oppose à une vélaire par exemple.
La troisième approche de la sous-spécification est connue sous le nom de
"spécification contrastive modifiée".
3.2.2.3. Spécification contrastive modifiée
Cette troisième approche (Avery & Rice 1988, 1989) combine la sous-spécification
liée à une théorie de la marque universelle (donc la sous-spécification radicale) à une
conception systémique proche de la spécification contrastive (cf. également Rose 1993 : 157).
Avery & Rice (1989 : 183) en effet "hold the position that one of the major
requirements of a theory of underspecification is a universal markedness theory which
provides information as to which features are present and/or absent in underlying
representations", à moins qu'un contraste phonologique n'existe dans une langue donnée ;
dans ce cas, la valeur marquée est spécifiée et le nœud de classe immédiatement dominant est
présent pour les deux segments concernés dans cette langue : le segment avec la valeur
marquée comportera le nœud de classe, mais ce sera également le cas du segment qui a la
valeur non-marquée pour le trait considéré. Ceci est implémenté par la Condition d'Activation
du Nœud (Avery & Rice 1989 : 183) :
(129)
Node Activation Condition (NAC)
If a secondary content node is the sole distinguishing feature between two segments,
then the primary feature is activated for the segments distinguished. Active nodes must
be present in underlying representation.
162
Chapitre 2 – Le caractère particulier des consonnes coronales
D'autre part, les traits sont monovalents dans ce modèle, et non binaires, si bien qu'ils
peuvent fusionner, se propager et se délier au même titre que les nœuds.
Avery & Rice (1989) s'intéressent également à la sous-spécification des coronales, à
l'intérieur de cette version de la Géométrie des Traits. Leur position en regard des consonnes
coronales est claire : le nœud coronal est le nœud non-marqué, il est donc absent des
représentations sous-jacentes, sauf si dans une langue donnée deux segments ne se distinguent
que par un trait qui dépend du nœud coronal, auquel cas ledit nœud est présent dans la
représentation sous-jacente des deux segments concernés, du fait de la NAC (Node Activation
Condition). Ghini (2001 : 152) résume ainsi le mécanisme : "if a system contrasts units within
the coronal space of articulation, then [Coronal] is activated".
Afin d'illustrer le fonctionnement de ce modèle, considérons deux langues LA et LB
ayant les inventaires phonologiques suivants : {p, t, k} pour LA, {p, t, , k} pour LB. Pour LA,
il n’existe pas de contraste phonologique à l'intérieur de la classe des coronales puisque son
inventaire ne contient qu'une seule consonne coronale ; de ce fait, /t/ ne comporte pas le trait
[coronal]. Dans LB en revanche, le fait que l'on trouve deux consonnes coronales impose le
trait [coronal], et ce dans la représentation des deux consonnes : ce n'est pas parce que /t/ est
moins marqué qu'il ne comporte pas le trait en question.
Le corollaire de cette position est le suivant : lorsque le nœud Coronal est absent, les
coronales peuvent s'assimiler librement à d'autres lieux d'articulation, mais lorsqu'il est
présent, elles ne peuvent s'assimiler qu'à l'intérieur de la classe des coronales. Donc dans une
langue comportant différents lieux d'articulation à l'intérieur de la classe des coronales, la
théorie prédit que les consonnes coronales ne peuvent pas s'assimiler ou, en tout cas, pas
davantage que les consonnes des autres lieux d'articulation, quel que soit le type de coronales.
Selon ce modèle, dans une langue ne nécessitant pas la présence du nœud Coronal, /t/
et // auront la même représentation en ce qui concerne le nœud de place, puisque le coup de
glotte n'a pas non plus de spécification de lieu d'articulation. Une alternance /t/ ~ // comme le
montrent certains dialectes de l'anglais (cf. Ladefoged 1982) dans certains contextes est dès
lors "totally natural" (Avery & Rice 1989 : 191), ce qui ne serait pas le cas d’une alternance
/k/ ~// ou /p/ ~ // par exemple, les vélaires comme les labiales comportant un nœud
163
Chapitre 2 – Le caractère particulier des consonnes coronales
supplémentaire sous le nœud de place au contraire des coronales. "When the unmarked node
Coronal is filled in in phonetic implementation, this segment is realised as [t]; when the
default Coronal is not filled in, it is realised as glottal stop." (Avery & Rice 1989 : 191).
S'il est vrai que la plupart des linguistes considèrent les coronales comme les segments
les moins spécifiés pour les raisons évoquées plus haut, il est intéressant de noter que certains
ne partagent pas cet engouement. La section suivante présente les arguments de deux d'entre
eux.
3.2.3. Contre la sous-spécification des coronales ?
Parmi les différentes interprétations données à la sous-spécification dans le cadre de la
Géométrie des Traits, celle de Rice (1996) se distingue en ce sens qu'elle ne considère pas les
coronales comme les consonnes les moins marquées, mais les vélaires. Elle propose de ce fait
une classification originale des consonnes à l'intérieur du cadre considéré. Goad (1995) remet
également en question la spécificité des coronales par rapport aux consonnes des autres lieux
d'articulation, en s'appuyant sur des données acquisitionnelles.
3.2.3.1. Rice (1996)
Dans cet article, Rice reprend la notion de sous-spécification à l'intérieur du cadre de
la Géométrie des Traits en mettant en avant la valeur non-marquée des vélaires, trop souvent
mise de côté au profit de celle, bien établie, des coronales. Sa démarche repose également sur
une différenciation des vélaires et des dorsales ; les premières sont articulées la langue au
repos ou levée vers l'arrière de la bouche, les secondes avec l'arrière de la langue levé vers le
vélum. Rice propose pour les différentes classes de consonnes les représentations suivantes :
(130)
coup de glotte
Racine
coronales / vélaires
Racine
|
Lieu
labiales
Racine
|
Lieu
|
Périphérique
dorsales
Racine
|
Lieu
|
Périphérique
|
Dorsal
164
Chapitre 2 – Le caractère particulier des consonnes coronales
Le coup de glotte comporte, dans sa représentation, uniquement le nœud racine, à
l'exclusion du nœud de place. Les coronales et les vélaires ont ce nœud de place, sans nœud
inférieur. Les labiales ajoutent le nœud périphérique, qui par défaut renvoie donc aux labiales
et non aux dorsales, pour lesquelles il faut ajouter le nœud dorsal sous le nœud périphérique.
Coronales et vélaires sont donc sur un pied d'égalité en ce qui concerne la sousspécification dans cette représentation. Si l'on se place dans le cadre de la Spécification
Contrastive Modifiée, à partir du moment où une langue distingue plusieurs catégories de
coronales, toutes comportent le nœud Coronal ("when Coronal is contrastive, it is not a
default feature for its class"), ce qui donne les représentations suivantes (Rice 1996 : 533) :
(131)
apico-alvéolaires
Racine
|
Lieu
|
Coronal
lamino-dentales
Racine
|
Lieu
|
Coronal
|
Laminal
|
Dental
lamino-palatales
Racine
|
Lieu
|
Coronal
|
Laminal
vélaires
Racine
|
Lieu
Dans cette optique, les vélaires sont donc sous-spécifiées par rapport aux coronales
dans le cas où une langue distingue plusieurs types de coronales, puisqu'il faut que la langue
ait les moyens de distinguer les différentes articulations coronales. A l'intérieur de la classe
des coronales, le classement en termes de marque va des apico-alvéolaires, les moins
marquées des coronales et ne comportant de ce fait que le nœud coronal, aux lamino-dentales,
comportant outre le nœud coronal, le nœud laminal, qu'elles partagent avec les laminopalatales, et le nœud dental.
Rice discute donc la sous-spécification des coronales au profit des vélaires en se
basant sur une distinction des consonnes vélaires avec les consonnes dorsales. Goad (1995)
met également en cause la sous-spécification des coronales, en se basant quant à elle sur des
données acquisitionnelles relevant de l'harmonie consonantique.
165
Chapitre 2 – Le caractère particulier des consonnes coronales
3.2.3.2. Goad (1995)
Elle remet également en question la sous-spécification des coronales, à partir d'une
étude sur l'harmonie consonantique dans le langage d'un enfant de langue maternelle anglaise.
Elle reprend pour ce faire les données de Smith (1973) concernant le parler de son fils Amahl
à l'âge de deux ans en regard de l'harmonie consonantique. Chez Amahl, on ne constate pas
d'harmonie consonantique entre labiales et vélaires, comme on peut le voir dans le tableau cidessous :
(132)
labiale + vélaire
[bæk] *[bæp] *[æk]
[mik] *[mip] *[ik]
[wi] *[wim]
vélaire + labiale
"black"
[eip] *[eik] *[beip]
"milk"
[ep] *[ek] *[bep]
"swing"
[m] *[] *[bm]
pas d'assimilation entre labiales et vélaires
"grape"
"escape"
"come"
En revanche, Amahl réalise bien une harmonie consonantique lorsque la cible de
l'harmonie est une consonne coronale, que celle-ci soit obstruante comme dans le tableau cidessous ou nasale comme dans le tableau d'après, sous certaines conditions.
(133)
(a)
obstruantes coronales en tant que cibles potentielles
velaire + coronale
"cloth"
[k]
"kiss"
[ik]
coronale + vélaire
"stalk"
[k]
"duck"
[k]
[wt]
"wash"
coronale + labiale
"stop"
[bp]
"stop"
[dp]
[uk]
"coach"
[ak]
"dark"
[bt]
"bolt" (N)
[bebu]
[ai]
"glasses"
[ii]
"sticky"
[bat]
"bath"
"drum"
[dm]
assimilation
optionnelle
assimilation obligatoire
(b)
[bit]
labiale + coronale
"bit" (N)
pas d'assimilation
"table"
nasales coronales en tant que cibles potentielles
velaire + cor nasale
"clean"
[in]
"skin"
[in]
"corner"
[n]
pas d'assimilation
cor nasale + vélaire
"snake"
[eik]
[]
/n/
"neck"
[()k]
assimilation obligatoire
labiale + cor nasale
"burn"
[bn]
"pen"
[bn]
"spoon"
[bun]
pas d'assimilation
cor nasale + lab
"knife"
[maip]
"nipple"
[mibu]
"knob"
[mb]
assimilation
obligatoire
En (a), on constate que l'assimilation entre obstruantes est obligatoire lorsque la
consonne déclenchant l'harmonie est vélaire, que celle-ci soit située avant la coronale (tableau
a1) ou après (tableau a2) : la coronale finale de "kiss" est réalisée en vélaire par Amahl
([ik]), tout comme la coronale initiale de "duck" ([k]). En revanche, l'assimilation entre
166
Chapitre 2 – Le caractère particulier des consonnes coronales
obstruantes est uniquement facultative, dans le meilleur des cas, lorsqu'elle est labiale : s'il
s'agit d'assimilation régressive, elle est optionnelle, comme la variation dans la réalisation de
stop par Amahl l'illustre : il produit la variante avec assimilation [bp] aussi bien que la
variante sans [dp]. Dans le tableau (b), on note que si la coronale est nasale elle ne s'assimile
pas progressivement, que la consonne potentiellement déclenchante soit vélaire (tableau b1)
ou labiale (tableau b3), mais uniquement régressivement, l'assimilation étant dans ce cas
obligatoire (tableaux b2 et b4).
Jusqu'à présent, les données semblent confirmer la sous-spécification des coronales :
en tant que cibles de l'harmonie consonantique dans le système d'Amahl, et surtout en tant
qu'uniques cibles, elles doivent être sous-spécifiées. Cette constatation amène Goad (1995 : 6)
à proposer les représentations suivantes pour les consonnes des différents lieux d'articulation :
(134)
(a) Représentations des consonnes obstruantes dans le système d'Amahl
|B| (/p, b/ adultes)
|G| (/k, g/ adultes)
|D| (/t, d, s, z, , / adultes)
Racine
Racine
Racine
|
|
|
Lieu
Lieu
Lieu
|
|
Labial
Dorsal
(b) Représentations des consonnes nasales dans le système d'Amahl
|m| (/m/ adultes)
|n| (/n/ adultes)
|| (// adultes)
Racine
Racine
Racine
Lieu
|
Labial
Nasal
Lieu
Nasal
Lieu
|
Dorsal
Nasal
Les représentations postulées ici traitent les éléments de place - labial, dorsal - comme
des nœuds, en ce sens qu'ils ne disposent pas d'une valeur positive ou négative mais qu'ils sont
tout simplement présents ou absents. Cette intrusion de la privativité jusque dans les éléments
terminaux de l'arbre sera discutée section 3.3.
Les coronales sont sous-spécifiées dans le système d'Amahl puisqu'elles sont les cibles
de l'harmonie consonantique, c'est pourquoi elles ne comportent pas d'indication de lieu
d'articulation sous le nœud de place.
167
Chapitre 2 – Le caractère particulier des consonnes coronales
Toutes les données ne concourent cependant pas à attribuer la valeur non-marquée aux
consonnes coronales. En effet, la réalisation par Amahl des coronales liquides /l/ et /r/ dans
des contextes potentiellement soumis à l'harmonie vocalique montre une concrétisation de
cette éventualité, alors que jusqu'à présent les coronales subissaient l'harmonie mais ne la
déclenchaient pas :
(135)
/l, r/ devant une labiale
"left"
[wpt]
"lamp"
[wæp]
"room"
[wum]
"Robbie"
[wbi]
[lli]
[lli]
[ll]
/l, r/ devant une coronale
"light"
[dait]
"lash"
[dæt]
"rain"
[dein]
"red"
[dt]
/l, r/ avec d'autres liquides
"lorry"
"trolly"
"troddler"
[lu]
[uli]
/l, r/ devant une vélaire
"lock"
[k]
"leg"
[k]
"ring"
[i]
"rug"
[k]
/l/ en isolation
"hello"
"only"
Les phonèmes /l/ et /r/ s'assimilent avec le lieu d'articulation, que celui-ci soit labial
(tableau 1) ou vélaire (tableau 3), sans que l'on puisse aboutir à aucune conclusion en ce qui
concerne le lieu coronal puisque les liquides sont déjà coronales (tableau 2) et partiellement
au moins avec le mode : /l/ comme /r/ seront réalisés comme un glide labial, [w], devant une
consonne labiale, comme une occlusive devant une consonne coronale ou vélaire. Par contre,
ils ne s'assimilent pas de la nasalité : "room" sera réalisé [wum] et non *[mum], Amahl
prononcera [dein] pour "rain" et non *[nein], ni *[i] pour "ring" mais [i].
Pour se convaincre du fait que les coronales déclenchent l'assimilation de /l/ et de /r/,
il suffit d'observer leur comportement lorsque c'est une liquide qui suit (tableau 4) : /l/ comme
/r/ restent coronales et surtout ne changent pas de mode articulatoire, tout comme lorsqu'ils
sont en isolation (tableau 5), du moins pour /l/ car Goad ne fournit pas de données pour /r/.
Ce qui est mis en relief avec ces nouvelles données est le fait que les coronales
peuvent également déclencher l'harmonie consonantique, pourvu que la cible soit une liquide.
Les données révèlent donc un paradoxe : les coronales sont à la fois les cibles de
l'harmonie consonantique et les déclencheurs de l'harmonie dans les mots où les cibles sont
des liquides.
168
Chapitre 2 – Le caractère particulier des consonnes coronales
En tant que cibles, les coronales devraient être sous-spécifiées, mais si elles sont sousspécifiées elles ne peuvent pas déclencher d'harmonie puisque celle-ci consiste en la
propagation d'un élément, qu'elles n'ont pas dans leur représentation et ne peuvent donc
propager si elles sont sous-spécifiées.
Malgré quelques remises en question marginales, la grande majorité des linguistes
considère que la consonne non-marquée par excellence est la coronale.
3.2.4. Bilan sur la sous-spécification
Reprenons les trois variantes de la sous-spécification évoquées ici, à savoir la SousSpécification Radicale liée à la marque, la Spécification Contrastive liée à un système donné
et la Spécification Contrastive Modifiée, qui combine les deux approches précédentes.
Le sanscrit, pris comme illustration par Avery & Rice (1989 : 192) du comportement
du nœud coronal dans le cadre de la Spécification Contrastive Modifiée, permet d'illustrer
clairement la position des trois variantes de la sous-spécification. Son inventaire
consonantique, en ce qui concerne les coronales, est le suivant :
(136)
dental
rétroflexe
palato-alvéolaire
t

t
th
h
th
d

d
dh
h
dh
n


l
r
/
s


Les consonnes dentales sont les segments non marqués (Kean 1975, Avery & Rice
1989 : 192), les rétroflexes ont un trait [rétroflexe] dépendant du nœud coronal, les palatoalvéolaires un trait [postérieur] également dépendant de Coronal.
Si l'on se place dans le cadre de la Sous-Spécification Radicale, les dentales n'ont pas
de nœud de lieu d'articulation du tout, les rétroflexes et les palato-alvéolaires présentent en
revanche le nœud Coronal puisqu'elles possèdent un trait qui en est dépendant.
(137)
dentales
Lieu
rétroflexes
Lieu
|
Coronal
|
[rétroflexe]
palato-alvéolaires
Lieu
|
Coronal
|
[postérieur]
169
Chapitre 2 – Le caractère particulier des consonnes coronales
Dans le cadre de la Spécification Contrastive, toutes les coronales sont spécifiées pour
le nœud. De ce fait, il n'y a pas de différence dans cette version avec les labiales et les vélaires
du point de vue de la sous-spécification.
(138)
dentales
Lieu
|
Coronal
|
[dental]
rétroflexes
Lieu
|
Coronal
|
[rétroflexe]
palato-alvéolaires
Lieu
|
Coronal
|
[postérieur]
Pour la Spécification Contrastive Modifiée, à partir du moment où un type de
coronales a besoin du nœud Coronal, tous les types de coronales en héritent, aussi bien les
dentales, les rétroflexes que les palato-alvéolaires. On obtient alors les représentations
suivantes (Avery & Rice 1989 : 192) :
(139)
dentales
Lieu
|
Coronal
rétroflexes
Lieu
|
Coronal
|
[rétroflexe]
palato-alvéolaires
Lieu
|
Coronal
|
[postérieur]
Après avoir observé la manière dont la Géométrie des Traits rend compte du
pcaractère particulier des consonnes coronales par le biais de l'utilisation de la sousspécification, tournons-nous vers les théories monovalentes que sont la Phonologie des
Particules, la Phonologie de Dépendance et la Phonologie de Gouvernement. Ces théories
proposent-elles une représentation des coronales différente de celle(s) de la Géométrie des
Traits ? Sont-elles en mesure de traiter les coronales comme une classe à part ? Quelles
motivations fourniraient-elles à un éventuel traitement particulier ?
3.3. Les théories monovalentes
Les théories monovalentes se distinguent de la Géométrie des Traits en ce qu'elles
utilisent des primitives et non des traits distinctifs dotés d'une valeur binaire : "the ultimate
constituent [...] is not the phonological feature" (Kaye & al. 1985 : 306).
170
Chapitre 2 – Le caractère particulier des consonnes coronales
Ces primitives sont monovalentes, c'est-à-dire privatives : soit elles sont présentes
dans la représentation d'un élément, soit elles en sont absentes ; par contraste, dans un cadre
comme la Géométrie des Traits standard, tous les traits sont présents, c'est leur valeur + ou au sein d'un élément qui déterminera la nature de cet élément. La Géométrie des Traits
n’exclut pas la privativité : les nœuds qu’elle propose sont de fait privatifs (cf. par exemple
Yip 1989 : 370, qui emploie explicitement le terme) ; mais les éléments terminaux des
représentations sont des traits.
La privativité des modèles monovalents leur permet de réduire dans une certaine
mesure la surgénération, dans le sens où le nombre de primitives dans ces modèles est
d'environ une dizaine, alors que l'on trouve généralement plus de traits dans les modèles nonmonovalents (cf. Ploch 1997 : 242-243). Le nombre de combinaisons théoriquement possible
est donc plus limité, si tant est que l'on limite également le nombre de primitives possible
dans une représentation.
La privativité des primitives réduit également les propagations possibles : dans un
cadre fonctionnant à l'aide de traits toujours présents, comportant la valeur positive ou
négative, ces traits ont tous la possibilité théorique de se propager, quelle que soit leur valeur.
Ainsi [-nasal] peut-il aussi bien se propager que [+nasal] par exemple, sans que la théorie
puisse analyser le caractère plus ou moins naturel de la propagation d'un élément portant la
valeur négative. Dans un système monovalent en revanche, ne peut se propager qu'une
primitive effectivement présente ; dans ce cas, le système prédit que seul le voisement peut se
propager et non le non-voisement, puisque seul le voisement sera présent dans la
représentation d'un élément.
La notion de monovalence est par ailleurs directement liée à la notion de marque (cf.
section 3.2.2.1.1) : plus un élément comporte de primitives, plus il est marqué. Dans un cadre
comportant des traits binaires, les deux valeurs possibles pour un trait sont marquées de la
même manière, c'est éventuellement l’absence du trait en question qui est non marquée (cf.
Yip 1989 : 370), mais il ne sera pas possible de faire référence à la marque autrement
qu’arbitrairement. Dans les théories monovalentes, par sa seule présence une primitive est
marquée, c’est son absence qui est non-marquée ; un élément non marqué comporte le
minimum de primitives possible, c'est-à-dire aucune.
Ces trois théories, si elles partagent le même ensemble de postulats communs, d'une
part les expriment de manière différente, d'autre part divergent sur d'autres points.
171
Chapitre 2 – Le caractère particulier des consonnes coronales
La Phonologie des Particules (Schane 1984) a travaillé essentiellement sur la structure
interne des voyelles, aussi ne la cité-je que pour mémoire, mais je ne développerai pas son
argumentation.
La Phonologie de Gouvernement a quant à elle pour ambition de limiter à la fois le
nombre de primitives et celui des opérations phonologiques, de façon à juguler la
surgénération des représentations. Elle sera développée en section 3.3.2.
La Phonologie de Dépendance se caractérise par le fait qu'elle détermine les primitives
phonologiques en fonction de critères phonétiques, comme on va le voir dans la section
suivante.
3.3.1. Phonologie de Dépendance
La Phonologie de Dépendance (Anderson & Durand 1986, Anderson & Ewen 1987) a
pour fondement les mêmes postulats que la Géométrie des Traits, à savoir la représentation
des classes phonologiques naturelles et la nécessité de pouvoir référer unitairement à un
ensemble d'éléments fonctionnant de la même manière. Il s'agit là d'une idée émise très
rapidement après la parution de Chomsky & Halle (1968) puisqu'on la retrouve clairement
revendiquée dès 1973 chez Anderson & Jones (1973 : 15) : "our 'model' has the power to
capture generalizations within processes (containing apparently unreducible sub-parts)
resistant to the 'standard' generative phonological theory (...) a claim for 'more structure'
within the phonology will enable underlying similarities and relationships between
phonological processes to be brought out, phenomena which the Chomsky-Halle model (as
well as most others) can only treat as unique or unrelated."
La Phonologie de Dépendance exprime ces postulats à travers la Componentiality
Assumption (Anderson & Ewen 1987 : 8) : "The representation of the internal structure of
segments optimises the expression of phonological relationships ('classes', 'regularities') that
are (a) recurrent and (b) natural."
Par ailleurs, elle repose sur le concept de dépendance "or modifier-head relation"
(Anderson 1987 : 15), défini comme la relation asymétrique de deux éléments à l'intérieur
d'un domaine particulier, dont l'un, obligatoire, est la tête (le gouverneur) et l'autre le
modifieur (ou dépendant). Ce concept de dépendance est issu de la syntaxe (cf. Anderson
1987) et se retrouve dans d'autres théories phonologiques génératives comme la Phonologie
de Gouvernement, cf. section suivante.
172
Chapitre 2 – Le caractère particulier des consonnes coronales
Le modèle présente trois types de dépendance (cf. Lass 1984 : 274) :
- dépendance stricte : aÖb ou a ; b se lit "a gouverne b" ou "b est dépendant de a".
- dépendance mutuelle : aÙb ou a : b se lit " a et b sont mutuellement dépendants" ou encore
"a gouverne b et réciproquement".
- combinaison : a,b se lit "a est associé avec b" sans qu'il n'y ait aucune relation de
dépendance entre les deux.
La structure interne d'un segment se présente sous la forme d'un "geste" composée de
deux sous-gestes :
- le geste catégoriel, subdivisé en sous-geste phonatoire et sous-geste initiatoire.
- le geste articulatoire, subdivisé en sous-geste locationnel et sous-geste oro-nasal (celui-ci
indiquant si un segment est oral ou nasal).
Le tableau suivant, issu de Anderson & Ewen (1987 : 150), indique les types de
propriétés présentes à l'intérieur de chacun des composants dans le modèle standard de
Phonologie de Dépendance dans lequel ils travaillent47 :
(140)
geste catégoriel
geste articulatoire
consonanticité
voisement
continuance
sonance
constriction glottale
glottalité
succion vélaire
lieu d'articulation
hauteur
arrondissement
postériorité
nasalité
sous-geste phonatoire
sous-geste initiatoire
sous-geste locationnel
sous-geste oro-nasal
Les primitives postulées dans ce cadre pour rendre compte des propriétés listées dans
le tableau ci-dessus correspondent approximativement aux traits phonétiques, articulatoires ou
acoustiques. La formulation des représentations en Phonologie de Dépendance s'opère selon
des conventions précises, données dans le tableau ci-dessous :
47
Comme l'indiquent Anderson (1988 : 15,) "there is some debate within DP as to the exact number of gestures
and subgestures". L'ambition de ce paragraphe n'étant pas de développer le cadre mais de montrer comment il
traite des coronales et de leur aspect particuler, je ne rentrerai pas dans le débat. Le tableau reproduit dans le
texte a simplement pour ambition de rappeler le fonctionnement général du cadre.
173
Chapitre 2 – Le caractère particulier des consonnes coronales
(141)
symbole
Accolade {}
X
Double barre |X|
signification
permettent de délimiter un segment
primitive
"the verticals indicate that in this case it is the only component present in this gesture"
(Anderson & Durand 1986 : 2)
dépendance du deuxième élément par rapport au premier
Flèche simple Ö
Deux points : ou
dépendance mutuelle
double flèche Ù
L'objectif poursuivi ici étant la représentation des consonnes coronales dans le cadre
étudié, je ne détaillerai pas le geste catégoriel, dévolu au mode d'articulation (cf. Anderson &
Ewen 1987 : 151-202 pour une présentation complète, Anderson 1987 : 34-38 ou Anderson &
Durand 1988 : 15-16 pour le sous-geste phonatoire) et présenterai directement le geste
articulatoire, plus particulièrement le sous-geste locationnel, qui traduit le lieu d'articulation
des segments.
Pour caractériser les voyelles, quatre primitives sont retenues dans le sous-geste
locationnel :
|i|
"avant"
|a|
"bas"
|u|
"arrondi"
||
"central"
Plus une voyelle contient de ces éléments, moins elle est distinctive au regard du
système universel. D'ailleurs, les trois premiers éléments cités correspondent au triangle
vocalique que toute langue possède : si elle ne doit contenir que trois voyelles, une langue
aura /i/, /u/ et /a/ (cf. arabe classique).
Ces quatre primitives ne sont pas égales face aux relations de dépendance : |i| et |u| ne
présentent pas de relation de dépendance l'un avec l'autre ; |a| et || au contraire peuvent entrer
en relation de dépendance, entre eux aussi bien qu'avec |i| et |u|. (cf. Anderson & Ewen 1987 :
226-228).
Les consonnes dans le modèle présenté par Anderson & Ewen (1987) font appel à huit
éléments pour caractériser leur lieu d'articulation. Deux au moins sont communs avec les
voyelles : |a| et |u|. |a| réfère en effet également aux consonnes uvulaires, |u| caractérise les
174
Chapitre 2 – Le caractère particulier des consonnes coronales
labiales et les vélaires en tant que "grave" : plus |u| est proéminent, plus grande est la part
basse du spectre dans la représentation.
Les six autres éléments sont les suivants :
|l|
lingualité (1987 : 237)
|t|
apicalité (1987 : 239)
|d|
dentalité (1987 : 240)
|r|
RTR (retracted tongue root) (1987 : 243)
|α|
ATR (1987 : 245)
|λ|
latéralité (1987 : 245)
|l| caractérise les segments produits avec la lame ou le dos de la langue comme
articulateur actif48.
|d| permet d'indiquer l'articulateur passif en sus de l'actif, pour distinguer les labiales
des labio-dentales, ainsi que les dentales des alvéolaires.
|r| caractérise les pharyngales. On a également besoin de son pendant ATR, |α|, "for
[+ATR] dominant systems" (1987 : 245) et d'un élément de latéralité |λ|.
Les classes consonantiques dépendant du lieu d'articulation sont donc représentées
dans cette version de la Phonologie de Dépendance de la manière suivante :
(142)
{|u|}
labiales
{|l,d|}
dentales
{|l|}
alvéolaires
{|l| Ù |t|}
apicales
{|l| Ö |t|}
laminales (c'est |l| qui gouverne car la lame est plus importante que l'apex dans
leur articulation)
{|t| Ö |l|}
rétroflexes (seuls l'apex et le dessous de la lame sont articulateurs actifs)
{|l, i|}
palatales (sans certitude absolue car cette représentation pose problème, cf.
Anderson & Ewen 1987 : 238)
{|l,u|}
48
vélaires
En ce qui concerne les voyelles, il constitue un trait redondant mais non distinctif des voyelles hautes.
175
Chapitre 2 – Le caractère particulier des consonnes coronales
[] et [h] se caractérisent par le fait qu'ils n'ont pas dans leur structure d'élément
supralaryngal, ils sont "specified for their categorial gesture but unspecified for articulation"
(Durand 1986 : 80). Si bien qu'ils sont sur la trajectoire de lénition des occlusives et fricatives
non-voisées ; "[] is viewed as the 'minimal' stop and [h] as the 'minimal' fricative."
(Anderson & Ewen 1987 : 38), ce qui se traduit en termes représentationnels par |C| pour // et
[CÙV] pour /h/ (cf. Durand 1986a : 80-81).
Les coronales sont identifiées par l'élément |l|, ses relations avec les autres éléments
déterminant les différentes articulations à l'intérieur de la classe des coronales. On remarquera
cependant le parallélisme, non souhaitable, entre la représentation des palatales (|l, i|) et celle
des vélaires (|l, u|).
La représentation des vélaires combine l'élément |u| correspondant à la classe des
labiales à l'élément |l| propre aux coronales, de façon à rendre compte du fait qu'elles "can be
shown to form natural recurrent classes with both labials and dentals" (Anderson & Ewen
1987 : 237). Cette représentation a un coût en termes de marque, comme on va le voir dans le
paragraphe suivant.
La Phonologie de Dépendance recourt elle aussi à la notion de marque et l'exprime en
termes de complexité : "the inherent complexity ('markedness') of a segment can be directly
measured in terms of the complexity of its representation: velars (u,l – gravity combined with
linguality) are more complex than denti-alveolars (|l| - linguality alone); voiceless fricatives
(|V:C|) than voiceless plosives (|C|)." (Anderson & Durand 1986 : 3). De cette manière,
"underspecification […] is more naturally expressed". Dans ce cadre donc, les coronales
alvéolaires sont moins complexes que les vélaires, mais tout autant que les labiales qui, elles
aussi, comportent un seul élément dans le composant locationnel. De plus, les coronales non
alvéolaires sont non seulement aussi marquées que les vélaires (deux éléments en jeu dans
chaque cas), mais en outre davantage que les labiales.
On ne peut donc pas considérer que les coronales jouissent d'un statut privilégié en
Phonologie de Dépendance par rapport aux labiales ou aux vélaires.
D'autant plus qu'est possible dans ce cadre un composant vide, ce qui prédit un
élément ou une classe d'éléments encore moins marqué que les labiales ou les coronales. Pour
Durand & Anderson (1988 : 31-32) en effet, "if features can be present or absent, the
complete lack of features within a given bundle (or gesture) is predicted. (...) The DP notation
176
Chapitre 2 – Le caractère particulier des consonnes coronales
(...) mirrors markedness directly." A partir de l'analyse du système vocalique du Yawelmani,
ils mettent ainsi en évidence que le caractère non-marqué de /i/ se traduit en Phonologie de
Dépendance par une matrice vide. "The notion of an unspecified vowel - that is a vowel
specified as |V| categorially but with an empty articulatory gesture - is therefore not an
extension of the DP framework but falls squarely within it, both in principle and in practice.
But it should also be obvious that the fully specified categorial matrices (...) are overspecified
when taken within the context of individual languages" (Durand & Anderson 1988 : 16).
Ce qui est démontré pour les voyelles fonctionne également dans le cadre des
consonnes : les laryngales seront moins marquées que les consonnes comportant un lieu
d'articulation au-dessus du larynx.
Comme la Géométrie des Traits, la Phonologie de Dépendance reflète directement la
marque, pour reprendre les propos de Durand & Anderson (1988 : 31-32) cités dans le
paragraphe précédent, mais ne propose pas de motivation intrinsèque à la théorie justifiant la
mise à l'écart des coronales par rapport aux consonnes des autres lieux d'articulation. Les
coronales ne se distingue pas, en termes de marque, des labiales et des vélaires en Phonologie
de Dépendance, ces trois lieux d'articulation étant de toute façon plus marqués que les
glottales.
Un second cadre exploite les primitives monovalentes, la Phonologie de
Gouvernement. Ce cadre propose-t-il une implémentation du statut particulier des coronales
ou les considère-t-il de la même manière que les consonnes des autres lieux d'articulation ?
3.3.2. Phonologie de Gouvernement
Les bases de la Phonologie de Gouvernement ont été jetées par Kaye & al. en 1985,
puis amendées en 1990 par Kaye & al. et Harris. Comme la Phonologie de Dépendance et la
Géométrie des Traits, ce cadre suppose une hiérarchie dans les primitives infrasegmentales.
Comme la Phonologie de Dépendance il définit une relation asymétrique entre les éléments.
Ce qui distingue la Phonologie du Gouvernement des autres cadres post-SPE précédemment
cités est, d'une part, son rejet programmatique des règles ordonnées, calquant ainsi le
fonctionnement des théories syntaxiques : "it is conceivable that some of the same principles
at work in syntax will be seen to be operative in phonology" (Kaye & al. 1990 : 193) ; d'autre
177
Chapitre 2 – Le caractère particulier des consonnes coronales
part, son rejet de la coda et de la syllabe comme constituants. Enfin, et c'est le point majeur
dans cette partie concernant la structure interne des éléments, la Phonologie de Gouvernement
a pour ambition de limiter le nombre de primitives ("The set of melodic primitives must be
finite, universal and minimal", Rennison & Neubarth ms : 5), et par là de prévenir la
surgénération, ainsi que de réduire les opérations phonologiques possibles.
3.3.2.1. cadre général
A ses débuts, la Phonologie de Gouvernement comportait les onze éléments suivants
(Harris 1990)49 :
(143)
primitive
I
A
U
I barré
v°
N
R

h
H
L
trait saillant pour les voyelles
antérieur
non-haut
labial
ATR
voyelle froide
nasalité
/
/
/
/
/
trait saillant pour les consonnes
palatalité
pharyngalité
arrondi
/
vélarité
nasalité
coronal
constriction
bruit
non-voisement
voisement
interprétation
phonétique
[i]
[]
[u]
[]
[]
[]
[h]
Certains éléments sont réservés aux représentations vocaliques (I barré), d'autres aux
représentations consonantiques (R, , h, H et L) ; d'autres encore sont susceptibles d'intervenir
dans les deux types de représentations et sont donc porteurs de deux valeurs, le choix de l'une
ou de l'autre étant subordonné au type d'élément squelettal auquel ils sont rattachés : l'élément
I par exemple renvoie à l'antériorité s'il est lié à une position vocalique, à la palatalité s'il se
rattache à une position consonantique. Il est à noter d'autre part que la voyelle froide n'est pas
à proprement parler un élément dans le sens où elle n'a pas de trait saillant ('hot feature', c'està-dire "the only feature whose value is marked" selon Kaye & al 1985 : 307 ).
Les éléments, en tant que constituants ultimes des segments phonologiques, sont
définis par Kaye & al. (1985 : 306) comme "independently prononceable units". Cependant, il
49
Ont été ôtées les indications de charme, propriété particulière ayant un "impact on the combinations of
elements that may exist and on their organisation into segmental systems" (KLV 1985 : 311-314), puisque le
charme a été abandonné dans le cadre actuel.
178
Chapitre 2 – Le caractère particulier des consonnes coronales
s'agit, jusqu'en 1995 (cf. Harris & Lindsey 1995) au moins, davantage d'un vœu pieux que
d'une réalité avérée, dans le sens où la déclaration d'intention n'a pas été suivie d'une
démonstration concluante : pour les primitives de place, il est possible de rattacher une
interprétation phonétique, comme on le voit dans le tableau ci-dessus, mais en ce qui concerne
les primitives de manière l'entreprise est nettement plus ardue.
Deux opérations phonologiques sont possibles, et deux seulement : la décomposition,
qui se traduit par une perte d'éléments d'un segment, et la composition, qui s'opère par le
transfert ou la duplication d'éléments d'un phonème vers un autre (cf. Harris 1994).
Les primitives peuvent donc se combiner, formant ainsi des segments composés. "The
results of such combinations are derived by means of fusion operations, each of which
involves two elements, one defined as the head, the other as an operator. In an expression
derived by means of fusion, the operator contributes only its salient property; all other
properties are contributed by the head." (Harris 1990). La tête est obligatoire, l'opérateur
facultatif (Rennison & Neubarth ms). Graphiquement, cette distinction de statut des différents
éléments à l'intérieur d'une représentation se traduit par une première place réservée à la tête,
qui est de plus soulignée, la seconde place étant dévolue à l'opérateur. Tête et opérateur sont
séparés par une virgule.
A l'intérieur d'une représentation, chaque primitive a sa propre ligne autosegmentale
s'il est montré qu'elle peut se combiner avec les autres primitives dans un système donné.
Dans le cas contraire, deux primitives qui ne se combinent jamais partagent la même ligne
autosegmentale (les lignes sont "fusionnées", cf. Kaye & al. 1985 : 307). Prenons par exemple
I et U : dans certains systèmes vocaliques, I et U partagent la même ligne autosegmentale, et
ne se combinent donc pas ; c'est le cas lorsqu'une langue a pour inventaire vocalique les cinq
voyelles /a/, /i/, /u/, /e/ et /o/ (cf. par exemple Cyran 1997 : 22-25).
La hiérarchie des éléments en tête et opérateur à l'intérieur d'une représentation, le fait
que chaque primitive ait sa propre ligne autosegmentale et l'interprétation possible de chaque
élément en unité prononçable font que "the double or multiple occurrence of an element (...)
would not change the phonetic interpretation of the expression in which it occurs" (Rennison
& Neubarth ms : 8), au contraire par exemple de la Phonologie des Particules selon laquelle
chaque élément peut intervenir plusieurs fois dans une représentation, se donnant ainsi plus de
poids.
179
Chapitre 2 – Le caractère particulier des consonnes coronales
En ce qui concerne le lieu d'articulation, la distinction se fait à l'aide des éléments U, R
et I pris en tant qu'opérateurs au sein de la représentation d'un élément. L'élément U renvoie à
la labialité, il permet donc de caractériser la classe des labiales ; c'est-à-dire que tout élément
(consonantique) ayant dans sa représentation l'opérateur U est labial. La classe des coronales
dispose quant à elle d'un élément qui lui est propre, l'élément R. Les palatales, qui dans ce
modèle sont distinctes des coronales (cf. section [2] 1.3 pour une présentation de la question
des palatales par rapport aux coronales) sont identifiées par l'élément I. Quant aux vélaires,
leur caractéristique est précisément de n'être identifiées par aucun élément propre.
Le caractère particulier des coronales est donc mis en évidence au moyen de l'élément
R, qui est le seul parmi ces éléments de place à ne porter que sur les consonnes. En fait, la
raison d'être de cet élément est précisément de définir le lieu d'articulation coronal, alors que
les autres éléments (U, R et I, ainsi que A pour les glottales) ont tous un rôle à jouer dans la
représentation des voyelles.
Par ailleurs, dans ce modèle, les coronales sont définies par un élément et non les
vélaires ; le statut particulier est donc ici attribué aux vélaires et non aux coronales. Les
coronales sont donc certes identifiées à part des autres consonnes, mais au même titre que les
labiales ou les palatales. Ce sont les vélaires auxquelles ici est réellement accordé un statut
particulier.
Intéressons-nous plus particulièrement à cet élément définitoire des coronales qu'est R,
et à son éviction du modèle dans un de ses développements.
3.3.2.2. L'élément R
La présentation du rejet de la primitive coronale va s'organiser de la manière suivante :
après avoir donné les raisons en amont du rejet de R, je présenterai l'argumentation propre à
son éviction.
3.3.2.2.1. Projet de l'école londonienne
Le nombre de primitives n’a eu de cesse d’être revu à la baisse, notamment sous
l’impulsion de Kaye au travers de l'école londonienne SOAS, dans le but de limiter le plus
possible la surgénération. Les années 90 voient ainsi passer le nombre de primitives de 11 à 5.
Seront touchées prioritairement les primitives qui ne sont liées qu'à un type de constituant,
180
Chapitre 2 – Le caractère particulier des consonnes coronales
c'est-à-dire les primitives qui ne sont propres qu'aux consonnes ou qu'aux voyelles, que ce soit
par leur disparition en tant que primitive (v, ATR, ) ou par leur regroupement du fait qu'on
les trouve en distribution complémentaire (N est fusionné avec L, R avec A). Le résultat de ce
processus de réduction des primitives est connu sous le nom de Revised Theory of Elements
(cf. Charette & Göksel 1994 : 65-66 par exemple). Après avoir donné brièvement les raisons
de la suppression des éléments, je m'attarderai plus particulièrement sur l'élément sous intérêt
ici, R.
L'élément ATR est supprimé (cf. Charrette & Göksel 1994, Harris & Lindsey 1994,
2000), du fait qu'il n'est jamais tête d'une représentation d'une part, et que c'est le seul élément
limité aux voyelles d'autre part.
Cyran 1997, s'appuyant sur son analyse de la phonologie de l'irlandais et en concluant
que cette langue n'exploite pas l'élément h, propose que l'occurrence de la primitive h relève
d'un paramètre, "déclassant" ainsi d'une certaine manière le h par rapport aux autres
primitives. Ce paramètre-h est exprimé de la manière suivante (Cyran 1997 : 194) :
THE 'H'-PARAMETER
The occurrence of 'h' in languages is parameterised (ON/OFF).
Les langues se répartissent donc en deux catégories, selon que le paramètre-h est
activé ('h-ful' languages) ou non ('h-less' languages).
Jensen (1994) élimine quant à lui  notamment à cause du fait qu'il ne porte que sur les
consonnes et non sur les voyelles ; c'est aussi la raison pour laquelle les éléments N et L
seront fusionnés (Ploch 1997, 1999), L ne portant que sur les consonnes.
Intéressons-nous maintenant à l'élément coronal R. Il sera pour sa part éliminé par
Backley (1993), la coronalité se retrouvant liée à la primitive A.
3.3.2.2.2. Rejet de R
Backley (1993 : 301) lie son rejet de l'élément R à la sous-spécification : "I shall
loosely adopt the position held by many working within an underspecification framework, in
181
Chapitre 2 – Le caractère particulier des consonnes coronales
which some doubt is cast on the status of coronality as a phonologically significant entity." A
partir de l'étude des clusters s+C anglais et de leur violation apparente de la Condition de
Complexité, il propose "that all coronal obstruents lack an overt phonological place
specification, thus rendering them inherently less complex than their non-coronal
counterparts."
Pour suivre l'argumentation de Backley, deux outils théoriques supplémentaires nous
sont nécessaires : la condition de complexité et le gouvernement.
Le gouvernement est une relation asymétrique entre deux positions squelettales. A
l'intérieur d'un constituant, il se fait de gauche à droite (Kaye et al. 1990 : 198), tandis que le
gouvernement entre deux constituants fonctionne au contraire de droite à gauche (Kaye et al.
1990 : 211).
Kaye et al. (1990) établissent les relations entre les éléments au moyen de la Condition
de Complexité, formulée de la manière suivante50 :
(144)
Condition de Complexité (Kaye et al. 1990 : 218) :
A neutral segment may govern if it has a complexity greater than its governee.
Harris (1990) reprend cette condition en la généralisant à tous les segments puisque le
charme disparaît, et la modifie de façon à ce qu'un élément puisse gouverner un élément de
même complexité que lui, et non uniquement moins complexe. On obtient donc la
reformulation suivante :
(145)
Condition de Complexité (Harris 1990 : 274) :
Let α and β be segments occupying the positions A and B respectively. Then, if A governs B,
β must be no more complex than α.
Backley (1993) reprend le cas des séquences initiales de mot #s+C, traitées par Kaye
(1992) qui avait démontré l'impossibilité de syllaber [sp] comme une attaque branchante, du
fait que [p] est plus complexe que [s] : si [sp] était une attaque branchante, alors [s] devrait
50
A ce moment de la Phonologie de Gouvernement, le charme est encore présent dans les relations de
gouvernement. Cependant, du fait qu'il est abandonné par la suite et qu'il n'a aucune incidence sur la présente
démonstration, les représentations et principes ici proposés s'en dispenseront.
182
Chapitre 2 – Le caractère particulier des consonnes coronales
gouverner [p] puisqu'il s'agit de gouvernement à l'intérieur d'un constituant ; or [p] est plus
complexe (trois éléments) que [s] (deux éléments : h et R), ce qui conduit à postuler
l'hétérosyllabicité des deux segments :
R
|
N
|
x
A
x
x
|
s
|
p
R
|
N
x
A
x
R
|
N
|
x
x
|
n
u
Backley (1993 : 303) établit le nombre de primitives présentes pour les représentations
des consonnes susceptibles de suivre un [s] initial :
- les glides [j] (sewer) et [w] (sweet) contiennent un élément chacune, I et U respectivement ;
- la liquide [l] (slope) contient deux primitives,  et R ;
- les nasales [n] et [m] comptabilisent chacune trois primitives : elles ont en commun  et N,
augmentées de R pour [n] et de U pour [m] ;
- les obstruantes [p], [t], [k] et [f] sont elles aussi formées de trois éléments.
Comme les représentations ci-dessous (Backley 1993 : 304) le mettent en évidence, un
problème théorique se pose dans le cas de [s] suivie d'un glide : [w] et [j] comportant moins
d'éléments que [s] (deux contre un), comment peuvent-ils le gouverner ?
(146)
R
|
N
|
x
[s] + nasale
A
x
|
h
|
R
x
|
R
|

|
N
snow
R
|
N
|
x
[s] + liquide]
A
x
|
h
|
R
x
|

|
R
slow
R
|
N
|
x
[s] + glide
A
x
|
h
|
R
x
|
U
swim
Lorsque [s] est suivi d'une nasale ou d'une obstruante, la deuxième consonne étant plus
complexe que la première, le gouvernement entre constituants, de droite à gauche, s'applique
183
Chapitre 2 – Le caractère particulier des consonnes coronales
automatiquement. Lorsque [s] est suivi de la liquide [l], la Condition de Complexité modifiée
par Harris (1990) permet à [l] de gouverner [s], puisqu'elle n'est pas moins complexe que [l]51.
Par contre, lorsque [s] est suivi d'un glide, celui-ci ne contient pas assez d'éléments pour
prétendre gouverner [s].
Trois possibilités logiques sont alors en concurrence pour permettre d'homogénéiser
les cas de gouvernement (Backley 1993 : 305) :
a/ abandonner l'élément h, ce qui ne laisse que R pour représenter [s] ;
b/ abandonner l'élément R, ce qui ne laisse que h pour représenter [s] ;
c/ abandonner les deux éléments h et R et adopter "an all-new representation".
Backley rejette la proposition c/ du fait que "the overall detrimental effects on the
representation system as a whole would greatly outweight any advantage to be gained from a
more satisfactory description of phonotactic constraints", ce qui à terme "would undermine
the value of any explanatory theory" (1993 : 305), sans parler de la surgénération occasionnée
par l'ajout d'un élément à l'ensemble des primitives postulées par la théorie, cet élément ne
pouvant couvrir le même champ empirique ni "match the combined expressive power of a
'place' feature such as R° and a 'manner' feature such as h°" (1993 : 306).
Considérons maintenant les deux premières options, à savoir la suppression soit de h,
soit de R. Backley (1993 : 306-309) s'attache à démontrer que R n'a pas autant de légitimité
que les autres éléments de la théorie. En effet, au contraire des autres éléments de place (I, U,
v et A), R ne se justifie pas par son implication dans un processus quelconque d'harmonie en
tant qu'élément actif, pas davantage dans un processus plus large d'assimilation ou dans un cas
de propagation. "In fact, the only objectively observable manifestation of the coronal element
that remains largely undisputed is its simplex interpretation as a tap, often constituting the
result of a segmental decomplexification process affecting coronal stops". Par ailleurs, qu'il
soit tête ou opérateur, R contribue exactement de la même manière à la représentation d'un
segment : à partir du moment où il est présent dans une représentation, le segment considéré
est coronal. De plus, R ne fonctionne que pour les représentations consonantiques et non pour
les vocaliques. En outre, alors que les autres primitives de place peuvent se combiner
librement entre elles R est restreint : "its amalgamation with some vocalic elements does
indeed produce unlikely combinations" (Backley 1993 : 308).
51
On remarquera que la Condition de Complexité telle que proposée dans Kaye et al. (1990) n'aurait pas permis
de postuler un gouvernement entre constituants à cet endroit, puisque cette Condition stipulait alors que le
gouverneur devait être plus complexe que son gouverné, ce qui n'est pas le cas ici.
184
Chapitre 2 – Le caractère particulier des consonnes coronales
Pour toutes ces raisons, Backley propose d'éliminer l'élément R de l'ensemble des
primitives admises en Phonologie de Gouvernement. Ce faisant, il transforme la
représentation de [s] qui passe des deux éléments (R, h) à (h) seulement : en anglais, [s] serait
une interprétation phonétique de h. Les représentations de #s + glide deviennent alors :
(147)
[s] + [w]
R
|
N
|
x
R
|
N
|
x
A
x
|
h
[s] + [j]
x
|
U
A
x
|
h
x
|
I
swim
suit
Si les coronales perdent leur élément "distinctif", elles comportent alors un élément de
moins que la plupart des non-coronales qui, elles, gardent leur élément de place A, I ou U. De
ce fait, "coronal obstruents are rendered intrinsically less complex than their non-coronal
counterparts" (Backley 1993 : 321).
Toutefois, les vélaires ne comportant pas non plus d'élément de place, on peut arguer
d'une complexité égale des coronales et des vélaires, et se demander comment sont
distinguées une vélaire et une coronale de mode d'articulation identique.
Szigetvári (1994), adhérant à l'idée de rejeter la primitive coronale R, s'intéresse
précisément à ce dernier point.
3.3.2.2.3. Szigetvári (1994)
Prenant pour motif le caractère non marqué des coronales par rapport aux consonnes
des autres lieux d'articulation, y compris par rapport aux glottales, Szigetvári (1994) propose
lui aussi d'exclure la primitive R des représentations segmentales. La suppression de R
permettrait aux coronales de n'avoir aucune spécification de place au niveau sous-jacent, et
donc de subir l'assimilation par une autre consonne ou de justifier leur transparence par
rapport à l'harmonie vocalique ; l'absence de primitive de place dans une représentation serait
par la suite interprété phonétiquement comme lié à la coronalité.
Cependant, "the radical going away with the element responsible for coronality, R,
leaves the representations of coronals in a serious situation." (Szigetvári 1994 : 214) En effet,
185
Chapitre 2 – Le caractère particulier des consonnes coronales
les segments dont les représentations ne se distinguaient que par la présence vs. l'absence de la
primitive R se retrouvent avec une représentation identique : les vélaires et les coronales ne
sont plus distinguées.
De ce fait, il semblerait qu'un moyen de distinguer les coronales et les vélaires serait
de supposer un nouveau constituant rendant compte du caractère marqué des vélaires par
rapport aux coronales. Cependant, cette dernière option constituerait une solution ad hoc,
"which permeates throughout the framework with a number of other undesirable
consequences" (1994 : 218).
Une autre solution plausible au problème serait de réhabiliter l'élément "voyelle
froide" en tant que constituant à part entière "as a 'normal' element" (1994 : 217), alors que sa
raison d'être est précisément d'occuper une position vide à l'intersection d'une position
squelettale et d'une position mélodique sans primitive, sans contribuer à la représentation en
termes d'apport d'élément. Lorsque la voyelle froide est tête d'une représentation, cela signifie
précisément que la tête de la représentation est vide. Pour rendre compte de la distinction
entre coronales et vélaires il faudrait que la voyelle froide dispose de sa propre ligne
autosegmentale, de façon qu'elle puisse également jouer le rôle d'opérateur et non uniquement
celui de tête. Dans ce cas, il faudrait qu'elle soit en mesure de contribuer à la représentation
par un trait saillant, et supposer cela serait retomber sur la solution ad hoc de supposer un
nouveau constituant. La voyelle froide doit donc rester l'élément neutre qu'il est dans le cadre
tel que conçu par Kaye & al (1985).
Ce qui distinguera les coronales des vélaires sera en fait l'élément qui sera tête : la
voyelle froide (c'est-à-dire rien) pour les vélaires, puisqu'une tête est obligatoire, et l'élément
/h/ pour les coronales. Les coronales sont donc identifiées par l'absence de primitive de place
dans leur représentation, ce qui traduit leur caractère universellement marqué.
Le schéma suivant met en regard les représentations "classiques" des occlusives
coronales et vélaires en Phonologie de Gouvernement, avec les représentations proposées par
Szigetvári (1994 : 218) :
186
Chapitre 2 – Le caractère particulier des consonnes coronales
(148)
représentations "classiques"
coronale [t]
vélaire [k]
h
h
|
R

v
|

représentations sans R
coronale [t]
vélaire [k]
h
h

v
|

L'élément souligné représente la tête de la représentation. La représentation des
vélaires ne change pas, c'est la représentation des coronales qui diffère. N'ayant plus de
primitive de place, il se distingue des vélaires par le choix de l'élément /h/ comme tête de la
représentation. La distinction entre les deux types de consonnes est donc maintenue.
Cette représentation des coronales par le choix de la primitive // en tête unifie la
représentation des trois "most common places of articulation" (cf. Szigetvári 1994 : 219) :
chacune est définie non par un élément de place mais par un élément de manière (la tête des
labiales est //, celle des coronales est /h/) ou pas d'élément du tout (pour les vélaires). Ce sont
les classes de consonnes les moins fréquentes qui exploitent les primitives de place en tant
que tête (I pour les palatales, A pour les uvulaires, U pour les labio-vélaires).
Cyran (1997) s'intéresse également à la représentation de la coronalité au sein de la
Phonologie de Gouvernement, mais propose une autre solution de substitution.
3.3.2.2.4. Cyran (1997)
Cyran (1997) envisage la représentation de la coronalité à l'aide des deux primitives I
(palatalité) et A (pharyngalité) : la coronalité serait une combinaison des deux.
Il établit à partir de l'étude de l'anglais et de l'irlandais d'une part, du polonais d'autre
part, que "perhaps coronality should in fact be defined as I.A" (1997 : 225) : les coronales du
premier type de langue en effet sont caractérisées par l'élément A en tête, alors qu'en polonais,
par exemple, ce sera I.
187
Chapitre 2 – Le caractère particulier des consonnes coronales
Utiliser des primitives de place dévolues à d'autres lieux d'articulation soulève le
problème de la distinction entre les classes de consonnes définies à l'aide d'une même
primitive. Ce serait donc uniquement la combinaison de deux d'entre elles, I et A, qui
permettrait de distinguer les classes de consonnes entre elles. Ainsi les palatales, définies par
I, seront-elles distinguées des coronales par le fait que celles-ci contiennent également A.
L'apport de Cyran dans la discussion est lié à la paramétralité. "It seems prudent to
assume that there is no such thing as a uniform or universal representation of coronality"
(Cyran 1997 : 226).
3.3.2.2.5. Scheer (1996)
Scheer (1996) réévalue la structure interne des consonnes au sein de la Phonologie de
Gouvernement. Il rejette lui aussi l'élément coronal R mais pour une raison intrinsèque à la
primitive et non dans le but de réduire le nombre de ses primitives (comme l'école
londonienne à laquelle Backley (1993) se rattache). L'éviction de R tient au statut uniquement
consonantique de l'élément R : "un modèle où R contribue la coronalité est hors état de
représenter des interactions entre Attaques et Noyaux impliquant cet élément" (Scheer 1996 :
144). Comment représenter dès lors une palatalisation de l'attaque par une voyelle haute par
exemple ? Ou plutôt, comment expliquer la transformation de la primitive R de l'attaque
coronale en I marqueur de palatalité ?
Un des critères qu'il utilise pour déterminer la constitution des classes de consonnes
est précisément, tout comme Szigetvári (1994), la notion de marque : [t] et [d] sont les
consonnes les moins marquées dans l'inventaire consonantique des langues du monde, en tant
que coronales mais aussi à l'intérieur même de la classe des coronales, et de leur statut
épenthétique en français et en nouveau haut allemand.
De ce fait, pour Scheer (1996 : 188-191), "[t, d] n'ont pas de substance : aucun élément
mélodique (I, U, A) ne contribue à leur articulation". Comme chez Szigetvári (1994) donc, le
caractère non marqué des occlusives coronales se traduit par l'absence de primitives de place
dans leur représentation.
Observons comment le système de Scheer (1996) distingue les coronales des vélaires,
qui sont dans le modèle "classique" les consonnes les moins marquées. Les vélaires et les
uvulaires comportent toutes l'élément U, ce qui les rend plus marquées que les coronales et
permet de distinguer les vélaires de celles-ci. Dans les vélaires, U est opérateur.
188
Chapitre 2 – Le caractère particulier des consonnes coronales
Comparons enfin les coronales aux glottales : aucune des deux ne comporte de
primitive de place ; pour autant, les glottales sont distinctes des coronales en ce qu'elles
comportent une primitive de moins, la voyelle froide, qui n'intervient pas dans leur
représentation. De ce fait, c'est l'élément // qui est tête dans la représentation de l'occlusive
glottale.
Le tableau suivant établit les représentations des occlusives coronales, vélaires et
glottales envisagées ici :
(149)
coronale [t]

|
h
v
vélaire [k]

|
h
|
U
|
v
glottale []

|
h
Pour Scheer (1996) donc, les occlusives coronales s'inscrivent en termes de marque
entre les vélaires (et les labiales) d'un côté et les glottales de l'autre. Cette hiérarchie de
marque se traduit directement par le nombre de primitives présentes dans la représentation de
chacune de ces classes de consonnes.
En ce qui concerne les coronales fricatives et sonantes, sur lesquelles Szigetvári
(1994) ne se prononce pas, Scheer (1996 : 186-188) attribue la sonorité aux primitives // et
/h/ mais également à la primitive "de place" A : [s, z, l] ont A comme tête dans leur
représentation, si bien qu'elles ne font pas partie de la classe des consonnes non marquées
bien qu'elles soient coronales ; [n] comporte également A.
Le fait que les coronales sont les consonnes épenthétiques par excellence en français
ne peut s'implémenter en Phonologie de Gouvernement qu'à partir de la version du modèle
qui prend en compte - et implémente - l'aspect non marqué des coronales. En effet, les
épenthèses, consonantiques comme vocaliques, font apparaître les segments les plus simples,
ceux qui comportent le moins de primitives possible dans une langue donnée.
189
Chapitre 2 – Le caractère particulier des consonnes coronales
Etablissons un bilan du statut des coronales au sein de la Phonologie de
Gouvernement. Quel lieu d'articulation est considéré comme non-marqué et pour quelle(s)
raison(s) ? Les coronales jouissent-elles d'un statut particulier ou sont-elles au même niveau
que les autres consonnes ?
3.3.2.3. Bilan sur la représentation des coronales au sein de la Phonologie de Gouvernement
Deux tendances se dégagent en ce qui concerne les consonnes non-marquées : d'un
côté, les partisans des vélaires, avec pour chef de file Kaye, de l'autre Szigetvári (1994) et
Scheer (1996) qui se prononcent pour les coronales.
Dans le premier cas, les coronales n'ont pas de statut particulier par rapport aux autres
consonnes, ou en tout cas par rapport aux labiales, ce sont les vélaires qui jouissent d'une
position privilégiée. Dans le second cas, les coronales ont bien un statut particulier,
directement hérité de leur place dans la hiérarchie universelle de la marque. On précisera
enfin que ce caractère non marqué, traduit par l'absence de primitive de place dans les
représentations, ne concerne en réalité que les occlusives.
Récapitulons les différents moyens mis à disposition par les théories pour rendre
compte le cas échéant du statut particulier des coronales. La Géométrie des Traits fait appel à
la sous-spécification, liée à la notion de marque universelle ou systémique. La Phonologie de
Dépendance n'accorde pas plus de statut particulier aux coronales qu'aux vélaires, malgré le
recours à la notion de marque. La Phonologie de Gouvernement réfère à la particularité des
coronales soit au moyen d'une primitive qui leur est dévolue, soit là encore au moyen de la
marque.
Le statut singulier des coronales établi dans la section 2 est donc implémenté dans les
théories phonologiques étudiées jusqu'à présent par l'intermédiaire de la notion de marque.
Le troisième volet de cette section portant sur la représentation du statut particulier des
coronales dans les théories phonologiques, après la Géométrie des Traits et les théories
monovalentes, est consacré à la théorie de l'Optimalité, qui est précisément une théorie de la
marque.
190
Chapitre 2 – Le caractère particulier des consonnes coronales
3.4. Théorie de l'Optimalité
La Théorie de l'Optimalité (Prince & Smolensky 1993, McCarthy & Prince 1993) a
fait son entrée en phonologie au début des années 90, et s'inscrit dans la lignée des cadres
Principes et Paramètres.
3.4.1. Présentation générale du cadre
La Théorie de l'Optimalité (OT) rejette la notion de règle dans le sens "moyen
d'encoder et d'expliquer les généralisations grammaticales". Elle ne cherche pas à dériver les
formes de surface à partir des structures profondes, mais à identifier les structures de suface outputs - correspondants aux structures profondes - inputs - en fonction de contraintes sur la
bonne formation des outputs ('markedness constraints') et sur la conservation exacte des
inputs (Prince & Smolensky 1993 [2002]). Comme on le voit ici, la marque est implémentée
dans la conception même de la grammaire de ce modèle théorique.
La grammaire définit un ensemble de structures sous-jacentes (inputs) qu'elle associe à
un ensemble de réalisations possibles (outputs) au moyen de la fonction Gen (générateur)
appartenant à la grammaire universelle. Chaque paire input-output est évaluée par la fonction
H-eval qui donne son avis quant à sa bonne formation, classant l'ensemble des paires inputoutput correspondant à un input en fonction de leur relative harmonie les unes par rapport aux
autres. "An optimal output is at the top of the harmonic order on the candidate set; by
definition, it best satisfies the constraint system." (Prince & Smolensky 1993 [2002] : 4). Les
fonctions Gen et H-eval travaillent non pas de manière successive mais en parallèle.
La fonction Gen "which generates for any input a large space of candidates analyses
by freely exercising the basic structural resources of the representational theory" (Prince &
Smolensky 1993 [2002] : 6) définit l'ordre des nœuds dans la représentation : mot prosodique
(PrWd) > pied (Foot) > syllabe (σ) > more (µ) > Racine (o) > trait (f) (cf. Heiberg 1999 : 29).
Gen ne syllabifie pas et n'oblige pas chaque nœud à dominer du matériel segmental.
C'est H-eval qui assume la partie explicative. Elle contient les contraintes de bonne
formation, qui sont universelles ; c'est l'ordre de ces contraintes qui est propre à chaque
langue. Nous sommes donc dans une approche Principes et Paramètres dans laquelle
191
Chapitre 2 – Le caractère particulier des consonnes coronales
l'ensemble des contraintes (contenues dans H-eval et dans Gen, ainsi que leur
ordonnancement dans cette dernière) correspondent aux principes, et leur ordonnancement à
l'intérieur de H-eval aux paramètres.
La fonction H-eval évalue les outputs potentiels de la manière suivante : tous les
candidats sont en concurrence face aux contraintes auxquelles ils sont soumis.
Maintenant que le cadre général est dressé, observons la représentation de la
particularité des coronales dans le modèle.
3.4.2. Les coronales dans le modèle
Comme je l'ai dit dans la transition entre les autres théories phonologiques et OT, la
particularité de ce cadre théorique est qu'il se fonde totalement sur la marque, comme le
formulent par exemple McCarthy & Prince (1997 : 55) : La théorie de l'optimalité (...)
propose une approche de la théorie linguistique qui vise à combiner une théorie de la marque
empiriquement adéquate avec une définition formelle précise de ce que signifie être 'non
marqué'". De ce fait, accorder un statut particulier aux coronales dans ce cadre est
particulièrement aisé. Ainsi Prince & Smolensky (1993 : 109) mentionnent le statut nonmarqué des coronales et indiquent qu'une consonne non-coronale doit recevoir "a noncoronal
specification (Labial or Dorsal), even secondarily", tandis qu'une consonne coronale n'est pas
spécifiée.
3.4.2.1. La classe des coronales
Prince & Smolensky (1993) et Smolensky (1993) indiquent une hiérarchie de place
dans laquelle la place la moins marquée est coronale.
Lombardi (2003) amende cette hiérarchie en incluant [pharyngal] comme lieu le moins
marqué, "on the basis of evidence from epenthesis, neutralization, and transparency". Les
coronales sont donc, après le coup de glotte, les consonnes les moins marquées ; du fait que
l'épenthèse fait appel aux segments, consonantiques comme vocaliques, les moins marqués,
les coronales sont donc les meilleures candidates à l'épenthèse, comme nous allons
maintenant le voir.
192
Chapitre 2 – Le caractère particulier des consonnes coronales
Lombardi (1997, 2003) s'intéresse en effet aux épenthèses coronales et glottales dans
le cadre de l'Optimalité. Elle développe son analyse à partir des contraintes élaborées dans
Prince & Smolensky (1993) et Smolensky (1993).
3.4.2.1.1. Coronales vs. labiales et vélaires
Dans l'explication de l'épenthèse de coronales, la Théorie de l'Optimalité écarte
explicitement la sous-spécification : "once the only surviving candidates are those with some
epenthetic consonant, the markedness constraints pick the consonant with the least marked
Place. This allows us to analyze the unmarked behavior of the coronal without recourse to
underspecification. The /t/ does have Place". (Lombardi 2003 : 3, également Lombardi 2001 :
28-30).
Itô et al. (1995) justifient ce rejet de la sous-spécification dans la théorie par son
caractère absolu, qui ne correspond pas à la réalité des faits. La sous-spécification,
particulièrement sous sa forme radicale, est en lien direct avec l'inactivité phonologique : un
trait qui n'est pas spécifié ne peut déclencher d'assimilation par exemple, ou influencer de
quelque manière que ce soit la distribution des segments environnants. Cependant, cette
hypothèse théorique ne résiste pas à l'épreuve empirique, particulièrement en ce qui concerne
la sous-spécification du trait [coronal] : "numerous generalizations holding of coronals during
the early derivation require reference to [coronal], and hence specification" (Itô, Mester &
Padgett 1995 : 572 ; cf. également McCarthy & Taub 1992). Pour Itô, Mester & Padgett
(1995 : 572), ce paradoxe de la sous-spécification des coronales, qui tantôt subissent des
processus phonologiques, tantôt en déclenchent, est causé par "an incorrect theory that views
phonological constraints as absolute and inviolable well-formedness conditions" ; cette
"rigidité" est palliée par OT, qui dispose de contraintes violables.
Dans ce modèle donc, les coronales ne sont pas sous spécifiées, mais la marque est
traduite par l'ordonnancement universel de contraintes suivant :
*LAB, *DOR >> *COR52
52
De Lacy (2002a : 191) lie la marque directement à l'épenthèse : "since epenthetic elements are never labials or
dorsals, it must be the case that no markedness constraint favours them over glottals and coronals".
193
Chapitre 2 – Le caractère particulier des consonnes coronales
*LAB est une contrainte rejetant tout segment labial, de même que *DOR rejette tout
segment dorsal et *COR tout segment coronal. Les >> indiquent l'ordre de priorité. Cet
ordonnancement de contraintes signifie que le rejet des labiales et des dorsales est prioritaire
sur le rejet des coronales.
Considérons l'exemple suivant qui évalue les outputs potentiels à une forme sousjacente /ao/ en fonction de l'ordonnancement de contraintes ici établi. On obtient dans les cas
d'épenthèse (adapté de Gafos & Lombardi 1999 : 85, Lombardi 2003 : 3) le tableau évaluatif
suivant53 :
(150)
b. abo
c. ako
d. a
e. a.o
MAXV
ONSET
/ao/
) a. ato
*LAB
*DOR
*COR
*
!*
!*
!*
!*
Outre les contraintes relatives au lieu d'articulation (*LAB, *DOR et *COR), deux
contraintes sont utilisées ici, qui en réalité sont au même niveau dans la hiérarchie des
contraintes (comme *LAB et *DOR le sont entre elles).
La contrainte ONSET exige une attaque pour chaque syllabe : "syllables must have
onsets (except phrase initially)" (Prince & Smolensky 1993 [2002] : 17). Cette contrainte est
binaire : "a given syllable either satisfies or violates the constraint entirely" (Prince &
Smolensky 1993 [2002] : 75). La contrainte MAXV fait partie des contraintes de fidélité
asking for the exact preservation of the input in the output" (cf. Prince & Smolensky 1993
[2002] : 4) ; elle impose la représentation de toutes les voyelles de l'input dans la forme
optimale.
La séquence proposée en (150)d., parce qu'elle ne contient pas trace du /o/ de la forme
sous-jacente, viole fatalement la contrainte MAXV. La forme proposée en e. ne contient pas
53
L'évaluation se présente sous la forme d'un tableau dont les lignes indiquent les candidats potentiels et les
colonnes les contraintes, dans leur ordre d'importance (dans la langue considérée) de gauche à droite. Chaque
fois qu'une contrainte est violée, la case correspondant en regard de la forme sera marquée d'une étoile *. Si la
violation est "fatale", c'est un point d'exclamation qui sera porté en regard de la forme, excluant celle-ci de toute
considération supplémentaire. La forme optimale, c'est-à-dire celle qui est prononcée de fait, est récompensée
d'un doigt pointé ).
194
Chapitre 2 – Le caractère particulier des consonnes coronales
d'attaque pour la deuxième syllabe, ce qui est considéré dans la langue comme une violation
de la contrainte ONSET fatale pour la forme candidate.
Les séquences (150)a., b. et c., parce qu'elles exploitent tous les segments de la forme
sous-jacente et que leur deuxième syllabe comporte une attaque, passent avec succès le cap
des deux premières contraintes et sont de ce fait jusque là équivalentes. Cependant, du point
de vue du lieu d'articulation, la violation de *LAB est fatale pour la séquence b. puisque la
consonne épenthésée est une labiale, de même que la violation de *DOR est fatale pour la
séquence en c. puisque [k] est une dorsale. Il est vrai que la séquence a. viole la contrainte
*COR, [t] étant coronale. Cependant, du fait que la contrainte *COR est placée après toutes les
autres contraintes s'appliquant sur les outputs, sa violation est la moins "grave", aussi la
séquence correspondante est-elle considérée comme optimale.
3.4.2.1.2. Coronales vs. glottales
L'ordonnancement des contraintes liées aux lieux d'articulation post-glottaux est réglé
par la hiérarchie présentée ci-dessus. Les occlusives glottales quant à elles ont un lieu
Pharyngal54 ; étant donné qu'elles sont encore moins marquées que les coronales (cf.
Lombardi 2001), la contrainte s'y rapportant se place dans la hiérarchie comme suit :
*LAB, *DOR >> *COR >> *PHAR
Le résultat est que // sera "the optimal epenthetic consonant". "Its Place markedness
violation is even lower than that of the relatively unmarked /t/" (Lombardi 2003 : 4). Ainsi si
l'on reprend l'exemple développé ci-dessus obtient-on le tableau suivant :
(151)
/ao/
)a. ao
b. ato
c. a
d. a.o
(ONSET, MAXV)
*COR
*PHAR
*
!*
!*
!*
54
Lombardi (2001) renvoie à McCarthy (1989, 1994), également pour la distinction entre [] et [h] d'une part,
qui seraient [+glottales], et [] et [] d'autre part, [-glottales]. Dans toutes les langues, /h, / "are Phar in
languages where they form a natural class with gutturals, and they are also Phar in languages with neutralization,
// epenthesis, and transparency effects." (Lombardi 2001 : 30).
195
Chapitre 2 – Le caractère particulier des consonnes coronales
Cette fois la séquence [ato] n'est pas optimale, puisqu'elle viole une contrainte qui
n'est pas la dernière dans la hiérarchie. La séquence [ao] est préférée puisqu'elle ne viole
que la contrainte la plus basse dans la hiérarchie.
Reprenons l'exemple du cupeño (cf. chapitre 1 section 2.1) traité par Lombardi (2003 :
19-18) pour illustrer le traitement des épenthèses de coup de glotte en OT par rapport à
l'insertion d'une dorsale ou d'une coronale.
Dans cette langue, le coup de glotte est inséré en coda "to satisfy a minimal word
requirement", ce qui reçoit le traitement suivant en OT :
(152)
/hu/
hu
) hu
hut
huk
MINWD
*DOR
*COR
*PHAR
!*
*
!*
!*
La contrainte MINWD requiert une structure minimale en CVC pour les mots de cette
langue, et les contraintes *DOR, *COR et *PHAR, dans cet ordre, gèrent le lieu d'articulation.
"The Place markedness hierarchy then chooses /hu/ as optimal, since the *Place violation
incurred by the glottal stop is the lowest ranked one." (Lombardi 2003 : 18).
La hiérarchie des contraintes liée aux lieux d'articulation est, nous l'avons vu,
universelle. Les épenthèses consonantiques sont donc universellement laryngales en priorité,
et ne sont coronales que dans le cas où d'autres raisons se greffent.
Pour Lombardi (1997 : 8) en effet, "there is no language where the general,
phonologically driven epenthesis consonant is a coronal; in all of them the story is more
complicated, confirming the generalisation that coronal epenthesis is only seen when
something additional to Place markedness is active." (cf. chapitre 1 section 2.2 pour une
évaluation de cette proposition).
Pour Lombardi (1997 : 7), en ce qui concerne les coronales, "in onset positions,
sonorants are not preferable; obstruents presumably are because of the steeper sonority cline
they give up to the syllable." De cette observation concernant les coronales elle va déduire
l'ordonnancement de contraintes permettant de justifier de l'épenthèse d'une coronale plutôt
196
Chapitre 2 – Le caractère particulier des consonnes coronales
que d'une glottale dans les langues où le phénomène se produit (par exemple l'anglais de
Bristol) ou dans les cas où au sein d'une même langue les deux types d'épenthèses sont
possibles (tunica).
Reprenons le phénomène de l'épenthèse de [l] en anglais de Bristol (voir chapitre 1
section 2 pour la présentation des données, chapitre 3 section 4 pour l'implémentation du
mode de concaténation dans la théorie). En fin de mot se terminant par un schwa est
épenthésé un [l]. Par exemple, le prénom Eva est prononcé [ivl].
Lombardi (2003 : 22-23) traite la différence de type de consonne inséré en coda ou en
attaque en ajoutant une contrainte à la hiérarchie de place détaillée plus haut, à savoir
SONCODA, selon laquelle "Codas should be sonorant".
La violation de cette contrainte étant fatale, elle exclut les épenthèses de coup de glotte
en coda avant même que l'on s'intéresse au lieu d'articulation puisque les occlusives glottales
sont par définition non sonantes. Reste à choisir le type de sonante possible en coda, ce qui
sera rendu possible par les contraintes *NASCODA, interdisant les nasales en coda, et
*NONNASCODA, interdisant les non-nasales en coda, la violation de la première étant fatale au
contraire de celle de la seconde. Le choix de l'épenthèse par la hiérarchie de contraintes
détaillée ci-dessus est repris dans le tableau suivant :
(153)
SONCODA
/iv/
)ivl
iv
ivn
*COR
*PHAR
*NASCODA
*
!*
*NONNASCODA
*
*
*
!*
La séquence [iv] est exclue puisque la contrainte SONCODA exige une sonante en
coda, ce que [] n'est pas, et que sa place dans l'ordonnancement des contraintes n'est pas la
dernière. [ivn] est définitivement rejetée, non pas parce que la coda est une coronale (sans
quoi [ivl] serait exclue également), mais parce qu'elle viole fatalement la contrainte
interdisant les nasales en coda (*NASCODA). La séquence optimale est donc [ivl] : certes la
coda et une coronale (ce qui viole *COR) mais c'est une sonante (ce qui correspond à
SONCODA) sans être une nasale (ce qui sied à *NASCODA, placée avant *NONNASCODA en
tunica).
197
Chapitre 2 – Le caractère particulier des consonnes coronales
Dans une langue comme le tunica (cf. chapitre 1 section 2.1) où cette fois c'est la
nasale qui est favorisée en coda, il suffit d'inverser l'ordre d'importance des deux dernières
contraintes citées, de façon à ce que ce soit l'éventuelle violation de *NONNASCODA qui soit
fatale (Lombardi 2003 : 25) :
(154)
/sahku/
sahku
) sahkun
sahkum
*LAB
*NONNASCODA *NASALCODA
!*
*
*
!*
*COR
*PHAR
*
*
La contrainte SONCODA est ici facultative : *NONNASCODA garantit une coda sonante
puisque nasale ; c'est donc *NONNASCODA qui va permettre le rejet définitif de la séquence
[sahku], le coup de glotte n'étant pas une sonante. Le choix entre /m/ et /n/ est réglé par
l'association habituelle *LAB >> *COR.
De plus, cet ordonnancement des contraintes permet de rendre compte des épenthèses
de coup de glotte présentes dans cette langue : certains mots à accent final prennent une
syllabe prothétique finale pour recevoir l'épenthèse finale de /n/ caractéristique de la fin d'une
proposition, syllabe constituée d'un coup de glotte, d'une copie de la voyelle précédente et du
/n/ :
forme normale
ri
forme en fin de proposition
riin
glose
"maison"
Le tableau suivant, utilisant les mêmes contraintes dans le même ordre que dans le cas
de l'épenthèse de [n], rend compte correctement des données :
(155)
/ri/
rii
) riin
rinin
*NONNASCODA *NASALCODA
!*
*
*
*LAB
*COR
*
**!
*PHAR
**
*
La séquence [riin] est optimale puisqu'elle ne viole de manière fatale aucune
contrainte, au contraire de [rii] qui viole la contrainte *NONNASCODA prohibant les nasales,
et donc les sonantes, de la position en coda, et de [rinin] qui contrevient à la contrainte *COR
198
Chapitre 2 – Le caractère particulier des consonnes coronales
s'appliquant à l'attaque de la syllabe : universellement placée avant *PHAR, elle privilégiera
les attaques en pharyngales plutôt qu'en coronales.
Ce qui permet de rendre compte de la prédilection du tunica pour les coronales dans
un cas mais pour les glottales dans l'autre est le fait que l'épenthèse de la glottale a lieu en
attaque, qui n'est régie au niveau phonologique que par les contraintes de place, alors que
l'épenthèse de la coronale se produit en coda, position sur laquelle interviennent des
contraintes relatives au mode articulatoire.
En attaque, les épenthèses de coronales sonantes sont dues pour Lombardi (2003 : 33)
"to factors that are not purely phonological". Ainsi, dans les langues suivantes (cf. chapitre 1
sections 2.1 et 2.2) les contextes morphologiques ou mélodiques suivants jouent un rôle
déterminant dans le conditionnement du lieu d'articulation de l'épenthèse :
- en gokana, l'épenthèse à l'intervocalique de /l/ se manifestant par un [r] dans un contexte oral
et un [n] dans un contexte nasal est restreint à deux suffixes, seulement entre deux voyelles
longues et à l'intérieur d'un pied. Donc, "it is not the general phonologically-driven epenthetic
consonant of the language" (Lombardi 2003 : 28-30).
- en japonais, l'épenthèse de [r] en initiale de radical derrière un préfixe se terminant par une
voyelle n'est pas due à une exigence de la langue - les hiatus y sont permis - mais au contexte
morphologique.
- en fula, l'épenthèse de [n] constatée ne fonctionne que dans un jeu de langue mais non plus
généralement dans la langue.
- en kçnni, [r] est inséré uniquement entre un radical et un suffixe de pluriel à condition que
ce radical se termine par [aa], [çç] ou [], donc lorsque des conditions à la fois
morphologiques et phonologiques sont réunies.
Cette position ne permet cependant pas d'expliquer en quoi la morphologie détermine
la nature de la consonne épenthésée : comment une frontière morphologique peut-elle
sélectionner une mélodie particulière ?
L'épenthèse en attaque de /t/, qui est certes une coronale mais qui n'est pas une
sonante, répond à une stratégie différente (Lombardi 2003 : 33-36).
Prenons le cas de l'axininca campa (cf. chapitre 1 section 2.1). Dans cette langue, /t/
est épenthésé en attaque entre un radical et un suffixe, donc dans un environnement
199
Chapitre 2 – Le caractère particulier des consonnes coronales
morphologique déterminé : la concaténation des morphèmes /i-N-koma-aa-i/ "il repagaiera"
se réalise [ikomataati].
Si // est bien l'épenthèse "par défaut" dans les langues du monde, pourquoi est-ce un
/t/ qui est inséré ? Le seul critère morphologique n'est pas suffisant pour justifier ce
manquement à la règle55, il faut considérer les raisons phonologiques au niveau de la
grammaire universelle.
Commençons par le mode d'articulation : non seulement les obstruantes sont
prioritaires sur les sonantes en attaque, mais à l'intérieur même de la classe des obstruantes les
occlusives sont préférables.
Ceci se traduit en Optimalité par les contraintes *SONV et *OBSV qui interdisent
respectivement les sonantes et les obstruantes en attaque, ordonnées universellement
*SONV>>*OBSV, d'une part ; d'autre part, les contraintes *FRICV et *STOPV qui interdisent
les fricatives et les occlusives en attaque, *FRICV étant universellement classée avant
*STOPV. L'inventaire phonologique de l'axininca campa excluant le // mais incluant le /h/,
celui-ci sera éliminé en tant que fricative, et les seules occlusives restant en lice seront celles
comprenant une articulation supralaryngale.
De plus, cette hiérarchie de contraintes de mode d'articulation est prioritaire sur celles
concernant le lieu d'articulation, *COR et *PHAR dans le cas présent56. On obtient alors le
tableau suivant57 (Lombardi 2003 : 36) :
(156)
/ikoma + i/
ikomahi
ikomasi
ikomali
) ikomati
*SONV
*FRICV
*!
*!
*!
*COR
*PHAR
*
*
*
*
55
C'est ici le lieu d'articulation que l'on cherche à justifier et non l'apparition même d'une épenthèse à la frontière
morphologique.
56
Sont également concernées *Lab et *Dorsal, qui éliminent les candidats tels que [ikomapi] ou [ikomaki]
mais qui n'entrent pas en compte dans la rivalité glottales / coronales.
57
Je rappelle qu'aucun output avec la glottale n'est proposé puisque // est exclus de l'inventaire de l'axininca
campa.
200
Chapitre 2 – Le caractère particulier des consonnes coronales
On notera que l'ordonnancement des contraintes concernant le mode d'articulation a
permis non seulement d'éliminer [] de la course, mais également la fricative [s], pourtant
coronale.
Plusieurs remarques sont à évoquer.
Tout d'abord, il manque une contrainte concernant le voisement, afin de rayer [d] de la
liste des candidats. Mais ceci n'est qu'une question de formulation et ne remet pas en cause
l'analyse. L'argument suivant est en revanche plus critique.
Le fait que // soit absent de l'inventaire phonologique ne constitue pas en soi une
raison suffisante pour exclure la possibilité d'un [] en output. Si l'on prend l'exemple de
l'allemand (Wiese 1996), la situation est précisément celle-ci : l'inventaire phonologique de la
langue ne comporte pas le coup de glotte, mais celui-ci apparaît en surface, notamment en
épenthèse (cf. chapitre 1 section 2.2), à l'initiale ([awtoo] pour Auto "voiture") et à
l'intervocalique devant voyelle accentuée (chaotisch "chaotique" est réalisé [ka()'oot]).
C'est également le cas en français : Encrevé (1988a : 32-41) relève une occlusion glottale dans
les cas de liaison sans enchaînement, et ce alors que le français ne comporte pas // dans son
inventaire phonologique ([ilfotntralafwa] il faut en être à la fois, [kyzessjl] que
je jugeais essentiel) (cf. également Tranel 1981 : 310-311, Plénat 1999 : 128).
Si l'on ne peut exclure le coup de glotte de la liste des outputs possibles, alors au terme
de l'analyse présentée ici non seulement [t] et [] sont encore en concurrence, mais en plus
selon les contraintes établies ici c'est [] qui est optimal et non [t], alors que c'est [t] qui est
observé en surface. La forme optimale ici n'étant pas celle attestée de fait, l'ordonnancement
des contraintes, l'ensemble des contraintes ou leur définition est à réétablir.
Examinons un instant comment les contraintes permettent de rendre compte de la
différence de marque à l'intérieur de la catégorie des consonnes coronales.
201
Chapitre 2 – Le caractère particulier des consonnes coronales
3.4.2.2. Au sein de la classe des coronales
De la même manière que l'ordonnancement de contraintes permet de rendre compte du
lieu d'articulation le moins marqué et donc d'élire la forme optimale (celle qui est attestée de
fait), l'ajout de contraintes portant sur le mode articulatoire permet de distinguer, à l'intérieur
d'une classe de consonnes, la consonne la moins marquée.
Nous avons vu dans la section précédente comment les contraintes régissant le mode
articulatoire en fonction de la position à l'intérieur de la syllabe permettaient d'établir la forme
optimale d'une épenthèse. En coda, le fait que l'on observe prioritairement des sonantes est
rendu par la contrainte SONCODA ; en attaque, les obstruantes sont moins marquées que les
sonantes, ce qui se traduit par *SONV >> *OBSTRV ; au sein de la catégorie des osbtruantes,
les occlusives sont préférées aux fricatives : *FRICV >> *STOPV. L'ordonnancement de ces
deux derniers ensembles est universel.
Il reste à s'intéresser aux différents lieux d'articulation au sein de la classe des
coronales. Les contraintes traduisant la marque et l'articulation alvéolaire étant la moins
marquée des articulations coronales, il suffit d'établir une série de contraintes excluant les
rétroflexes, les dentales, éventuellement les palatales, puis les alvéolaires, celle-ci étant
ordonnée en dernier : *RÉTROFLEXE >> *PALATALE >> *DENTALE >> *ALVÉOLAIRE. Je n'ai
pu trouver trace de ces contraintes, mais le modèle permet aisément de les générer puisque,
encore une fois, la théorie de l'Optimalité implémente la marque.
3.4.3. Bilan sur les coronales en OT
En OT, la particularité des coronales est mise en exergue en utilisant des contraintes
de marque, mais le degré de marque des coronales et des laryngales est analysé sans faire
référence à la sous-spécification. Les laryngales sont les consonnes les moins marquées, mais
il arrive que les coronales soient épenthésées "à leur place" pour des raisons de conflits de
contraintes. Si des coronales sont épenthésées à la place de , c'est pour des raisons
morphologiques ou phonologiques et non comme consonnes coronales par défaut. La
hiérarchie de contraintes concernant le lieu d'articulation est donc bien universelle :
*LAB, *DOR >>*COR >>PHAR.
202
Chapitre 2 – Le caractère particulier des consonnes coronales
3.5. Bilan sur la représentation des coronales dans les théories phonologiques
Dans toutes les théories présentées ici – Géométrie des Traits, Phonologie de
Dépendance, Phonologie de Gouvernement – soit la représentation des coronales est
équivalente à celle des labiales ou des vélaires, soit elle met en exergue la particularité des
coronales par rapport à la marque. Autrement dit, ce sont les données qui conditionnent les
théories quant à leur position par rapport aux coronales.
Aucune théorie ne propose un rapport de marque pour une raison interne à la théorie
elle-même, indépendamment de l'empirie : les théories ne font qu'encoder la marque, basée
sur l'empirie. Chaque théorie pourrait, du point de vue de sa structure, encoder n'importe quel
autre lieu d'articulation.
Seule Lombardi (1997, 2003) dépasse ce raisonnement circulaire et fait une prédiction
quant au fait que l'on ne trouvera pas d'épenthèse de coronales dans les langues du monde qui
ne soit conditionnée par rien d'autre que la phonologie.
Dans cette partie consacrée à la présentation de l'épenthèse consonantique, le premier
chapitre a été consacré à l'exposé des données dans les langues du monde, assorti d'une
typologie des raisons invoquées à l'apparition de l'épenthèse et d'un inventaire des épenthèses
consonantiques en français. Celles-ci étant toutes coronales, le deuxième chapitre a fait le
point sur le statut de la coronalité dans les théories phonologiques génératives.
Après cet éclaircissement concernant le lieu d'articulation de la consonne
épenthétique, tournons nous dans le chapitre suivant vers l'implémentation du phénomène de
l'épenthèse consonantique au sein de deux problématiques distinctes, dans différents cadres
théoriques.
203
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Chapitre 3.
Traitements antérieurs des alternances consonne ~
zéro en français : liaison et épenthèse
Les théories phonologiques ont abordé le phénomène de l'épenthèse consonantique
sous deux angles : en rapport avec les alternances consonne ~ zéro du français, et pour ellemême. Nombre de travaux ont été consacrés à l'une comme à l'autre de ces perspectives.
En ce qui concerne les alternances consonne ~ zéro, l'épenthèse s'est révélée une
alternative d'analyse face aux imperfections de représentation du modèle linéaire. Dans la
première section de ce chapitre, je passerai en revue les différentes analyses proposées pour ce
type d'alternances, particulièrement en ce qui concerne la liaison, sur laquelle portera un des
phénomènes analysés dans la troisième partie de cette thèse.
L'épenthèse a également été envisagée en elle-même, l'enjeu étant dans ce cas non pas
de l'opposer à une analyse en termes de consonne sous-jacente mais de modéliser l'apparition
d'une consonne intrusive. La deuxième section de ce chapitre se propose de montrer
l'évolution de traitement dont a bénéficié l'épenthèse, en fonction de la prise en compte de la
structure syllabique dans le processus explicatif.
1. Epenthèse et alternances consonne ~ zéro
L'étude de l'épenthèse au sein de la dérivation en français s'inscrit dans le cadre plus
large des alternances consonne ~ zéro, c'est-à-dire des unités lexicales se présentant tantôt
avec une consonne, tantôt sans, par opposition à deux autres catégories de termes : ceux ne
comportant jamais de consonne à la finale (flou, joli) et ceux au contraire dont la consonne
finale est toujours présente (lucide, agréable).
Les alternances consonne ~ zéro se manifestent dans trois cas de figure : à la liaison, à
la flexion et à la dérivation (cf. par exemple Tranel 1981 : 159-162, Paradis & El Fenne
1995 : 170, Prunet 1986 : 230, Wetzels 1987). Le tableau suivant propose un aperçu des cas
où elles se manifestent, en fonction des contextes et de la consonne qui apparaît :
204
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(157)
liaison
consonne
alternante
t
z
adjectif _ nom

r
nom _ adjectif
z
entre
catégories
adverbe
_
participe
z
majeures
z
adverbe _ substantif /
adjectif
p
verbe _ adjectif
t
z
verbe _ adverbe
contexte
après
mineure
avant
mineure
après
numéral
catégorie syntaxique
déterminant _ substantif
catégorie / adjectif
préposition
_
déterminant
verbe _ préposition
_
clitique
catégorie verbe
(impératif)
verbe
_
clitique
(inversion)
cinq _
adjectif
huit _
six, dix _
adjectif
genre
substantif
flexion
dérivation
nombre
substantif
personne
verbe
mode
verbe
préfixe _ base
radical _ suffixe
z
z
t
z
t
k
t
s/z
t
d

s
z

n
t
z
f
s
t
m
d
z
v
t
d
v
m
z
s
t
p
d
illustration
petit copain / petit ami
gros castor / gros écureuil
long printemps / long été
premier train / premier invité
athlètes français / athlètes américains
très attendu
très envie, *fort envie
trop tard / trop important
il est français / il est anglais
vous chantez bien / vous chantez
agréablement
les parents / les enfants
les petits / les anciens amis
dans deux heures / dans une heure
il vient à la maison
manges-en
ms : mange en cuisine
mange-t-il
cinq / cinq enfants / cinq cents
huit / huit enfants / huit cents
dix / dix enfants / dix copains
petit / petite
bavard / bavarde
long / longue
gros / grosse
gris / grise
franc / franche
sain / saine
avocat / avocate
lépreux / lépreuse
œufs/ œuf
os [o] / os [çs]
sort / sortent
dort / dorment
entend / entendent
coud / cousent
vit / vivent
sort / sorte
entend / entende
vit / vivent
dort / dorme
défaire / désorganiser
gros / grossir
numéro / numéroter
drap / draper
décès / décéder
205
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français

z
nid / nicher
impôt / imposer
Les consonnes intervenant dans ces trois phénomènes, grande a été la tentation de les
unir sous une même logique explicative (cf. pour une présentation Tranel 1981 : 162, Durand
1986b, Paradis & El Fenne 1992, 1995), notamment par les générativistes linéaires "de la
première heure" que sont Schane, Selkirk et Dell (cf. section I [3] 1.1.1.2.2). C'est ce que
Durand (1986b : 164) appelle l'hypothèse du parallélisme, due au fait que c'est la même
consonne qui apparaît pour un item donné à la liaison, à la dérivation et à la flexion vs. son
absence en finale absolue :
(158)
adjectif : petit
verbe : mettre
en finale de
proposition
[pti]
[ilm]
à la liaison
[ptitami]
[mtil]
à la flexion
[ptit]
[mt]
à la dérivation
[ptits]
[mtabl]
Paradis & El Fenne (1995 : 170) formalisent cette hypothèse de la manière suivante :
"the well-known consonant/ø (C/ø) alternation in French should be analyzed as much as
possible in a uniform way, independently of the context where it occurs (verbal, nominal,
adjectival inflection or derivation, and liaison)".
Dans une première section, je soumets une revue des analyses proposées pour la
liaison, sujet particulièrement sous le feu des projecteurs dans la phonologie du français dans
le courant génératif ; l'épenthèse a été considérée comme l'alternative prioritaire face à une
analyse posant la consonne alternante comme sous-jacente.
La deuxième section propose une partition des cas de liaison, en termes d'obligation et
d'interdiction et en fonction des appartenances syntaxiques des éléments en jeu. Ce bilan
permettra de poser les fondements empiriques d'un cas particulier de consonne apparaissant à
la liaison post-verbale, développé dans la troisième partie de cette thèse.
Dans la troisième section de ce chapitre, c'est la flexion, tant nominale que verbale, qui
sera étudiée à son tour, de façon à distinguer précisément, en ce qui concerne plus
particulièrement le verbe, les critères déterminant l'appartenance d'une consonne à un
morphème flexionnel plutôt qu'au radical.
206
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1. Analyses antérieures de la liaison
La liaison est un des trois cas, avec la flexion et la dérivation, où s'observent les
alternances consonne ~ zéro en français. C'est sans doute celui qui a été le plus traité, en
témoignent les divers compte-rendus récapitulatifs que l'on peut en trouver, consacrés
expressément à son historique (Klausenburger 1984, Encrevé 1988b, Tranel 1995a, b) ou le
développant pour soutenir une analyse particulière (cf. Tranel 1981, Durand 1986b, Encrevé
1988a, Paradis & El Fenne 1992, 1995, Côté 2003). Il ne s'agit pas ici de concurrencer ces
bilans, non plus que de simplement les mettre à jour, mais plutôt de mettre en évidence les
arguments qui sont avancés pour défendre les différentes options d'analyse qui s'offrent face à
l'apparition sporadique d'une consonne.
La liaison est un cas particulier d'enchaînement de mots, délimitée par Encrevé
(1988a : 23) comme "un phénomène ayant lieu dans la chaîne parlée au contact entre deux
mots dont le premier, lorsqu'il est prononcé isolé ou devant un mot commençant par une
consonne (C), se termine par une voyelle (V), et dont le second prononcé isolément
commence par une voyelle".
Le phénomène se caractérise donc par un contexte phonétique particulier - devant une
voyelle vs. devant une consonne - et la présence de deux mots en contact. La nature
consonantique ou vocalique de l'élément à gauche de l'alternance n'est pas considérée comme
pertinente pour le phénomène.
Dans cette section, je récapitulerai les différentes analyses qui ont été proposées selon
lesquelles la consonne que l'on entend à la liaison est présente dans l'un des mots participant
du processus58. Dans la section suivante, je tâcherai d'établir une partition des différents types
de liaison possibles (section 2.2).
Je distinguerai ici les analyses en fonction de la position qu'elles accordent à la
consonne qui alterne dans le lexique : en fin du premier mot (section 1.1.1), en début du
second (section 1.1.2), ou ni dans l'un, ni dans l'autre (section 1.1.3). La position concerne la
place lexicale et non la position après syllabation, celle-ci étant, dans les cas d'enchaînement,
58
Je ne présenterai pas les cas particuliers relevant de la prise en compte des mots à "h aspiré", qui font l'objet
d'une littérature importante (cf. notamment Kiparsky 1973, Ågren 1973, Klausenburger 1974, Vergnaud 1975,
de Cornulier 1974, 1978, Gaatone 1978, Clements & Keyser 1981, Kaye 1984, Tranel 1981, Anderson 1982,
Iverson 1983, Wetzels 1987, Spence 1988, Encrevé 1988a) et pour lesquels je proposerai une représentation en
partie III (section [9] 3.2.1.4). Je ne traiterai pas non plus ceux s'intéressant plus particulièrement à la liaison
après nasale (cf. entre autres Dell 1973, Tranel 1974, 1981, Anderson 1982, Prunet 1986).
207
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
toujours en attaque (Encrevé 1988a : 75 : "dans les contextes de liaison où la consonne de
liaison est réalisée invariablement (liaison obligatoire), cette consonne est invariablement
enchaînée à la voyelle du mot suivant"). Lorsque l'on considère la chaîne parlée, les cas où la
consonne est réalisée de fait en "coda" en fin de premier mot sont minoritaires et
correspondent à ce que Encrevé (1988a) attribue au non-enchaînement. En effet, "la présence
de la consonne de liaison et sa position dans la structure syllabique sont deux phénomènes
dissociables" (Encrevé 1988a : 30).
1.1.1. La consonne appartient au premier morphème
Dans cette section sont rassemblées les analyses considérant que la consonne est
présente au niveau lexical en finale du premier morphème.
Envisager la consonne dans cette position plutôt qu'insérée par épenthèse (et donc non
présente dans le lexique) permet de rendre compte des différences de mélodie de la consonne
(petit [t] ami, long [g] été, premier [r] élément, etc) de manière unifiée.
On distinguera deux traitements possibles, tous deux envisagés dans la littérature
consacrée à l'épenthèse : la supplétion (section 1.1.1.1) ou la présence systématique de la
consonne (section 1.1.1.2).
1.1.1.1. Supplétion
La supplétion consiste à poser deux ou plusieurs allomorphes du premier mot (ou du
morphème intervenant à la gauche de la consonne considérée) dans le lexique. Par exemple
pour le déterminant défini pluriel les, on aura /le/ / /lez/. Le choix de l'allomorphe se règle en
fonction du contexte.
Cette solution a été présentée dans le traitement de la liaison dès avant la phonologie
générative.
1.1.1.1.1. Cadre non génératif
Paradis & El Fenne (1992, 1995) relèvent divers travaux dans lesquels la liaison est
considérée sous l'angle de la supplétion (Michaut 1934, Trager 1944, Pinchon & Couté 1981).
Avant 1968 en effet, il était difficilement concevable qu'un segment non-attesté dans une
208
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
réalisation phonétique soit présent dans la représentation phonologique de l'unité lexicale à
laquelle il correspond59 (à l'exception de Togeby 1951).
1.1.1.1.2. Cadre génératif linéaire
Devant le choix d'une consonne à élider sous certaines conditions ou d'une consonne à
épenthéser dans des contextes particuliers, plusieurs phonologues ont préféré opter pour cette
troisième solution que constitue la supplétion. Cependant, en phonologie générative cette
solution reste marginale et correspond à deux périodes bien précises.
En ce qui concerne la phase linéaire, c'est l'année 1978 qui s'est révélée féconde pour
cette approche : Long, Gaatone, Encrevé et Rotenberg considèrent que la liaison correspond à
un phénomène d'allomorphie. Encrevé (1988b : 87) résume ainsi la position de l'époque :
"nous estimions que la moins mauvaise solution était celle de la supplétion, accompagnée
d'un recours à l'information syntaxique directe."
Rotenberg propose une solution originale, la 'supplétion partielle', qui permet de
rendre compte du statut particulier de la consonne de liaison (c'est la seule consonne du mot
dont la non prononciation n'altère pas la base) tout en gardant la généralisation "selon laquelle
dans tous les cas la forme prévocalique diffère de la forme préconsonantique en ce qu'elle est
plus longue d'une consonne" (1978 : 131). Tout comme Schane (1978), il suppose que la
consonne qui apparaîtra à la liaison est indiquée dans le lexique, mais non de manière
idiosyncratique : "à chaque mot qui peut entrer en liaison est associée une consonne de
liaison, étiquetée L, que l'on peut insérer par application d'une règle". De ce fait, et comme le
souligne Encrevé (1988b : 88), Rotenberg traite séparément la nature de la consonne de
liaison et sa présence en surface. Par ailleurs, il établit une règle différente pour la liaison
facultative de celle concernant la liaison obligatoire.
59
Le fait que le lexique puisse contenir des éléments qui n'apparaissent pas en surface a d'ailleurs fait l'objet d'un
débat entre générativistes "concrets", pour lesquels le lexique ne contient que ce qui est observable, et
"abstraits", qui supposent des objets dans le lexique même si ceux-ci ne se manifestent pas directement en
surface. Je n'entrerai pas dans ce débat ici, cf. Tranel (1981 : xii).
209
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.1.1.3. Cadre génératif multilinéaire
La supplétion a été envisagée par plusieurs linguistes, et ce jusque dans les théories
actuelles ; on retiendra entre autres Klausenburger (1984), Herslund (1986), Morin (1987),
Green & Hintze (1988), Perlmutter (1998), Tranel (1995b), Bonami & Boyé (2003).
Côté (2003) ne formalise pas ses propositions, mais se réfère aux travaux génératifs
dans sa présentation du phénomène de liaison en français, aussi ne l'ai-je pas classée parmi les
linguistes non génératifs.
Ses recherches en acquisition l'ont conduite à distinguer trois types de consonnes
apparaissant à la liaison. Elle relève ainsi le cas des adjectifs dont la voyelle varie selon que le
mot est impliqué ou non dans une liaison :
(159)
non liaison en [v], liaison en [vn]
non liaison en [o], liaison en [t]
non liaison en [e], liaison en [r]
autres
bon, ancien
sot, idiot
premier, dernier
beau/bel, vieux/vieil, fou/fol, ce/cet
Ces adjectifs comportent les deux formes dans le lexique, et c'est la possibilité même
d'une liaison qui déclenche l'utilisation de l'un ou de l'autre allomorphe.
Perlmutter (1998), Tranel (1995a) et Bonami & Boyé (2003) parlent de supplétion
pour ces mêmes adjectifs. Les deux premiers en proposent une analyse dans le cadre de la
Théorie de l'Optimalité, tandis que Bonami & Boyé (2003) s'inscrivent dans un cadre
théorique morphologique et non phonologique.
1.1.1.1.4. Bilan sur la supplétion
L'avantage de la supplétion sur l'épenthèse, tout comme celui de la présence de la
consonne dans le lexique, est de rendre compte de la nature de la consonne alternante puisque
celle-ci est lexicalisée.
Les reproches qu'on adresse à cette conception de la liaison concernent l'absence de
prise en compte du fait que dans certains cas, ce sont toujours les mêmes consonnes qui
apparaissent et non une distribution aléatoire de l'ensemble des consonnes possibles à la finale
210
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
de mot en français ; par ailleurs, la supplétion n'est pas explicative, dans ce sens qu'elle ne fait
aucune prédiction quant à la nature de la consonne qui apparaît ou même de la présence vs.
l'absence de la consonne dans certains cas (cf. Paradis & El Fenne 1995 : 172).
Tranel (2000 : 50) insiste en outre sur la différence de statut de deux types de
consonnes, les consonnes intrinsèques facultatives et les consonnes latentes. Les consonnes
intrinsèques facultatives "peuvent être prononcées ou non chez un même locuteur" en
variation libre : toubib, exact, août, ananas peuvent être réalisés avec la consonne finale
([tubib], [ezakt], [ut], [ananas]) ou sans ([tubi], [eza], [u], [anana]). Pour Tranel, la
supplétion se justifie dans le cas de ces consonnes facultatives, mais non dans le cas des
consonnes latentes, mais il ne motive pas davantage son propos : "ce genre de représentations
semble devoir être réservé aux cas des consonnes intrinsèques facultatives (voir ci-dessus),
qui se comportent différemment des consonnes latentes".
Une critique plus grave qu'il émet (également Tranel 1981, 1990, 1998, 1999)
concerne le statut de la consonne finale : "intrinsèque" (c'est-à-dire fixe) ou latente réalisée,
elle est représentée de la même manière alors que dans certains cas, le comportement des
deux est précisément différent, l'une s'enchaînant et l'autre non. "Pour ne prendre qu'un seul
exemple emprunté à Morin (1998), dans un robuste, mais petit, t-enfant, la consonne de
liaison [t] se trouve normalement en position d'attaque après la pause séparant l'adjectif du
nom ("enchaînement"), mais dans l'expression parallèle une robuste, mais petite, aspérité, la
consonne finale intrinsèque /t/ doit rester en position de coda" (Tranel 2000 : 51).
L'explication la plus courante pour les consonnes apparaissant à la liaison consiste à
considérer qu'elles sont toujours présentes dans le lexique.
1.1.1.2. Présence de la consonne au niveau lexical, à la finale
Que ce soit dans le cadre génératif linéaire, multilinéaire ou même non génératif,
l'analyse la plus fréquemment observée consiste en effet à considérer que la consonne
alternante est systématiquement présente à la finale du premier mot, mais qu'elle est omise
(cadre non génératif), élidée (cadre génératif linéaire) ou qu'elle n'est pas réalisée (cadre
génératif multilinéaire).
211
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.1.2.1. Cadre pré-génératif
Parmi l'ensemble des travaux s'intéressant à la liaison, trois au moins sont à retenir
dans ce cadre d'analyse de la liaison, en-dehors des études génératives : Bloomfield (1933 :
217), Harris (1951 : 168-169) et van den Eynde & Blanche-Benveniste (1970).
Harris (1951 [1966] : 168-169) s'intéresse à la variation de genre des noms et des
adjectifs français (fermier / fermière, musicien / musicienne) dans le cadre de la variation
"between any phoneme in a given position and zero in that position; i.e. it may consist of
omitting a phoneme." Il précise cependant en note que "instead of considering the omission of
phonemes as a special case of phonemic interchange we can consider the interchange of
phonemes to consist of omitting one phoneme and adding another. In this case the morphemes
considered hitherto would all consist of the addition or subtraction of phonemes in respect to
the rest of the utterance".
Il considère l'hypothèse d'un éventuel morphème de féminin rattaché à la base
masculine, mais le rejette au motif que "we would find almost every consonant phoneme in
French occurring as a morphemic segment for 'female', and each occurring only ager some
few particular morphemes. (...) In such cases, when many morphemes (/t/, /r/, etc.) in one
position (fem.) alternate wih zero in another (masc.), it is simpler to consider the various
consonants or vowels as part of the various morphemic segments: the longer (fem.)
morpheme plus a single omit –phoneme morpheme".
L'explication du phénomène de liaison au moyen d'une consonne finale présente dans
le lexique quoique non toujours réalisée en surface est de loin la plus courante en phonologie
générative.
1.1.1.2.2. Cadre génératif linéaire
Dès l'avènement de la phonologie générative avec Chomsky & Halle (1968), la liaison
en français a été conçue comme le résultat d'une consonne lexicale finale de mot, présente
avant une voyelle initiale du mot suivant.
Le principe général est le suivant : le morphème contient une consonne finale, qui est
effacée par règle soit devant une consonne soit à la finale (il ne s'agit plus alors d'une liaison
mais les deux cas sont considérés comme relevant d'un même processus).
212
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
L'histoire de la liaison envisagée sous cet angle commence avec Schane (1968) et la
French Truncation Rule.
Schane (1968) considère que l'élision (/l/ + /ami/ réalisé [lami], /ptit/ + /kamaad/
réalisé [ptikamaad]) et la liaison ([lezami] pour l'enchaînement des morphèmes /lez/ +
/ami/, [ptitami] pour /ptit/ + /ami/) relèvent du même processus de troncation d'un élément
en fin de mot. Il observe en effet que, en fin de mot comme en fin de morphème :
"a. Consonants are truncated before consonants and liquids.
b. Vowels are truncated before vowels and glides.
c. Liquids and glides are never truncated." (1968 : 2)
Ce parallélisme entre les deux traitements le conduit à poser cette règle de troncation
(Schane 1968 : 10) : "at a boundary [α cons, -α voc, -stress] segments are truncated before [α
cons] segments"; que la frontière soit entre deux mots (petit ami vs. petit camarade) ou
intérieure de mot (petitesse)60.
Ce qui se formalise de la manière suivante :
(160)
α cons
-α voc
-stress
Æ
ø / __
+
(#) #
[α cons]
Cette règle, baptisée French Truncation Rule (FTR) par Chomsky & Halle (1968), est
connue sous ce nom depuis lors, sans la partie concernant l'accent. Encrevé (1988b : 102 note
11) souligne d'ailleurs le problème inhérent à cette spécification de l'accent, destinée à
protéger les voyelles qui ne s'élident pas : "la formalisation implique que ce trait s'applique
également aux consonnes..."
Les mots qui se terminent par une consonne finale qui se maintient devant une autre
consonne (par exemple avec, sept, sens, chef, sec) doivent être spécifiés dans le lexique
comme "résistant" à la règle de troncation, autrement dit comme des exceptions.
La FTR s'accompagne de la règle d'effacement final (Schane 1968 : 7) suivante :
"delete a word final consonant in phrase final position". Celle-ci permet de rendre compte de
l'absence de la consonne en fin de proposition.
60
La formulation de Grace (1975) est bientôt plus connue que le détail de la règle elle-même : "like drops before
like".
213
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
En outre, Schane signale que "liaison does not occur between just any two contiguous
words. There are restrictions which are syntactically determined." (Schane 1968 : 11) ; de
plus, certaines liaisons sont obligatoires mais d'autres facultatives ("its presence or absence
generally being a stylistic factor" 1968 : 13). Ceci le conduit à réaffirmer le lien direct entre
l'output de la syntaxe et l'input de la phonologie ("syntactic information is then available at
the phonological level" 1968 : 12), et à amender la règle d'effacement final de consonne :
"delete a word final consonant
1. obligatorily,
a. in phrase final position
b. in a singular noun;
2. optionally, in a plural noun." (Schane 1968 : 13)
Cependant, ce facteur syntaxique et la règle afférente prenant en compte la variation
ne reçoivent pas de formalisation dans le cadre génératif linéaire.
Schane (1968) reconnaît donc trois types de facteurs : phonologiques (présence d'une
voyelle suivante), syntaxique (catégorie lexicale des mots) et morphologique (frontière de
morphème et de mot). Pourtant, seuls les facteurs phonologique et morphologique sont
formalisés dans les règles qu'il propose. Il reconnaît également l'existence de la variation
(liaison optionnelle), sans pouvoir l'implémenter dans le modèle.
Dell (1970, 1973) et Selkirk (1972, 1974) rejettent l'unification de la liaison et de
l'élision, suivant en cela les idées de Milner (1967) relatives au réajustement des frontières
morphologiques. Schane (1973) lui-même abandonnera la FTR ("There is no French
Truncation Rule").
Dell (1970) propose une métathèse de la frontière morphologique avec la dernière
consonne du premier mot, permettant à celle-ci de s'attacher directement à la voyelle initiale
du deuxième mot, dans le cadre d'une liaison obligatoire :
C
#
V
1
2
3
Æ
2
1
3
Cette solution est rejetée par Selkirk (1972) du fait qu'une métathèse ne peut se
produire qu'entre éléments de même nature et non entre une frontière et un segment.
214
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Selkirk (1972, 1974) reprend la FTR en amendant le contexte : "liaison occurs when
one # separates two words, and not when two do" (1974 : 579) : le nombre de frontières est
distribué par la syntaxe et fonction, en outre, du registre stylistique. "To be more explicit, the
following assertion is true for speech in an elevated style in French : A head Noun, Verb, or
Adjective which is inflected may be in a liaison context with the word that follows, if that
word is in its Complements" (1974 : 581).
Schane (1974) fait le bilan de l'évolution depuis Schane (1968) : il distingue la liaison
et l'élision, considère que la liaison n'est impossible que devant une frontière morphologique
ou une consonne et propose donc la règle suivante :
C Æ ø / _ [-seg] {C, #}
Tout comme la supplétion, la présence de la consonne dans la forme lexicale d'un mot
permet de justifier la nature mélodique de la consonne sans avoir à la déduire du contexte,
alors qu'une analyse par épenthèse est tenue de le faire.
La principale critique formulée à l'encontre de ce traitement des alternances consonne
~ zéro est son opacité, c'est-à-dire le manque d'explicativité du modèle. Pourquoi certaines
consonnes sont-elles élidées en finale mais non d'autres, à frontières morphologiques et nature
segmentale identiques ? On a tenté de corriger cette opacité par l'insertion de schwas finaux
"protégeant" la consonne lorsqu'elle doit être maintenue : comment en effet rendre compte
autrement de la différence de traitement entre une consonne fixe, c'est-à-dire qui doit être
systématiquement réalisée (lucide, agréable) et qui donc ne sera pas élidée, et une consonne
qui alterne avec zéro ?
Par ailleurs, le processus explicatif est ici circulaire : j'observe qu'il y a liaison dans
certaines conditions bien définies, ce qui me permet d'élaborer un ensemble de règles les
formalisant, mais je ne détermine pas pour autant les causes déclenchantes. L'ordonnancement
des règles devrait pour se faire être intrinsèque, défini par d'autres phénomènes ou par le
mécanisme interne de la théorie.
De ce fait, jusqu'à l'avènement des cadres génératifs multilinéaires, les phonologues se
sont tournés vers d'autres modes de représentation de l'alternance, au moyen de la supplétion
(cf. section 1.1.1.1.1.) ou de l'épenthèse (cf. section 1.1.3.1), voire de la présence dans
certains cas bien définis de la consonne à l'initiale de second mot (cf. section 1.1.2.2).
215
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Par ailleurs, se pose la question du statut de cette consonne alternante. En effet, elle est
différente des autres consonnes en ce que son absence n'altère pas la base, et pourtant dans le
cadre linéaire elle est traitée de la même manière que les autres consonnes (cf. Sauzet 1999).
C'est le cadre multilinéaire qui va permettre de donner un statut différent aux
consonnes fixes et aux consonnes latentes, pour le traitement d'une consonne présente en
finale du mot immédiatement à gauche de l'alternance consonne ~ zéro.
1.1.1.2.3. Cadre génératif multilinéaire
La philosophie des cadres multilinéaires est de dissocier -notamment- la mélodie des
constituants squelettal et syllabique. Il ne s'agit donc plus ici de définir les contextes où la
consonne va être élidée, mais de déterminer dans quel cas elle va être amenée à se réaliser.
De ce fait, la consonne de liaison a désormais un statut différent des autres consonnes
du mot, ce qui permet de rendre compte du fait que son absence ne nuit pas à l'intégrité du
mot.
La phonologie multilinéaire fait son apparition "officielle" en 1976 avec la thèse de
Goldmith, bien que l'idée de répartir l'information phonologique lexicale sur plusieurs
niveaux ait été en préparation depuis le début des années soixante-dix. Pourtant, l'application
du principe de multilinéarité au phénomène de la liaison en français attendra trois années
supplémentaires.
C'est Lowenstamm (1979) en effet qui exploite le premier la distinction des niveaux,
tout en reprenant la French Truncation Rule depuis longtemps abandonnée par les
générativistes linéaires, et donc réunifiant la liaison et l'élision. Il établit qu'"une consonne
s'efface à la fin d'un mot quand l'attaque de la syllabe suivante est remplie", donc devant une
consonne, et pose la généralisation parallèle en ce qui concerne les voyelles. On retrouve cette
idée dans Kaye & Lowenstamm (1984). Leur formulation est la suivante :
(161)
α cons
- α voc
A
Æ
ø
/ __ #
[α segment]
Anderson (1982) s'attache pour sa part à reformuler la règle d'effacement de la
consonne finale, en soulignant le fait que seules les obstruantes (cf. Dell 1973) en coda sont
216
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
concernées. Il distingue ainsi le constituant syllabique de la mélodie comme l'atteste la règle
de troncation suivante (1982 : 561)61 :
σ
(162)
A
R
N
M
|
__
[+ obstruent] Æ ø /
# (#)
A l'intérieur des cadres multilinéaires postérieurs on peut distinguer deux tendances
majeures concernant l'analyse des consonnes qui alternent avec zéro. Dans les deux cas, la
consonne est réputée flottante, c'est-à-dire non rattachée au niveau syllabique, mais tantôt elle
est attachée à une position squelettale dès le lexique (section 3.1.1.2.3.1), tantôt elle n'est
attachée à rien (section 2.1.1.2.3.2).
1.1.1.2.3.1. La consonne est attachée à une position squelettale
Clements & Keyser (1981, 1983) vont plus loin dans la représentation multilinéaire
que Lowenstamm (1979). Ils considèrent la consonne de liaison comme un élément flottant
associé à une position consonantique mais non à un nœud syllabique, comme le [t] final de
petit dans l'exemple suivant :
(163)
σ
C
|
p
σ
V
|

C
|
t
V
|
i
C
|
t
La réalisation de la consonne passe par une règle de liaison associant toute position
consonantique non rattachée à une syllabe, à la syllabe suivante :
(164)
σ
C
|
p
61
σ
V
|

C
|
t
σ
V
|
i
C
|
t
V
|
a
σ
C
|
m
V
|
i
N indique le noyau, M la marge.
217
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Durand (1986a) implémente la représentation de Clements & Keyser (1983) dans le
cadre de la Phonologie de Dépendance.
Booij (1984) reprend l'idée de Clements & Keyser (1983) selon laquelle la consonne
de liaison est un élément extrasyllabique62 et doit, de ce fait, soit être syllabifié, soit
disparaître. Cependant cette disparition se fait au moyen d'une Convention universelle et non
d'une règle, propre à une langue. Cette Convention universelle est exprimée de la manière
suivante : "Suppression du segment non-syllabé : supprimez de la représentation phonétique
tout segment qui n'est pas dominé par (σ)". On y reconnaît le principe (2) de Vergnaud (cf.
section 1.1.1.2.3.2). Par ailleurs, il garde une règle de liaison.
Plénat (1987) utilise lui aussi les consonnes extrasyllabiques, entendues ici comme
reliées à leur position squelettale mais non au niveau du constituant syllabique, dans la
représentation qu'il propose de la liaison, mais d'une façon différente de ses prédécesseurs.
Pour lui, il existe un gabarit de la rime finale d'un mot qui limite celle-ci aux trois
configurations suivantes :
1.
V
2. VV
3. VC[sonante]
Toute rime qui en surface ne correspond à aucun de ces gabarits est syllabifiée
différemment en structure profonde, ou marquée lexicalement. Examinons les différents cas
possibles :
(165)
-C[obstruante]##
-C[sonante]##
alterne avec
zéro
/p()tit/
fixe
/apid/
alterne avec
zéro
fixe
/pmje/
/sul/
/fil/
V_
syllabifiée en attaque
suivante
lexicalement marquée
VC_
syllabifiée
suivante
/pak/
/takt/
syllabifiée en coda
/film/
attaque
lexicalement marquée
syllabifiée
suivante
lexicalement marquée
en
en
attaque
lexicalement marquée
Si une consonne finale de mot est située juste après une voyelle, deux cas de figure
sont possibles :
62
Je n'entrerai pas ici dans le débat de l'extramétricalité de la consonne : il s'agit là d'un problème marginal par
rapport au but ici recherché. Cf. Prunet (1986) et Tranel (1986, 1995 : 145-146) pour une discussion à ce sujet.
218
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
- si la consonne est obstruante, elle ne correspond à aucun des gabarits de rime finale
possibles, elle est donc flottante. Ainsi sera-t-elle syllabée en attaque suivante le cas échéant,
et donc audible à la liaison mais non en isolation. Dans le cas où l'on entend malgré tout la
consonne en isolation, cela signifie qu'elle est spécifiée comme telle dans le lexique.
- si la consonne est sonante, elle correspond au gabarit (3) et est donc syllabée en coda. De ce
fait, elle est toujours audible. Si ce n'est pas le cas, elle doit être marquée à cet effet dans le
lexique.
Après une consonne, la consonne finale se comporte là encore différemment selon son
mode d'articulation :
- s'il s'agit d'une obstruante, elle est syllabifiée en attaque du mot suivant si celui-ci
commence par une voyelle, et n'est audible en isolation que si elle comporte une marque
lexicale à cet effet.
- s'il s'agit d'une sonante, la coda étant déjà "occupée", elle sera syllabifiée dans l'attaque du
mot suivant et se manifestera donc à la liaison. Si elle est présente en surface également en
isolation, cela indique qu'elle est lexicalement marquée.
La position de Plénat (1987) est originale en ce qu'elle pose comme non marqué le cas
où la consonne obstruante alterne avec zéro, alors que dans toutes les autres analyses c'est
l'alternance qui est considérée comme spéciale, et la fixité la norme.
Le système de Piggott (1991) s'apparente également à celui de Clements & Keyser
(1983) en ce qu'il considère que la consonne flottante est liée à une position squelettale mais
non à une position syllabique. Il a ceci de particulier qu'il permet de distinguer différentes
catégories de langues, non seulement en fonction du fait qu'elles autorisent les consonnes
finales, fixes ou alternantes, mais également en fonction de la position de la consonne dans la
structure de la syllabe : en attaque ou en coda. Ceci n'étant pas directement pertinent ici, je ne
développerai pas le sujet (cf. Tranel 1995b : 149-155 pour une évaluation du modèle dans
cette optique). Signalons enfin que Piggott (1991) considère, comme la phonologie de
gouvernement, qu'une consonne fixe en fin de mot est syllabifiée en attaque d'une syllabe
avec un noyau vide et non en coda de la syllabe précédente.
D'autres modèles ont choisi de ne pas attacher la consonne à une position squelettale et
donc de la représenter comme "complètement" flottante.
219
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.1.2.3.2. La consonne n'est pas attachée à une position squelettale
Sous cette approche, c'est parce que la consonne n'est pas rattachée à la position
squelettale qu'elle n'est de ce fait pas liée au constituant syllabique. L'absence de liaison avec
le constituant syllabique est ainsi une conséquence et non un postulat de départ.
C'est en 1982 qu'a été formalisé l'abandon de toute règle de liaison. Le traitement de la
liaison est réalisé au moyen d'une consonne détachée non seulement du niveau de la syllabe,
mais également de celui des constituants squelettaux : la formulation d'une règle de liaison
devient inutile puisque le rattachement de la mélodie à la position se fait "automatiquement".
Vergnaud (1982) postule en effet que la consonne flottante s'attache directement à la position
vide en attaque de la syllabe initiale du deuxième mot, en vertu des deux principes suivants
(cf. Encrevé 1988a : 96) :
1. toute syllabe comporte nécessairement une attaque et une rime.
2. après application des conventions de liage, les constituants demeurés flottants ne sont pas
réalisés phonétiquement.
Si l'on reprend l'exemple de petit ami, la représentation est donc la suivante :
(166)
C
|
x
|
p
V
|
x
|

C
|
x
|
t
V
|
x
|
i
C
V
|
x
|
a
t
C
|
x
|
m
V
|
x
|
i
Il ne semble pas que Vergnaud (1982) explique la formation du point d'ancrage
squelettal qui doit pourtant intervenir entre la mélodie et le constituant syllabique.
Prunet (1986, 1987 ; cf. également de Jong 1990) défendent une représentation qui
tient à la fois de Vergnaud (1982) et de Clements & Keyser (1983) : tout mot commençant par
une voyelle contient une position attaque sous-jacente, associée à la syllabe. La consonne
alternante n'est liée à aucun matériel squelettal ni syllabique, mais s'adjoint à celui
éventuellement disponible dans le mot suivant :
(167)
σ
x
|
p
σ
x
|

x
|
t
σ
x
|
i
x
t
σ
x
|
a
x
|
m
x
|
i
220
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Dans cette optique, le point squelettal n'est pas généré automatiquement, il est présent
dans la représentation, mais en initiale du second mot et non à la finale du premier.
Hyman (1985) considère également que la consonne de liaison est flottante, c'est-àdire qu'elle n'est reliée ni à une position squelettale, ni encore moins à une position syllabique
puisqu'il se situe dans un cadre moraïque dans le lexique (par exemple Hayes 1989 ; cf.
Tranel 1995b : 161-165, 1995a : 803-804).
Encrevé (1988a) ne rattache pas non plus la consonne au point squelettal, mais celui-ci
est présent dans la représentation du mot, ainsi que le constituant syllabique coda auquel il se
rapporte. Il distingue ainsi (a) les consonnes finales fixes, qui sont rattachés à un point
squelettal, et (b) les consonnes finales flottantes, qui ne le sont pas :
(168)
(a) consonne finale fixe
A
y
|
l
R
|
N
|
y
|
y
A
y
|
s
R
|
N
|
y
|
i
(b) consonne finale flottante
A
C
y
|
d
y
|
p
R
|
N
|
y
|

A
y
|
t
R
|
N
|
y
|
i
C
y
t
En finale absolue, le [d] de lucide, puisqu'il est rattaché dès le lexique à son
constituant squelettal, s'associera avec la seule position disponible : la coda. Le [t] de petit en
revanche, puisqu'il n'est pas associé à sa position squelettale, n'est pas attaché au constituant
syllabique et n'est donc pas réalisé. En effet, selon la Convention universelle d'association des
constituants syllabiques flottants (Encrevé 1988a : 178), "les autosegments A, N et C flottants
ne peuvent s'ancrer que dans des positions du squelette qui sont interprétées segmentalement".
Cette représentation lui permet de rendre compte des liaisons avec et sans
enchaînement : devant une voyelle, la consonne finale flottante s'attache à l'attaque et son
constituant coda est effacé s'il y a enchaînement. En cas de non enchaînement, la consonne
s'attache à sa position squelettale en vertu du paramètre d'ancrage des consonnes finales
flottantes (Encrevé 1988a : 179) selon lequel "en français, une consonne finale flottante ne
peut s'ancrer dans le squelette que si le mot suivant dans la chaîne parlée commence par une
attaque nulle" ; en revanche, la consonne s'associe à sa position coda, et non à l'attaque
suivante, laquelle se voit adjoindre un coup de glotte, puisque selon Encrevé (1988a : 185)
"en français la consonne épenthétique non marquée est []".
221
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
La critique essentielle à porter à l'encontre d'une représentation de ce type concerne les
catégories d'association en phonologie autosegmentale. Dans ce type de cadre en effet,
l'association entre une position squelettale présente dans le lexique et un constituent
mélodique est réputée automatique (cf. Vergnaud 1982). La représentation de la consonne
flottante avec une position squelettale sans que le lien entre les deux soit automatique est donc
un problème et nécessite l'adjonction de conventions supplémentaires (cf. de Jong 1990,
Paradis & El Fenne 1995 : 180).
Se rattache également à cette tendance de ne pas représenter le constituant squelettal
de la consonne flottante la Phonologie de Gouvernement (Kaye & al. 1985, 1988, 1990,
Harris 1990) comme on le constate dans les travaux de Kaye et al. (1988) ou Charette (1988,
1991). La consonne fixe finale de mot est syllabifiée en attaque et non en coda, ce qui
constitue la particularité de ce cadre. Dans ce modèle, comme également pour Paradis & El
Fenne (1991, 1992, 1995), le constituant squelettal n'est présent ni dans le premier mot, ni
dans le second, mais il est créé au cours de la concaténation des deux, par la mise en présence
du constituant syllabique du deuxième mot avec la mélodie du premier. Ceci correspond au
principe de sous-spécification (cf. section I [2] 3.2.2) et plus particulièrement à la Node
Generation Convention d'Archangeli & Pulleyblank (1986 : 75) : "a rule or convention
assigning some feature or node x to some node b creates a path from x to b".
Cette position signifie que la syllabation d'un mot se fait directement en fonction des
segments et non des positions squelettales, ce qui conduira par la suite différents modèles à
supprimer les constituants squelettaux (cadre CVCV, Lowenstamm 1996).
Wauquier-Gravelines (ms) se rattache, dans une étude acquisitionnelle de la liaison, à
l'analyse de Paradis & El Fenne. Elle démontre en effet que dans un premier temps, lorsque
l'enfant "découvre" la contrainte de remplissage des attaques vides ("remplir autant que
possible toutes les attaques de mots vides sur le domaine det + nom pour syllaber l'unité
prosodique" ms : 15), il va avoir recours à l'épenthèse d'une consonne dont la nature est
fonction des contextes dans lesquels le mot a été rencontré, et non des contextes de liaison.
Dans un deuxième temps, il découvre "que le déterminant un relâche une consonne nasale au
féminin, que les adjectifs comme petit, grand, gros relâchent une consonne lors d'opérations
d'inflexion (petite, grande, grosse) ou de dérivation nominale (petitesse, grandeur, grandir,
grosseur, grossir)" (ms : 17) ; c'est alors qu'il encode les consonnes flottantes finales dans les
représentations lexicales et qu'il cesse d'avoir recours à l'épenthèse. Pour Wauquier222
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Gravelines (ms : 17), la contrainte de remplissage des attaques vides résulte alors d'une
stratégie de réparation telle qu'elle a été proposée par exemple par Paradis & El Fenne
(1995)".
Sauzet (1999) s'inscrit dans un cadre multilinéaire particulier mais, comme la plupart
des générativistes, considère que les consonnes latentes figurent dans le lexique.
1.1.1.2.3.3. Critique des modèles multilinéaires
Les modèles multilinéaires reconnaissent et implémentent le statut particulier de la
consonne qui alterne par rapport aux autres consonnes du mot ("une déficience qui les
prédispose à l'effacement", Sauzet 1999 : 73), ce qui constitue un des atouts majeurs de ce
type de cadres phonologiques et une avancée par rapport aux modèles linéaires. Pour autant,
Sauzet (1999 : 72) déplore le fait que cette distinction se fasse au moyen de la suppression
d'une caractéristique de la consonne qui n'est jamais que redondante dans les consonnes
fixes : "la faiblesse principale de l'approche multilinéaire, c'est qu'elle doit poser que le
segment flottant est marqué par l'absence d'une propriété qui est redondante dans les autres
segments".
Un second point fort de ces cadres est qu'ils offrent un traitement unifié des cas de
liaison obligatoire à l'intérieur du groupe nominal. En revanche, ils ne permettent pas de
rendre compte de l'homogénéité de la nature de la consonne de liaison dans certains cas, par
exemple à l'inversion après le verbe (cf. partie III chapitre 10 pour une analyse).
1.1.1.2.4. En théorie de l'Optimalité
La Théorie de l'Optimalité, bien qu'apparue chronologiquement après les cadres
mutlilinéaires, se situe plutôt dans le prolongement direct de la phonologie générative linéaire.
Ainsi, si l'on considère l'article de Tranel (2000) portant notamment sur l'implémentation de la
liaison en OT, constate-t-on qu'il fonde sa critique des analyses précédentes sur les cadres
linéaires, comme l'indique le titre de sa deuxième section : "consonnes finales et schwa :
règles vs. contraintes", et non sur les cadres autosegmentaux. Le paragraphe consacré à
l'analyse de la liaison en phonologie générative non-linéaire n'a qu'une visée purement
informative, il se conclut par : "la question que je laisse en suspens ici est de savoir si la
notion technique de consonne flottante peut ou doit survivre dans la théorie linguistique et en
particulier dans un cadre OT".
223
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Je présenterai ici le modèle de Tranel (2000 : 51-59) afin d'illustrer la formalisation
proposée par la théorie.
Comme je l'ai dit en introduction de cette section, OT ne se préoccupe pas du statut de
la consonne flottante. Il suffit de savoir que la consonne "n'appartient pas en propre au
morphème (...) mais qu'il s'agit, selon les analyses, ou bien d'une consonne finale flottante, ou
bien d'une consonne empruntée au féminin, ou bien encore d'une consonne de déclinaison, en
tout cas d'une consonne lexicalement disponible, mais non intrinsèque" (2000 : 51). La
présence de cette consonne rend l'unité lexicale marquée par rapport à celles qui n'ont pas de
consonne latente, ce qui signifie qu'elle transgresse une contrainte (supplémentaire), mais
cette transgression est moins forte que celle qui consiste à insérer une consonne épenthétique
pure : DEP(C) >> DEP(L).63
Les contraintes MAX garantes de l'emploi de tous les segments offerts par l'input sont
également à l'œuvre ici : MAX(V) pour les voyelles et MAX(C) pour les consonnes.
Une contrainte relative à la résolution d'hiatus doit également intervenir : *VV, même
si "d'autres facteurs que l'évitement d'hiatus sont à l'œuvre et prioritaires" (2000 : 46).
Etant donné les réalisations en surface, la hiérarchie des contraintes est la suivante :
DEP(C), MAX(C), MAX(V) >> *VV >> DEP(L). Le tableau suivant récapitule le traitement des
quatre cas de figure observés en français : (a) réalisation d'une consonne flottante en liaison,
(b) enchaînement d'un mot se terminant par une voyelle avec un mot commençant par une
voyelle, (c) non réalisation d'une consonne flottante devant une consonne et (d) non
réalisation d'une consonne flottante en finale de proposition.
(169)
(a) consonne flottante en liaison
Dep(C) Max(V)
/pti{t} ano/
) a. pœtitano
b. pœtiano
c. pœtano
* ! (i)
d. pœtino
* ! (a)
*VV
(b) enchaînement en V_V
Dep(L)
*
*!
b. çlitano
c. çlano
) a. pœtipano
b. pœtitpano
c. pœtitano
Dep
(C)
Max
(C)
* ! (p)
Ma
x
(V)
Dep(C)
*VV
Max(V)
*VV
*
*!(t)
* ! (i)
d. çlino
(c) non réalisation devant une consonne
/pti{t} pano/
/çli ano/
) a. çliano
* ! (a)
(d) non réalisation en finale
Dep
(L)
*!
*
/(il
est)
pti{t}/
) a. pœti
b. pœtit
Dep
(C)
Max
(C)
Max
(V)
*VV
Dep
(L)
*!
63
Cf. section I [3] 2.2.2 pour les détails des contraintes. Je précise ici simplement que les contraintes DEP
interdisent l'épenthèse : DEP(L) de consonnes latentes et DEP(C) de consonnes fixes.
224
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
L'analyse au moyen de cet ordonnancement de contraintes "permet d'intégrer les cas
de liaison supplétive qui auparavant demeuraient sans analyse véritable" (2000 : 54-55), de
type mon amie vs. ma femme ou ce livre vs. cet ordinateur.
Quatre explications sont proposées par Tranel : une transgression du genre, le recours
à la sous-spécification, une contrainte morphologique plutôt que syntaxique ou l'intervention
d'une contrainte supplémentaire.
Face à deux allomorphes dont l'un est à finale vocalique et l'autre à finale
consonantique, la hiérarchie va préférer le second dans les contextes de liaison, alors même
que dans les termes de Tranel (2000) il y a "transgression de l'accord en genre". La contrainte
exigeant l'accord en genre entre un déterminant et un nom, GENRE[SYN], est alors "battue" par
la contrainte phonologique concernant la résolution d'hiatus. Lorsqu'il n'y a pas d'hiatus, il n'y
a par conséquent pas transgression de *VV, c'est pourquoi c'est GENRE[SYN] qui gère le choix
de l'allomorphe.
(170)
(a) en hiatus
/ma~m{n}
ane/
a. ma ane
) b. m ane
*VV
Genre[Syn]
Dep(L)
*!
*
*
/sœ~s{t}
ano/
a. sœ ano
) b. st ano
*VV
Genre[Syn]
Dep(L)
*!
*
(b) devant consonne
/ma~m{n}
pupe/
)
ma pupe
a.
b. m pupe
*VV
Genre[Syn]
*!
Dep(L)
*VV
/sœ~s{t}
pano/
) a. sœ pano
b. st pano
Genre[Syn]
Dep(L)
*!
L'inconvénient de cette analyse est de mêler contraintes syntaxiques et contraintes
phonologiques, alors que la syntaxe se situe à un niveau différent de la phonologie et ne peut
pas intervenir après elle.
C'est pourquoi Tranel propose en deuxième hypothèse de sous-spécifier le genre
masculin : "supposons que mon et cet(te) soient lexicalement non-marqués pour le genre et
par conséquent compatibles avec des contextes masculins ou féminin, alors qu'au contraire ma
et ce soient lexicalement spécifiés (respectivement [féminin] et [masculin]). Le résultat est
que pour une paire de mots comme ma/mon, seul mon est syntaxiquement compatible avec un
nom masculin, alors que ma et mon sont tous deux syntaxiquement compatibles avec un nom
féminin. On aura donc toujours mon avec un nom masculin quel qu'il soit (décision
225
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
syntaxique), mais avec un nom féminin commençant par une voyelle, mon va correctement
triompher de ma puisqu'il permet d'éviter l'hiatus (décision phonologique)."
Une troisième possibilité serait de faire intervenir la contrainte -COD pour justifier du
rejet des séquences *cet panneau et *mon poupée, la consonne nasale de mon étant considérée
comme formée à partir d'une consonne nasale flottante.
La quatrième solution offerte consiste à considérer que la contrainte portant sur le
genre n'est pas syntaxique mais morphologique, auquel cas le problème de visibilité de la
syntaxe par la morphologie ne se pose plus. Il semble cependant que cette solution soit ad
hoc.
En effet, cette hiérarchie de contraintes permet de rendre compte des phénomènes de
liaison en français, tout du moins de liaison obligatoire, tout comme les autres modèles
postulant la présence de la consonne dans le lexique.
Par ailleurs, elle ne se veut pas ad hoc puisqu'elle s'applique dans une certaine mesure
à l'élision en français, renouant avec l'esprit de la French Truncation Rule de Schane (1968)
déjà réévoquée par Kaye & Lowenstamm (1984).
Cependant, en ce qui concerne l'élision, le maintien de cette hiérarchie ne se fait qu'au
prix du changement de la nature de la voyelle élidée : seul le schwa serait concerné en
français. Tranel (2000 : 59) considère en effet que l'élision ne s'applique qu'au schwa (le, je,
me, te, se, ce (pronom), de, ne, que) et non à la voyelle /a/ dans la (article et pronom). Pour
lui, une séquence comme l'idée ne se conçoit pas comme formée à partir de /la/ et de /ide/
mais de "l'utilisation du masculin le à des fins phonologiques prioritaires". En ce qui concerne
les voyelles fermées [i] et [y] qui s'élident facultativement dans les pronoms qui (le taxi qui
arrive réalisé [ltaksikaiv]) et tu (tu arrives réalisé [taiv]), il affirme les considérer
"comme des cas d'élision véritable" mais n'en tient pas compte dans sa représentation de la
liaison.
Le schwa en français, en tant que voyelle "faible", "c'est-à-dire d'une voyelle qui cède
le pas quand il y a excès vocalique et qui au contraire apparaît par défaut quand il est
nécessaire d'alléger des séquences de consonnes", doit être distingué des autres voyelles par
des contraintes qui lui sont propres et qui seraient classées plus bas dans la hiérarchie que les
contraintes semblables, relatives aux voyelles. En ce qui concerne l'élision, c'est la contrainte
MAX(V) qui se dédouble en l'occurrence : MAX(SCHWA) concerne exclusivement [], MAX(V)
226
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
l'ensemble des autres voyelles. MAX(SCHWA) est placée dans la hiérarchie après MAX(V),
ainsi qu'après la contrainte *VV portant sur l'hiatus (cf. Tranel 2000 : 59-61).
Cependant, cette analyse en Théorie de l'Optimalité n'est pas explicative quant au
statut de la consonne en question, même si elle lui reconnaît bien un statut particulier. Ne
prenant pas position, elle ne prête pas le flanc à l'évaluation de sa validité.
Bonami & Boyé (2003) mettent de plus en évidence que "l'idée de départ, selon
laquelle on peut mettre en compétition contrainte syntaxique et contrainte phonologique, pose
un problème fondationnel pour la Théorie de l'Optimalité" (2003 : 2). En effet, le cadre
théorique suppose une évaluation phonologique d'un candidat syntaxique donné, et non
l'interaction entre syntaxe et phonologie.
1.1.1.2.5. Bilan sur la consonne en fin de premier mot
Postuler la consonne alternante en fin du premier mot permet de rendre compte de la
variabilité de la nature de cette consonne. Cet aspect positif devient cependant une limite au
modèle si l'on considère les cas où précisément c'est toujours la même consonne qui apparaît à
la liaison, par exemple entre un verbe et un clitique donné (parle-t-il [parltil], manges-en
[mz]) ; cet aspect sera plus particulièrement abordé en section III [10] 2.1.
Le progrès notable des cadres de deuxième génération est la prise en compte du statut
particulier de cette consonne dans les représentations lexicales. Les cadres deviennent alors
réellement explicatifs, dans le sens où c'est la structure de la théorie qui permet de justifier les
cas où la consonne apparaît par rapport à ceux où elle n'apparaît pas, alors que les cadres
linéaires proposent un ensemble de règles purement descriptives.
Cette hypothèse de la présence de la consonne en finale du premier mot est
concurrencée, dans certains cas bien circonscrits, par l'alternative consistant à considérer la
consonne comme appartenant au morphème suivant.
227
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.2. La consonne appartient au deuxième morphème
C'est-à-dire qu'elle est présente dès le lexique, et qu'elle est éventuellement effacée par
la suite. On trouve trace de cette idée dès Durand (1936 : 32), pour qui "le féminin se forme
en ajoutant des phonèmes au masculin pris pour base et ce phonème est une consonne".
1.1.2.1. Supplétion
L'hypothèse d'une allomorphie relative à l'initiale du mot a été peu exploitée. Ce sont
essentiellement les travaux sur l'acquisition qui en font état, mais davantage en tant qu'étape
transitoire dans l'apprentissage de la langue que comme résultat définitif dans le lexique d'un
adulte (cf. par exemple Dugua et al. 2003, Dugua, Chevrot & Côté 2003).
Seul Ternes (1977) propose de considérer la liaison comme une mutation
consonantique initiale se présentant sous la forme de divers allomorphes. Selon les termes de
Côté (2003 : 3), il considère en effet que "vowel-initial words have several consonant-initial
variants, selected by the context" : ainsi été aura-t-il les formes [zete], [gete], [nete] ou [tete]
selon qu'il sera employé dans les contextes mauvais été, long été, un été ou grand été.
Dans l'ensemble, l'hypothèse de la supplétion reste minoritaire, même au sein des
analyses postulant la présence de la consonne de transition dans la représentation lexicale du
deuxième mot.
1.1.2.2. Présence de la consonne au niveau lexical, à l'initiale
Côté (2003) considère que les liaisons constatées entre le verbe et le pronom de la
troisième personne en inversion d'une part, entre le verbe et un clitique suivant à l'impératif
d'autre part, sont toutes les deux dues à la présence de la consonne à l'initiale du second mot.
Les pronoms sujets seraient donc dans le lexique /til/, /tl/, /t/, pour respectivement il, elle et
on, et les clitiques /zi/ et /z/ pour y et en. Elle ne précise pas si elle considère la solution de
l'allomorphie plutôt que celle d'un seul morphème pour lequel il faut définir les contextes
d'apparition de la première consonne, mais cite Morin (1979a, b, 1986) pour qui ces
enclitiques sont lexicalisés avec l'initiale (cf. section 3 pour une analyse détaillée de ce
phénomène).
228
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.2.3. La consonne est le deuxième morphème impliqué
Cette hypothèse a été formulée dans deux cas de liaison : après le pluriel dans le
syntagme nominal, et après le verbe dans les pataquès (les liaisons "fautives").
Commençons par le pluriel. Un des premiers sans doute à avoir envisagé cette
éventualité est Gougenheim (1938 : 59-60) qui met en parallèle les séquences un nez aquilin
et des nez aquilins. Dans le premier cas, la liaison entre le substantif et l'adjectif est interdite
(*[œnezakil]) alors que dans le deuxième elle est possible ([denezakil]). Il s'agit alors d'un
élément qui se comporte comme le préfixe de l'adjectif et qui est morphologiquement
conditionné (en plus de la présence nécessaire de la voyelle à sa droite). Pour autant, ce
marqueur n'est pas lexicalisé à l'initiale de chaque adjectif.
Morin & Kaye (1982 : 320-323) reprennent cette analyse et l'étayent au moyen de cas
de liaison mettant en évidence la présence de la consonne à l'initiale du second mot plutôt qu'à
la finale du second. Si l'on reprend par exemple la séquence des marchands de bière anglais
[demardbjrl] réalisée des marchands de bière [z] anglais, le [z] observé ne peut pas
provenir de bière, singulier ; si tel était le cas, l'adjectif anglais serait au féminin : bière
anglaise [lz]. Force est donc de le supposer à l'initiale du second morphème. Le
déclencheur de la présence de la consonne dans la réalisation de surface est flexionnel. "The
presence of a liaison z is still triggered by the lexical head when it is plural because adjectives
agree in number with the lexical head. This is a simple case of agreement, very similar in
nature to the rule which accounts for final s in English verbs as in John sings, and for which
one would not want to postulate a morphophonological rule of epenthesis" (1982 : 323).
Morin (1979a) étend cette idée aux contextes après déterminants pluriels : quatre [z]
enfants, des mini [z] ordinateurs, il y avait trop de [z] enfants.
On pourrait proposer une analyse alternative sous forme d'un morphème de pluriel
discontinu, distribué par un constituant syntaxique situé au niveau de la tête du syntagme
nominal par exemple, ce qui permettrait de rendre compte des pluriels "à distance" (des
marchands de bière [z] anglais) comme des pluriels "multiples" (des armes [z] automatiques
[z] américaines). Il ne s'agirait cependant alors que d'une reformulation de l'hypothèse, qui ne
remet pas en cause le fait que le [z] observé n'est pas présent dans la forme sous-jacente du
premier mot impliqué, mais qu'il appartient bien à un second morphème.
229
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Morin & Kaye (1982 : 323-326) envisagent le même type d'hypothèse pour le [t] qui
apparaît après un verbe dans les pataquès, quelle que soit la personne (j'ai beaucoup [t] aimé,
apprends-moi [t] à parler, c'est pas [t] à moi, faisez-moi [t] un lit, ils m'ont donné [t] un don).
Le [t] ici est réanalysé comme marqueur de verbe (et non de personne, cf. section III [10]
2.4.3), mais n'est pas considéré, au contraire du [z] marqueur de pluriel, comme se rattachant
au mot suivant plutôt qu'au mot précédent, et ce pour les deux raisons suivantes :
- "there is no obvious morphological interpretation for this marker" (1982 : 326) ;
- on n'observe pas selon eux de [t] avant les compléments séparés du verbe ("to the best of our
knowledge such forms do not exist" 1982 : 326) ; pourtant, ils en citent après la négation
(c'est pas [t] à moi), après un complément (ils chantent tous [t] en chœur) ou un adverbe (ça
doit bien [t] être cuit) (1982 : 324).
Bien que l'on puisse objecter à leur exclusion de ce marqueur [t] du complément
suivant, la question du rattachement du marqueur est ici secondaire. Ce qui est essentiel est le
fait que la consonne n'est pas une consonne de liaison à proprement parler, mais un marqueur
à conditionnement partiellement morphologique.
Dans certains cas de "liaison", l'alternance consonne ~ zéro est en réalité due à la
présence d'un marqueur morphologique, dont on peut relever qu'il ne se manifeste qu'à une
frontière syntaxique, devant une voyelle. Le contexte de liaison est ici requis, dans le sens où
l'on n'observe pas la présence de ce marqueur à la finale de proposition ; les deux cas relevés
sont néanmoins en marge du phénomène de liaison propre, puisque intervient un critère
morphologique (au moins dans le cas de [z]) autre que la simple présence d'une frontière ou la
catégorie lexicale des mots en contact.
J'ai passé en revue les analyses postulant la présence de la consonne en finale du
premier mot ou faisant partie de la séquence à droite de la frontière. La troisième possibilité
quant à l'apparition d'une consonne à l'enchaînement entre deux mots est l'épenthèse
consonantique.
1.1.3. La consonne n'appartient à aucun des deux morphèmes
Si la consonne n'appartient à aucun des deux morphèmes mis en contact, force est de
considérer qu'elle est épenthésée.
230
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.1.3.1. Cadre pré-génératif
A ma connaissance, aucun ouvrage ne mentionne la solution de l'épenthèse
consonantique avant l'avènement du cadre génératif. C'est la présence de la consonne dans le
premier mot en jeu dans la liaison qui était privilégié jusqu'alors.
1.1.3.2. Cadre génératif linéaire
C'est Klausenburger (1974, également 1976, 1977, 1978a, b) qui le premier tente de
proposer une règle d'épenthèse plutôt que de troncation (ce qu'avait explicitement rejeté
Schane 1973b). A l'époque où cet article est écrit, la FTR est encore populaire, et il entend
considérer la liaison et l'élision comme deux procédés différents, afin de ne pas postuler de
règles opaques. Les morphèmes dans le lexique contiennent une consonne finale quand elle
est fixe et non quand elle alterne avec zéro à la liaison. La consonne n'apparaît dans ce
deuxième cas que par l'action d'une règle d'épenthèse conditionnée par la présence d'une
voyelle, la règle Liaison étant de ce fait de la forme suivante : ø Æ C / _ V
Klausenburger entend par là soutenir la notion d'inversion de règle proposée par
Vennemann (1972) : le mécanisme d'élision de consonne attesté historiquement dans la
liaison a fait place en synchronie à un mécanisme d'épenthèse. Cependant, il n'est pas plus en
mesure d'implémenter les liaisons facultatives que les partisans d'une forme de base contenant
la consonne (Schane 1968, Dell 1970, 1973, Selkirk 1972, 1974, etc.), et n'explicite
aucunement la façon dont les consonnes insérées reçoivent leur mélodie, alors que celle-ci
n'est pas prédictible.
Tranel est le second chantre de l'épenthèse dans le cadre des consonnes flottantes. Au
contraire de Klausenburger, il précise systématiquement la mélodie de la consonne insérée,
que ce soit après voyelle nasale (1974a, 1978), après un pluriel (1976), après un adjectif
(1978), ou dans tous les cas d'alternance consonne ~ zéro. Pour être précise, la règle
d'épenthèse duplique la frontière morphologique et insère la consonne observée à la liaison
entre les deux frontières, comme dans la règle d'insertion de n suivante (1974a ; cf. également
1981 : 240) :
231
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(171)
V
+nasal
[-seg]
V
1
2
3
Æ
1
2
n
2
3
Les règles d'épenthèse qu'il propose contiennent le cas échéant des informations
relatives à la syntaxe tout en conservant les frontières morphologiques, comme on peut le
noter dans la règle d'insertion de [r] après un infinitif (1981 : 234) :
(172)
e
Verb
#
[+ syll]
2
3
+ infinitive
+ first conjugation
1
Æ
1
2
r
2
3
Signalons enfin la position de Tranel (1981 : 210-221) dans le traitement de la liaison
en [z] dans le groupe nominal (les enfants [lzf]) que l'on a observé notamment chez Kaye
& Morin (1982) : [z] "cannot be systematically present, underlyingly, owing to a spelling rule
rewriting the feature [+Plural]. Instead, it must be inserted only when it is actually present on
the surface", c'est-à-dire après les substantifs, les adjectifs, les déterminants pluriels (les, des,
aux, ces, mes, tes, ses, nos, vos, leurs), les quantifieurs (certains, plusieurs, etc.) et les
pronoms personnels pluriel (nous, vous, les, ils, elles), ce qui est défini par la règle d'insertion
suivante :
(173)
X
#
[+syll]
2
3
[+plural]
1
Æ
1
2
z
2
3
Le pronom pluriel leur ne suivant pas cette règle, il est marqué en conséquence dans le
lexique. Par ailleurs, cette règle exclut les verbes, sans que Tranel (1981) explicite ce rejet
dans la formulation de la règle64.
Par ailleurs, il propose de remplacer le conditionnement en nombre de frontières
proposé par Selkirk (1972, 1974) par une considération de la cohésion syntactique entre les
64
Il mentionne cette limite de sa règle tout en indiquant qu'un cadre supposant un morphème pluriel /z/ rencontre
le même problème : "in the framework of the systematic plural-suffix hypothesis, the spelling rule that rewrites
[+Plural] as /z/ has to be similarly constrained" (1981 : 217).
232
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
mots, avec une influence du style. Cette approche a l'avantage "over the word-boundary
solution of capturing directly the genuine relation that exists between the syntax/style and the
phonology" (1981 : 219) ; cependant, elle n'est pas formalisée au sein de la règle autrement
que, précisément, par une frontière morphologique.
Mentionnons également Schane (1978). Son point de vue est en réalité à mi-chemin
entre la consonne lexicale et l'épenthèse, dans le sens où il propose de considérer qu'il y a
épenthèse, mais d'une consonne précisée comme "épenthésable" pour chaque entrée lexicale :
le (t) de /pti(t)/ par exemple. A partir du moment où la consonne est dans le lexique, il
semble que considérer qu'il puisse s'agir d'une épenthèse relève davantage de l'artefact
notationnel que d'un réel changement de pensée de sa part.
Van Ameringen (1977) se penche sur le problème de la représentation des liaisons
facultatives par rapport aux liaisons obligatoires, et propose des règles de "réajustement de
bornes" pour en rendre compte. Dans les deux cas – liaison obligatoire ou facultative, les
consonnes de liaison sont épenthésées et non présentes dans le lexique.
Dumas (1978) s'intéresse à la liaison de pluriel à l'intérieur du syntagme nominal,
celle-là même qui a été analysée par Kaye & Morin (1978, 1982) comme résultant de
l'insertion d'un marqueur de pluriel et par Tranel (1981) comme une épenthèse conditionnée
par la syntaxe et le style. S'opposant à Schane (1968) et aux travaux subséquents, il reproche à
la théorie de la troncation de se baser sur des raisons historiques et graphiques, ainsi que de
supposer facultative une liaison qui est en réalité "exceptionnelle et marginale" (1978 : 87). Il
propose donc une règle d'insertion qui "insèrera à la fin des adjectifs préposés un segment [z],
pourvu que le constituant suivant (adjectif ou nom) soit à initiale vocalique, l'application de la
règle étant déclenchée par la présence dans le SN d'un déterminant pluriel" (1978 : 92). Cette
règle d'épenthèse s'accompagne d'une règle de troncation, de portée plus vaste et moins
"hétéroclite" (1978 : 96) que celle de Schane, selon laquelle "la finale consonantique
s'effacera devant l'initiale consonantique du mot suivant et à la fin de tout syntagme" (1978 :
98).
233
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
L'analyse par épenthèse de l'alternance consonne ~ zéro a pour ambition de rendre
compte de l'unité de certains types de liaison, en particulier celle intervenant dans un groupe
nominal pluriel, sans poser de morphème de pluriel. Elle vise également à mieux représenter
la différence entre liaison obligatoire et liaison facultative.
En réalité, ce sont surtout des considérations théoriques portant sur le rejet de la
présence d'une consonne en finale, non prononcée dans certaines conditions, qui conduisent à
postuler des épenthèses. Mais dans ce cadre linéaire, le remède semble pire que le mal et les
règles d'insertion au moins aussi ad hoc que celles de troncation.
Tournons-nous à présent vers le traitement par épenthèse proposé dans les modèles
multilinéaires.
1.1.3.3. Cadre génératif multilinéaire
Dans un cadre multilinéaire, postuler une épenthèse revient à insérer une position
squelettale (cf. Tranel 1995b : 140-142). D'après Encrevé (1988a : 184), une "vraie"
épenthèse "augmente le nombre des places du mot", c'est-à-dire qu'elle consiste à ajouter une
position squelettale, alors qu'une "fausse" épenthèse "se borne à interpréter une position du
squelette déjà présente au niveau lexical".
L'analyse proposée par Wetzels (1987) entre dans le cadre d'une "vraie" épenthèse
selon les termes d'Encrevé. Wetzels (1987 : 300) propose de considérer la liaison comme
l'assignation d'un "timing slot to a floating consonant before a vowel-initial word" au moyen
de la règle Liaison formalisée de la manière suivante :
(174)
Æ
ø
C
/
__
V
(within the appropriate domain)
|
[+cons]
[x]
Le cadre multilinéaire permet dans cette optique de profiter des avantages de la
présence de la consonne dans le lexique sans les inconvénients relatifs à son élision le cas
échéant.
Cependant, cet aspect positif n'est valable que dans le cas où l'on compare l'approche
de Wetzels avec celle postulant la position squelettale attachée à la consonne flottante, comme
Clements & Keyser (1983) par exemple (cf. section 1.1.1.2.3.1). Dans ces modèles en effet,
234
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
les consonnes finales, extrasyllabiques, qui ne sont pas syllabifiées par le processus de liaison,
ne sont pas réalisées et doivent donc être élidées par règle. Wetzels, en ne posant que le
segment flottant et non la position squelettale associée, n'a pas besoin de recourir à une règle
la concernant ; en ce qui concerne la mélodie, "just like floating tones, untimed matrices are
eliminated by convention" (1987 : 301). Ce même résultat est obtenu par les approches ne
postulant précisément que le segment flottant et non la position squelettale (cf. section
1.1.1.2.3.2). Par ailleurs, ces dernières sont plus explicatives que l'hypothèse de Wetzels, dans
le sens où ce n'est pas une règle, aux contours morphologiques par ailleurs mal définis
("within the appropriate domain"), qui justifie de l'intrusion d'une consonne, mais c'est la
structure elle-même qui la requiert. L'analyse de Wetzels se montre plus fine que les autres
cependant en ce qu'elle ne fait pas intervenir uniquement un facteur phonologique (en
l'occurrence la structure de la syllabe) comme conditionnement de l'apparition de la consonne
sous-jacente.
Dans le domaine de l'acquisition, Kilani-Schoch (1983) et plus récemment Côté (2003)
considèrent certains cas de liaison comme relevant du phénomène de l'épenthèse plutôt que de
la présence d'un segment sous-jacent.
Côté (2003) défend l'hypothèse de l'épenthèse consonantique à la liaison entre adjectif
et substantif sur la base de recherches en acquisition (Chevrot & Côté 2003, Dugua, Chevrot
& Côté 2003, Dugua 2002, Chevrot 2001, Chevrot & Fayol 2000, 2001) sur des enfants de 2 à
5 ans (cf. compte-rendu de Wauquier-Graveline ms. en section 1.1.1.2.3.2), mais également
des caractéristiques acoustiques (Delattre 1940, Dejean-De-La-Batie 1993, Spinelli et al.
2003) des consonnes : les consonnes épenthétiques à la liaison sont plus courtes que les
consonnes fixes.
1.1.3.4. Bilan sur l'épenthèse
Dans le cadre de la liaison, l'épenthèse semble globalement se révéler une solution
moins satisfaisante que de supposer la consonne sous-jacente. En effet, la nature de la
consonne sous intérêt est à spécifier à chaque fois, puisque dans la plupart des cas de liaison
elle n'est pas prédictible par le contexte, ni phonologique, ni morphologique, ni syntaxique.
De plus, l'appel à une règle d'insertion n'est pas explicatif mais uniquement représentationnel.
Dans les cas où l'apparition de la consonne est liée à une contrainte syntaxique, i.e.
quand elle apparaît à la liaison dans un contexte pluriel, l'épenthèse pourrait permettre de
235
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
rendre compte de l'invariabilité de la nature de la consonne, mais rien n'autorise à privilégier
cette solution à celle qui consiste à voir en la consonne intrusive une marque morphologique.
1.1.4. Bilan sur les analyses antérieures de la liaison
Cette section a passé en revue les diverses analyses proposées de la liaison qui
justifient la présence vs. l'absence d'une consonne entre deux mots, devant une voyelle.
L'hypothèse la plus fréquemment formulée, dans la majorité des cas de liaison,
consiste à considérer que la consonne est présente à la finale du mot situé à sa gauche. Ce sont
les limites du modèle linéaire qui ont conduit à réenvisager la solution de la supplétion de
bases étudiée par certains linguistes non génératifs ; d'autres ont préféré la solution de
l'épenthèse de façon à ne faire figurer dans le lexique que les éléments observables en surface.
Toutefois, la supplétion n'est pas explicative en soi et l'épenthèse, dans le cadre de la liaison,
se heurte au problème de la nature de la consonne épenthésée, non prédictible.
L'avènement des modèles multilinéaires a relancé le débat, en permettant de séparer la
mélodie des niveaux squelettal et syllabique. L'hypothèse considérant que la consonne
appartient au premier morphème y a gagné en explicativité : la consonne alternante acquiert le
statut particulier auquel son comportement lui permet de prétendre, et les cas de liaison
(obligatoire) découlent de la bonne formation de la structure et non de règles. Pourtant,
l'hypothèse de l'épenthèse ou de l'appartenance de la consonne au morphème situé à sa droite
ne sont pas évacuées, car certains problèmes restent en suspens lorsque l'on considère que la
consonne appartient au premier morphème :
- pourquoi les consonnes alternantes sont-elles majoritairement des coronales ?
- pourquoi dans certains cas la consonne de liaison apparaît-elle devant le deuxième
morphème, alors que celui-ci est séparé du premier (des marchands de sucre [z] anglais) ?
- pourquoi trouve-t-on systématiquement [t] à l'inversion du sujet devant les pronoms il, elle
et on et non devant une préposition ou un article ?
Dans l'hypothèse de la présence de la consonne flottante en finale du premier
morphème, c'est essentiellement le facteur phonologique structural qui est pris en compte : il
y a liaison lorsque l'attaque du second mot est vide. Ceci met alors sur un pied d'égalité les
liaisons obligatoires et les liaisons facultatives et fait passer au second plan les motivations
syntaxiques, morphologiques ou stylistiques. C'est ce qui permet aux générativistes de cette
tendance d'unifier sous une même hypothèse explicative l'ensemble des phénomènes
236
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
d'alternance consonne ~ zéro, à savoir les cas de liaison, de flexion ou de dérivation. Cette
unification sert de justification pour rejeter une analyse par épenthèse de l'un ou l'autre de ces
phénomènes, faisant fi des cas particuliers tels que la "liaison post-verbale" pour laquelle je
propose une analyse différente dans la partie III, au chapitre 10.
S'il est vrai que l'on peut difficilement représenter au niveau phonologique les facteurs
stylistiques qui sous-tendent la réalisation d'une consonne de liaison facultative, la théorie doit
néanmoins être en mesure de rendre compte des liaisons obligatoires comme des liaisons
interdites. Les mots commençant par un h aspiré, qui interdit toute liaison, ont de ce fait
beaucoup été étudiés.
Afin d'établir ce que la théorie doit réussir à implémenter, récapitulons les différents
cas de liaison possibles en français, ainsi que leur statut en termes "d'obligation de
réalisation".
1.2. Liaisons obligatoires, facultatives et impossibles
Etablir une partition entre liaisons obligatoires, liaisons facultatives et liaisons
interdites n'est pas une entreprise aisée ; en effet, la plupart des travaux sur la liaison
envisagés dans ces termes sont à visée normative (Fouché 1961, Grevisse 1993) ou
pédagogique (par exemple Abry & Chalaron 1994, Mauger 1968, Chevalier et al. 1964) et ne
reflètent pas toute la variation que connaît ce phénomène de la liaison, tant régionale que
stylistique. Grevisse (1993 : 48) lui-même prend des précautions et fournit une liste des
liaisons "généralement considérées comme obligatoires" ou "généralement recommandées"
plutôt qu'un classement absolu. Tranel (1981 : 223) propose un classement en termes de
liaison obligatoire, facultative ou interdite. Le projet Phonologie du Français Contemporain
(PFC), dont l'un des buts est précisément d'établir les contextes de liaison au moyen
d'enquêtes circonstanciées, envisage les trois catégories sous l'angle de la liaison catégorique,
variable et erratique. Malheureusement, la publication des premiers résultats des enquêtes
menées sur le terrain ne sont pas encore disponibles au moment de la rédaction de cette thèse.
C'est pourtant uniquement au moyen d'une enquête de grande ampleur comme celle du PFC
que l'on obtiendra une réelle partition des liaisons en français actuel.
Il ne s'agit donc pas ici d'établir une liste ferme des contextes de liaison obligatoires ou
interdits, mais plutôt de recenser les tendances générales concernant tel ou tel type de liaison.
Par ailleurs, les expressions figées et les locutions (petit à petit [ptitapti], de mieux en
237
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
mieux [dmjøzmjø], mot à mot [motamo], vis-à-vis [vizavi], etc. vs. pots à tabac [poataba],
moulins à vent [mulav]), en ce qu'elles concernent une liaison figée (obligatoire ou
interdite) à l'intérieur d'une unité lexicale, ne sont pas considérées ici.
Je distinguerai ici deux cas, selon que la liaison s'établit dans un contexte "pluriel"
(1.2.1) ou singulier (1.2.2.). On pourrait objecter à ce classement qu'il fait intervenir un
phénomène de flexion dans une partie consacrée à la liaison. En réalité, il s'agit bien de liaison
puisque l'alternance entre la présence vs. l'absence de consonne se manifeste entre deux mots
et non à la finale absolue, comme dans les cas de flexion du français répertoriés ici. Toutefois,
en ce qui concerne les liaisons après un "pluriel", il est vrai que l'on suppose la présence d'un
morphème particulier, comme il l'a été suggéré dans l'analyse de Morin & Kaye (1982) par
exemple, et comme on va le voir dans la section suivante.
1.2.1. Après un "pluriel"
Le tableau ci-dessous rappelle les cas pertinents ici, en fonction du premier mot
entrant en jeu. Les deux dernières colonnes du tableau permettent de distinguer les liaisons
obligatoires, les liaisons interdites et les liaisons facultatives (qui ne sont ni obligatoires, ni
interdites).
(175)
après adjectif
après
substantif
contexte
C
adjectif _ nom
z
gentils maris / gentils enfants
nom _ adjectif
z
athlètes français / athlètes américains
z
verbe _ préposition
après verbe
t
auxiliaire
participe
_
t
illustration
liaison
obligatoire
9
liaison
interdite
nous vivons dans le luxe / nous vivons à
Paris
ils chantent dans une chorale / ils chantent
en chœur
ils ont mangé / ils ont appelé
Sont ici regroupés les cas de pluriels au sens "classique", c'est-à-dire concernant les
substantifs et les adjectifs, et les cas de pluriels de personnes verbales, qui ne correspondent
pas nécessairement à un pluriel dans les faits (cf. le nous rhétorique ou le vous de politesse).
Ce dernier cas sera cependant réévalué lors du traitement des formes singulier du verbe dans
la section suivante.
238
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Comme on peut le constater dans ce tableau, seules deux consonnes sont possibles à la
jonction entre les deux mots impliqués : [z] et [t]. Pour autant, seul [z] est obligatoire, à la
liaison entre un adjectif et un substantif (dans cet ordre), donc à l'intérieur du syntagme
nominal.
1.2.2. Après un singulier
Là encore, le tableau récapitulatif est classé en fonction de la catégorie lexicale du
morphème situé à gauche de la liaison : adjectif, substantif ou verbe comme dans le tableau
précédent, mais également adverbe avec une subdivision selon qu'il s'agit d'un adverbe en ment ou non, et après les clitiques : déterminants, prépositions, pronoms.
Les contextes pertinents sont issus des manuels et articles abordant le phénomène de la
liaison ainsi que de mes propres observations, de même que le classement en termes
d'obligation ou d'interdiction de la liaison.
(176)
contexte
après adjectif adjectif _ nom
qualificatif
(vs. nom _ adjectif)
après
substantif
C
illustration
t
t
z
g
r
petit copain / petit ami
fort taux / fort accent
gros castor / gros écureuil
long printemps / long été
premier train / premier invité
savant français / savant anglais
loup dangereux / loup inutile
loup courbatu / loup enragé
le chat arrive
le chat et la souris
très demandé / très attendu
pas demandé / pas attendu
très faim / très envie
pas faim / pas envie
fort tard / fort envie
très gentil / très aimable
fort gentil / fort aimable
trop tard / trop important
bien tard / bien aimable
extrêmement peur / extrêmement envie
extrêmement gentil / extrêmement aimable
spontanément à l'esprit
directement en enfer
les parents / les enfants
les petits / les anciens amis
dans deux heures / dans une heure
nom _ adjectif
t
nom _ participe
nom _ verbe
nom _ conjonction
adverbe _ participe
/ adjectif
v
t
t
z
z
z
z
t
z
t
p
n
t
t
adverbe
après adverbe
substantif
de négation ou
de degré
_
adverbe _ adjectif
adverbe_substantif
après adverbe adverbe _ adjectif
autre
adverbe
_
préposition
après
déterminant
_
déterminant
substantif / adjectif
après
préposition
_
préposition
déterminant
t
z
z
après adjectif
numéral
k
t
z
après pronom
pronom _ verbe
sujet
z
cinq cents / cinq enfants
huit cents / huit enfants
dix copains / dix enfants
nous prenons / nous avons
ils prennent / ils ont
liaison
obligatoire
liaison
interdite
9
9
9
9
9
9
9
9
9
239
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
pronom _ pronom
pronom Pe3 _
préposition
(interrogation)
pronom Pe3 _
participe
(interrogation)
pronom Pe3 _
infinitif
(interrogation)
pronom Pe3 _
pronom
(interrogation)
pronom Pe6 _
préposition
(interrogation)
pronom Pe6 _
participe
(interrogation)
pronom Pe6 _
infinitif
(interrogation)
pronom Pe6 _
pronom
(interrogation)
pronom Pe 4 & 5 _
préposition
(interrogation)
pronom Pe 4 & 5 _
participe
(interrogation)
pronom Pe 4 & 5 _
participe
(interrogation)
pronom Pe 4 & 5 _
pronom
(interrogation)
après pronom pronom _ verbe
complément
pronom _ pronom
après pronom
relatif
dont,
pronom _ pronom
conjonction
quand
après pronom
pronom _ verbe
interrogatif
pronom
_
préposition
après pronom
indéfini
pronom _ verbe
après pronom
pronom _ verbe
possessif
après verbe
verbe _ adjectif
z
nous y allons, ils en prennent, à vous en
croire
qu'a-t-on à faire
9
9
n
qu'a-t-on acheté
9
n
que doit-on acheter
9
n
que peut-on y faire
9
n
t
qu'ont-ils à faire
qu'ont-elles à faire
9
t
qu'ont-ils acheté
qu'ont-elles ignoré
9
t
que doivent-ils acheter
que peuvent-elles imaginer
9
t
que peuvent-ils y faire
combien peuvent-elles en demander
9
z
qu'avons-nous à faire
qu'avez-vous à faire
z
qu'avons-nous oublié
qu'avez-vous étudié
z
que devons-nous étudier
que pouvez-vous apprendre
z
z
z
t
t
n
n
t
z
n
t
z
verbe _ adverbe
z
verbe _ clitique
(impératif)
z
que pouvons-nous y faire
que pouvez-vous en attendre
combien pouvez-vous en demander
il nous prend / il nous entend
il nous en prend
quand nous venons / quand il vient
dont nous venons / dont il vient
9
9
quand est-il parti
comment ouvrir la fenêtre
chacun à son tour
chacun aura
tout ira bien, tout arrive
plusieurs iront
le mien ira
il est français / il est (c'est) anglais
je suis français / je suis anglais
vous chantez bien / vous chantez
agréablement
manges-en
9
9
9
9
9
9
240
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
verbe _ clitique +
infinitif
verbe _ préposition
verbe _ préposition
(impératif)
verbe _ clitique
(inversion)
infinitif
_
préposition
infinitif
_
déterminant
auxiliaire
_
participe
z
t
z
t
r
r
t
va en avoir des nouvelles
va y mettre de l'ordre
il vient à la maison
mange en cuisine
mange-t-il
9
9
9
chanter en chœur
donner un espoir
il est venu / il est arrivé
1.2.2.1. Liaison facultative
Du fait précisément de la fluctuation de sa réalisation, je ne traiterai pas la liaison
facultative dans le détail. Le rôle d'une théorie phonologique à son égard est d'être en mesure
d'attribuer une position structurale pour l'éventuelle consonne attestée, et non de prédire dans
quelles circonstances la liaison sera effectuée. Ceci dépend en effet de facteurs sociologiques,
sémantiques, stylistiques, fréquentiels et contextuels que la théorie phonologique ne doit pas
représenter.
Cela est particulièrement vrai en ce qui concerne l'adverbe, la nature même de chaque
adverbe semblant constituer un premier facteur déterminant (la liaison dans très envie
[trzvi] semble bien plus fréquemment attestée que celle de fort envie [fçrtvi] par
exemple). Après une préposition, après le pronom dont ou la conjonction dans, la variation est
également la règle. Après le verbe à l'infinitif, il est possible de réaliser un [r] de liaison bien
qu'il soit loin d'être obligatoire.
La variation s'observe enfin après le verbe non infinitif, l'adjectif ou certains pronoms
sujets dans des cas définis.
1.2.2.2. Liaison obligatoire
Certaines liaisons sont données obligatoires par les grammaires sans que cela soit vrai
pour tous les registres.
Ainsi après la conjonction quand et le pronom relatif dont, la liaison est-elle réputée
obligatoire : quand [t] il arrivera, la femme dont [t] il te parle. Pourtant, ces séquences sont
possibles sans cette consonne de transition, pour certains locuteurs ou dans des conditions
stylistiques particulières : quand [ø] il arrivera, la femme dont [ø] il te parle.
241
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
De même, après certaines prépositions (en, dans, chez, sans, sous) la liaison est-elle
réputée obligatoire, mais là encore les attestations montrent qu'il s'agit plus de norme
prescriptive qu'objective : chez [z] un ami peut être réalisé chez un ami. Il semble donc qu'on
ne puisse attribuer de caractère impératif concernant la liaison pour l'ensemble de la catégorie
lexicale, et qu'il faille là, éventuellement, considérer chaque adverbe ou chaque préposition
particulièrement.
Je distinguerai ici les liaisons obligatoires à l'intérieur des syntagmes ou à la frontière
entre deux syntagmes.
1.2.2.2.1. A l'intérieur du syntagme nominal
Les liaisons entre déterminant et adjectif ou déterminant et substantif sont obligatoires,
ainsi qu'après un adjectif numéral. En revanche, ce n'est pas le cas entre un adjectif et un
substantif (dans cet ordre), et contrairement à ce qui est supposé dans la plupart des modèles
génératifs (par exemple Tranel 1986 : 326) : selon mes propres observations, la liaison semble
facultative et non obligatoire, en tout cas pour certains locuteurs qui pourront parler d'un petit
immeuble tout comme d'un petit [t] immeuble par exemple. L'exemple favori de liaison
"obligatoire" dans ce contexte, à savoir petit ami, semble lexicalisé avec la consonne de
liaison et non le produit de la concaténation synchronique de deux items distincts du lexique.
Si des observations à grande échelle confirment cette impression, cela signifierait que même
les cas de liaison "obligatoire" pris en exemple dans les théories génératives ne seraient pas
uniquement dus à des facteurs phonologiques. Signalons en outre que les cas de liaison après [] sont bloqués : un fort accent n'est jamais réalisé avec la consonne de liaison (un fort *[t]
accent).
Il est possible d'établir une gradation dans les sons les plus fréquemment observés
entre adjectif (non numéral) et substantif en liaison, sur la base d'observations il est vrai non
systématisées : [t] et [z] arriveraient en tête, la liaison avec [r] ou [g] étant peu attestée en
regard. Il s'agirait donc des coronales, et plus particulièrement des coronales obstruantes, [t]
étant la moins marquée de toutes.
Tournons-nous à présent vers la liaison à l'intérieur du syntagme verbal, qui est plus
particulièrement celle sous intérêt dans ce chapitre.
242
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.2.2.2.2. A l'intérieur du syntagme verbal
Je distinguerai ici deux sites de liaison obligatoire potentiels : entre verbe et clitique, et
entre pronom complément et verbe. En revanche, à l'intérieur de la forme verbale même, c'està-dire entre auxiliaire et participe, la liaison est facultative (il est [t] allé ou il est allé).
Si la liaison semble interdite devant préposition (il vient *[t] à la maison), elle est
cependant obligatoire avant un pronom de troisième personne (mange-t-il [mtil], fait-on
[ftç], prend-elle [prtl]) et avant les pronoms cliticisés en65 et y (fais-en [fz], vas-y
[vazi]). Cela indique que le site [verbe _ pronom] est particulier en regard de la liaison, qu'il
s'agisse de pronoms sujets ou de pronoms compléments. Je proposerai une analyse de ce type
de "liaisons" en partie III chapitre [10], prenant en compte cette particularité.
Le site inversé, à savoir entre pronom complément et verbe, est tout aussi intéressant.
Là encore en effet, la liaison revêt un caractère impératif, en l'occurrence obligatoire : il nous
[z] entend est la seule réalisation possible, la séquence sans liaison (*[ilnut]) semble
inattestée.
1.2.2.2.3. Entre deux syntagmes
"Dans la langue contemporaine, la liaison est en régression : on lie seulement à
l'intérieur d'un groupe" affirment Chevalier & al (1964 : 24). Près de quarante ans après ces
propos, est-il vrai que la liaison entre deux groupes a disparu ?
La position entre deux syntagmes concerne soit deux syntagmes indépendants reliés
par un élément de coordination, qui bloque la liaison (le chat *[t] et le chien, il est petit *[t] et
malingre), soit par la position entre sujet et verbe.
Dans ce dernier cas, il y a lieu de distinguer deux situations, selon que le sujet est ou
non pronom personnel.
Si le sujet est un pronom personnel, la liaison est obligatoire, tout comme l'est celle
entre pronom complément et verbe (cf. section 1.2.2.2.2) : on [n] ira, nous [z] allons, vous [z]
aurez, ils [z] utilisent, elles [z] estiment. Ce n'est donc pas la nature de la frontière syntaxique
qui est déterminante ici, mais les catégories lexicales des éléments en contact : pronom
personnel et verbe, dans cet ordre.
65
Mais pas avant la préposition en : mange *[t] en cuisine.
243
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Lorsque le sujet n'est pas un pronom personnel, plusieurs cas sont répertoriés.
L'observation de la liaison lorsque le sujet n'est pas un pronom personnel mais un pronom
d'une autre catégorie soutient l'hypothèse de la relation particulière entre catégories lexicales
plutôt qu'entre positions relatives au syntagme. La liaison est en effet interdite si le sujet est
un substantif (le chat *[t] arrive), ou s'il s'agit d'autres types de pronoms que personnels :
possessifs (le mien *[n] est là), pronoms indéfinis singulier de sens affirmatif (quelqu'un *[n]
est venu, chacun *[n] a un rôle) ; pour les pronoms interrogatifs, il est plus difficile d'établir
une règle fixe (comment *[t] iras-tu à la gare ?, comment *[t] allons nous venir ? mais
comment [t] irez-vous à la gare ?), mais il semble que l'on puisse voir dans la nonhomogénéité de traitement une particularité de la relation entre comment et la cinquième
personne du verbe aller, probablement due à la tournure comment allez-vous.
A l'intérieur du syntagme verbal, c'est donc le contact entre un pronom personnel et un
verbe qui est source de l'obligation de liaison. Dans la section suivante, je m'intéresse aux cas
de liaison interdite.
1.2.2.3. Liaison interdite
Sans qu'il soit question de catégorie ou d'une quelconque frontière syntaxique, on
observe qu'une consonne de liaison n'est jamais réalisée lorsqu'elle se situe après [] : *un fort
[t] accent, *c'est fort [t] important.
En dehors de ce cas particulier, l'interdiction de liaison s'observe dans trois sites :
après un substantif, après un pronom sujet et après un verbe. Ce contexte de gauche n'est pas
toujours suffisant à caractériser la position de liaison.
1.2.2.3.1. Après substantif
Le substantif n'est jamais suivi de liaison, qu'il se situe à l'intérieur d'un syntagme
nominal devant adjectif (savant *[t] anglais) ou participe (loup *[p] enragé), ou à la frontière
entre les deux syntagmes, devant le verbe (le chat *[t] arrive) comme devant une conjonction
(le chat *[t] et la souris). C'est donc bien sa nature de substantif et non la relation syntaxique
entre les éléments qui détermine l'apparition, ou en l'occurrence ici la non-apparition, de la
liaison.
244
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.2.2.3.2. Après pronom sujet
Les sections 2.2.2.2.2 et 2.2.2.3.1 ont établi l'obligation de liaison entre pronom
personnel et verbe. Il existe pourtant un cas où la liaison après pronom personnel non
seulement n'est pas obligatoire, mais est même interdite : à l'interrogation, quel que soit le mot
suivant (participe, infinitif, pronom, préposition), pour les personnes 3 et 6 : qu'a-t-on *[n] à
faire, que doivent-ils *[z] acheter, que peut-on *[n] y changer, qu'ont-elles *[z] appris. En ce
qui concerne les personnes 4 et 5, la liaison est possible mais non obligatoire : qu'avons-nous
[z] à faire, que devez-vous [z] acheter, que pouvons-nous [z] y changer, qu'avez-vous [z]
appris.
Il semble qu'ici la syntaxe reprenne ses droits, et qu'elle soit suffisamment puissante
pour passer outre la catégorie du pronom dont nous avons pourtant vu la force en ce qui
concerne la liaison obligatoire. Faut-il voir dans cette interdiction de liaison un effet de
l'inversion du sujet, dont nous avons vu le caractère particulier – mais dans l'autre sens – en ce
qui concerne la troisième personne ?
1.2.2.3.3. Après verbe : devant préposition ou déterminant
Je m'en tiendrai ici aux verbes conjugués au présent de l'indicatif, qui "ne contient
aucun autre segment formel que celui du radical et celui de la personne" (Touratier 1996 : 36).
Les autres temps pouvant être marqués par des morphèmes spécifiques, je ne les aborderai pas
dans le cadre de ce panorama général de la liaison.
Entre un verbe (au singulier) et une préposition, la liaison n'est pas interdite mais
semble cependant fortement marquée (il part [t] à l'école, elle court [t] à perdre haleine, je
viens [z] en retard, tu entres [z] au couvent), et ce même si la préposition introduit un
complément du verbe (tu dis [z] à ton frère). Je reviendrai sur ce type de "liaison" en section
III [10].
La situation est la même devant un déterminant : il part [t] un peu vite, je cours [z] un
cent mètres, tu prends [z] un café, il faut [t] un peu travailler sont possibles par exemple.
Les sections 1.2.2.1 à 1.2.2.3 ont permis de mettre en évidence les particularités de
certaines classes d'unités lexicales dans leurs rapports face à la liaison. La section suivante en
propose un récapitulatif.
245
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.2.2.4. Récapitulatif par catégorie lexicale du premier terme
Le traitement est rarement uniforme pour une catégorie lexicale donnée, aussi faut-il
souvent préciser davantage que la simple catégorie lexicale.
En ce qui concerne les pronoms, il faut distinguer différents cas : après le pronom sujet
la liaison est obligatoire, sauf dans les tournures interrogatives où elle est au contraire
interdite, et ce, même si le pronom est situé devant un participe (qu'ont-ils *[z] imaginé).
Après le pronom complément la liaison est obligatoire, alors qu'elle est interdite après un
pronom possessif ou interrogatif. Enfin, après les pronoms indéfinis on ne peut établir de
règle absolue, étant donné que la liaison est "parasitée" par la négation (aucun n'ira) ou le
pluriel (plusieurs iront) ; pour les autres pronoms indéfinis il semblerait qu'il faille poser un
interdit de liaison (chacun *[n] ira), sauf pour tout qui au contraire rend la liaison obligatoire.
La liaison après les autres catégories de termes est plus "simple". Après le substantif,
elle est interdite, tout simplement. Après l'adjectif qualificatif, elle est obligatoire ou
facultative, jamais interdite. En ce qui concerne les adverbes, la liaison est ponctuellement
obligatoire, jamais interdite non plus. Elle est obligatoire après un déterminant et facultative
après une préposition.
C'est la liaison post-verbale qui manifeste la plus grande variation parmi les catégories
majeures, dans le sens où les trois types de liaison sont possibles : facultative, obligatoire ou
interdite. C'est ainsi la seule des catégories majeures pour laquelle le contrôle de la liaison
s'effectue aussi bien dans le sens de l'obligation que de l'interdiction66.
1.2.3. Bilan sur la liaison
Les phonologues se sont essentiellement intéressés aux liaisons obligatoires,
particulièrement après l'adjectif, classant les liaisons interdites parmi les phénomènes
syntaxiques et les liaisons facultatives avec les processus stylistiques. On aurait pu s'attendre
de ce fait à ce que la liaison post-verbale, tant à l'inversion du sujet à la troisième personne
(mange-t-il) qu'après la deuxième personne de l'impératif (manges-en), soit abondamment
documentée puisqu'il s'agit d'un cas de liaison obligatoire.
Il n'en est rien. Peu d'analyses y sont consacrées. Parmi celles-ci, le traitement de la
consonne est très varié. C'est en effet le seul cas de liaison où il a été envisagé que la
66
Cette ambivalence se retrouve également avec les pronoms sujets.
246
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
consonne soit présente à l'initiale du second mot et non seulement, classiquement, en finale du
premier ou même insérée par épenthèse.
Dans le chapitre 10 de la partie III, je vais m'attacher à évaluer les différentes
possibilités d'analyse de la liaison post-verbale, ce qui me conduira à proposer un traitement
original du phénomène en termes d'intervention de la syntaxe dans la phonologie. Pour ce
faire, un deuxième phénomène est à prendre en considération, celui de la flexion.
1.3. La flexion
La flexion constitue la deuxième catégorie de phénomènes mettant en lumière une
alternance consonne ~ zéro.
Elle aussi peut résulter de la mise en contact de deux morphèmes, mais à l'intérieur
d'une unité lexicale, comme la dérivation, et non à la frontière entre deux mots. Cependant,
l'alternance s'observe toujours en fin de mot, comme à la liaison.
Les deux grandes familles de phénomènes flexionnels sont la flexion nominale et la
flexion verbale, que je vais aborder successivement en fonction de leur rôle dans l'alternance
sous intérêt.
1.3.1. Flexion nominale
La flexion nominale concerne le genre et le nombre des adjectifs et des substantifs, de
façon disproportionnée.
1.3.1.1. Nombre
Ce cas de flexion impliquant une alternance consonne ~ zéro concerne en réalité peu
d'items lexicaux, tous substantifs (cf. Tranel 1981 : 182-184) :
(177)
[al] / [o]
V[mi-ouverte]C / V[mi-fermée]
singulier
cheval, bocal
œuf, bœuf
os
pluriel
chevaux, bocaux
œufs, bœufs
os
Deux options sont possibles : soit on considère qu'il n'y a qu'une forme sous-jacente
dans chacun de ces deux cas, soit on choisit de postuler deux allomorphes.
247
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.3.1.1.1. Une seule forme sous-jacente
En ce qui concerne l'alternance [al] / [o], Schane (1968 : 80-81) propose de considérer
que la forme de singulier présente dans le lexique soit modifiée par deux règles, qui
reprennent en fait en synchronie l'historique de l'alternance. La première règle consiste à
vocaliser le /l/ final, la seconde à convertir la séquence de voyelles [au] en la voyelle
postérieure mi-fermée [o] :
/l/-VOC
l Æ u / _C
/o/-CON
au Æ o
Il faut de plus préciser, comme l'indique Selkirk (1972 : 307-309), la nature de la
frontière morphologique impliquée : la vocalisation ne peut avoir lieu que devant une
frontière de morphème et non de nom (un royal prétendant et non *un royaux prétendant), le
morphème suivant étant celui de pluriel /z/ dans le cas de la flexion nominale.
Ces deux règles ont une portée générale en ce qu'elles permettent de rendre compte des
variations non seulement dans les substantifs, mais également dans les verbes (valoir / vaut si
l'on considère que le morphème de troisième personne est bien /t/, cf. section III [10] 2.1). En
revanche, en ce qui concerne la dérivation (altitude / haut, falsifier / faux) et bien que l'on
observe également la même alternance, ces règles ne peuvent la justifier puisque cette fois la
variante [al] est précisément attestée devant consonne.
L'alternance V[mi-ouverte]C / V[mi-fermée] est justifiée par les générativistes linéaires au
moyen du suffixe pluriel /z/ et du nombre de frontières, qui protègent la consonne finale au
singulier : les substantifs concernés sont marqués dans le lexique comme exceptions à la règle
d'effacement en finale de morphème (C Æ ø / _ [-seg] C) mais pas à celle de la troncation de
consonne (C Æ ø / _##). Oeuf, bœuf et os ne sont donc pas soumis à la première règle ([œf],
[bœf], [çs]) mais le sont à la seconde, correspondant au pluriel ([ø], [bø], [o]).
1.3.1.1.2. Allomorphie
Quatre raisons concourent à ne pas implémenter ce type d'alternance consonne ~ zéro
dans le lexique autrement que comme une marque idiosyncratique.
248
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Tout d'abord, l'alternance s'accompagne toujours d'une modification du timbre ou de la
hauteur de la voyelle, sans que les règles postulées par les générativistes linéaires mettent en
évidence le lien nécessaire, indissociable, entre les deux catégories d'événements.
Il s'agit de plus d'une alternance figée, portant sur un nombre limité d'items et non sur
d'autres de mêmes terminaisons : le pluriel de bal ne sera pas *baux, celui de thermos (si tant
est qu'on le prononce avec une voyelle mi-ouverte) ne sera pas [trmo].
En effet, et c'est là la troisième raison invoquée ici, ces alternances ne semblent plus
productives, les locuteurs ne construisent pas un pluriel en [o] à partir d'un radical en [al]67 et,
selon Tranel (1981 : 191), "the plural forms [des mots comme bœuf, œuf et os] tend to be
pronounced like the singular forms, with the final consonants present".
En outre, Tranel (1980, 1981 : 185-191) montre les problèmes causés par la
postulation de la règle de vocalisation du [l] devant une frontière de morphème et non de mot.
Il observe en particulier que, dans le cas du français, "several essential rules postulated in the
framework assuming the validity of the systematic plural-suffix hypothesis in fact require that
a word boundary precedes the plural marker, since the attachment of the plural morpheme /z/
has an effect upon the preceding word which is identical with that of a consonant-initial word
separated from the preceding word by at least one word boundary" (1981 : 186).
De ce fait, les items qui font un pluriel "irrégulier" de ce type devront être spécifiés
dans le lexique pour ce faire. L'intervention de la flexion dans l'alternance consonne ~ zéro se
limite donc à la flexion de genre, très représentée pour sa part.
1.3.1.2. Genre
La flexion de genre concerne les adjectifs comme les substantifs. Cependant les
substantifs soit n'ont pas été abordés par les théories en ce qui concerne la flexion, soit ont été
traités au même titre que les adjectifs.
67
Je ne considère pas les cas éventuels d'hypercorrection, qui conduisent à construire des pluriels en [o] sur tout
singulier en [al] dans certains contextes stylistiques marqués.
249
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Il est vrai que l'on peut observer une alternance entre présence vs. absence de
consonne en finale des substantifs, mais celle-ci soit s'apparente à celle observée avec
l'adjectif (avocat / avocate), soit relève de la forme spécifique du morphème suffixal (lépreux
/ lépreuse) au même titre que des variations plus importantes (instituteur / institutrice).
Si la variation ne concerne que la consonne finale vs. son absence, le cas semble
similaire à celui du genre des adjectifs, aussi peut-on considérer qu'il s'agit d'un même
phénomène et ne pas distinguer le genre du substantif de celui de l'adjectif.
Comme pour le cas de la liaison, au moins deux grands types d'approches ont été
utilisées par les théories : soit la consonne est présente dans le lexique, soit elle est insérée par
une épenthèse.
1.3.1.2.1. Consonne sous-jacente
Les linguistes qui se sont intéressés à la liaison ont souvent abordé en parallèle le
traitement du féminin de l'adjectif, puisque le féminin permet d'observer le plus souvent la
même consonne que celle qui apparaît à la liaison.
La différence essentielle entre la liaison et la flexion est d'ordre syntaxique : le
morphème flexionnel entretient un rapport plus étroit avec sa base que deux mots enchaînés.
Schane (1968 : 5) : "Since the t [final de l'adjectif petit] appears throughout the
paradigm of the feminine, this segment must be followed by a vowel which protects it from
truncation. The vowel in the underlying representation is the morpheme which indicates
feminine gender in adjectives and certain nouns". C'est la règle de troncation à la finale ("like
drops before like"), déjà à l'emploi pour expliquer la non-réalisation d'une consonne en finale
d'adjectif (cf. section 1.1.1.2.2), qui explique la chute du "schwa protecteur" et donc sa nonréalisation à la finale de la forme féminine. C'est la raison qui a poussé Schane à étendre la
règle de troncation à la finale de morphème et non à la réserver à la finale de mot.
La plupart des phonologues génératifs se rattachent à cette unification du phénomène
de liaison avec celui de flexion, qu'ils soient de première génération (par exemple Dell 1973 :
185) ou de seconde (par exemple Prunet 1986 : 227, Sauzet 1999 : 71), de manière le plus
souvent implicite d'ailleurs.
250
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Pourtant, la flexion de genre a également été considérée comme relevant d'un
phénomène d'épenthèse, notamment par Tranel (1981).
1.3.1.2.2. Epenthèse
Pour Tranel (1981 : 251-272) le féminin est, comme dans le cas de la liaison, le
résultat d'une épenthèse et non de la réalisation d'une consonne sous-jacente : "the feminine
forms are derived by a general morphophonological rule inserting an unspecified consonant in
word-final position:
(178)
X
#
N
A
1
2
[+fem]
Æ
1
C
2"
La règle stipule que l'épenthèse concerne une consonne sans matériel mélodique
attaché, donc en réalité la présence d'une consonne au niveau squelettal si l'on traduit cette
règle en phonologie multilinéaire.
Dans un premier temps, je présenterai les arguments fournis par Tranel en faveur de
l'épenthèse, puis j'exposerai son étude de la nature de la consonne épenthésée.
1.3.1.2.2.1. Epenthèse vs. présence de la consonne dans la base
Tranel (1981 : 267) préfère la solution de l'épenthèse à celle de la présence de la
consonne sous-jacente car elle permet de rendre compte de la différence de statut, d'une part
entre la consonne de la base et celle de la flexion, d'autre part entre celle de la flexion et celle
de la liaison ("liaison consonants and gender consonants are derived by the application of
different rules").
La différence entre les règles d'insertion dans les cas de liaison de celles dans le cadre
de la flexion concerne la frontière morphologique : la consonne de liaison est séparée du mot
par une frontière de mot, alors que la consonne de genre y est directement rattachée ; "this
difference captures the fact that liaison consonants are in essence, as indicated by their name,
connective elements between words, whereas gender consonants are markers on words which
contribute to the formation of other words having an existence of their own".
Tranel relève en effet plusieurs arguments tendant à démontrer la différence de statut
des consonnes de flexion et de celles de liaison, différence que les générativistes partisans de
251
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
la présence d'une consonne sous-jacente ne peuvent traiter, précisément parce qu'ils unifient
les deux phénomènes.
En premier lieu, les consonnes de liaison subissent des changements que ne subissent
pas les consonnes de genre.
On relève tout d'abord une modification du voisement. A la liaison, /d/ est réalisé [t] et
/s/, [z]. C'est la différence entre grande et grand [t] homme ou grosse et gros [z] avion.
Toutefois, présentée en termes de "changement", cette première remarque implique que la
consonne est considérée comme présente au niveau lexical, ce qui va à l'encontre de la règle
d'épenthèse postulée par Tranel. Toutefois ce premier argument est valide : l'occlusive
coronale est non-voisée en liaison et potentiellement voisée à la flexion, et la fricative
coronale est au contraire voisée à la liaison et possiblement non-voisée à la flexion.
D'autre part, le cas particulier de présence vs. absence de consonne après -r final met
en exergue une autre particularité des consonnes de liaison par rapport aux consonnes de
flexion : les adjectifs masculins en -r(C) ne réalisent pas leur dernière consonne à la liaison
alors qu'ils la réalisent à la flexion (un court *[t] entretien vs. courte [t]#).
Un deuxième argument en faveur de l'épenthèse concerne les effets des consonnes de
liaison et des consonnes de flexion. Les consonnes de liaison et les consonnes de flexion ne
déclenchent pas les mêmes effets sur la voyelle précédente.
Ainsi en français de Montréal, les voyelles hautes se relâchent-elles dans les syllabes
fermées (petit [pti] vs. petite [ptt], lu [ly] vs. lutte [lt], doux [du] vs. douce [ds]), mais ce
phénomène est-il facultatif à la flexion, "showing that whereas the linking consonant [t] in
petit ami automatically belongs to the next syllable, the gender consonant [t] in petite amie
may close the preceding syllable".
De même, en français "standard", on observe une alternance comparable des voyelles
antérieures moyennes non-arrondies (premier [pmje] vs. première [pmj]) ; or au
masculin, la voyelle peut rester ouverte alors qu'elle semble être en position fermée (premier
étage [pmjeta]). Les voyelles postérieures moyennes manifestent un comportement
parallèle dans l'adjectif sot, "in the somewhat marginal construction where it is used in
prenominal position" (1981 : 270) : à la liaison, la voyelle peut être ouverte (sot ami [stami])
ou fermée (sot ami [sotami]), alors qu'elle est toujours ouverte à la flexion.
252
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Le point suivant en faveur de l'analyse par épenthèse concerne la stabilité des deux
types de consonnes. "Liaison between an adjective and a noun may not always take place (...)
in contrast, the consonants found in feminine marking exhibit great stability". Tranel
mentionne même certains dialectes dans lesquels la liaison adjectivale a complètement
disparu, alors que la distinction en genre par la présence vs. l'absence d'une consonne est
maintenue.
Postuler que les consonnes sont épenthésées et non présentes dans la forme sousjacente permet d'expliquer selon Tranel la différence de statut entre les consonnes de liaison et
de flexion, puisque les consonnes sont épenthésées avant la frontière de mot dans le cas de la
flexion, et font donc partie intégrante du mot, alors qu'elles sont insérées après une frontière
dans le cas de la liaison, ce qui justifie leur statut "relatively instable".
Les trois arguments présentés jusqu'à présent concernent directement la différence de
statut des consonnes de flexion et de dérivation. Le dernier argument porte uniquement sur la
flexion elle-même.
L'analyse par épenthèse plutôt que par troncation permet de rendre compte du fait que
le masculin constitue la forme non-marquée de l'adjectif, non seulement parce que c'est le
générique mais également pour des motifs historiques remontant à l'indo-européen (cf. Meillet
1928, également Huot 2001 : 108).
Dans cette langue préhistorique en effet, deux genres existaient : le genre "animé" et le
genre "inanimé" ou neutre. Le féminin était dérivé de la forme masculine correspondant au
genre "animé" : "le masculin est donc le genre commun, et le féminin en est seulement une
différenciation" (Huot 2001 : 108).
Après cette revue des différences entre les consonnes de flexion et les consonnes de
liaison, justifiant d'une analyse par épenthèse, observons comment Tranel répond à la critique
majeure que l'on peut opposer à l'hypothèse de l'épenthèse : la nature de la consonne
épenthésée semble aléatoire.
253
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.3.1.2.2.2. Nature de la consonne épenthésée
Tranel prétend que la nature de la consonne est prédictible en fonction de la forme de
base représentée par le masculin. Le corpus qu'il utilise à l'appui de sa démonstration est celui
de Durand (1936) qui rassemble 5630 noms et adjectifs. Treize consonnes, sur les vingt que
recense l'inventaire phonologique du français et les dix-huit possibles en finale de mot (// et
/w/ en sont exclues), sont attestées au féminin : /t/ (petite), /d/ (grande), /k/ (franque), /g/
(longue), /n/ (naine), // (maligne), /v/ (louve), /s/ (grasse), // (franche), /r/ (première), /l/
(saoule) et /j/ (gentille). Ne sont pas représentées les labiales (/p/, /b/, /m/), la labio-dentale
sourde /f/ et la fricative post-alvéolaire voisée //.
La prédictibilité de la consonne épenthétique s'appuie sur les observations suivantes :
- seule une base à finale vocalique ou en /r/ (précédé uniquement de certaines voyelles) subit
l'épenthèse d'une consonne de féminin.
- sept des consonnes suscitées68 ne sont employées que dans un très petit nombre de termes :
cinq ne concernent qu'un seul terme (/k/ franque, /g/ longue69, /v/ louve, /l/ saoule, /j/
gentille), // pour sa part est présent dans trois (franche, blanche, fraîche), // dans deux
(bénigne, maligne).
A partir de ces remarques et de l'étude de son inventaire, Tranel dégage des tendances
de distribution. "The consonant-insertion rules of adjective liaison and gender formation can
still be regarded as uniformly picking the needed consonant (if any) from the lexical entries,
but in some cases the consonant (if any) will be truly idiosyncratic, whereas in others the
burden of memory on the native speaker will not be so heavy, because of the general patterns
involved" (1981 : 254).
Le tableau suivant présente les généralisations dégagées par Tranel70 en illustrant d'un
exemple les consonnes attestées au féminin après les terminaisons de bases répertoriées ; les
chiffres entre parenthèses indiquent le cas échéant le nombre de termes concernés71 :
68
On remarquera que les sept consonnes qui ne participent pas du mécanisme productif sont toutes et seulement
les non-coronales de l'inventaire, ce qui laisse uniquement les consonnes coronales comme marques de féminin :
/t/, /d/, /s/, /z/, /n/ et /r/.
69
Auquel on peut ajouter oblongue.
70
Il répertorie également les termes qui ne suivent pas ces tendances, cf. (1981 : 254-266) pour le détail. Il
aborde en outre les alternances de consonnes (sec / sèche, veuf / veuve, etc.) qui n'entrent pas dans le cadre des
alternances [C] ~ [ø] (cf. 1981 : 265).
254
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(179)
finale
de base
-[i]
-[e]
pas de
consonne
pp vb 2ème
gpe : finie
[t]
[d]
[s]
pp vb 3ème
gpe en -ire:
dite
-[u]
-[o]
-[]
-V[r]
71
72
autre
[j] :
gentille
première
suff -et :
grassouillette
pp vb 3ème
gpe en -aire :
faite
sujette
auvergnat
suff -ais :
écossaise
mauvaise et
niaise
suff -ois :
pragois
rase
confuse (11)
suff -u :
barbue
pp certains vb
3ème gpe : lue
suff -eux :
scandaleuse
cas idiosyncratiques (douze termes concernés)
suff -ot :
suff -aud
petiote
lourdaude
rigolote
chaude
ppst :
grande
suff -an :
méritante
(12)
castillane
lente
artisan
blonde
(12)
-[ç]
-[]
[r]
pp vb 3ème
gpe non en
-ire : mise
-[a]
-[ø]
[n]
pp vb 1er gpe :
chantée
-[]
-[y]
[z]
pp vb 3ème
gpe : éteinte
suff -on :
breton
bon
une (7)
canadienne
fine
(productif)
[o] ~ [l]
12
termes
[] :
blanche
(3)
[k] :
franque
(1)
[g] :
longue
(1)
suff -aire :
pp vb 3ème
suff -ard : diverse
supplémentaire gpe : couverte clocharde
suff -oire :
courte
contradictoire
[yr] dure
[ir] pire
cher
[œr]72 :
antérieure
pp indique un "participe passé", vb renvoie à "verbe", gpe à "groupe, suff à "suffixe".
En dehors du suffixe -eur dont les féminins -euse et -rice n'entrent pas dans le cadre des alternances [C] ~ ø.
255
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
1.3.1.2.3. Bilan sur la flexion nominale de genre
L'hypothèse la plus généralement admise est que la consonne observée à la flexion est
tout aussi idiosyncratique que celle apparaissant à la liaison, c'est pourquoi elle doit être
spécifiée dans la base (cf. par exemple Sauzet 1999 : 73 "un acquis de l'analyse générative
classique est que les consonnes latentes sont lexicales"). Ceci est confirmé par l'identité
fréquente des consonnes de flexion avec celles de liaison.
Cependant, le fait que l'on n'observe à la flexion que des coronales, que l'on constate
des différences de comportement entre les consonnes de liaison et celles de flexion tout autant
que des différences d'effets de l'ajout de l'une ou de l'autre, font relativiser cette position et
conduisent à envisager là encore la solution épenthétique.
Intéressons-nous maintenant à la flexion verbale, qui se manifeste au niveau de la
personne et du mode.
1.3.2. Flexion verbale
L'alternance consonne ~ zéro qui relève de la flexion est à distinguer de celle traitée
dans le cadre de la liaison. Il s'agit en effet de distinguer les consonnes qui apparaissent entre
la base et la désinence, qui relèvent de la flexion, de celles qui se manifestent entre une
désinence et le mot suivant, ce qui est du domaine de la liaison.
Je présenterai le problème de l'impératif dans ce cadre au chapitre 10, et montrerai
qu'il ne faut pas prendre en compte la présence de la consonne au sein du morphème
d'impératif même.
Je traiterai ici le cas de l'alternance consonne ~ zéro impliquée dans le mode (section
1.3.2.1), et celui lié à la personne (section 1.3.2.2).
1.3.2.1. Mode
Les consonnes concernées apparaissent au subjonctif et non à l'indicatif des verbes du
troisième groupe, autrement dit des verbes "irréguliers". Je ne retiendrai pas ici les variations
impliquant également des voyelles comme dans sait / sache, mais uniquement celles dans
lesquelles la consonne est le seul élément distinctif du mode, de sorte que l'on observe les
paires minimales suivantes :
256
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(180)
indicatif : absence de la consonne
sort
entend
vit
dort
vainc
ø ~ [t]
ø ~ [d]
ø ~ [v]
ø ~ [m]
ø ~ [k]
subjonctif : présence de la consonne
sorte
entende
vivent
dorme
vainque
La consonne est absente aux formes du singulier de l'indicatif présent et de l'impératif,
et présente à toutes les autres formes.
Envisageons les trois types d'analyses possibles : soit il s'agit d'allomorphie, soit la
forme courte est issue de la forme longue, soit la forme longue provient de la forme courte,
avec épenthèse.
Si la forme courte est la forme de base, alors les verbes du troisième groupe doivent
être divisés en sous-groupes selon la nature de la consonne qu'ils insèrent.
Si c'est la forme avec consonne qui est basique, il faut supposer une règle de
troncation, comme celle de Tranel (1981 : 249) :
(181)
C
#
1
2
-subjunctive
+present
+singular
+third conj.
Æ
ø
2
Tranel (1981 : 249-250) préfère la troisième solution, c'est-à-dire l'allomorphie, car
d'après lui "there does not seem to be any convincing substantive evidence justifying the
decision to make one form of the stems primary rather than the other".
Schane (1968 : 101-103) suppose la présence d'une voyelle thématique sous-jacente
dont on n'observerait jamais la manifestation phonétique directe, comme pour le schwa
permettant à la consonne de féminin de l'adjectif de se réaliser.
1.3.2.2. Personne
Tranel (1981 : 248) traite pareillement l'alternance [C] ~ [ø] de mode et celle de
personne, c'est-à-dire que là encore il ne considère pas que la consonne est le fait d'une
épenthèse, alors que c'est ce qu'il préconise dans les cas de flexion nominale ou de liaison.
257
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Paradis & El Fenne (1992, 1995) ont étudié plus particulièrement les cas de flexion
verbale et les ont mis en relation, dans la tradition du cadre génératif "classique", avec les
phénomènes de liaison.
Elles se situent dans un cadre génératif multilinéaire posant les consonnes latentes
comme complètement flottantes, c'est-à-dire non attachées à un constituant squelettal (donc
encore moins à un constituant syllabique ; cf. section 1.1.1.2.3). De ce fait, elles posent la
consonne alternante comme finale flottante de radical. Deux cas sont à distinguer :
(182)
a. la consonne alternante est la même qu'à l'infinitif
sort / sortent
(sortir)
x
x
x
|
|
|
ç
s
r
t
tend / tendent
(tendre)
x
x
|
|
t

d
vit / vivent
(vivre)
x
x
|
|
v
i
v
dort / dorment
(dormir)
x
x
x
|
|
|
ç
d
r
m
vainc / vainquent
(vaincre)
x
x
|
|
v

k
b. la consonne alternante est différente de celle de l'infinitif
connaît / connaissent
(connaître)
x
x
x
x
|
|
|
|
ç
k
n

s
moud / moulent
(moudre)
x
x
|
|
m
u
l
coud / cousent
(coudre)
x
x
|
|
k
u
z
x
|
e
écrit / écrivent
(écrire)
x
x
x
|
|
|
k
r
i
v
A la troisième personne du singulier, une règle d'effacement supprime les consonnes
finales non rattachées au niveau squelettal en vertu du principe de légitimation selon lequel
"toute unité phonologique doit être légitimée au niveau prosodique et segmental, c'est-à-dire
être intégrée dans une structure phonologique immédiate complète" (1992 : 122). Le
morphème de troisième personne du pluriel est une unité de temps vide (comme pour le
féminin de l'adjectif), qu'une règle d'association lie à la consonne flottante dans la version de
1992, puis qui est automatiquement liée dans la version de 1995.
La réalisation de la consonne flottante est donc morphologiquement conditionnée.
"However, its manifestation is entirely phonological: it is caused by the presence of an empty
onset" (1995 : 191).
Que se passe-t-il lors de la concaténation avec le morphème de l'infinitif ? Paradis &
El Fenne (1995 : 192) distinguent cinq infinitifs suffixaux : -r, -ir, -tr (toujours réalisé -dr
derrière une consonne voisée), -war et -er, mais ne donnent pas explicitement leurs
représentations multilinéaires non plus qu'elles n'indiquent précisément quels verbes y sont
258
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
associés. Lorsque le morphème de l'infinitif se concatène aux bases verbales telles qu'elles ont
été posées, on obtient :
(183)
la consonne alternante est la même qu'à l'infinitif
sortir, dormir
x
|
s
x
|

x
|
r
x
x
|
i
t
x
|
r
x
|
v
tendre, vivre, vaincre
x
x
|
v
r
x
|
i
Si l'on considère que les morphèmes -ir et -r ont tous deux une position squelettale
vide à l'initiale, on peut rendre compte de la formation de ces infinitifs de manière
satisfaisante : la consonne flottante s'adjoint à la position squelettale disponible, on obtient les
réalisations recherchées.
(184)
x
|
e
la consonne alternante est différente de celle de l'infinitif
x
|
k
écrire
x
x
|
|
r
i
v
x
|
r
x
|
k
x
|
o
x
|
n
connaître
x
|

s
x
|
t
x
|
r
x
|
m
moudre, coudre
x
x
|
|
u
l
t
x
|
r
Cette fois, pour rendre compte adéquatement des infinitifs, il est nécessaire de postuler
un morphème -r différent du précédent, en ce sens qu'il ne comporte pas de position
squelettale vide à son initiale (cf. 1995 : 192). S'il en avait une, on obtiendrait *[ekrivr] ; c'est
pourquoi Paradis & El Fenne (1992 : 123) considèrent écrire comme une exception
("l'infinitif écrire, dont la consonne flottante du radical /v/ est absente, semble être le résultat
d'une mémorisation comme c'est le cas de nombreux participes passés"). Dans la version de
1995 en revanche, c'est vivre, ainsi que vaincre et rompre, qui sont considérés comme des
exceptions, puisque ce sont les trois seuls verbes (sur 588) à consonne flottante finale qui
maintiennent cette consonne devant le suffixe d'infinitif.
Il n'y a donc bien qu'un seul suffixe -r : sans position consonantique à l'initiale. Le
verbe tendre s'analyse alors comme un cas de consonne alternante "différente" de celle de
l'infinitif, donc avec le suffixe -tr et non -r.
2. Analyses antérieures de l'épenthèse
Il s'agit dans ce chapitre d'établir de quelle manière les différentes théories
phonologiques génératives ont considéré le phénomène de l'épenthèse consonantique en leur
sein.
259
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Si l'épenthèse consonantique a été globalement moins traitée que l'insertion vocalique,
elle a cependant fait l'objet de travaux en phonologie générative dès les débuts de celle-ci. Les
premières études génératives concernant le sujet datent en effet de la fin des années soixante
et se situent donc dans la "première génération".
Dans cette partie je passerai en revue les analyses concernant l'épenthèse
consonantique en phonologie générative, en distinguant les analyses qui postulent une
épenthèse dans n'importe quelle position (section 1), des analyses dans lesquelles l'épenthèse
se situe dans une position syllabique pré-existante (section 2).
2.1. Cadre non syllabique : insertion d'une consonne
La phonologie linéaire se caractérise par l'utilisation de règles phonologiques
permettant de rendre compte des phénomènes observés dans les langues. L'ordonnancement
de ces règles est propre à chaque langue, mais les règles elles-mêmes font partie d'un
ensemble universel dans lequel une langue donnée puise ce dont elle a besoin.
L'épenthèse au sein de cette première génération de modèles génératifs est envisagée
comme l'insertion d'une consonne, qui est ensuite remplie par du matériel mélodique
"emprunté" aux segments voisins ou qui apparaît ex nihilo.
A l'intérieur de cette première génération "post SPE", je distinguerai trois cas de figure
selon que l'épenthèse est considérée comme uniquement liée à la position en hiatus (section
2.1.1), à la mélodie des segments environnants (section 2.1.2) ou à la conjonction d'un hiatus
et d'une frontière morphologique (section 2.1.3).
2.1.1. Epenthèse en hiatus : Pupier (1971)
Pupier (1971) est le premier travail à ma connaissance portant sur les épenthèses
consonantiques en français depuis les débuts de la phonologie générative. Il analyse
l'"insertion d'une consonne avant le suffixe dans les dérivés du français standard", ceci dans
un cadre génératif "de la première génération" c'est-à-dire en utilisant des règles ordonnées,
dans la droite lignée de Chomsky & Halle (1968) et de Schane (1968).
2.1.1.1. Présentation de l'analyse
Dans son article, Pupier distingue quatre types de dérivés du français présentant ou
semblant présenter une épenthèse consonantique, de types (a) petitesse (b) enjoliver (c)
rapetisser (c') numéroter, bleuter (d) faisander, caviarder.
260
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Sans surprise, le [t] suspect de petitesse est analysé comme la réalisation d'une
consonne sous-jacente dont on trouve la manifestation au féminin (petite) et à la liaison (petit
[t] enfant) (cf. également Schane 1968).
Le [v] de enjoliver, en revanche, ne peut pas jouir du même statut, attendu qu'il
n'apparaît ni au féminin (*jolive) ni à la liaison (joli [v] enfant), ni même dans un autre dérivé,
joliesse (*jolivesse) ; ce [v] n'étant pas de ce fait une consonne sous-jacente, force est de
supposer qu'il est fourni par une règle d'insertion.
Rapetisser présente un cas de changement de [t] en [s], puisque le dérivé est formé sur
petit pour lequel a été établi un [t] sous-jacent. Ce phénomène se rattache à la règle
d'assibilation de Schane (1968 : 106), remaniée en fonction des traits du système de Pupier
(1971 : 123) :
t Æ s /_ [V +haut +antérieur]
Cette règle permet dans un deuxième temps de rendre compte des dérivés comme
endurcir. "On voudrait en effet appliquer le même traitement aux verbes endurcir et éclaircir
qu'à (r)accourcir, qui ont la même structure de surface que lui […] et sont comme lui des
verbes factitifs : ils tiennent lieu de "rendre plus ADJECTIF"." (Pupier 1971 : 124). Le
problème réside dans le manque de consonne sous-jacente finale des adjectifs dur et clair au
contraire de court, aussi faut-il insérer un [t] dans leurs dérivés, entre le radical et le suffixe
verbal, après la formation du féminin.
Cette insertion de [t] a pour corollaire d'expliquer les dérivés de type numéroter ou
pianoter, et la règle aurait ainsi la forme (Pupier 1971 : 125) :
ø Æ t / V_SUFFIXE]]V
Il faut néanmoins que les unités lexicales auxquelles cette règle s'applique soient
spécifiées comme telles, de façon à limiter son champ d'application ; en effet, à côté de
bleuter et clouter on trouve bleuir et clouer, preuves que tous les radicaux ne sont pas
concernés. "Ainsi numéro et piano auront le trait [insertion de t], tandis que pour bleu et clou
le verbe dérivé n'a un -t- que s'il peut être paraphrasé par "mettre ARTICLE N sur" (où N est
une variable qui peut prendre les valeurs bleu et clou)" (Pupier 1971 : 125).
Un autre problème, de l'aveu même de Pupier, se pose. En effet, la règle d'assibilation
doit être généralisée de façon à ce que tout [t] en contact avec [i] (et non seulement précédant
[i]) soit changé en [s], de façon à rendre compte d'un terme comme plisser pour lequel un [t] a
dû être préalablement inséré, comme pour pianoter par exemple. Ce faisant, la règle produira
261
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
des résultats erronés quant à la dérivation à partir de termes comme débit (débiter et non
*débisser), bruit (ébruiter et non *ébruisser), profit (profiter et non *profisser), etc.
"Rapetisser reste donc une exception, peut-être construit par analogie avec lisser" (Pupier
1971 : 128).
Considérons maintenant le quatrième cas répertorié par Pupier (1971) après petitesse,
enjoliver et rapetisser : faisander. L'insertion d'un [d] dans faisander ou caviarder est attestée
mais problématique pour la théorie, dans le sens où on ne peut appliquer le même type de
raisonnement que pour les cas considérés plus haut. Tout d'abord en effet, on ne peut arguer
du caractère sous-jacent de la consonne comme on l'a fait dans le cas de petitesse puisqu'on ne
trouve trace de ce [d] ni au féminin (faisane et non *faisande), ni à la liaison (caviar avarié et
non *caviar [d] avarié). On ne peut non plus trouver de contexte d'apparition satisfaisant
implémentable dans une règle, puisqu'un dérivé comme élancer rejette l'hypothèse d'un
contexte propice à l'épenthèse de type an_er par exemple.
Pupier (1971 : 130) propose alors une règle générale permettant de rendre compte des
consonnes apparaissant dans les trois derniers cas considérés, en l'occurrence tous des dérivés
verbaux (enjoliver, rapetisser, faisander). Cette règle consisterait à insérer une consonne
coronale antérieure devant les suffixes verbaux, règle mineure qui ne s'appliquerait que pour
les mots explicitement fléchés comme tels dans le lexique : [+règle 20]. Celle-ci serait
formulée de la manière suivante :
règle 2073
øÆ
C
+ antérieur
+ coronal
+ ____ +
A
I
+r
V
Cette règle d'insertion devrait être assortie de règles précisant la nature de la consonne
dentale insérée : [s], [d] ou [t].
Le problème de l'insertion de [v] dans enjoliver reste entier, puisqu'il ne s'agit pas
d'une coronale. Modifier la règle 20 de façon à autoriser n'importe quelle consonne à s'insérer
impliquerait une complication des règles subséquentes, puisqu'il faudrait préciser dans la règle
73
Pupier formule la règle à l'aide de majuscules, mais il réfère dans son analyse aux phonèmes qui associés à /r/
forment les suffixes verbaux -er et -ir.
262
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
suivante non pas quelle consonne dentale est insérée, mais quelle consonne (antérieure) parmi
l'ensemble des consonnes de la langue est épenthésée.
Pupier (1971 : 132) propose donc une règle supplémentaire, propre à enjoliver et au
féminin de bailli, baillive, qui comporte également une insertion de [v].
Examinons maintenant cet article d'un œil critique.
2.1.1.2. Critique
Outre les critiques de Pupier lui-même concernant certains points de la démonstration
invalidés par les données, plusieurs critiques sont à formuler à l'encontre de cette
représentation du phénomène de l'épenthèse : le fait que la frontière morphologique ne soit
pas prise en compte, l'obligation du fléchage des unités lexicales, la surgénération des sites
possibles d'épenthèse.
2.1.1.2.1. Frontière morphologique
Tous les exemples donnés par Pupier se situent à une frontière morphologique, et plus
précisément à la frontière dérivationnelle suffixale. Pourtant, ce paramètre n'est aucunement
pris en compte dans la formulation des règles d'insertion de consonne ; or, la formulation en
règles permet de faire appel à l'information morphologique (même si elle n'explique pas
comment celle-ci peut inférer l'apparition d'une épenthèse), la preuve en étant que Pupier luimême restreint les cas d'épenthèse aux seuls verbes. Cette non prise en compte de la frontière
morphologique signifie que Pupier ne la considère pas comme un facteur dans l'apparition
d'une épenthèse.
De cette observation découle en partie une deuxième critique portant sur la
surgénération des règles (cf. section 2.1.1.2.3). Avant d'aborder celle-ci, tournons-nous vers
un second point faible du modèle, lié à la formulation des règles.
2.1.1.2.2. Fléchage dans le lexique
Un second reproche que l'on peut adresser à ce type d'approche est le manque de
globalité des règles et l'obligation de flécher les unités lexicales. Ce reproche est valable pour
263
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
l'ensemble des théories génératives de première génération, basées sur la linéarité d'une part et
tentant de tout expliquer en synchronie d'autre part.
Quel est en effet l'intérêt mémoriel d'indiquer par deux marques, renvoyant à deux
règles différentes, que la base joli construira son dérivé verbal à l'aide d'une consonne de
transition ([+règle20]), et que cette consonne sera [v], par rapport à l'inscription d'enjoliver
comme entrée distincte de joli dans le lexique ?
On remarquera que ce système de règles ne fait aucune prédiction puisque les unités
lexicales qui se verront adjoindre l'épenthèse sont encodées en ce sens dans le lexique. Il ne
s'agit donc que de l'implémentation d'une observation, celle d'une épenthèse à la frontière
morphologique dérivationnelle entre radical et suffixe, et non d'une explication du phénomène
de l'épenthèse par la théorie.
2.1.1.2.3. Surgénération des sites d'épenthèse
La critique majeure exprimable contre la phonologie linéaire dans le traitement de
l'épenthèse a cependant été soulevée par Kaye & Lowenstamm (1984 : 131 ; également
Piggott & Singh 1985 : 421), elle concerne la structure des représentations sous-entendue par
la formulation des règles. En effet, une règle d'épenthèse sera de la forme (cf. section 1.2.) :
øÆA/X_Y
Or dans la théorie telle que présentée dans le SPE et dans les travaux en phonologie
générative linéaire, rien ne précise où se trouve l'ensemble vide en question ou, plus
exactement, cet élément est implicitement pointé comme se trouvant entre deux segments
quels qu'ils soient, donc partout. "Pourtant un petit sous-ensemble seulement des ø qui
potentiellement peuvent faire partie d'une chaîne segmentale sont la cible de processus
phonologiques les remplaçant par des segments. Pourquoi cet état de fait ? La question reste
sans réponse" (Kaye & Lowenstamm 1984 : 131). La théorie telle qu'elle est formulée n'est
donc pas en mesure de prédire les contextes dans lesquels une épenthèse est possible et ceux
dans lesquels elle ne l'est pas.
Cette première analyse du phénomène de l'épenthèse permet de souligner les faiblesses
relatives à la représentation linéaire : l'épenthèse n'est pas assez contrainte par les règles qui,
ne prenant en compte que le contexte phonologique immédiat de la position insérée, oblige à
flécher les unités lexicales concernées par l'épenthèse.
264
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Un traitement parallèle s'observe lors de l'analyse, dans ce cadre non syllabique, d'un
second cas d'insertion : l'épenthèse de consonne au sein d'un groupe consonantique.
2.1.2. Epenthèse et mélodie des consonnes contextuelles : Wetzels (1985), Picard (1987a,
1987b, 1989), Clements (1987)
Les articles de Picard de la deuxième moitié des années 80 reprennent l'analyse de
Wetzels (1985) pour en proposer une nouvelle perspective. Ce qui caractérise cette série de
travaux est leur focalisation sur les épenthèses consonantiques à l'intérieur de groupes de
consonnes, et non en hiatus.
2.1.2.1. Présentation de l'analyse
Commençons par présenter les données sur lesquelles porte l'analyse. Wetzels (1985 :
285-289) distingue deux types d'épenthèses d'occlusives à l'intérieur d'un groupe
consonantique, en synchronie comme en diachronie :
I. à l'intérieur d'un groupe dont le deuxième élément est une liquide
II. à l'intérieur d'un groupe dont le deuxième élément n'est pas une liquide.
Le tableau suivant propose une illustration des données prises en compte (cf. chapitre
1 section 2.2) :
265
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(185)
I
ancien français
diachronie de l'espagnol
diachronie de l'italien
grec ancien
diachronie de l'anglais
diachronie de l'écossais
diachronie du germanique / slave
II
ancien français
écossais moderne
anglais moderne
ess(e)re > estre
cam(e)ra > chambre
trem(u)lare > trembler
pol(ve)re > poldre
ven(i)ra > vendra
sal(i)ra > saldra
hom(i)nem > hombre
mem(o)rare > membrare
pess(u)lus > peskjo
slavo > skjavo
*gam-ros > gambros
*me-mloka > membloka
*anr-os > andros
thunrian > thunder
alre (acc.) > alder
thimle > thimble
polre > polder
Gelre > Gelder
s(i)roop > stroop
*srow- > strawmr (vieux Norse)
strem (vieil anglais)
struja (vieux bulgare)
annos > ants
pognos > points
genoclos > genults
hemt ~ hempt
hemden ~ hembden
hat ~ hakt
warmth ~ warmpth
sensitive ~ sentsitive
prince ~ printce
"être"
"chambre"
"trembler"
"poudre"
"il viendra"
"il quittera"
"homme"
"se souvenir"
"rocher"
"esclave"
"marié"
"il a marché"
"homme (génitif)"
"tonnerre"
reclaimed land
"sirop"
"ans"
"poing"
"genou"
"chemise"
"chemises"
"pend"
"chaleur"
"sensible"
"prince"
Pour Wetzels (1985 : 296-301), seules les consonnes insérées dans le type I relèvent
de vraies épenthèses, celles qui figurent dans la deuxième catégorie étant en réalité des
segments de contour, ce qui se manifeste par le caractère facultatif de leur apparition. Je
présenterai ici successivement les cas des occlusives intrusives (section 2.1.2.1.1) et celui des
"vraies" épenthèses (section 2.1.2.1.2).
2.1.2.1.1. Occlusives intrusives
En ce qui concerne les épenthèses de type II, Clements (1987) considère lui aussi qu'il
ne s'agit pas d'épenthèse, mais de "intrusive stops". Son analyse se situe dans le cadre de la
Géométrie des Traits (Clements 1985 ; cf. section I [2] 3.2).
Cette distinction entre épenthèse et occlusive intrusive fait que, tout comme Wetzels, il
n'attribue pas de position syllabique à ces occlusives mais considère qu'elles sont issues d'une
liaison de la cavité orale de la consonne suivante au segment nasal (b), ce qui cause
266
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
l'apparition en surface de l'affriquée de même lieu d'articulation que la première consonne (c).
Il faut pour cela admettre que les deux consonnes sont dès le départ reliées à un même point
squelettal74.
(186)
(a) situation initiale
C
RN
LN
(b) liaison de la cavité orale
C
RN
RN
LN
LN
(c) apparition occlusive
C
RN
RN
LN
LN
RN
LN
SLN
SLN
SLN
SLN
SLN
SLN
OC
OC
OC
OC
OC
OC
[ns]
[ns]
[nts]
A terme, ce mécanisme peut conduire à l'effacement de la nasale, comme dans le cas
d'une langue bantou, le kihungan (cf. Takizala non daté, également Clements 1987 : 42) dont
le tableau ci-dessous reprend les séquences pertinentes75 :
(187)
devant labiale
devant coronale
forme sous-jacente
/luN + fut/
/luN + vaatis/
/luN + sey/
forme de surface
[lupfut]
[lumbvaatis]
[lutzey]
glose
"payer"
"habiller"
"se moquer"
L'effacement est facultatif, puisqu'on ne l'observe pas par exemple dans [lumbvaatis].
Les données fournies ne permettent pas de décider si c'est le voisement de la deuxième
consonne qui protège la nasale, mais cette question est marginale dans l'argument développé.
L'effacement de la nasale est l'étape suivante du phénomène de concaténation ayant
conduit à l'apparition de l'occlusive intrusive, réinterprétée comme un segment de contour
avec la deuxième consonne : le premier nœud de racine sous la position squelettale se délie, si
bien que la nasale n'est plus prononcée.
74
Je rappelle ici les sigles utilisés :
RN
root node
LN
laryngal node
SLN
supralaryngal node
OC
oral cavity
75
L'apparition d'occlusives intrusives dans cette langue répond à un phénomène plus large que celui concernant
le contexte ici évoqué, à savoir une nasale suivie d'une fricative. Je ne donne ici que les données permettant de
suivre la démonstration de Clements (1985). Par ailleurs, les gloses ne sont qu'indicatives, toutes les données
n'étant pas fournies.
267
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Tournons-nous à présent vers ce que Wetzels (1985) considère comme étant les seuls
vrais cas d'épenthèse du corpus de départ.
2.1.2.1.2. Epenthèses consonantiques
Pour Wetzels (1985), c'est la mélodie qui conditionne l'insertion de la consonne
épenthétique, ce qui se formule au moyen de la règle suivante (1985 : 312) :
ø Æ C / C _ σ[C [+son, -nas]
Sous cette formulation, la nature de la première consonne importe peu, c'est la position
entre deux consonnes assortie de la frontière syllabique qui est déterminante. Le remplissage
mélodique se fait par la propagation du voisement et du lieu d'articulation de la consonne
précédente.
Cette consonne, ou plutôt cette position consonantique occlusive, insérée est ensuite
syllabifiée en première partie d'attaque branchante de la syllabe suivante.
Le tableau ci-dessous récapitule les deux étapes de l'insertion d'une consonne
épenthétique : insertion d'une position et intégration de celle-ci dans la structure syllabique.
(188)
σ
V
|
e
situation de départ
σ
C
|
s
C
|
r
σ
V
|
e
V
|
e
insertion d'une position
σ
C
|
s
C
|
t
C
|
r
σ
V
|
e
V
|
e
syllabation de la position
σ
C
|
s
C
|
t
C
|
r
V
|
e
La différence entre l'analyse de Wetzels et Clements d'une part, et celle de Picard
(1987a, 1987b, 1989) d'autre part, concerne le classement des deux types de consonnes : pour
Picard, il s'agit, dans les deux cas, d'épenthèses.
Le type II se caractérise par des épenthèses occlusives, certes facultatives, faisant
partie d'un segment de contour et n'ayant donc pas de statut segmental autonome, au contraire
des épenthèses de type I qui représentent des segments indépendants en surface. Mais les
épenthèses de type II peuvent par la suite être remplacées par une réanalyse stable de la forme
sous-jacente du morphème. Ainsi en anglais n'y a-t-il plus de différence, ni phonétique ni
phonologique, entre empty (< aemtig), glimpse (< glimse), où le /p/ a été épenthétique au
départ, et tempting, pumpkin, pants où le /p/ est d'origine.
268
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Picard propose donc de ne pas distinguer de classes d'épenthèses sur la base de statuts
phonologiques mais plutôt sur la base de la structure syllabique de la langue considérée. Pour
ce faire, il fait appel à deux principes phonologiques "reconnus" et aux règles qui en
découlent (Picard 1987b : 274-275) selon lesquels :
(189)
Principe 1
Principe 2
Règle A
Règle B
Les langues ont une propension naturelle aux syllabes ouvertes.
Dans chaque langue, les seuls groupes consonantiques qui sont permis en début de syllabe sont
ceux qui sont également permis en début de mot.
Insertion de frontière syllabique
Dans toute séquence phonologique, $76 s'insère après chaque segment [+syllabique] sauf le dernier.
Déplacement de frontière syllabique
Si l'output de la Règle A crée un goupe consonantique interne qui est inadmissible en début de mot,
$ se déplace obligatoirement vers la droite jusqu'à ce qu'il atteigne un groupe qui soit permis.
Prenons le cas de l'épenthèse de type I de l'ancien français. Ont été touchés les groupes
[mr], [nr], [lr], [sr], [zr] et [ml], qui après épenthèse sont syllabifiables en C$OL (consonne frontière syllabique - occlusive - liquide) puisqu'à l'initiale [br], [dr], [tr] et [bl] sont autorisés.
En revanche, [tl] et [dl] étant interdits en début de mot, ils le sont également à l'intérieur de
mot selon le principe II, c'est pourquoi il ne peut y avoir d'épenthèse d'occlusive dans les
groupes [nl], [sl] et [zl] (chapitre 1 section 2.2.1.2 pour le détail du traitement de ces groupes).
Il s'agit donc d'une contrainte sur la syllabe à l'intérieur d'une langue donnée.
Selon Picard, l'épenthèse consonantique fonctionne donc à l'aide des conditions et
contraintes suivantes (1987a : 140-141, cf. également 1987b : 283) :
(I) Consonant epenthesis consists in the insertion of a stop (S) between two consonants (C1C2), that is,
C1C2 > C1SC2.
(II) The epenthetic stop can only appear between the following types of consonant sequences:
(a) nasal + liquid, liquid + liquid, fricative + liquid (Type I)
(b) nasal + stop, nasal + fricative, liquid + fricative (Type II)
(III) This intrusive stop always assimilates to the point of articulation of C1, and becomes voiced only if
both C1 and C2 are voiced, e.g., ml > mbl and nz > ndz, but sr > str and mt > mpt.
(IV) Type I epenthesis can arise only if the styllable structure is C1$C2, whereas Type II can occur if the
structure is either (a) C1$C2, or (b) C1C2$.
(V) In Type I epenthesis, the stop is always inserted to the right of the syllable boundary, that is, C1$C2
> C1$SC2, where as in Type II, it always appears on the left, that is, (a) C1$C2 > C1S$C2, and (b) C1C2 >
C1SC2$.
(VI) Type I epenthesis occurs only if the output $SC2 (where C2 is a liquid) is a permissible wordinittial cluster (#SC2) in a particular language, e.g., Old French m$l > m$bl because of #bl but n$l >
*n$dl because of *#dl.
(VII) Type I epenthesis occurs only if the structural description consists of two different segments, e.g.,
lr > ldr but ll > *ldl, while Type II can take place only if the structural change results in a sequence of
three different segments, e.g., mt > mpt but nd > *ndd.
76
$ indique une frontière syllabique.
269
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.1.2.2. Critique
La critique essentielle à porter à ces analyses est le fait que, si elles fournissent une
description complète et détaillée du phénomène, en témoignent les conditions et contraintes
fournies par Picard, elles ne posent en revanche jamais la question du pourquoi.
En effet, la frontière de syllabe sert à déterminer le contexte d'apparition de l'épenthèse
mais la structure de la syllabe elle-même ne joue pas de rôle. Ce n'est pas un "problème de
structure" syllabique qui induit l'apparition d'une épenthèse consonantique, c'est uniquement
la présence d'une frontière de syllabe qui est en jeu ici. Le seul cas où la structure joue un rôle
dans l'analyse proposée par Picard, c'est pour la resyllabation et non pour l'insertion-même de
la consonne.
La section suivante présente un troisième cas d'insertion de consonne analysée dans un
cadre linéaire. Cette fois, et au contraire de Pupier (1971), la frontière morphologique entre en
ligne de compte dans le cadre de l'apparition de l'épenthèse ; de plus, sont prises en compte
non seulement les épenthèses en hiatus mais également celles après consonne.
2.1.3. Epenthèse en hiatus et frontière morphologique : Wetzels (1987)
Dans cet article, Wetzels met en parallèle les consonnes de liaison en morphologie
dérivationnelle et les consonnes épenthétiques en "français moderne", du fait qu'elles sont
"not only functionally equivalent in sofar as they avoid hiatus by creating CV syllables, but
also, to the extent that their phonetic realization deviates from the unmarked dental
articulation". Son analyse incorpore des causes structurales et des motivations
morphologiques.
2.1.3.1. Présentation de l'analyse
Son point de départ est l'alternance consonne ~ zéro dans des séquences où la base
adjectivale est seule, par rapport aux séquences dérivées de cette même base :
(190)
adjectif seul
petit [p´ti]
petite
petitement
grand []
franc [f]
gris [i]
grande
franche
grise
grandement
franchement
/
adjectif + suffixe
petitesse
grandeur
franchise
grisâtre
rapetisser
grandir
franchir
griser
270
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Pour Wetzels, l'analyse du phénomène en termes de troncation tel que présenté dans
Schane (1968) par exemple (toute forme féminine terminée par une consonne se voit amputée
de cette dernière pour former le masculin) se heurte à la multitude d'adjectifs se terminant par
une consonne en français, de type honnête, simple, large, morose, vétuste, intime, bègue,
jeune, etc. En effet, ôter par une règle générale toute consonne finale de l'adjectif au féminin
amputerait ces adjectifs épicènes ([on], [sp], etc.).
De plus, certains mots sans consonne sous-jacente - puisqu'elle n'apparaît pas à la
liaison ou dans tous les mots dérivés - présentent une épenthèse dans certains dérivés mais
non dans tous, comme on peut le constater dans le tableau suivant :
(191)
adjectif seul
bleu
joli
bleue
jolie
bleuter
enjoliver
adjectif + suffixe
bleuâtre
joliesse
bleuir
joliment
On peut supposer, avec Wetzels, que le cas est le même pour des termes dérivés à
partir de noms, même si l'absence de consonne flottante est moins aisée à mettre en évidence :
le féminin de caillou est pour le moins difficile à établir, de même qu'il n'est pas aisé de
trouver un contexte de liaison permettant à ladite consonne de se réaliser le cas échéant. Sont
concernés des dérivés tels que esquimautage formé sur esquimau, caillouteux sur caillou,
hugotesque sur Hugo, silotage sur silo, chichiteux sur chichi, comateux sur coma, moscoutaire
sur Moscou, dénoyauter sur noyau et ronéoter sur ronéo.
Une première solution proposée par Wetzels (1987 : 285) serait une règle de type :
"introduce a t (or s in the plural) between two vowels which are located at each side of a
morpheme- (or word-) boundary, except for those morphemes or words which are lexically
marked as acquiring no consonants at all [cf. a.] or where the liaison consonant is not t [cf.
b.]".
(192)
a
b.
masculin
connu
hébreu
aisé
gaga
bon
gros
salaud
gris
gentil
féminin
*connute
*hébreute
*aiséte
*gagate
bonne
grosse
salope
grise
gentille
271
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Cette solution présente deux inconvénients, correspondant aux deux réserves
formulées par Wetzels. D'une part, on se retrouve avec une liste d'exceptions à l'insertion de
[t], marquées comme telles dans le lexique (ce qui correspond aux mots de a.), ce qui rend
cette solution équivalente de ce point de vue à la règle de troncation proposée plus haut.
D'autre part, il est nécessaire de spécifier dans le lexique la nature de la consonne à insérer
puisqu'elle n'est pas prédictible (cf. b.), ce qui est plus coûteux que dans le cas de la règle de
troncation, ou bien garder "some version of the criticized truncation rule" (Wetzels 1987 :
286).
Wetzels (1987 : 286) se rattache d'une part aux travaux de Bichakjian (1973),
Limonard (1981) et Tranel (1981) pour la liaison envisagée en termes d'épenthèse, et à
Encrevé (1983) et Hyman (1985) pour le fait que "liaison consonants in French are best
represented at the level of lexical representation as floating, or untimed consonants". Il
considère en effet qu'il n'y a pas épenthèse de mélodie, laquelle est déjà présente dans le
lexique, mais épenthèse de position squelettale ('timing slot'), permettant ainsi à la consonne
sous-jacente d'être réalisée. Autrement dit, si une base se termine par une consonne flottante,
un emplacement consonantique est introduit, quel que soit le segment suivant. L'apparition
phonétique d'une consonne est alors traitée à la fois comme étant en relation avec une
consonne flottante et comme une épenthèse - de position et non de mélodie.
Wetzels s'intéresse également aux épenthèses consonantiques après consonne, c'est-àdire en réalité [r], qui ne comportent pas de consonne flottante à la finale : cauchemardesque
sur cauchemar, bazarder sur bazar, escobarderie sur escobar, butorderie sur butor.
La règle qu'il propose tient compte de l'ensemble des données sur l'épenthèse
consonantique sans consonne flottante - épenthèse en hiatus comme devant un [r] - et est
formulée de la manière suivante (Wetzels 1987 : 293) :
(193)
Augment-insertion
ø Æ C ] / {V, C} ]
___ ]
{V, C} ]
Paraphrase : "insère une consonne de liaison
derrière une voyelle ou un [r] final de morphème
r
[+cons]
r
et devant une voyelle ou un [r] s'il n'y a pas de
consonne flottante à cet endroit.".
272
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Cette consonne de liaison est vue par Wetzels "as an augment-like item added as a
morphological extension to the vowel-final base" (1987 : 313) et non comme une partie du
morphème de base ou du morphème dérivationnel. Cette règle "adequately predicts that it
should not be exceptional for invariable adjectives (the ones that do not have a floating
[+cons] feature) to acquire a linking consonant if followed by a vowel-initial derivational
suffix" (Wetzels 1987 : 293), de type poli / politesse, bleu / bleuter / bleusaille, etc.
La règle présentée ci-dessus ne remet pas en question l'insertion d'une position
squelettale consonantique si une consonne flottante est disponible, elle la complète.
Récapitulons les phénomènes présentés par Wetzels dans le cadre de la morphologie
dérivationnelle :
(194)
condition segmentale
condition contextuelle
présence de consonne flottante
{V, r} _ ]{V, r}
absence de consonne flottante
V_ ]V
règle
insertion d'une position squelettale permettant de
réaliser phonétiquement la consonne flottante
insertion d'une consonne de liaison
L'analyse de Wetzels permet donc de distinguer les deux types d'adjectifs - ceux sans
consonne flottante à la finale comme ceux avec. En ce qui concerne ces derniers, le trait
[+cons] s'assortit le cas échéant des traits [+voisé] et [+nasal], de façon à pouvoir traiter des
différences de type persan / grand / plaisant, qui ont respectivement un [n] (il considère que
"nasal vowels in French are lexical" 1987 : 291), un [d] et un [t] épenthétiques, pour lesquels
on obtient les représentations suivantes (1987 : 292) :
(195)
adjectifs de type persan
adjectifs de type grand
V
V
V
[-cons]
[+cons]
[+low]
[+nas]
[+nas]
[-cons]
[+cons]
Adj
[-cons]
[+low]
[+low]
[+nas]
[+nas]
[0 voi]
Adj
adjectifs de type plaisant
[+cons]
[+voi]
Adj
Adj
Adj
Adj
273
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
La consonne "par défaut" s'avère donc être le [t], puisqu'il n'est besoin que du trait
[+cons] pour l'identifier. Par ailleurs, Wetzels (1987 : 295) précise que le trait flottant [+cons]
"has the same diacritic function as the extrasyllabic consonants in Clements & Keyser (1983),
the weightless consonant of Hyman (1985), and the unlinked consonant of Encrevé (1983)."
Wetzels (1987 : 295) propose le schéma suivant, récapitulatif des mécanismes à
l'œuvre ici :
t : prédit par la règle
(196)
variable : [+cons] flottant (lexical)
morphème
de base :
adjectif
pas t :
- traits marqués flottants (lexicaux)
- prédictible par une règle (contextuellement,
segmentalement)
invariable
Le 'timing slot' inséré ne fait pas partie pour Wetzels des morphèmes en jeu dans la
dérivation, mais relève plutôt d'une extension morphologique de la base à finale vocalique. Il
considère en effet la liaison comme un 'timing' et non comme une resyllabation, celle-ci
devant plutôt être une conséquence de la liaison.
Cette hypothèse permet de rendre compte :
- de la nature (en termes de lieu d'articulation et de voisement) de la consonne épenthésée présente sous forme de trait(s) dans le lexique, elle est propre à chaque unité ; absente du
lexique, c'est un [t] qui est prédit s'insérer puisque la règle Augment-insertion n'insère que le
trait [+cons].
- du fait qu'une consonne n'apparaît pas toujours entre un radical et un suffixe : la règle
d'insertion Augment-insertion fonctionne en hiatus, mais non pas lorsque le suffixe débute par
une consonne (*polit(e)ment, *jolit(e)ment).
2.1.3.2. Critique
La position de Wetzels rend compte des données et propose un point de vue justifiant
la nature, en termes de lieu d'articulation, de la consonne épenthésée. De plus, il met en
évidence le rôle de la frontière morphologique dans l'apparition de l'épenthèse consonantique.
Toutefois, même si Wetzels réduit ainsi le caractère ad hoc des règles linéaires, restent
encore plusieurs problèmes :
274
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
- il considère l'insertion de la consonne entre la base et le morphème du féminin comme une
frontière "en hiatus", sans justifier de la représentation de ce morphème ; or en surface,
l'insertion est à la finale.
- le lexique contient plusieurs morphèmes de féminin, et pour chaque adjectif doit être indiqué
quel suffixe il sélectionne ; l'abandon de la règle de troncation de Schane, à l'intérieur d'un
cadre linéaire, est au prix d'un fléchage nécessaire dans le lexique et donc d'un manque de
portée générale. La théorie en effet n'a pas les moyens de prédire la nature de la consonne
apparaissant au féminin.
- tous les hiatus en français ne déclenchent pas l'apparition d'une épenthèse consonantique.
Certes Wetzels, en introduisant la frontière morphologique dans la règle, n'impose pas une
épenthèse à l'intérieur d'hiatus intramorphématiques (haïr, éblouir, etc.) ; cependant, il
provoque de la surgénération à l'intérieur d'hiatus intermorphématiques, que ce soit entre deux
mots (il a à appeler et non *il a [t] a [t] appeler), ou à la frontière dérivationnelle, même
entre base et suffixe (jouable), même lorsque la base est adjectivale (bleuir), ou encore à la
frontière flexionnelle (*jolite, *bleute).
- Wetzels (1987) contourne le problème de resyllabation évoqué plus haut en ajoutant un
nouvel élément dans la structure, le 'timing slot', qui n'a d'autre raison d'être que précisément
d'éviter la resyllabation. Il s'agit donc d'une solution ad hoc, et aucunement explicative. Elle a
cependant le mérite de souligner une des faiblesses du modèle non-syllabique, de façon à ce
que les héritiers du modèle y prennent garde.
2.1.4. Bilan sur le cadre non-syllabique
La phonologie générative linéaire résout l'épenthèse consonantique au moyen de
règles, souvent ad hoc, sans établir de connexion explicative particulière entre l'insertion
d'une consonne et la morphologie. Celle-ci intervient dans le meilleur des cas sous la forme de
frontière de syllabe, mais sans qu'il soit établi de lien de fonctionnement entre la frontière et
l'apparition d'une consonne.
De plus, la théorie n'est pas restreinte, prédisant de ce fait des types d'épenthèses non
rencontrés dans les langues puisqu'une épenthèse est théoriquement possible entre deux
segments quels qu'ils soient.
Cette surgénération est due au fait de postuler l'insertion d'une position consonantique
et non l'emploi d'une position déjà existante. C'est particulièrement patent dans l'analyse des
données sur la diachronie de l'ancien français (sim(i)lare > sembler) : le groupe de consonnes
275
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
non toléré par la langue est causé par la chute d'une voyelle. L'analyse en termes de règles,
synchronique, ne tient pas compte de la présence d'une position squelettale pour cette voyelle
et est obligée d'en supposer la chute, puis d'insérer une nouvelle position, consonantique cette
fois, pour permettre l'insertion de la consonne observée en surface.
De ce fait, le cadre linéaire n'est pas prédictif en termes universels ; en termes
systémiques, les règles étant directement issues de l'observation du fonctionnement de la
langue en surface et non d'un fonctionnement interne à la théorie, le cadre ne peut être
considéré non plus comme explicatif, il ne fait que transcrire le phénomène d'induction qui
consiste à supposer la généralisation du phénomène à partir de l'observation d'un certain
nombre de données.
Les limites du modèle génératif non-syllabique ont conduit les chercheurs à s'attacher
plus particulièrement aux contextes d'apparition des épenthèses, en termes notamment de
syllabation et non d'insertion de position consonantique.
2.2. Cadre syllabique : présence d'une position consonantique
2.2.1. Epenthèse consonantique et syllabation : Piggott & Singh (1985), Itô (1989)
Au début des années quatre-vingts, de nombreuses analyses prenant en compte les
constituants syllabiques en relation avec le phénomène de l'épenthèse ont été proposées,
parmi lesquelles Halle & Vergnaud (1978), Selkirk (1981), Singh (1980, 1981a, 1981b,
1981c), Piggott (1981), Kaye & Lowenstamm (1984) et Clements (1987).
Je présenterai ici deux études parmi celles qui ont une portée universelle (et non
circonscrite à une seule langue), représentatives de la tendance générale.
2.2.1.1. Piggott & Singh (1985)
2.2.1.1.1. Présentation de l'analyse
Piggott & Singh (1985) s'intéressent aux cas où l'épenthèse consonantique se produit
entre deux consonnes ou entre une consonne et une frontière morphologique, référant
explicitement à (a) l'épenthèse diachronique d'occlusive voisée entre vieil et moyen anglais,
(b) l'épenthèse synchronique d'occlusive derrière une sonante ou [s] en vieux français (Walker
1978 : 66) et (c) l'épenthèse dans certains dialectes d'anglais entre la consonne nasale [n] et la
276
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
fricative non-voisée [s] (cf. chapitre 1 section 2, cf. également Wetzels 1985, Picard 1987).
Pour les deux derniers cas, l'alternance se produit en synchronie, à un moment donné de
l'histoire de la langue. Dans le cas de l'ancien français, elle est due à une suffixation
particulière, mais est en variation libre pour les dialectes d'anglais.
Le tableau ci-dessous présente des données pertinentes :
(197)
a
vieil anglais
nemnan
spinel
b
raiembre
prendre
cosdre
c
fence
tense
moyen anglais
nempne
spindel
synchronie de l'ancien français
raemons
prenons
cousons
variation dans certains dialectes d'anglais
[fnts]
[tnts]
glose
"nommer"
"épingle"
"racheter"
"prendre"
"coudre"
"barrière"
"tendu"
L'analyse se situe non pas dans le cadre de la phonologie linéaire avec
ordonnancement de règles mais dans celui de la phonologie métrique, selon laquelle "the
segments of a language are organized into syllables, syllables are organized into units called
feet, and feet are organized into word trees." (Piggott & Singh 1985 : 422).
Cette analyse rejette les règles ordonnées en tant que mécanisme explicatif pour une
des raisons évoquées en section 2.1.1.2.3, à savoir le manque de précision quant à l'élément ø
- possible virtuellement partout. Son but est donc de parvenir à formuler une prédiction quant
à l'endroit où une épenthèse est possible : "an adequate theory of phonology must make
formally explicit whatever link there is between rules of epenthesis and language-particular or
universal constraints on sequences or segments" (1985 : 421).
La prédiction est ici la suivante : "epenthetic segments arise automatically to fill empty
structural positions that are created in the course of syllabification" (Piggott & Singh 1985 :
422).
En effet, l'ordonnancement des segments en syllabes est soumis à des contraintes
phonotactiques et aux stratégies de resyllabation d'une langue. Si les stratégies de réparation,
à savoir la resyllabation, ne sont pas suffisantes, alors il y a épenthèse. Ainsi en vieux
français, une sonante syllabée en coda se retrouve-t-elle dans le noyau de la syllabe
précédente par l'application de la règle Move Sonorant, laissant un emplacement vide dans la
structure, emplacement que seule une épenthèse peut combler, en vertu des Conditions de
277
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Bonne Formation de la structure syllabique (ce qui correspond aux "Syllable Completeness
Conditions" de Selkirk 1981 : 216).
(198)
σ
A
R
(a) situation initiale
p

σ
A

n
N
p

σ
A
impliquant
C

C
n

R
N
l'épenthèse
p

R
(b) déplacement de la nasale dans le noyau de la
syllabe
(c) resyllabation,
consonantique
N


C
n
ø

C
"It should now be apparent that consonant epenthesis is invariably associated with the
moving of a sonorant" (Piggott & Singh 1985 : 443) puisqu'il faut qu'une sonante
anciennement en attaque se soit déplacée sur un noyau. Le [s] de cosdre a donc dans cette
optique été considéré comme une sonante, ayant déclenché une épenthèse dans les mêmes
conditions qu'une nasale. Ceci se vérifie indépendamment de l'épenthèse : "Old French
Apocope, Cluster-Simplification, and Early Syncope treat /s/ as if it were a sonorant." (Piggott
& Singh 1985 : 443, renvoyant à Reighard 1975).
Sous cette analyse, l'épenthèse est donc la conséquence automatique de certains types
de réajustements de la structure métrique nécessités par une violation de la contrainte pesant
sur la structure de la syllabe, contrainte selon laquelle "every squeletal point must be
associated with a segment and every segment must be associated with a squeletal point"
(Piggott & Singh 1985 : 430). Tout ce qui ne correspond pas à cette définition n'est pas une
épenthèse.
278
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.1.1.2. Critique
Plusieurs remarques sont à adresser à l'encontre de cet article. La première est établie
par Picard (1987b : 268, en note), qui reproche à Piggott & Singh d'"affirmer quelque chose
qu'il faut sans contexte considérer comme phonétiquement injustifiable et insoutenable", à
savoir que le segment [s] soit analysé comme une "fricative sonante". Il faut relativiser cette
critique : Piggott & Singh relèvent un fait, à savoir que [s] se comporte comme une sonante
dans le cas étudié. Ce qui est critiquable n'est pas cette constatation, mais l'analyse en termes
de "fricative sonante" qui en est donnée.
Si la possibilité de la présence d'une sonante dans un noyau syllabique est attestée par
ailleurs (noyaux syllabiques en anglais, par exemple [btn] où [n] est noyau de la deuxième
syllabe), celle de la présence d'une fricative reste à démontrer. Quel serait le résultat
phonétique d'un noyau contenant [s] ? Comment cette dernière se combinerait-elle avec une
voyelle dans le cas d'un noyau branchant ?
Par ailleurs, la resyllabation de la nasale en noyau n'est pas appuyée par la phonétique
en anglais au contraire du français, qui réalise une voyelle nasale lorsqu'un élément nasal est
attaché au noyau. Il faut donc supposer dans l'hypothèse de l'analyse de Piggott & Singh
(1985) un principe selon lequel ce mécanisme sous-jacent de migration de la coda "sonante"
(vraie sonante ou [s]) ne se manifeste jamais en surface : quelle serait la réalisation de [l] ou
[r] dans un noyau branchant ?
Malgré ses imperfections, l'analyse met en évidence une réelle différence avec les
analyses non-syllabiques : cette fois c'est la structure qui prédit le site de l'épenthèse, aussi ne
peut-il y avoir d'épenthèse n'importe où (entre n'importe quelle séquence de deux segments)
mais uniquement dans des positions déterminées par la structure de la syllabe dans la langue
considérée.
De plus, le motif de l'épenthèse est cette fois universel : une position syllabique non
remplie appelle une épenthèse, vocalique ou consonantique. L'analyse dans une langue
donnée dépend des structures de syllabe admises par cette langue.
Enfin, on peut relever que cette fois, le cadre théorique implémente le motif de
l'épenthèse.
279
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Piggott & Singh (1985) représentait un cas d'épenthèse entre consonnes. Les mêmes
causes produisant les mêmes effets, observons avec Itô (1989) l'application de la syllabation
au contexte hiatusal.
2.2.1.2. Itô (1989)
Itô (1989) rejette l'épenthèse comme résultant de règles d'insertion de position
squelettale et propose "a theory in which epenthesis is treated as a prosodic phenomenon and
accounted for directly by syllabification" (1989 : 217). Je ne présenterai ici que les éléments
pertinents pour la justification de l'implémentation de l'épenthèse dans la théorie.
2.2.1.2.1. Présentation de l'analyse
En ce qui concerne la structure interne de la syllabe, deux éléments sont à considérer :
les gabarits et la sonorité.
La syllabification repose sur des gabarits et sur des conditions de bonne formation, et
non sur des règles de construction des syllabes. Elle doit être considérée comme "a simple
mapping of the syllable template to the phonological string in conformity with the parameter
settings" (Itô 1989 : 225). La sonorité joue un rôle dans la constitution de la syllabe, au moyen
du principe de Sonority Sequencing (Selkirk 1984 : 116) formulé ainsi : "in any syllable, there
is a segment constituting a sonority peak that is preceded and/or followed by a sequence of
segments with progressively decreasing sonority values".
L'Onset Principle tel que présenté par Itô (1989 : 223) veille à la satisfaction de
l'attaque et non à sa maximisation : toute consonne intervocalique doit être syllabifiée en
attaque, mais dès lors que l'on a affaire à un groupe de consonnes interviennent des
paramétrages en fonction des langues, selon qu'elles autorisent ou non les codas notamment.
Ce principe est formulé de la manière suivante : "Avoid σ[v". Les langues excluant les
syllabes sans attaque renforcent ce paramètre en Strict Onset Principle : "Onsetless syllables
are impossible".
Le Coda Filter (Itô 1986) quant à lui restreint les consonnes possibles en coda : seules
le premier élément d'une géminée ou une consonne homorganique à l'attaque de la syllabe
suivante sont tolérées. Il est énoncé de la manière suivante :
280
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(199)
Coda Filter
*C]σ
Paraphrase : une consonne finale de syllabe,
|
donc en coda, n'est pas spécifiée pour son
[place]
lieu d'articulation.
Itô (1989) s'intéresse aux épenthèses vocaliques et consonantiques. En ce qui concerne
les consonnes, son analyse repose sur l'axininca campa (Payne 1981 ; cf. chapitre 1 section 1),
langue dans laquelle un [t] est inséré dans tout hiatus correspondant à une frontière entre
radical et suffixe : /noN-pisi-i/ "je balaierai" est réalisé [nompisiti].
Si une des positions du gabarit n'est pas remplie, il y a insertion d'une consonne ou
d'une voyelle selon la position en question.
Considérons la forme sous-jacente /noN-pok-piro-i/ "je viendrai vraiment" et
appliquons les principes et les paramètres permettant la syllabification des segments :
- en vertu du Coda Filter, /N/ peut être syllabifié en coda puisqu'il partagera alors son lieu
d'articulation avec l'attaque suivante.
- /k/ se trouve devant une consonne avec laquelle il ne peut partager le lieu d'articulation ni
n'est géminé ; il ne peut donc pas, toujours selon le Coda Filter, être syllabifié en coda. Il sera
donc nécessairement en attaque.
- la dernière syllabe ne comporte pas d'attaque ; or l'axininca campa est une langue où l'on
n'observe pas de syllabe sans attaque, ce qui indique que c'est le Strict Onset Principle qui
s'applique.
La structure syllabique du mot est alors la suivante :
(200)
σ
n
o
σ
mp
σ
o
k
σ
_
p
σ
i
r
σ
o
_
i
Aux positions laissées vides s'adjoignent les sons épenthétiques par défaut dans la
langue : [a] pour les voyelles, [t] pour les consonnes. La forme de surface est alors
[nompokapiroti].
281
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.1.2.2. Critique
Au moyen de contraintes de formation établies indépendamment de l'analyse de
l'épenthèse, et de paramètres réglés en fonction de la langue considérée, la théorie rend
compte de l'apparition d'épenthèses. Elle prédit les sites possibles d'épenthèse, et ceux qui ne
le sont pas.
Cependant, elle ne permet de rendre compte que des épenthèses directement liées à la
structure de la syllabe, et non celles en relation supplémentaire avec la morphologie ou avec
une mélodie particulière (cf. section I [1] 2.2.3) : comment justifier dans ce contexte de
l'apparition d'une épenthèse en partie causée par un type particulier de morphème, ou par une
frontière morphologique particulière ? Ou, plus exactement, comment empêcher, en
appliquant cet algorithme de syllabation, l'épenthèse d'un segment dans une position où il
n'est pas réalisé, puisque son occurrence est liée à d'autres facteurs que la simple structure
syllabique ?
Le point fort de cette théorie est qu'elle prédit les sites possibles d'épenthèses par des
propositions internes à la théorie et non en vertu de règles ou contraintes idoines. Cependant,
elle néglige tout ce qui n'est pas lié à la structure syllabique, tel que la nature de la frontière
morphologique (entre deux mots, entre préfixe et radical, entre radical et suffixe, etc.), la
catégorie lexicale de la base ou du suffixe, la mélodie des segments environnants, ou encore le
rôle de l'accent.
2.2.1.3. Bilan sur le cadre syllabique
L'avancée par rapport aux modèles non-syllabiques est ici explicative : en supposant la
présence d'une position syllabique préexistant à l'épenthèse, les cadres circonscrivent celle-ci
à certaines positions uniquement. L'épenthèse n'est donc plus virtuellement possible partout,
comme c'était le cas dans la phonologie générative non-syllabique. On est passé d'une vision
somme toute descriptive à une portée explicative de l'apparition d'une consonne épenthétique.
Ce qui est paramétrable à travers les langues, c'est le type de syllabe autorisé : avec coda ou
non, avec attaque obligatoire ou non.
En revanche, rien de ce qui est du domaine morphologique n'entre en ligne de compte.
La section suivante montre comment la morphologie peut être implémentée dans une théorie
282
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
et ainsi, à terme, intégrer une dimension explicative supplémentaire dans l'analyse de
l'épenthèse consonantique.
2.2.2. Epenthèse, syllabation et morphologie : Théorie de l'Optimalité
A l'intérieur de la Théorie de l'Optimalité (cf. chapitre 2 section 3 pour une
présentation générale du cadre), deux écoles s'affrontent en regard de la représentation de
l'épenthèse : la théorie FILL (Prince & Smolensky 1993), et la théorie DEP (McCarthy &
Prince 1995). Je présenterai ici successivement chacune d'elles, en indiquant la différence de
philosophie sous-jacente à leur séparation.
2.2.2.1. Prince & Smolensky (1993) : FILL theory.
Prince & Smolensky (1993 : 99-106) abordent le cas de l'épenthèse au sein de leur
partie consacrée à la théorie de la syllabe. Se réclamant de la typologie de Jakobson (1962 :
256), ils soutiennent que la syllabe optimale est de la forme CV, ce qui se traduit en termes
optimalistes par la contrainte suivante (1993 : 98) :
(201)
THM. UNIVERSALLY OPTIMAL SYLLABES
No language may prohibit the syllable .CV. Thus, no language prohibits onsets or requires
codas.
Ainsi aura-t-on les contraintes -COD (Prince & Smolensky 1993 : 17) et ONS (Prince &
Smolensky 1993 : 93) de façon respectivement à éviter les codas et à obtenir une attaque.
Elles sont formulées dans le texte original de la manière suivante :
ONS77
Syllables must have onsets (except phrase initially)
-COD
A syllable must not have a coda
Toutefois, si aucune langue n'interdit la syllabe de type CV, cela ne signifie pas que
les langues n'autorisent pas d'autres types de syllabe, y compris les syllabes sans attaque. Ce
que THM. indique, c'est que si le matériel lexical est suffisant pour obtenir une syllabe de type
CV, aucune langue ne choisira d'effacer l'attaque ou de rajouter une coda.
77
Dans les versions plus récentes de la théorie, cette contrainte est appelée ONSET.
283
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
A ces contraintes s'ajoutent dans la représentation de l'épenthèse deux contraintes de
fidélité, veillant à ce que les outputs soient le plus proche possible de l'input correspondant :
FILL et PARSE.
La contrainte PARSE (Prince & Smolensky 1993 : 94) impose que tous les segments
sous-jacents soient syllabifiés :
Underlying segments must be parsed into syllable structure
PARSE
FILL (Prince & Smolensky 1993 : 94), quant à elle, oblige la structure à remplir une
position vide par du matériel segmental. Elle se présente ainsi comme la contrainte
responsable de l'apparition d'une épenthèse78 :
Syllable positions must be filled with underlying segments
FILL
En réalité, cette contrainte FILL est représentative de trois contraintes (Prince &
Smolensky 1993 : 94 note 51) portant sur les constituants de la syllabe :
FILLNUC
Nucleus positions must be filled with underlying segments
FILLMAR Margin positions (Ons and Cod) must be filled with underlying segments
FILLONS
Onset positions must be filled with underlying segments
Prince & Smolensky (1993 : 97) qualifient l'élision et l'épenthèse respectivement
d'underparsing et overparsing, du fait que les deux mécanismes violent ces contraintes de
fidélité selon laquelle la structure de sortie doit être la plus proche possible du matériel
lexical.
L'épenthèse se justifie alors par le fait que "a syllable position node unassociated to an
input segment ('overparsing') is phonetically realized through some process of filling in
default featural values." (Overparsing Phonetically Realized as Epenthesis, Prince &
Smolensky 1993 : 97).
78
Parallèlement, la contrainte *FILL peut être à l'œuvre pour effacer un segment.
284
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.2.1.1. Epenthèse en attaque
C'est l'ordonnancement des contraintes qui décide, pour une langue donnée, de sa
propension à accepter les attaques vides ou à préférer les remplir au moyen d'une épenthèse.
C'est aussi elle qui décide de son exigence ou de son rejet des codas.
Dans une langue n'exigeant pas d'attaque, un morphème /V/ (voyelle) sera traité de la
manière suivante :
(202)
/V/
).V.
<V>
.†V.
PARSE
FILL
ONS
*
*!
*!
Les trois candidats en lice sont les suivants : une voyelle syllabée en noyau mais sans
attaque (.V.) ; une voyelle non syllabée (<V>) ; une voyelle précédée d'une position
consonantique (.†V.).
Les violations de PARSE et de FILL sont fatales du fait que l'un des candidats – .V. en
l'occurrence – satisfait ces deux contraintes. "If PARSE, FILL >> ONS, then onsets are not
required" (1993 : 100).
En revanche, dans une langue nécessitant une attaque en début de syllabe, mais ne
disposant toujours que d'une voyelle orpheline dans le lexique, "if ONS dominates either
PARSE or FILL, then onsets are required" (1993 : 101). Ceci se retrouve dans le tableau suivant
(Enforcement by Overparsing (Epenthesis), 1993 : 100) :
(203)
/V/
.V.
<V>
).†V.
PARSE
ONS
FILL
*!
*!
*
Les trois candidats sont les mêmes que dans le cas précédent, les trois contraintes
également. Ce qui change, c'est l'ordonnancement de ces dernières : la violation de ONS est
cette fois-ci fatale puisque ONS est placée avant PARSE et FILL.
285
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.2.1.2. Epenthèses en coda ?
En ce qui concerne la coda, c'est toujours l'ordonnancement des contraintes qui va
rendre compte des différences interlinguistiques, mais les contraintes considérées ne sont pas
toutes les mêmes. Seront communes PARSE et FILL, sera différente -COD. Si -COD est dominé
par PARSE et par FILL (appliqué cette fois au noyau, soit FILLNUC), alors les codas sont
autorisées dans la langue considérée.
Cependant, "autorisées" ne signifie pas que la langue tolère les épenthèses en coda.
Prince & Smolensky (1993) ne considèrent pas cette option mais estiment au contraire que
l'épenthèse est limitée à l'attaque et au noyau.
Considérons les différents outputs proposés pour une forme sous-jacente /CVC/ dans
une langue interdisant les codas :
(204)
/CVC/
.CV.
<CVC>
.CV†.
).CV.C†.
FILLNUC
PARSE
-COD
*!
*!
*!
*
Le premier candidat n'utilise pas tous le matériel disponible dans le lexique, aussi
viole-t-il la contrainte Parse. Le second n'est pas syllabifié, c'est pourquoi il n'est pas optimal.
Le troisième candidat (.CV†.) comporte une position en coda alors que la contrainte -Cod est
en tête de hiérarchie (du fait que l'on observe que la langue interdit les codas). L'output
optimal est donc .CV. C†. : il ne comporte pas de coda, utilise tous les phonèmes
disponibles, et ne viole que la contrainte la plus basse dans la hiérarchie.
Imaginons maintenant une langue qui exige une coda. Le système de contraintes tel
qu'il est formulé ne permet pas de rendre compte de cette épenthèse, comme on le voit dans le
tableau suivant :
(205)
/CV/
).CV.
<CV>
.CV†.
PARSE
FILL
-COD
*!
*!
Le candidat optimal est .CV., même si la contrainte -COD est placée dernière dans la
hiérarchie, puisqu'il ne viole aucune contrainte.
286
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Pour rendre compte des données du cupeño, il faudrait postuler une contrainte
supplémentaire COD, placée dans certaines langues avant -COD, de façon à permettre les
épenthèses de consonnes en coda. Le problème serait alors que toutes les syllabes dans cette
langue seraient tenues de comporter une coda, ce qui n'est pas attesté dans les langues du
monde (cf. section I [1] 2.2.3.3.1) : les épenthèses en coda de syllabe sont toutes liées à un
conditionnement supplémentaire. Ainsi en huariapano (cf. section 2.1.2.1.3. du premier
chapitre), c'est la conjonction de la position avec l'accent qui impose l'épenthèse d'une coda.
Il faut donc postuler une contrainte liée à l'accent pour rendre compte de ces données
particulières.
Le système de contraintes tel qu'il est présenté ici permet donc de décrire l'épenthèse
en attaque et de justifier l'impossibilité de l'épenthèse en coda comme unique
conditionnement.
2.2.2.1.3. Bilan
Récapitulons ce qui concerne l'épenthèse en Optimalité selon Prince & Smolensky
(1993 : 101-103) :
(206)
Onset Theorem
Onsets are not required in a language if ONS is
dominated by both PARSE and FILL. Otherwise, onsets
are required. In the latter case, ONS is enforced by
underparsing (phonetic deletion) if PARSE is the lowest
ranking of the three constraints; and by overparsing
(phonetic epenthesis) if FILL is lowest.
Lowest
constraint
ONS
PARSE
FILLONS
Onsets are…
Enforced by…
Not required
Required
Required
N/A
V 'Deletion'
C 'Epenthesis'
Coda Theorem
Codas are allowed in a language if -COD is
dominated by both PARSE and FILLNUC. Otherwise,
codas are forbidden. In the latter case, -COD is
enforced by underparsing (phonetic deletion) if
PARSE is the lowest ranking of the three constraints;
and by overparsing (epenthesis) if FILLNUC is the
lowest.
Lowest
Codas are…
Enforced by…
constraint
-COD
Allowed
N/A
PARSE
Forbidden
C 'Deletion'
FILLNUC
Forbidden
V 'Epenthesis'
Le problème interne à la théorie est qu'il est nécessaire de distinguer deux contraintes
FILL différentes, l'une concernant l'attaque et l'autre s'appliquant au noyau. En effet, si les
deux sont sous le même intitulé, alors cela signifie que pour une langue classant FILL en
dernier dans l'ordonnancement, les deux types d'épenthèses, vocalique et consonantique, sont
favorisées au même titre dans cette langue. C'est ce que Prince & Smolensky (1993 : 103)
appellent le "triomphe de l'épenthèse" :
287
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
(207)
Input
/V/
/CVC/
Optimal Analysis
.†V.
.CV.C†.
Phonetic
.CV.
.CV.CV.
Or, "nothing that we know of in the linguistic literature suggests that the appearance of
epenthetic onsets requires the appearance of epenthetic nuclei in other circumstances" (1993 :
103). La contrainte FILL n'est donc pas la même dans les deux différents types d'épenthèses.
Une critique est à retenir à cet endroit de la démonstration : l'épenthèse en attaque et
celle en noyau répondent à deux stratégies totalement différentes puisqu'elles ne font pas
intervenir les mêmes contraintes. Donc il semblerait qu'il y ait autant de points communs
entre l'épenthèse en noyau et celle en attaque qu'entre un type d'épenthèse et n'importe quel
autre processus phonologique, à commencer par la lénition, qui est pourtant le processus
exactement inverse.
Prince & Smolensky (1993) ont établi le cadre de l'Optimalité et la manière dont ce
cadre pouvait rendre compte des phénomènes d'épenthèse consonantique, en liaison avec la
structure de la syllabe79. McCarthy & Prince (1995) ont envisagé une autre manière de
concevoir les relations entre structure de surface et structure profonde, ce qui les a conduit à
proposer un autre traitement de l'épenthèse consonantique au sein de ce cadre de la Théorie de
l'Optimalité. Après avoir présenté cette nouvelle approche, nous observerons un cas concret
d'épenthèse consonantique en français, celui abordé par Plénat (1999).
2.2.2.2. McCarthy & Prince (1995) : DEP theory.
McCarthy & Prince (1995) s'intéressent dans cet article à la Morphologie Prosodique,
théorie traitant de "empirical problems lying at the phonology-morphology interface"
(1995 : 1) qui préfère, aux contraintes de fidélité à l'input (FILL, PARSE) de la Théorie de
l'Optimalité telle que présentée ci-dessus, des contraintes d'identité.
79
l'épenthèse dépend dans ce cadre également de la structure du pied, ce qui est implémenté au moyen de la
contrainte EDGEMOST (cf. Prince & Smolensky 1993 : 29) :
Edgemost position of head foot in word
The most prominent foot in the word is at the right edge.
288
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.2.2.1. Principe général
Le concept central est la notion de correspondance, définie comme une relation entre
l'input et l'output (1995 : 4). En ce qui concerne l'épenthèse, les contraintes PARSE et FILL sont
reformulées respectivement en MAX-IO, "which liberates it from its connection with
syllabification and phonetic interpretation" et DEP. Celle-ci consiste en réalité en un ensemble
de contraintes qui "encompass the anti-epenthesis effects of FILL without demanding that
epenthetic segments be literally unfilled nodes, whose contents are to be specified by an
auxiliary, partly language-specific component of phonetic interpretation (1995 : 7). Ces
contraintes sont formulées de la manière suivante :
MAX-IO Every segment of the input has a correspondent in the output
DEP
Every segment of S2 has a correspondent in S180
DEP-BR Every segment of the reduplicant has a correspondent in the base
DEP-IO Every segment of the ouput has a correspondent in the input
En 1993, Prince & Smolensky (1993) envisageaient l'épenthèse comme un moyen de
pallier une insuffisance du matériel segmental lorsque la prosodie exige la présence d'un
constituant. Cet article de 1995 estime que le segment considéré comme une épenthèse est en
réalité présent dès le lexique, en vertu de ce principe de correspondance qui veut qu'il y ait
autant d'éléments dans un input que dans l'output qui y est lié ; en revanche, il s'agit de
déterminer parmi tous les candidats possibles lequel sera validé par la langue.
Plénat (1999 : 108) illustre la position des deux versions de la théorie en regard de
l'adjectif fastoche, analysé comme étant formé à partir de facile et du suffixe -oche :
(208)
Prince & Smolensky (1993)
FILL theory
fas.†ç
McCarthy & Prince (1995)
DEP theory
fas.tç (vs. fas.pç, fas.kç, etc.)
Pour Plénat (1999), le fait que le coup de glotte soit la consonne la plus fréquemment
rencontrée dans les langues du monde en tant que consonne épenthésée, et se place de fait
comme la consonne la moins marquée, tend à valider la théorie de 1993 : si la consonne était
80
Ce qui signifie qu'aucun élément ne doit apparaître, dans une forme candidate, qui ne soit présent dans l'input
correspondant.
289
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
présente dès le lexique, pourquoi correspondrait-elle systématiquement à la consonne la
moins marquée ?
Cependant, du fait que d'autres consonnes apparaissent en épenthèse, le degré de
marque s'avère ne pas être seul déterminant de la nature de la consonne épenthésée, ce qui le
pousse à préférer la deuxième théorie (comme par exemple Lombardi 1997, 2003, cf. chapitre
2 section 3).
Dans la sous-section suivante, je vais présenter l'analyse d'un cas d'épenthèse en
anglais, de façon à illustrer ce fonctionnement de la théorie DEP.
2.2.2.2.2. Illustration : épenthèse de [l] en coda
Reprenons le phénomène de l'épenthèse de [l] en anglais de Bristol (voir chapitre 1
section 2 et chapitre 2 section 3 ; cf. Lombardi 2003). En fin de mot se terminant par un
schwa, un [l] est épenthésé ; ainsi, le prénom Eva est prononcé [ivl]81.
Nous avons vu que la Théorie de l'Optimalité exclut les épenthèses en coda au motif
de la seule structure syllabique. Il faut donc ici postuler une contrainte préalable permettant de
référer au contexte mélodique en jeu, c'est-à-dire d'exclure les schwas en fin de mot. Ce sera
la contrainte *]w "word-final schwa is prohibited".
Pour satisfaire la construction d'un mot se terminant lexicalement par un schwa dans
ce dialecte, il faut donc décider entre l'épenthèse d'un élément ou la chute d'un autre, ce qui
est régi respectivement par les contraintes DEP, selon laquelle il ne faut pas ajouter de
matériel supplémentaire à celui fourni par le lexique, et MAX, selon laquelle il faut
impérativement utiliser tout le matériel segmental de la forme sous-jacente.
La langue préfère l'épenthèse, ce qui rend la violation de la contrainte MAX fatale,
celle-ci étant placée avant DEP. Nous obtenons le tableau suivant (Lombardi 2003 : 23) :
(209)
/iv/
iv
) ivC
iv
81
*]
!*
MAX
DEP
*
!*
L'article de Lombardi (2003) ne contient que cet exemple.
290
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Si la langue avait choisi la troncation, l'inversion de la hiérarchie des deux dernières
contraintes aurait permis d'en rendre compte comme l'indique le tableau suivant :
(210)
/iv/
iv
ivC
)iv
*]
!*
DEP
MAX
!*
*
Cette fois, c'est [iv] qui est optimal puisque la contrainte qu'il viole est la dernière dans
la hiérarchie.
2.2.2.3. Critique
Les deux théories (FILL et DEP) permettent de représenter adéquatement les données
sur l'épenthèse et ce à partir de contraintes universelles, dont seul l'ordonnancement est
paramétré dans une langue donnée. Toutes deux sont en mesure d'implémenter l'information
concernant la structure syllabique tout comme celle relative à la morphologie : il suffit
d'ajouter une contrainte qui y serait relative.
Vaux (2003) reproche au cadre, non sa manière de rendre compte de l'épenthèse, mais
le fait de considérer que sont épenthésés en priorité les segments non marqués : glottales,
coronales (cf. chapitre 2 sections 2 et 3). Il appuie cette appréciation sur le fait que l'on
observe d'autres consonnes épenthésées dans les langues du monde, comme les vélaires. Cette
critique semble plutôt injustifiée, puisque le cadre permet de rendre compte de n'importe quel
type d'épenthèse pourvu que les contraintes soient ordonnées correctement dans une langue
donnée.
En effet, ce que l'on peut reprocher aux deux, et par là à l'ensemble du cadre, c'est
précisément son manque de "prédictibilité". Etant donné que le nombre de contraintes n'est
pas limité, étant donné surtout que les contraintes sont toutes violables, rien n'est réputé
impossible dans ce cadre.
La critique majeure apportée à la représentation de l'épenthèse dans le cadre de la
théorie de l'Optimalité est donc la même que celle formulée à l'encontre des cadres génératifs
de première génération : ces théories sont non contraintes, elles sont capables de tout générer,
y compris ce qui n'est pas possible dans la langue. Toutes ont cependant pour objectif de
parvenir à un ensemble d'éléments universaux (règles ou contraintes) dont la hiérarchie serait
291
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
paramétrable selon les langues. Tant que cet inventaire ne sera pas fini, il ne sera pas possible
à la théorie d'émettre des prédictions falsifiables, et elle restera de ce fait descriptive et non
explicative.
Tournons-nous à présent vers les contraintes elles-mêmes. Celles supposées pour
rendre compte de l'épenthèse, à savoir ONS(ET), -COD, augmentées de FILL et PARSE pour un
modèle ou DEP et MAX pour l'autre, sont liées à la structure de la syllabe. La théorie explique
donc pourquoi il y a possibilité d'épenthèse dans les langues : c'est la structure de la syllabe
qui impose une attaque là où le matériel lexical n'en fournit pas. Pour ce qui est des
épenthèses en coda en revanche, la théorie n'implémente pas la nécessité d'une coda parmi les
conditions favorisant son apparition, ce qui signifie qu'elle ne reconnaît pas de contrainte
structurale dans ce cas de figure.
Par ailleurs, la théorie ne permet pas d'expliquer comment la structure de la syllabe
joue un rôle dans l'apparition d'une consonne épenthétique. Elle ne fait qu'implémenter
l'observation que c'est le cas, mais n'explique pas le lien nécessaire entre les deux, et encore
moins par un mécanisme interne à la théorie qui se détacherait des données pour parvenir à
une réelle dimension explicative.
Enfin, dans ce cadre théorique, le terme d'épenthèse n'est utilisé que par facilité ou
abus de langue, dans le sens où il n'y a pas insertion d'un segment à proprement parler, mais
évaluation de tous les outputs possibles. La Théorie de l'Optimalité n'évalue pas d'abord
l'épenthèse face à un autre mode de résolution de la structure de la syllabe, puis les candidats
mélodiques possibles pour remplir cette structure. Tous les outputs sont évalués en parallèle,
qu'ils portent sur la structure même de la syllabe (donc de l'output avec élision vs. celui avec
épenthèse) ou sur la nature de la consonne épenthésée. De ce fait, il ne s'agit plus d'épenthèse,
comme pour les modèles théoriques précédents, mais de la simple élection du candidat
optimal.
Nous avons vu en section 2.2 du chapitre 1 que, outre la structure des unités et
l'information morphologique, l'accent pouvait également contribuer à justifier l'insertion d'une
consonne épenthétique.
Tournons-nous donc vers un cas d'épenthèse conditionnée par l'accent, et l'analyse qui
en est proposée.
292
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.3. Epenthèse et accent : Scheer (2000a)
2.2.3.1. Présentation de l'analyse
Scheer (2000a : 151-154) s'intéresse à l'épenthèse du coup de glotte en allemand (cf.
chapitre 1 section 1), dont le tableau suivant récapitule les principes82 :
(211)
V_V
#_V
accentuée
non
accentuée
accentuée
non
accentuée
graphie
echt
üben
Antenne
Idee
Duel
Poet
duellieren
poetisierend
épenthèse de []
t
yybn
an’tn
i’dee
d’l
poo’eet
*du’liin
*pooeeti’ziint
épenthèse de glide
sans épenthèse
d’wl
poo’eet
duw’liin
pooeeti’ziint
glose
"authentique"
"s'exercer"
"antenne"
"idée"
"duel"
"poète"
"se battre en duel"
"poétisant"
A l'initiale, une voyelle lexicale sera précédée en surface d'un coup de glotte
épenthétique, et ce, quel que soit son statut en regard de l'accent.
En hiatus en revanche, la question de l'accent est cruciale : non accentuée, la deuxième
voyelle d'un hiatus n'est jamais précédée de l'occlusive glottale mais est réalisée avec un glide
homorganique de la première voyelle si celle-ci est haute ([duwe'liin]) ou sans consonne si
ce n'est pas le cas ([pooeeti'ziint]). Accentuée, la deuxième voyelle de l'hiatus peut se voir
précédée d'un coup de glotte ([dl]) ou être réalisée, comme une voyelle non accentuée,
avec un glide ([d’wl]) ou rien ([poo’eet]).
Un coup de glotte est donc inséré à l'initiale de mot (devant voyelle) et à
l'intervocalique si la deuxième voyelle de l'hiatus est accentuée.
L'analyse de Scheer (2000a) se situe dans le cadre CVCV83 (Lowenstamm 1996,
Scheer 1996, 1999), développement récent de la Phonologie de Gouvernement (Kaye & al
1985, 1990, Harris 1990). Dans ce cadre, le niveau squelettal consiste en une suite de C et de
V en stricte alternance. Chaque position vocalique, ou noyau, doit être reliée à du matériel
segmental à l'intérieur d'une représentation84 ou, à défaut, doit être proprement gouvernée85.
82
L'accent est indiqué avant la syllabe sur lequel il porte par une apostrophe (convention API).
Cf. partie III chapitre 8 pour une présentation plus complète de ce cadre.
84
Ce qui n'infère pas qu'un morphème ne puisse être constitué uniquement de positions squelettales.
83
293
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Le gouvernement propre (Kaye & al. 1990) est dispensé par un noyau attaché à du matériel
segmental vers une voyelle à sa gauche, de telle sorte que celle-ci peut rester phonétiquement
vide. A défaut, la voyelle gouverne sa propre attaque. Dans tous les cas, le gouvernement est
obligatoire.
Pour des motifs extérieurs à ce cas d'épenthèse (aspiration des occlusives sourdes
anglaises, loi de Verner, les voyelles issues du latin en français, la distribution du [h]
hollandais), Scheer (2000a : 141) est amené à proposer l'implémentation de l'accent par un
groupe de deux positions [CV] (étant donné la structure du niveau squelettal, toute insertion à
ce niveau comporte nécessairement les deux positions).
L'introduction de ce matériel squelettal par l'accent fournit une position vocalique
supplémentaire à la structure, position qui n'est pas remplie mélodiquement. Le gouvernement
doit alors s'appliquer, de façon à autoriser la présence de cette position vocalique ; de ce fait,
il ne peut s'appliquer à la consonne qui le précède immédiatement. C'est ce manque de
gouvernement d'une position consonantique qui conduit à l'insertion de la consonne
épenthétique.
Le tableau suivant illustre la différence de comportement de la langue en hiatus, selon
que la deuxième voyelle est accentuée ou non :
(212)
deuxième voyelle non accentuée
Gvt
C
|
k
V
|
a
C
V
|
ç
C
|
s
deuxième voyelle accentuée
Gvt
V
C
|
k
V
|
a
[C
V]
C
V
|
o
ti

Chaos ['kaçs] "chaos"
chaotisch [ka'çti] "chaotique"
Par ailleurs, selon cette théorie le début de mot comporte une unité [CV]
(Lowenstamm 1999), dont l'existence a été postulée là encore pour des raisons indépendantes
de l'épenthèse : la cliticisation en français et en hébreu. Scheer (2000b) a proposé de
paramétrer cette unité [CV] pour des raisons distributionnelles86 : les langues qui ont une
85
Le principe des catégories vides (ECP) peut également être satisfait par le gouvernement infrasegmental
(Scheer 1996) et le licenciement des noyaux vides finaux en ce qui concerne les voyelles. Ceux-ci ne sont pas
pertinents pour le raisonnement présenté ici.
86
Cf. section III [8] pour une présentation circonstanciée du [CV] initial et du débat sur sa paramétrisation.
294
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
distribution consonantique libre à l'initiale (C, TR, RT) n'ont pas ce [CV] initial, celles qui
tolèrent uniquement les consonnes simples ou les groupes de consonnes à sonorité croissante
(C, TR, *RT) disposent de ce [CV] – et sont donc dans l'obligation de le gouverner. Ce débat
n'est pas pertinent ici puisque, même dans l'option de Scheer (2000b), l'allemand comporte un
[CV] initial.
L'allemand fait partie de ce deuxième groupe de langues, et a donc un [CV] à l'initiale.
Ce qui rend le traitement de l'épenthèse en allemand uniforme : "toute Attaque vide non
gouvernée est remplie par un coup de glotte" (Scheer 2000a : 154). Le tableau ci-dessous met
en regard les deux cas, c'est-à-dire initiale de mot vs. hiatus dont la deuxième voyelle est
accentuée.
(213)
initiale de mot
Gvt
[C
V]
C
V
|
ç
deuxième voyelle accentuée
Gvt
ft
C
|
k
V
|
a
[C

oft ['oft] "souvent"
V]
C
V
|
o
ti

chaotisch [ka'çti] "chaotique"
2.2.3.2. Critique
L'analyse de Scheer (2000a) fait état des cas où il y a épenthèse consonantique, mais
ne tient pas compte du fait qu'en ce qui concerne l'hiatus accentué, l'épenthèse est facultative.
Selon cette analyse, l'épenthèse est obligatoire au même titre que l'est celle du début de mot,
puisque c'est le maintien de la structure qui est en jeu.
Cette analyse est en relation avec la structure syllabique du mot et sa bonne formation.
Le cas d'épenthèse relevé ici ne portant pas sur une frontière morphologique, on ne peut
évaluer de la pertinence de l'analyse dans le contexte morphologique. On peut toutefois
supposer que la frontière morphologique puisse distribuer elle aussi un [CV] (cf. Pagliano
1999a, b, Barillot 2002 ; cf. partie III [11]), auquel cas il y aurait unification des contextes
d'apparition de l'épenthèse et par là une prédiction de la théorie : toute position consonantique
295
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
non gouvernée en allemand doit être remplie par du matériel épenthétique – ou propagé par
une voyelle haute en première partie d'hiatus, comme ici ([d’wl]).
L'analyse proposée fait la prédiction suivante : toute position en rapport avec l'accent
manifestera un "allongement" au sens large, traduction de l'insertion d'un [CV] dans la
structure. C'est le cas dans les langues évaluées par Scheer (2000 a: 141-151).
Par ailleurs, l'épenthèse est ici expliquée par un raisonnement interne à la théorie et
non par une simple implémentation de ce qui est observé en surface – d'où les "ratés" dans les
prédictions d'ailleurs (Poet, bien qu'accentué sur la deuxième syllabe, peut ne pas comporter
d'épenthèse d'occlusive glottales en hiatus : [poo’eet]), signe de la perfectibilité de la théorie.
Comme les théories prenant en compte la structure syllabique exposées en section 2.1,
l'hypothèse formulée ici se veut explicative : elle établit un lien de cause à effet entre la
présence de l'accent et l'apparition d'une consonne épenthétique. Les autres théories, linéaires
comme basées sur des contraintes, définissent les contextes d'apparition, fournissent le cas
échéant une explication en termes de frontière morphologique ou de structure syllabique, mais
n'expliquent pas quelle est la motivation de l'épenthèse.
296
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
2.2.4. Bilan
Le tableau ci-dessous reprend de manière synthétique les analyses présentées dans les
deux sections précédentes :
(214)
Analyse
syllabique
Æ présence de la position
non-syllabique
Æ insertion d'une consonne
Cadre
Section
Pupier 71
2.1.1
Wetzels 85
Picard 87, 89
2.1.2
Wetzels 87
2.1.3
Piggott &
Singh 85
2.2.1.1
Itô 89
2.2.1.2
Prince &
Smolensky
93
2.2.2.1
McCarthy &
Prince 95
2.2.2.2
Scheer 2000a
2.2.3
Données
dérivés verbaux
français
Conditionnement de
l'épenthèse
hiatus
Critique
- non prise en compte de la
frontière morphologique
- fléchage des unités sujettes à
l'épenthèse dans le lexique
- surgénération des sites
d'épenthèse
à l'intérieur des
mélodie + frontière - frontière de syllabe sans
groupes
syllabique
dimension explicative
consonantiques
- plusieurs morphèmes de
féminin, fléchage dans le lexique
après une base en hiatus + frontière - surgénération : tous les hiatus +
français
morphologique
frontière ne sont pas déclencheurs
- 'timing slot' (remplaçant la
resyllabation)
à l'intérieur des position structurale
groupes
vide créée au cours - [s] est syllabifié en noyau
consonantiques
de la syllabation
position structurale - ne prend pas en compte la
vide dans un
morphologie alors que portée
générales
"gabarit" créé par la générale
syllabation
- système non contraint
générales
tous
- pas d'explication interne au
modèle
- pas d'explication du lien
nécessaire entre les causes et
générales
tous
l'épenthèse
coup de glotte
- non prise en compte de la
accent
allemand
variation
La répartition entre les théories du courant non-syllabique et celles du courant
syllabique permet de montrer la progression dans le traitement de l'épenthèse consonantique.
Les premières approches génératives manquaient de portée générale du fait qu'il leur
fallait rendre compte de l'insertion de la consonne, donc être en mesure d'exclure tous les
contextes dans lesquels il n'y avait pas d'épenthèse possible. En effet, la formulation générale
de la règle d'épenthèse : ø Æ X / A_B avait pour principal défaut que l'ensemble vide était
possible au sein de n'importe quelle séquence de segments. De ce fait, c'était au contexte
d'apporter la précision, et ce contexte ne pouvait se définir qu'au cas par cas, dans une langue
donnée.
297
Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français
Au sein de la deuxième génération, les théories se divisent en deux groupes selon
qu'elles implémentent simplement l'observation d'un lien de cause à effet entre un contexte
donné (structure d'un constituant, information morphologique) ou qu'elles apportent une
dimension explicative à l'épenthèse, cette dimension découlant de la théorie et non de la
simple "traduction" des motifs de l'épenthèse.
298
Conclusion de la partie I
Conclusion
Au cours de cette première partie ont été exposées les différentes épenthèses
consonantiques recensées dans la littérature, assorties d'un examen de leurs conditions
d'apparition en termes structuraux comme morphologiques.
La focalisation sur les épenthèses en français a permis d'établir l'omniprésence des
coronales dans cette langue. L'examen de cette catégorie de consonnes en a montré la
spécificité. J'ai présenté dans quelle mesure cette spécificité était reconnue dans différentes
théories phonologiques.
Un troisième chapitre s'est penché sur la place accordée, dans les théories
phonologiques (génératives), à l'épenthèse. Les différentes analyses exposées ont souligné un
point important : tous les phénomènes d'alternance ne relèvent pas d'un processus unique ; il
est nécessaire de faire la part entre les consonnes sous-jacentes flottantes, telles qu'on les
trouve par exemple à la liaison ou qui apparaissent dans certains cas à la flexion, les
consonnes appartenant à un terme présent tel quel dans le lexique et non dérivé, et les
épenthèses consonantiques ex nihilo.
Dans la partie suivante vont être élaborés les matériaux qui serviront de base à l'étude
des épenthèses consonantiques à la frontière dérivationnelle suffixale en français, de façon à
compléter les informations relatives à l'épenthèse récoltées ici. Seront notamment indiquées
les étapes de tri des données brutes, dont les analyses précédentes ont montré la nécessité.
L'ensemble de ces outils – théoriques comme empiriques – permettra dans une
troisième partie de proposer une analyse intégrant le processus d'épenthétisation à la
dérivation en français à l'intérieur d'un cadre plus large d'intervention de différents niveaux de
la grammaire dans la phonologie.
299
Conclusion de la partie I
Index des langues
A
G
allemand ...24, 26, 31, 32, 36, 37, 38, 41, 42,
gokana24, 28, 31, 32, 37, 38, 43, 44, 45, 46,
43, 45, 46, 51, 56, 57, 58, 61, 62, 66, 68,
76, 79, 184, 197, 289, 291, 292, 293
amharique .........................35, 37, 38, 59, 76
anejom ................................................29, 38
anglais 25, 26, 29, 30, 37, 38, 39, 41, 42, 43,
44, 45, 46, 51, 53, 55, 56, 58, 60, 61, 65,
76, 79, 111, 116, 117, 125, 126, 149,
159, 178, 181, 183, 193, 201, 262, 264,
273, 275, 286
arabe .......21, 26, 38, 43, 46, 60, 61, 76, 170
asheninca campa.....34, 37, 38, 44, 45, 46, 68
atayal ..19, 20, 26, 38, 41, 42, 46, 56, 60, 76
ayutla mixtec ....13, 14, 37, 42, 46, 62, 76, 79
B
61, 66, 75, 76, 78, 80, 195
guajiro ........................ 14, 37, 41, 42, 61, 76
H
hanunoo ............................ 12, 14, 37, 44, 45
hare ................ 13, 37, 44, 45, 46, 64, 76, 79
hébreu .................................... 12, 21, 37, 38
huariapano .... 13, 37, 42, 46, 62, 76, 79, 283
I
ilokano18, 20, 26, 38, 45, 46, 66, 67, 74, 76,
80
indonésien 16, 20, 26, 38, 45, 46, 66, 67, 72,
76, 78, 80
baka ...27, 37, 38, 44, 45, 46, 65, 69, 76, 79,
80
bearlake ..........13, 37, 44, 45, 46, 64, 76, 79
buginese ..................9, 37, 38, 42, 46, 60, 76
bulgare ....25, 26, 38, 43, 46, 56, 61, 76, 262
C
chipewyan ............................................13, 37
coréen .............................31, 32, 35, 38, 125
cupeño ......22, 26, 38, 41, 42, 46, 56, 60, 76,
192, 283
E
J
japonais ... 29, 37, 38, 44, 45, 46, 66, 67, 75,
76, 78, 80, 195
K
kaingang ............................................... 9, 37
kisar ............... 18, 20, 26, 38, 43, 46, 61, 76
koryak .................. 22, 23, 38, 43, 46, 61, 76
L
langues tchadiques ..................................... 38
larike .................................................. 20, 38
espagnol sévillan .................30, 33, 38, 44, 45
F
fox ................................................14, 15, 37
français québécois ...38, 39, 71, 82, 83, 87, 90
fula ....31, 32, 37, 38, 44, 45, 46, 60, 65, 66,
76, 79, 119, 120, 121, 195
M
makassar.. 17, 20, 26, 38, 41, 42, 46, 56, 61,
76
malais .. 6, 16, 17, 20, 26, 38, 44, 45, 46, 63,
71, 72, 76, 78, 79
maltais36, 37, 38, 44, 45, 46, 64, 70, 76, 77,
78
mohawk ...................................... 22, 38, 123
mongol .............................. 10, 37, 44, 45, 46
murut ................................. 9, 31, 32, 37, 38
300
Conclusion de la partie I
N
nisgha..................................................12, 37
O
odawa.34, 37, 38, 44, 45, 46, 66, 67, 73, 76,
78
P
persan ...............................22, 23, 38, 45, 69
S
selayarese .17, 20, 26, 38, 43, 45, 46, 59, 65,
76, 79, 124
sundanese ............................................20, 38
T
tchèque .... 25, 26, 38, 43, 45, 46, 61, 62, 66,
67, 73, 76, 80, 114
tigré........................................ 12, 24, 37, 38
tigrigna .... 21, 26, 38, 44, 45, 46, 64, 66, 67,
74, 76, 78, 80, 132
tsishaath nootka ................................... 22, 38
tucanoan ............................................. 14, 37
tunica 22, 31, 32, 37, 38, 41, 46, 58, 76, 79,
193, 194, 195
U
uradhi ................................. 9, 37, 40, 41, 46
Y
yagua .................................................. 14, 37
yucatec...... 12, 14, 37, 41, 42, 46, 56, 60, 76
tamil ..18, 22, 23, 26, 38, 43, 46, 61, 76, 79,
112
301
Sommaire
Sommaire
Introduction générale............................................................................................................... 1
PARTIE I.
L’ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN
GÉNÉRAL ................................................................................................................................ 5
Introduction .............................................................................................................................. 6
Chapitre 1. Distribution géographique, variation qualitative, contextes d'apparition et
causalités ................................................................................................................................... 7
1. Définition ........................................................................................................................... 7
2. Substance des épenthèses consonantiques dans les langues du monde ........................... 12
3. Les épenthèses en français ............................................................................................... 88
Chapitre 2. Le caractère particulier des consonnes coronales : phonétique, phonologie,
théories .................................................................................................................................. 109
1. Les coronales : quelques faits phonétiques .................................................................... 109
2. Le statut particulier des coronales : phonologie............................................................. 119
3. Le statut particulier des coronales : les théories génératives ......................................... 144
Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français : liaison
et épenthèse ........................................................................................................................... 204
1. Epenthèse et alternances consonne ~ zéro ..................................................................... 204
2. Analyses antérieures de l'épenthèse ............................................................................... 259
Conclusion............................................................................................................................. 299
Index des langues.................................................................................................................. 300
302
Partie II.
L'épenthèse consonantique
devant suffixe dérivationnel
en français : les faits
300
Partie II – L'épenthèse consonantique devant suffixe dérivationnel en français : les faits
Introduction
Cette seconde partie est consacrée à la constitution d'un corpus portant sur l'épenthèse
consonantique à la frontière dérivationnelle suffixale en français. Dans un premier temps
(chapitre 4), je définirai les contours de l'objet d'étude, en précisant la nature du français pris
en compte, tant du point de vue de la variation sociale que de celui de la dimension temporelle
dans laquelle s'inscrit le corpus. Je proposerai également une mise au point terminologique en
ce qui concerne la suffixation.
Le chapitre suivant (chapitre 5) sera dévolu à la constitution de la base de données
brutes. Il décrira les sources auxquelles il a été fait appel, et proposera une évaluation de leur
intérêt respectif en termes de travail préalable à l'extraction mais également des résultats
obtenus en regard du sujet d'étude que constituent les dérivés suffixaux français présentant
une épenthèse consonantique entre les deux morphèmes minimalement en relation.
Dans le troisième chapitre de cette partie (chapitre 6), je détaille les deux étapes
distinctes qui ont réduit de manière significative la base de données, puisque des 859 unités
lexicales initialement retenues ne subsistent dans le corpus final que 272. Au terme de chacun
des deux filtres – le filtre "étymologique" comme le filtre "suffixal" – est proposé un bilan de
la composition du corpus en fonction de critères morphologiques comme phonologiques.
Enfin, le dernier chapitre se penche sur le rôle d'un questionnaire visant à compléter le
corpus au moyen de néologismes strictement synchroniques. J'exposerai les contraintes
portant sur l'établissement et la réalisation concrète du questionnaire ainsi que sur son
exploitation, et présenterai les résultats obtenus, en les mettant en parallèle avec ceux issus du
corpus.
Au terme de cette partie, le lecteur disposera d'un corpus aux contours précis, propre à
servir de fondement à une réflexion sur l'épenthèse consonantique à la frontière suffixale en
français.
301
Chapitre 4 – Délimitation de l'objet d'étude
Chapitre 4.
Délimitation de l'objet d'étude
Un des objectifs de cette thèse est d'éclaircir les conditions d'occurrence des
épenthèses situées entre radical et suffixe en français, créées par les francophones quelle que
soit leur catégorie sociale, leur provenance géographique ou la période dans l'histoire du
français à laquelle ils les ont produites. Si les critères temporels, géographiques ou sociaux
sont pertinents, ce sera précisément à l'analyse de le mettre en évidence : dans le cas où
l'épenthèse obéit à un système unique, alors preuve est faite que ces critères ne sont pas
pertinents. Dans l'hypothèse contraire, l'analyse indiquera la valeur de chacun.
Il serait pourtant opportun de préciser davantage la – ou les – variétés de français
concernée : s'agit-il du français standard contemporain ? Quels sont les registres de langue
considérés ? Sur quelle période s'étend l'étude ?
Dans un premier temps, je présenterai différentes définitions ou acceptions données
aux notions de langue "standard", de français "populaire" ou "ordinaire". Cette thèse n'a pas
pour ambition de contribuer au débat sociolinguistique sur ces notions, aussi me contenteraije de souligner les convergences entre les définitions et de rappeler les points d'achoppement.
Je m'intéresserai ensuite à la "synchronie" dans le cadre d'une étude comme celle-ci.
1. Français standard, populaire, ordinaire...
Il s'agit dans cette section non pas de fixer une étiquette ou un cadre sur le français
concerné par cette étude, mais au contraire de montrer pourquoi aucun cadre limitatif ne peut
être établi d'emblée. Je commencerai par rappeler les différentes acceptions données à la
notion de "langue standard" puis envisagerai les étiquettes de "langue populaire" et "français
ordinaire".
1.1. Français standard
Esquissons tout d'abord la notion de "standard", telle que définie dans un premier
temps par les dictionnaires de façon à appréhender les difficultés inhérentes au concept, puis
302
Chapitre 4 – Délimitation de l'objet d'étude
de manière plus pointue par la sociolinguistique et la didactique des langues qui s'y sont
intéressé plus particulièrement.
Le Dictionnaire de linguistique et des sciences du langage de Dubois & al (1994)
indique que
"une forme de langue est standard quand, dans un pays donné, au-delà des variations
locales ou sociales, elle s'impose au point d'être employée couramment, comme le
meilleur moyen de communication, par des gens susceptibles d'utiliser d'autres formes
ou dialectes. C'est d'une manière générale une langue écrite. Elle est diffusée par
l'école, par la radio, et utilisée dans les relations officielles. Elle est généralement
normalisée et soumise à des institutions qui la régentent. Dans ce sens, on parle aussi
souvent, par exemple, de français commun. La langue standard tend à supprimer les
écarts en imposant une forme unique entre toutes les formes dialectales. Elle ne se
confond pas nécessairement avec la langue soutenue, bien qu'elle tende à s'en
rapprocher. Ainsi, une prononciation tend à être adoptée comme celle du français
courant, central dans toutes les provinces. On dira que cette prononciation est
standardisée. Dans la pratique, standardisé et normalisé ont des sens voisins, bien que
ce dernier terme insiste davantage sur l'existence d'institutions régulatrices (Académie
française, école, etc.)".
Le TLF donne l'acception linguistique suivante à la notion de standard, dans le
contexte d'une langue ou d'un état de langue : "le plus couramment employé au sein d'une
communauté linguistique, qui correspond à l'usage dominant jugé normal, sans tenir compte
des variations géographiques ou sociales."
Le dénominateur commun de ces deux définitions est la mise à l'écart des variations
sociale et géographique, ainsi que la notion de "plus couramment employé". Dubois & al.
(1994) insistent sur le rôle des institutions dans le "véhiculage" de ce standard, allant jusqu'à
préciser qu'il ne s'agit pourtant pas de langue soutenue, tandis que le TLF met en exergue la
normalité, l'usage dominant. Plusieurs problèmes se posent quant à ces définitions : outre la
difficulté qu'il peut y avoir à définir exactement ce qui relève de la variation sociale ou
géographique, mais qui ne peut être totalement éradiquée du fait du mouvement constant de la
langue, il semble plus périlleux encore de s'engager sur le terrain de la normalité de la langue,
ou de quantifier les termes d'une langue donnée pour déterminer ceux qui sont "le plus
couramment employés".
303
Chapitre 4 – Délimitation de l'objet d'étude
Ce manque de précision quant à la définition de la langue "standard" n'est pas inhérent
aux dictionnaires consultés. En effet, si l'on consulte des ouvrages ou articles de disciplines
plus précisément intéressées par le sujet, le même flou se rencontre, doublé d'une certaine
hétérogénéité du concept.
1.1.1. Standard, norme et communauté linguistique
Les deux disciplines que sont la sociolinguistique et la didactique des langues se sont
beaucoup penchées sur la notion de "standard", liée en partie aux notions de "norme" et de
"communauté linguistique".
Une langue standard se détermine tout d'abord par rapport à une communauté
linguistique, c'est-à-dire "un ensemble de variétés linguistiques superposées dont une, au
moins, est reconnue par l'ensemble des locuteurs comme langue de référence. On appelle
langue standard la variété reconnue comme modèle par l'ensemble des locuteurs. Cette variété
remplit une fonction d'intégration symbolique à la communauté linguistique." (Marchand
1975 : 26-27). Cette fonction d'intégration exige pour Marchand "une norme explicite – et
c'est là une des caractéristiques essentielles des langues standard." Il met en avant le lien étroit
entre la communauté linguistique et sa langue standard, les deux se déterminant l'une l'autre.
Le concept de "standard" fait également appel à celui de "norme". Il s'agit cependant
de préciser de quelle norme il s'agit : norme objective ou norme subjective ? Et comment se
définit la norme en regard des registres de langue ?
Pour Baylon (1991 : 162-165), "il existe deux façons d'aborder le problème de la
norme en matière de langage. D'un point de vue formel, on peut la définir par la négative,
comme une moyenne : il s'agit de la langue sans les écarts. On rejette alors aussi bien les
registres populaires et familiers que les usages trop distingués. On obtient une norme d'usage,
statistique, qui représente le registre des habitudes linguistiques sociales qui se régularisent
par la vie en société. Mais on peut aussi voir dans la norme un modèle à imiter : cette
définition en positif désigne alors l'ensemble des formes habituellement considérées comme
correctes. (...) La sociolinguistique s'est intéressée à la notion de norme : elle lie le
phénomène normatif à l'idéologie sous un double aspect de "pratique sociale"
(comportements sociaux) et de "consensus" (acceptation pour une communauté de
locuteurs)." On retrouve ce lien entre norme, communauté linguistique et langue standard par
exemple chez Milroy & Milroy (1997 : 52), pour qui "speech communities in which
quantitative sociolinguistics have usually worked have been within nation states in which a
304
Chapitre 4 – Délimitation de l'objet d'étude
standardized form of the language is considered to be a well-established superordinate norm
(as contrasted with pidgin situations, for exemple)."
1.1.2. Standard et correctitude de la langue
La langue standard est également mise en relation avec la "correctitude de la langue".
Pour Armstrong (2001 : 4) par exemple, "the connotations of the term 'standard language',
even for scholars of linguistics, have the potential to evoke notions of 'correctness'." Le lien
avoué entre langue standard et aspect correct est également manifesté par Marchand (1975 :
39), qui va plus loin en dénonçant l'abus de certains travaux considérant la langue standard
comme la seule langue existante ou en tout cas la seule langue possible : "Bon nombre de
manuels contemporains, en particulier la plupart des manuels de grammaire en usage dans
l'enseignement, rejettent nettement ces différentes variétés hors de la langue, puisque la seule
opposition relevée est celle de "correct" vs "incorrect", soit "appartient à la langue française",
"n'y appartient pas". (…) Ces grammaires ne signalent donc même pas l'existence d'autres
usages et donnent à croire qu'il existe une langue homogène."
Cet aspect radical du français standard comme porteur d'une seule variété n'est
cependant pas partagé par tous les sociolinguistes. Valdman (1993 : 7-8) considère en effet
que bien que le français standard soit "la principale variété linguistique" des régions où il est
la langue actuelle, "même de nos jours, [il] montre une variation qui se manifeste
principalement sur le plan de la prononciation et du vocabulaire" et s'étend sur une large
gamme de registres de langues.
1.1.3. Standard et naturalité
Outre ce problème de reconnaissance des variétés au sein d'une langue entrevu dès lors
que l'on emploie le terme de langue standard, se dégage une autre difficulté liée à la nature
même de cette langue standard et à son caractère artificiel. Hudson (1980 : 34) le caractérise
comme "the unusual character of standard languages, which are perhaps the least interesting
kind of languages for anyone interested in the nature of human language (as most linguists
are). For instance, one might almost describe standard languages as pathological in their lack
of diversity. To see language in its 'natural' state, one must find a variety which is neither a
standard language, nor a dialect subordinate to a standard (since these too show pathological
305
Chapitre 4 – Délimitation de l'objet d'étude
features, notably the difficulty of making judgments in terms of the non-standard dialect
without being influenced ty the standard one)."
1.1.4. Bilan sur le français standard
L'étude présentée ici ne peut être considérée comme portant sur le français standard, à
supposer qu'une telle entité existe, et ce pour plusieurs raisons. Tout d'abord, le manque de
clarté quant au concept de langue standard et particulièrement le manque de consensus sur le
nombre de registres contenus dans une langue standard interdisent toute affirmation trop
véhémente quant à l'appartenance d'un corpus à cette langue standard et à elle uniquement. De
plus, la langue standard est liée à la notion de correction ou plutôt de "correctitude", or l'étude
porte en partie sur des réalisations synchroniques, donc pour la plupart non attestées dans les
dictionnaires : comment juger de leur degré d'acceptabilité par la langue standard ? Par
ailleurs, cette étude ne souhaite en aucune façon se réduire à un français qualifié d'artificiel
mais a au contraire pour ambition de s'intéresser aux mécanismes réels de la langue, c'est
pourquoi la variation y est nécessaire, excluant par là-même toute référence à un système
unique.
Si l'on rejette le terme de français standard comme cadre de notre étude, peut-on pour
autant trouver un terme définissant plus adéquatement l'ensemble des données considérées
dans cette thèse ? Peut-on parler de "français populaire" ou de "français ordinaire" par
exemple ?
1.2. Français populaire
Le français populaire est selon Valdman (1993 : 7-8) "associé aux classes sociales
inférieures de la capitale" et est un sous-ensemble du français standard, son "style familier".
C'est également ce que déplorent Blanche-Benveniste & Jeanjean (1986 : 11-14) dans
le sens où français populaire et français parlé sont souvent associés dans la littérature1 – à
tort. Qu'il soit considéré comme partie intégrante du français standard ou non, il reste que le
terme de "français populaire" est lié aux registres de langue, et l'utilisation de ce terme
exclurait tous les autres registres du français, ce qui n'est pas souhaitable dans le cadre de
cette étude.
1
voire français fautif, cf. Blanche-Benveniste (2002 : 11).
306
Chapitre 4 – Délimitation de l'objet d'étude
1.3. Français ordinaire
Le terme de "français ordinaire" semble séduisant dans le cadre de cette étude. Gadet
(1989 : préface) le définit de la manière suivante :
"Le français ordinaire… Ce n'est pas là un terme habituel en linguistique. Car
qui a conscience d'être, dans sa façon de parler, ordinaire, ou bien d'être autre chose
que toujours ordinaire ?
'Français ordinaire' doit être compris par référence à ce à quoi on peut
l'opposer. Ce n'est bien sûr pas le français soutenu, ni recherché, ni littéraire, ni
puriste. Mais ce n'est pas non plus (pas seulement) le français oral ou parlé, puisqu'il
peut s'écrire. Pas davantage le français populaire, ramené à un ensemble social. C'est
davantage le français familier, celui dont chacun est porteur dans son fonctionnement
quotidien, dans le minimum de surveillance sociale : la langue de tous les jours."
Parce qu'il écarte certains registres, le terme de "français ordinaire" ne se prête que
partiellement à l'étude entreprise ici. Il est vrai que tout ce qui relève du "français soutenu,
recherché, puriste" échappe le plus souvent à la spontanéité de la réalisation, ce qui est
dommageable lorsque l'on souhaite travailler sur le système de la norme objective et non
subjective. Cependant, exclure cet ensemble a priori ampute l'analyse de données dont on ne
peut évaluer à l'avance la pertinence.
1.4. Variations régionale et sociale
Si l'on accepte tout type de variation stylistique puisque tous les types de registres sont
susceptibles d'être représentés, comment considère-t-on ce qui relève de la variation régionale
ou de la variation sociale ?
La variation dialectale ou régionale, rejetée par le français standard, inclut des unités
lexicales comme des structures syntaxiques influencées par le parler local, dont les
mécanismes peuvent être différents de ceux de la langue française. Gadet (1989 : 8) définit ce
qu'elle appelle la "variation régionale" comme "les usages régionaux du français, en France et
hors de France, les particularismes régionaux ou "régionalismes", qui n'existent en tant que
tels que lorsqu'une forme manque à être utilisée sur toute la zone d'extension du français. (…)
Les régionalismes sont pour la plupart d'ordre lexical". Elle mentionne en outre les
"phénomènes qui peuvent en être rapprochés ; les interférences, entre langues, ou entre langue
307
Chapitre 4 – Délimitation de l'objet d'étude
et dialecte". De ce fait, l'inclusion de régionalismes dans le corpus pourrait fausser les
données : rien ne permet en effet de savoir si une épenthèse dans une unité lexicale donnée est
le résultat d'un processus typiquement "français" ou si elle est issue d'un mécanisme dialectal.
La variation géographique importante que l'on peut observer dans les pays francophones me
semble relever du même mécanisme, peut-être même plus accentué dans ce sens que, dans un
pays où le français cohabite avec d'autres langues – l'anglais au Canada, l'allemand, l'italien et
leurs variantes en Suisse, le néerlandais en Belgique, le catalan, l'occitan, l'alsacien en France,
etc. – l'influence de ces langues peut modifier les processus "naturels" d'épenthétisation.
Cependant, l'exclusion de termes au motif de leur caractère régional, tout comme l'exclusion
de certains registres, risque d'appauvrir le corpus sans qu'il soit toujours possible de
déterminer avec certitude le caractère réellement régional de certaines unités lexicales.
De la même manière, les "langues de spécialité" relevant de la variation sociale, telles
que le vocabulaire de la médecine ou de la chimie, ne fonctionnent pas nécessairement sur le
même mode que la langue générale : elles font appel notamment à des préfixes et à des
suffixes particuliers, et la création lexicale y est rarement spontanée, ce qui est un frein à toute
adaptation naturelle de la langue telle que la troncation ou l'épenthèse. Cependant, il pourrait
être intéressant d'étudier précisément si cette hypothèse de départ, à savoir la non-adaptation
des langues de spécialité au fonctionnement général de la langue, est fondée ou non. C'est
pourquoi il m'a semblé plus judicieux de garder les termes relevant de langues de spécialité,
afin de déterminer leur éventuelle particularité. Ces termes seront codés comme tels dans le
corpus, de façon à les traiter séparément, le cas échéant.
En dehors de ces langues de spécialité, la variation sociale n'est pas si tranchée que je
puisse décider avec certitude d'éliminer tel ou tel terme de mon corpus, au prétexte qu'il
appartiendrait à une certaine classe sociale à l'exclusion de toute autre ; Gadet (1989 : 9) parle
à ce propos de "continuum de la variation". Parallèlement à cela, tout terme dérivé produit par
une classe sociale donnée répondra vraisemblablement aux règles sous-jacentes de formation
du français. "Variation sociale et variation stylistique ont souvent des manifestations
linguistiques semblables" (Gadet 1989 : 10), car si l'on peut parler de continuum en ce qui
concerne la variation sociale au sein d'une communauté, la variation stylistique pourrait se
définir dans le sens d'un continuum au niveau de l'individu : "il n'y a pas de locuteur à style
unique" (Gadet 1989 : 10).
308
Chapitre 4 – Délimitation de l'objet d'étude
1.5. Bilan
Ce panorama des concepts et des acceptions liés à la langue standard et aux autres
étiquettes utilisées pour qualifier tel ou tel type de français à permis d'une part d'indiquer
pourquoi cette étude ne peut s'inscrire dans aucun de ces cadres, d'autre part de préciser la
méthode de travail ici envisagée : tout terme comportant une épenthèse entre radical et suffixe
produit par un francophone, quelle que soit son origine sociale ou géographique, doit être
intégré dans le corpus. Seule l'analyse établira les critères pertinents.
Ce protocole s'applique également en ce qui concerne la période de création du mot
construit : rien ne permet d'affirmer avant l'analyse qu'il existe un processus d'épenthétisation
à une période de l'histoire du français et pas à une autre. Dans la sous-section suivante je vais
rappeler là encore les divergences de définition pour chacun des concepts susceptibles de
servir de cadre à l'analyse ou de se révéler pertinent a posteriori : synchronie et actualité.
2. Le français dans sa dimension temporelle
Il s'agit maintenant de définir avec davantage de précision la notion d'actualité de la
langue, c'est-à-dire de synchronie. Pour le TLF, la synchronie en matière linguistique est
l'"état de langue considéré dans son fonctionnement à un moment donné", ce qui rejoint la
définition fournie par Dubois & al. (1994) : "on appelle synchronie un état de langue
considéré dans son fonctionnement à un moment donné de temps, sans référence à l'évolution
qui l'aurait amené à cet état." ainsi que celle de Mounin (1974) : "l'ensemble des faits
linguistiques qui assurent la communication à un moment donné de l'histoire d'une langue,
dans un "état de langue" daté".2
Le plus difficile à déterminer est l'ampleur du "moment donné". S'agit-il de quelques
jours ou de plusieurs décennies ? Ducrot & Schaeffer (1995 : 334) se demandent si "le
français parlé en 1970 et celui qui était parlé en 1960 appartiennent (…) au même moment de
développement du français", et relèvent que "de proche en proche pourquoi ne pas dire que le
français et le latin appartiennent au même état de développement de la langue mère indoeuropéenne ?"
2
On trouve dans la littérature d'autres acceptions du terme synchronie. Mounin 1974 [2000] précise que le terme
de synchronie peut être employé "comme abréviation de 'linguistique synchronique' et de 'description
synchronique'." Ducrot & Schaeffer (1995 : 334) indiquent quant à eux que "bien que la terminologie américaine
appelle descriptive linguistics, ce qui est appelé ici "linguistique synchronique", il n'est pas évident que le point
de vue synchronique ne puisse pas être explicatif."
309
Chapitre 4 – Délimitation de l'objet d'étude
Non seulement il est difficile de délimiter avec précision la période à considérer,
compte tenu précisément des documents disponibles pour établir un corpus de travail (cf.
chapitre 5), mais cette délimitation n'est pas nécessaire et pourrait même constituer une limite
à l'étude ici envisagée.
En ce qui concerne la frontière temporelle "supérieure", l'exploitation d'un
questionnaire, l'utilisation de dictionnaires récents et l'introduction de termes issus des médias
me semble garantir une base de travail "la plus récente possible", sans que je sois en position
de m'avancer davantage quant aux dates concernées.
Par ailleurs, l'étude étymologique des termes candidats au corpus comme la recherche
dans les sources écrites (cf. section 2) ont mis en exergue des items anciens, et rien ne me
permet de les exclure a priori de la base de données puisque rien ne me permet d'affirmer
avant l'analyse que le facteur temporel est un critère déterminant. Exclure des termes d'emblée
sous prétexte que les dictionnaires établissent leur première attestation au douzième ou au
quatorzième siècle d'une part oblige à poser une date arbitraire sans réelle motivation, d'autre
part prive le corpus d'une partie des termes présentant une épenthèse consonantique sans que
l'on puisse corréler à cette restriction une réelle motivation scientifique.
Je ne proposerai donc pas ici une définition précise ou restrictive de l'ensemble
langagier dans lequel je compte situer cette étude, du fait d'une part de la difficulté à trouver
un terme suffisamment englobant et consensuel, d'autre part de la volonté de ne pas priver, de
manière somme toute arbitraire, l'analyse de termes pouvant se révéler riches d'enseignement.
Cette délimitation de l'objet d'étude quant au temps et à l'espace, ou plus exactement
ce manque de délimitation nette, aura une incidence directe sur la constitution de la base de
données.
310
Chapitre 4 – Délimitation de l'objet d'étude
3. Point sur la suffixation
Traiter des épenthèses consonantiques présentes entre thèmes et suffixes exige une
étude rigoureuse de ce qu'on entend par dérivation suffixale et de ce que cette expression
recouvre. Il faut pour ce faire définir avec précision les différents éléments intervenant dans
un processus de suffixation, et quelles étiquettes leur donner : tous les linguistes ne
s'accordent pas sur les définitions données à "radical" ou à "base" par exemple, aussi me
semble-t-il nécessaire d'indiquer clairement ma position à ce sujet et de confronter la
dérivation à la composition et à la flexion, processus proches mais dont je ne m'occuperai pas
dans cette thèse. J'aborderai également la question du rattachement de la suffixation à la
syntaxe ou à la morphologie, avant de m'intéresser à quelques aspects particuliers des suffixes
et des dérivés, notamment à la notion de compositionalité du sens, qui se retrouveront dans la
constitution du corpus. Je terminerai cette section par un tour d'horizon de quelques-unes des
nombreuses appellations de l'élément sous intérêt ici, à savoir l'épenthèse consonantique à la
jonction entre radical et suffixe, envisagées sous l'angle lexicologique.
3.1. Mise au point terminologique
Éclaircir ce qu'on entend précisément par les termes "radical", "racine", "suffixe",
"suffixoïde", etc., devrait permettre d'identifier "à coup sûr" les éléments "parasites"
intervenant à la jonction d'une suffixation. Pourtant, ce que signifient ces termes, ce qu'ils
désignent, est difficilement définissable. Il faut en effet en tout premier lieu sortir de la
définition circulaire telle que la dénonce Debaty-Luca (1988 : 54) : "le radical est ce qui reste
quand on enlève le suffixe, le suffixe est ce qui est ajouté au radical"3, et tenter de définir
toutes ces notions le plus indépendamment possible les unes par rapport aux autres.
Dans un premier temps, je vais rappeler brièvement ce que recouvre précisément les
notions d'unités lexicales simple et construite, et m'intéresserai ensuite à ce que l'on trouve
précisément dans le lexique. Je me pencherai enfin sur les acceptions données à "racine",
"radical", etc.
3
Cf. entre autres Mounin (1974 : 311) : "La linguistique historique définit le suffixe comme un élément de
formation qui s'ajoute à la fin d'une racine ou d'un radical." Il indique également (1974 : 279) que "la linguistique
historique traditionnelle définit la racine comme l'élément irréductible du mot, obtenu par l'élimination de tous
les éléments de formation, comme les suffixes thématiques, les préfixes et suffixes dérivationnels et les
désinences."
311
Chapitre 4 – Délimitation de l'objet d'étude
3.1.1. Mot et lexique
3.1.1.1. Mots et unités lexicales.
Pour Giurescu (1975 : 29), "la définition du concept de 'mot composé' est
inconcevable en-dehors de la définition du mot lui-même."4 J'élargis pour ma part cette
opinion aux mots dérivés, auxquels on ne peut faire allusion sans expliquer en premier lieu ce
qu'on entend par mot. Or le terme de "mot" connaît de trop multiples acceptions (cf. par
exemple Eluerd 2000 : 34-36) pour que je l'utilise tel quel ; pour reprendre Spencer (1991 :
41), c'est même "one of the most difficult and important problems in morphological theory".
En effet par "mot" on peut entendre "mot graphique", c'est-à-dire l'ensemble de lettres
compris entre deux blancs, ce qui signifierait que leu dans à la queue leu leu, bien que ne
portant aucun signifié propre, serait un mot (cf. par exemple Apothéloz 2002 : 9). On peut
également l'utiliser dans le sens de "mot phonétique", "suite de sons entre deux pauses"
(Siouffi & Van Raemdonck 1999 : 132). Une troisième acception serait sémantique : une
"unité de sens" (Siouffi & Van Raemdonck 1999 : 132) correspondrait à un mot. Le mot peut
être compris comme "mot lexical" ou lexème. La définition structurale du mot serait "minimal
free form ou minimal utterance, l'unité la plus petite capable de jouer le rôle de proposition."
(Togeby 1951 : 90-91). Enfin, on peut envisager le mot en tant qu'unité accentuelle (cf. Lyche
& Girard 1995).
Apothéloz (2002 : 6-7) souligne que "unité par excellence de l'analyse grammaticale
traditionnelle, le mot est toutefois une entité difficile à saisir, au point que c'est devenu un lieu
commun de la littérature linguistique que de dénoncer cette notion comme floue et impossible
à définir avec rigueur". De ce fait, nombreux sont les linguistes à avoir proposé une
terminologie concurrente. Ainsi Pottier remplace-t-il le terme de mot par lexie, Benveniste par
synapsie, Martinet par synthème, Guilbert par unité syntagmatique, Dubois par unité
phraséologique (cf. Picoche 1992 : 23 pour une présentation plus complète), chacun indiquant
le sens précis qu'il souhaite donner au terme qu'il utilise.
J'emploierai pour ma part plutôt le terme d'unité lexicale, moins connoté que "mot",
faisant référence non pas au "mot graphique" ou au "mot phonique", trop imprécis, ni au sens
4
Giurescu dresse à ce propos un inventaire commenté des points de vue de divers linguistes (Sapir, Meillet,
Hjemslev, Martinet…) sur ce qu'ils entendent par 'mot' et comment ils le définissent.
312
Chapitre 4 – Délimitation de l'objet d'étude
de lexème, trop limité, mais dans l'acception sémantique d'unité de sens et en utilisant les
critères définis par Spencer (1991 : 41-57) pour le mot :
- critère sémantique : les unités lexicales (simples) sont référentiellement opaques, dans le
sens où "it is impossible to refer to their part" (cf. également Martinet 1970 : 296 : "un
syntagme autonome formé de monèmes inséparables")
- critère syntaxique : "no syntactic process to be allowed to refer exclusively to part of
words", c'est-à-dire qu'il n'est pas possible de parler de *chaise très longue par exemple à
partir de chaise longue. Ceci correspond en partie à ce qu'Apothéloz (2002 : 8) appelle la
stabilité interne du mot, à savoir des "morphèmes ou des blocs de morphèmes dont l'ordre
n'est pas modifiable", comme triste et ment dans l'adverbe tristement. Mais comme le relève
Apothéloz lui-même, ce critère amène à considérer que le chat constitue un seul mot,
puisqu'on ne peut permuter les deux morphèmes, aussi ajoute-t-il un critère de nonséparabilité : un mot est formé de morphèmes indissociables.
- critère phonologique : dans certaines langues, les frontières de mots sont marquées par des
phénomènes phonologiques ou par l'accent. En français a priori, il ne semble pas que ce genre
de critère intervienne, comme le souligne Apothéloz (2002 : 7) : "définir le mot comme une
unité accentuelle est impossible en français, car cette langue, contrairement par exemple à
l'allemand ou à l'anglais, ne possède pas d'accent de mot mais des accents de groupes de
mots.".
J'emprunte le terme d'unité lexicale à Martinet (1970). La distinction entre "simple" et
"construit" est quant à elle due à Corbin (1987) qui donne pour le mot construit la définition
suivante : "un mot construit est un mot dont le sens prédictible est entièrement compositionnel
par rapport à la structure interne, et qui relève de l'application à une catégorie lexicale majeure
(base) d'une opération dérivationnelle (effectuée par une RCM [règle de construction des
mots] associant des opérations catégorielle, sémantico-syntaxique et morphologique" (1987 :
6). Les mots simples, ou mots non construits pour continuer avec la terminologie corbinienne,
"sont des mots dont l'éventuelle structure interne et le sens ne sont pas du tout superposables."
(Corbin 1987 : 459 ; cf. également Apothéloz 2002 : 23, Huot 2001 : 20, Gross 1996 : 29,
Niklas-Salminen 1997 : 52).
Signalons en outre l'existence d'une catégorie intermédiaire identifiée par Corbin
(1987 : 185-188) : les "mots complexes non construits". Soient les trois termes suivants (ces
exemples sont les siens) : maisonnette, carpette et omelette.
313
Chapitre 4 – Délimitation de l'objet d'étude
Maisonnette est un mot construit car sa base est indépendamment attestée avec un
signifié propre qui se retrouve ici (cf. principe de définition des bases, Corbin 1987 : 186) et
que le suffixe -ette est présent par ailleurs avec la même forme et le même signifié diminutif.
Carpette est classé comme mot complexe non construit dans le sens où l'on identifie
bien le suffixe -ette tant formellement que par son signifié, mais que *carpe "tapis" n'est pas
attesté en tant que base.
Omelette enfin n'est ni complexe ni construit : *omel n'est pas une base qui aurait pour
signifié "grande omelette" ni -ette un suffixe diminutif ici. Malgré les apparences, il s'agirait
alors d'un mot simple.
Les mots complexes non construits "forment une catégorie intermédiaire entre les
mots construits et les mots non construits. Linguistiquement, ce sont des mots non construits,
qui ont néanmoins une structure interne. Psycholinguistiquement, tout se passe comme si la
"connaissance" des règles dérivationnelles par le locuteur, jointe aux phénomènes
d'homonymie formelle entre un affixe et une terminaison, et à la possibilité de superposer,
même vaguement, l'interprétation sémantique à la structure formelle, autorisait les locuteurs à
percevoir des mots morphologiquement construits comme à travers un "filtre" - au sens
photographique du terme - qui modifie leur apparence extérieure" (Corbin 1987 : 188).
J'entendrai donc par unité lexicale simple ou terme tout morphème pouvant se trouver,
et étant de fait, en isolation. Une unité lexicale simple sera composée d'un seul morphème,
une unité complexe de plusieurs, pouvant être libres ou liés. Le produit d'une opération de
dérivation affixale comme d'une composition est donc une unité lexicale construite. On peut
citer à cet endroit la définition proposée par Mitterand (1963 : 25-26) : "Nous retenons
comme mot simple toute forme qui ne peut être amputée d'aucun élément phonique sans que
la forme restante soit ou bien totalement inexistante dans la langue, ou bien une forme
déclinée ou conjuguée de la forme initiale. (…) Les mots construits s'opposent aux mots
simples par le fait qu'on y reconnaît au moins, soit deux éléments radicaux (mots composés et
recomposés : chauffe-eau, thermomètre), soit, en sus de l'unique radical et de la désinence
flexionnelle – lorsque celle-ci est marquée phonétiquement ou graphiquement – au moins un
élément signifiant supplémentaire, non radical, préfixé ou suffixé au radical (mots dérivés :
généreusement, générosité)."
(1)
Unité lexicale simple
Un morphème
Unité lexicale complexe
Plusieurs morphèmes
Libre
Poisson, chat…
Libres
Poisson-chat, ouvre-boîte
Libre et liés Re-travaill-er
Composition
Dérivation
314
Chapitre 4 – Délimitation de l'objet d'étude
Adopter unité lexicale comme terme "neutre" est d'une certaine manière dangereux,
puisqu'il semble impliquer que les éléments considérés sont tous de fait dans le lexique. Il
convient donc de s'intéresser précisément à ce qui est dans le lexique, et à ce qui n'y est pas.
3.1.1.2. Que trouve-t-on dans le lexique ?
J'entendrai ici par lexique l'ensemble des unités lexicales de la langue, qu'il s'agisse
des morphèmes grammaticaux ou lexicaux, et non uniquement les éléments lexicaux (cf.
Apothéloz 2002 : 11). Il s'agit maintenant de déterminer ce que contient précisément ce
lexique : uniquement les bases et les affixes, ou également les unités lexicales construites ?
Ceci permettra de préciser en quoi une thèse portant sur les dérivés peut contribuer au débat.
La première option consiste à considérer que le lexique ne contient que ce qui n'est pas
prédictible de quelque manière que ce soit, ni par la syntaxe, ni par la phonologie par exemple
(cf. Bloomfield 1933). Pour les partisans de cette approche, le lexique contient uniquement
des morphèmes, gérés par des "règles de formation des mots" (Word Formation Rules) en
dehors du lexique.
Cependant, du fait notamment que le sens d'un mot n'est pas toujours celui de la
somme de ses éléments (cf. section 3.6), d'autres linguistes considèrent que ce sont les unités
lexicales que l'on trouve dans le lexique.
Il est fort à parier que la réalité se situe entre ces deux extrêmes. Le problème ne se
situe pas au niveau des unités lexicales simples, composées d'un seul morphème : que l'on se
place dans la théorie n'acceptant que les morphèmes dans le lexique ou dans celle exigeant les
unités lexicales, les unités lexicales simples sont pour l'une comme l'autre dans le lexique.
C'est donc sur le sort des unités lexicales construites qu'il faut statuer. D'un côté, certaines
unités lexicales ne peuvent qu'être apprises car elles ne correspondent pas à la dérivation
attendue à partir du morphème de base et du ou des affixes (l'unité lexicale construite
compréhensible doit être connue, la formation classique base + suffixe à partir de comprendonnant comprenable, juste dans sa formation mais non attesté en français), ou que le sens du
dérivé est trop différent de la somme du sens de ses éléments.
D'un autre côté, si seules les unités lexicales étaient stockées dans le lexique, il serait
difficile d'expliquer à la fois la créativité de la langue et le fait que nous comprenions la
plupart des néologismes (en tout cas spontanés) la première fois que nous les entendons. Le
cas de comprenable en est une parfaite illustration : le sens "que l'on peut comprendre" est
315
Chapitre 4 – Délimitation de l'objet d'étude
décodé par tout locuteur du français sur la base de sa connaissance des deux morphèmes
formant l'unité lexicale.
La contribution de cette thèse au débat dépendra de l'analyse du mécanisme
d'épenthèse en tant que mécanisme toujours actif ou figé dans le temps. Dans ce dernier cas
en effet, les unités lexicales font nécessairement partie du lexique en tant qu'entités
autonomes. Si l'analyse conclut au contraire à la vitalité du processus d'épenthétisation, alors
elle ne pourra pas contribuer au débat sur la lexicalité des mots construits.
Afin de préciser quelque peu les éléments présents dans une unité lexicale construite,
tournons-nous vers les termes de racine, radical, thème et base.
3.1.2. Racines et radicaux, thèmes et bases
Suivant notamment Picoche (1992 : 22), je n'utiliserai pas le terme de racine dans le
cadre de la formation d'unités lexicales (cf. par exemple Dubois & al. 1994), le réservant à la
reconstruction linguistique, notamment indo-européenne, et à la linguistique sémitique.
Je distinguerai dans ce travail les trois notions suivantes : radical, thème et base.
La base est un élément ayant un sens, et se trouvant dans au moins une unité lexicale
simple ; j'entendrai donc par base l'unité lexicale autonome sur laquelle est formé un dérivé,
ou pour reprendre Apothéloz 2002 : 15 "l'élément sur lequel opère un affixe". Dans le cadre
de la formation de mots construits, une base peut être une unité lexicale déjà dérivée ellemême, pourvu qu'elle existe de manière indépendante : "La base d'un mot dérivé est le mot
dont il dérive" (Lehmann & Martin-Berthet 1998) quel que soit le statut de ce "mot" par
ailleurs, simple ou construit.
Le thème est différent de la base en ce sens qu'il est la forme réellement présente dans
le dérivé : changer est la base de changeable, chang- en est le thème. Je sais que -able n'est ni
la base ni le thème car il n'est ni autonome ni "autonomisable".
Distinct de la notion de thème et de celle de base, le concept de radical s'appuie sur la
notion d'allongement thématique (cf. Benveniste 1966 chapitre 9), qui "se présente comme
316
Chapitre 4 – Délimitation de l'objet d'étude
une suite d'éléments, susceptible d'avoir une forme pleine ou une forme réduite" (Huot 2001 :
44), d'origine latine. Il se trouve souvent après des radicaux verbaux. La forme pleine
rassemble une voyelle ([a], [i], parfois [y]) suivie d'une consonne ([t] ou [s]), la forme réduite
l'un ou l'autre de ces sons, ce qui donne les possibilités suivantes, "toutes observables dans le
lexique d'aujourd'hui" (tableau de Huot 2001 : 44) :
(2)
Forme pleine
Forme réduite
V
a
t
e/é
i
u
-
C
i
t
t
s
L'allongement thématique est situé à gauche (avant dans la chaîne parlée) des
morphèmes de l'infinitif ou de certains morphèmes flexionnels, ce qui pourrait militer pour la
reconnaissance du morphème de l'infinitif comme désinence et non comme suffixe (cf.
section 3.3). Cependant, on peut également trouver l'allongement thématique devant des
suffixes (cf. section 3.2.5. et partie II chapitre 6). Il ne constitue pas un morphème dans le
sens où il n'a pas de signifié propre : son rôle est de classer les verbes, comme le genre classe
les substantifs, et de leur attribuer un fonctionnement particulier. Ainsi en latin, le verbe
amāre se décompose-t-il en radical am-, voyelle thématique ā (cf. cantāre) et suffixe -re (cf.
delēre "détruire", audīre "entendre", legĕre "lire", capĕre "prendre"). Les conjugaisons seront
distinguées en fonction de la voyelle thématique : ā (première conjugaison), ē (deuxième
conjugaison), ĕ (troisième conjugaison), ī (quatrième conjugaison) (cf. Cayrou 1960 : 47).
Huot (2001 : 45) prête cependant à l'allongement thématique un contenu
essentiellement aspectuel, "et plus précisément lié à la notion d'accompli" : un format est ce
qui résulte de l'action de mettre en forme, une faillite est une situation résultant d'une
défaillance.
Le terme de radical désigne donc ce qui reste du thème après que l'on a ôté la voyelle
thématique. Si le terme n'a pas de voyelle thématique, le radical s'identifie au thème. Je ne
définirai en outre pas le radical ou le thème par rapport à l'unité lexicale construite, mais par
rapport à l'ensemble des unités lexicales, simples et construites, dans lesquelles se trouvent un
radical donné, tout en étant consciente que ceci ne rend pas compte de tous les types de
radicaux existants car au sein d'une même famille peut se constater une allomorphie de
radicaux (cf. section [5] 1.2.5.1, portant sur la constitution de la base de données).
317
Chapitre 4 – Délimitation de l'objet d'étude
La mise au point terminologique a permis de préciser ce qui sera entendu par radical,
thème et base tout au long de cette thèse, ainsi que par unité lexicale simple et construite.
Cette dernière catégorie rassemble deux processus lexicologiques distincts, la composition et
la dérivation. La présente thèse ne s'intéresse qu'à ce deuxième cas de figure, aussi est-il
nécessaire de distinguer précisément ce que chacun recouvre.
3.2. Formation des unités lexicales : composition et dérivation5
Selon le Dictionnaire de linguistique et des sciences du langage de Dubois & al.
(1994 : 136), "pris en un sens large, le terme de dérivation peut désigner de façon générale le
processus de formation des unités lexicales. Dans un emploi plus restreint et plus courant, le
terme de dérivation s'oppose à composition (formation de mots composés)". Je retiendrai
quant à moi ce terme de dérivation dans la deuxième acception proposée, à savoir un des
processus de formation des unités lexicales, distinct du processus de composition.
Mitterand (1963 : 29-30) distingue dérivés et composés de la manière suivante :
"Tandis que les mots dérivés sont formés par l'adjonction d'un ou plusieurs affixes (préfixes et
suffixes) à un radical unique (sans préjudice du jeu des désinences), les mots composés
associent deux radicaux, eux-mêmes éventuellement enrichis de suffixes, dans des
constructions de types divers, du point de vue de leur morphologie et de leur orthographe,
mais qui ont dans l'énoncé le même statut que les mots simples."
Le schéma ci-dessous (Lehmann & Martin-Berthet 1998 : 114) récapitule les procédés
de formation des unités lexicales construites du français contemporain.
(3)
Procédés de formation des unités lexicales construites du français contemporain
Formation
des mots
dérivation
dérivation
affixale
préfixation
composition
dérivation
non
affixale
composition
"populaire"
composition
"savante"
suffixation
5
Je ne traiterai pas de la réduplication ("in which some part of a base is repeated, either to the left, or to the right,
or, occasionally, in the middle", Spencer 1991 : 13), autre mode de formation d’unités lexicales, car en français
elle ne se trouve pas en concurrence avec la dérivation.
318
Chapitre 4 – Délimitation de l'objet d'étude
La dérivation se décompose en deux types : la dérivation affixale et la dérivation non
affixale.
Dans la dérivation non affixale se retrouvent les déverbaux, c'est-à-dire les "noms
dérivés de verbe sans affixation, comme oubli dérivé de oublier : ils ont la forme du radical
du verbe" (cf. Lehmann & Martin-Berthet 1998 : 103). On parle parfois dans ce cas de
dérivation régressive ou inverse, dans le sens où l'on "perd" un morphème (cf. NiklasSalminen 1997 : 69-71). Le deuxième type de dérivation non affixale consiste en l'adaptation
d'un verbe en un substantif, du type manger qui donne le manger. La dérivation non affixale
est parfois appelée "dérivation impropre" ou "conversion" (Apothéloz 2002 : 95, NiklasSalminen 1997 : 68-69).
Le processus de dérivation affixale consiste en "l'agglutination d'éléments lexicaux,
dont un au moins n'est pas susceptible d'emploi indépendant, en une forme unique" (Dubois
1994 : 136), alors que la composition "désigne la formation d'une unité sémantique à partir
d'éléments lexicaux susceptibles d'avoir par eux-mêmes une autonomie dans la langue"
(Dubois & al. 1994 : 106). On opposera ainsi des termes comme refaire ou malheureux à
portefeuille ou timbre-poste, les deux premiers étant composés à l'aide notamment d'un
élément lexical non autonome (re-, mal-) au contraire des deux derniers. Cette distinction a
priori simple rencontre pourtant des variations, l'autonomie des composés comme la nonautonomie des dérivés pouvant être remises en question, des critères graphique et sémantique
se révélant également insuffisants.
Je me pencherai dans cette thèse sur la dérivation suffixale, en tant que déclencheur ou
révélateur de phénomènes produisant en surface l'apparition d'une consonne.
Intéressons-nous quelques instants aux critères de distinction des dérivés et des
composés : un critère paradigmatique est tout d'abord avancé, puis l'apport de la sémantique
est envisagé ; la simple graphie est à son tour étudiée. Se posera ensuite la question de
l'autonomie ou de la non autonomie des éléments d'un composé ou d'un dérivé, pour finir par
l'ordre des composants des mots construits en termes de détermination.
3.2.1. Critère paradigmatique.
Je n'entendrai pas ici le terme de paradigme dans l'acception retenue par Spencer
(1991 : 9-12), à savoir "the set of all the inflected forms which an individual word assumes"
319
Chapitre 4 – Délimitation de l'objet d'étude
(cf. également Dubois & al. 1994 : 341), mais je l'utiliserai plutôt dans le sens d'"ensemble
des unités entretenant entre elles un rapport virtuel de substitualité" (Dubois & al. 1994 : 342).
"Composés et dérivés ont en commun de se comporter comme les unités lexicales
simples susceptibles d'apparaître dans les mêmes contextes" (Dubois & al. 1994 : 137, cf.
également de Saussure 1916 : 148), ce que Ducrot & Schaeffer (1972 : 436-437) justifient
pour les composés notamment par la notion de choix ("il est clair que pomme de terre fait
l'objet d'un choix unique à l'intérieur d'un inventaire où se trouvent aussi poireau, chou, etc.,
et qu'on ne choisit pas successivement pomme, par opposition à poire, et terre par opposition
à eau."). Les mêmes critères peuvent aisément s'appliquer aux dérivés : on peut opposer dans
un même paradigme gentil et aimable par exemple, homme et prédicateur… A partir du
moment où les unités lexicales sont toutes deux des substantifs ou des adjectifs, elles peuvent
entrer dans le même paradigme.
Il faut cependant noter, avec Spencer (1991 : 296), que "prefixation in general alters
the subcategorization (selection) properties of verbs",
a/ Tom calculated
our time of arrival
b/
when we would arrive
c/ Tom miscalculated our time of arrival
d/
*when we would arrive
Si la préfixation ne change pas en français la catégorie de l'unité lexicale, elle peut
induire des modifications dans la structure de la phrase. Cette thèse ne portant cependant pas
sur l'ensemble des affixes mais uniquement sur les épenthèses concernant les suffixes, je ne
développerai pas ce point plus avant.
Le critère paradigmatique ne permet donc pas de distinguer les dérivés des composés,
non plus d'ailleurs que des unités lexicales simples. Tentons notre chance avec un second
critère portant sur la sémantique.
3.2.2. Amalgame sémantique.
Peut-on corréler le nombre de sèmes et le type d'unité lexicale ? "Une fois admise la
possibilité d'amalgames (plusieurs unités significatives sont manifestées par un seul segment
phonique), comment distinguer nettement l'unité significative minimale des éléments
320
Chapitre 4 – Délimitation de l'objet d'étude
sémantiques minimaux (sèmes) dont parlent des sémanticiens comme B. Pottier ou A.-J.
Greimas ? Pourquoi ne pas dire que le segment phonique soupe manifeste, en les amalgamant,
les choix sémantiques "aliment", "liquide", "salé", etc.?" Quelle serait alors la différence avec
le segment phonique pomme de terre, lui-même amalgame des sèmes "tubercule",
"comestible"… ?
On ne peut pas prétendre qu'une unité lexicale simple correspondrait à un maximum
de n sèmes, et qu'au-delà de ce nombre n de sèmes on n'aurait affaire qu'à des unités lexicales
construites.
Là encore, dérivés et composés se comportent comme des unités lexicales simples et
ne se distinguent pas par ce critère.
3.2.3. Critère graphique
Gross (1996 : 29) affirme que "la dérivation met en jeu une racine et des affixes
(préfixes et suffixes) et forme des mots soudés. La composition quant à elle concerne des
éléments lexicaux, c'est-à-dire susceptibles d'un emploi autonome, constituant entre eux des
unités polylexicales, séparées par des blancs ou par d'autres séparateurs."
En français, on ne trouvera pas de contre-exemple à la première partie de l'affirmation
de Gross : les termes dérivés sont "soudés". En revanche, il existe des termes
traditionnellement considérés comme des composés mais constitués d'éléments non séparés
par des blancs ou autres séparateurs (cf. Darmesteter 1967 : 2). En effet, à côté de termes tels
que pomme de terre (séparation par des blancs) ou pot-au-feu (séparation par traits d'union),
des termes tels que portefeuille, malvoyant ou passeport, appartiennent également à la classe
des composés bien que constitués d'éléments soudés.
Pas plus que les critères paradigmatique et sémantique, le critère graphique ne permet
d'identifier à coup sûr un dérivé d'un composé. Un quatrième candidat à cette distinction
concerne l'autonomie des éléments formant les composés.
321
Chapitre 4 – Délimitation de l'objet d'étude
3.2.4. Autonomie des éléments formant les composés6
Benveniste (1966 : 171) reconnaît bien qu'il y a composition "quand deux termes
identifiables pour le locuteur se conjoignent en une unité nouvelle à signifié unique et
constant"7, donnant pour exemples aussi bien portefeuille, pour lequel porte et feuille
constituent bien des unités lexicales autonomes en français, que centimètre ou palmipède. Or
dans ces derniers, il est certes possible d'identifier les termes, mais peut-on considérer que
centi-, palmi- ou -pède sont des éléments autonomes en français "contemporain" comme le
préconise pourtant Dubois & al. (1994) ? Benveniste justifie sa classification par l'origine
savante, "c'est-à-dire gréco-latine", de ces unités lexicales. Il semblerait donc que pour lui des
unités lexicales formées diachroniquement à partir d'unités autrefois autonomes mais qui ne le
sont plus en synchronie, relèvent du processus de composition. De même, les unités ayant
astro- (astronome, astrophysique), géo- (géographe) ou cosmo- (cosmonaute, cosmodrome)
pour premier élément relèvent de "la composition savante", ces éléments n'étant donc selon
lui non des préfixes mais des unités lexicales autonomes et le -o- étant un "joncteur".
Scalise (1984 : 75) mentionne également ces éléments que l'on considère parfois
comme des préfixes ("anglo, bio, electro, franco, etc.") et ceux assimilés à des suffixes ("crat,
phile, etc."). Ce classement n'est pas satisfaisant pour lui, pour plusieurs raisons récapitulées
ci-dessous :
a. Un élément comme phile peut se trouver aussi bien en début qu'en fin d'unité lexicale :
francophile / philanthrope. Or "a "true" affix is not this free: if it occurs to the left it is a
prefix, if it occurs to the right it is a suffix". (cf. également Niklas-Salminen 1997 : 72)
b. Ces éléments peuvent être séparés de leur base ("it does not matter if they are philo- or
anti- Soviet"), ce qui n'est pas le cas pour les "vrais" affixes : on ne peut pas dire *"I do not
know if he should be dis- or encouraged."
6
Je ne retiendrai pas dans cette étude la distinction proposée par Schöne (1951 : 44-45), selon laquelle "la
composition utilise les préfixes, la dérivation les suffixes". La question qui se pose ici porte sur des éléments dont
il est difficile de déterminer la nature affixale ou autonome.
7
Benveniste distingue deux types de "composition verbale" : porte-monnaie, taille-crayon vs. maintenir,
vermoulu (Benveniste 1966 : 103). Outre la composition, Benveniste mentionne deux autres types de formation
lexicale distincts de la composition : les conglomérés (meurt-de-faim, dorénavant…) et les synapsies ( pomme de
terre, avion à réaction…). Cf. Benveniste (1966 : 171-176). Mon propos n'étant pas la composition dans ses
différentes variétés mais uniquement la composition en ce qu'elle se distingue de la dérivation, je ne détaillerai
pas ces concepts.
322
Chapitre 4 – Délimitation de l'objet d'étude
c. Ces éléments peuvent se combiner entre eux ; pour reprendre l'exemple de Scalise, on peut
dire en anglais aussi bien Anglo-Italo-Soviet production que Italo-Anglo-Soviet production, ce
qui n'est pas le cas avec des "vrais" affixes : indéformable mais *déinformable.
d. Si l'on considère que francophile est formé d'un préfixe et d'un suffixe, où est la base ?
e. Avec de "vrais" affixes, on ne peut pas avoir de structure de type [Préfixe + Suffixe] : *in +
ique, *super + eux.
f. Une structure comme francophile se comporte davantage comme un composé que comme
un dérivé : un -o- apparaît également dans certains composés (Italo-Américain), pas dans les
dérivés ; ce -o- n'appartient pas au "suffixe", on n'a pas par exemple de suffixe comme ographie (historiographie), -ophile (germanophile), -ophobe (germanophobe), puisqu'on ne le
retrouve pas lorsque le morphème est situé à l'initiale : graphologue (*ographologue),
philanthrope (*ophilanthrope). Ce -o- apparaît devant un second morphème d'origine grecque
(musicologie), comme un -i- apparaît devant un second élément d'origine latine (insecticide,
herbivore).
Des éléments comme -phile ou astro- participent donc de la formation de composés,
alors même qu'ils ne sont pas autonomes. C'est pourquoi je ne les retiendrai pas dans mon
corpus, puisque l'analyse que je propose se base sur les formes suffixées.
L'autonomie des morphèmes composant les composés n'est donc pas un critère
déterminant de l'opposition composé / dérivé, rejoignant ainsi les critères paradigmatique,
sémantique et graphique. Tentons notre chance du côté de son pendant, c'est-à-dire la nonautonomie des éléments formant les dérivés.
3.2.5. Non-autonomie des éléments formant les dérivés
Un autre élément rend plus difficile la distinction entre composés et dérivés au lieu d'y
contribuer : l'autonomie possible des affixes. Cependant, elle concerne essentiellement les
préfixes. Ceux-ci en effet "peuvent correspondre à des formes ayant une autonomie lexicale"
(Dubois & al. 1994 : 37). C'est le cas par exemple de contre, adverbe et préposition, qui est
pourtant préfixe dans contredire ; de même bien, adverbe et substantif, est préfixe dans
bienfaisant ; la préposition outre est préfixe dans outrepasser, etc.
Cependant ce problème d'autonomie ne se rencontre pas avec les suffixes, puisque
comme l'affirme Mitterand (1963 : 33-34), "aucun des suffixes du français contemporain ne
323
Chapitre 4 – Délimitation de l'objet d'étude
peut fonctionner sans être indissolublement lié à son radical". Il note d'ailleurs que certains
"grammairiens 'historisants' du siècle dernier, comme Diez ou Darmesteter, rangeaient les
mots à préfixes parmi les composés", pour les deux raisons suivantes : d'une part, certains
préfixes peuvent être en isolation ; d'autre part, "la plupart des préfixes remontent à des
formes latines ou grecques qui apparaissent tantôt isolées, tantôt accolées à un radical".
Comment déterminer si un terme donné est un composé ou un dérivé, si des éléments
pourtant autonomes sont analysés comme des préfixes, et des éléments non autonomes
comme faisant partie d'un processus de composition ?
Cette thèse ne s'intéressant qu'à la dérivation suffixale, je considérerai le critère de
non-autonomie du suffixe comme indicateur d'un dérivé.
On rencontre également dans la littérature un autre moyen de distinguer les dérivés des
composés : l'ordre des segments dans les unités lexicales construites.
3.2.6. Ordre déterminant / déterminé dans les unités lexicales construites
Examinons maintenant un possible critère sémantique : l’ordre déterminant /
déterminé dans les unités lexicales composées et dérivées. Dans la composition à partir de
deux noms, "des deux membres, c'est toujours le premier qui fournit la dénomination : un
oiseau-mouche est un oiseau, un poisson-chat un poisson. Le second membre apporte au
premier une spécification en y apposant le nom d'une autre classe. Mais entre les deux, il n'y a
qu'un rapport de disjonction : les mouches ne sont pas un embranchement des oiseaux, ni les
chats des poissons. L'être désigné comme oiseau-mouche est donc en apparence membre de
deux classes distinctes qui pourtant ne sont ni homogènes, ni symétriques, ni même voisines.
Si cette désignation double reste néanmoins non-contradictoire, c'est que la relation qu'elle
institue n'est ni logique ni grammaticale, mais sémantique. L'objet ainsi dénommé ne relève
pas identiquement des deux classes. A l'une il appartient par nature, à l'autre il est attribué
figurément." (Benveniste 1966 : 147-148). L'ordre des éléments serait donc, en ce qui
concerne les composés formés de deux substantifs, déterminé + déterminant.
Tous les composés ne fonctionnent cependant pas selon l'ordre déterminé /
déterminant. Afin de démontrer ce point, je vais introduire ici une brève explication de la
notion de tête en lexicologie.
324
Chapitre 4 – Délimitation de l'objet d'étude
La tête d'un composé est l'élément central de ce composé, celui dont la fonction
syntaxique lui permet de se substituer à l'unité construite entière ; elle correspond au
"déterminé". Si la tête est comprise dans le composé, celui-ci est dit endocentrique. Si elle est
extérieure au composé, celui-ci sera qualifié d'exocentrique.
Dans les composés endocentriques par subordination, la tête est "généralement" à
gauche en français : garde-barrière, timbre-poste… Ces composés comportent un élément
modifié (garde, timbre) et un élément modifieur (barrière, poste). Il existe également des
composés endocentriques par coordination, qui sont formés de deux éléments à la fois
modifieurs et modifiés (aigre-doux, gris-bleu…).
Dans les composés exocentriques, la tête se trouvant à l'extérieur (cf. rouge-gorge,
ouvre-boîte, garde-fou, etc.), on ne peut distinguer déterminant et déterminé.
De plus, il existe en français des composés de plus de deux éléments, le plus souvent
comprenant une préposition en deuxième élément : substantif + préposition + substantif
(pomme de terre, chemin de fer, l’homme à abattre, poudre à canon, chair à canon), adjectif
+ préposition + substantif (fier à bras)… D'autres encore, de types plus variés : sot-l’y-laisse,
m’as-tu-vu…
Tous les types de composés en fonctionnent donc pas selon le schéma déterminé suivi
de déterminant.
Par ailleurs, le critère inverse n'est pas valable non plus pour les dérivés suffixaux. Si
l'on considère les unités lexicales comportant un thème suivi d'un suffixe, on peut les classer
en deux types : ceux dont le thème est le déterminé, ceux dont c'est le suffixe qui remplit ce
rôle. Dans la première catégorie on trouvera des unités lexicales telles que maisonnette ou
rougeâtre, dans la seconde charcutier ou animateur.
L'ordre des éléments déterminant et déterminé ne peut donc pas constituer un critère
fiable dans la distinction des composés et des dérivés. Une analyse quantitative permettrait
sans doute de préciser ce degré de fiabilité, en indiquant précisément la proportion de
composés répondant à l'ordre déterminé suivi de déterminant par rapport à l'ensemble des
composés, ainsi que celle des dérivés suivant l'ordre déterminant suivi de déterminé par
rapport à l'ensemble des dérivés.
325
Chapitre 4 – Délimitation de l'objet d'étude
3.2.7. Bilan
Aucun des critères évoqués ici ne fonctionne totalement dans la distinction des
composés et des dérivés : dérivés et composés se comportent comme les unités lexicales
susceptibles d'apparaître dans les mêmes contextes ; compter le nombre de sèmes des dérivés
et des composés n'apporte aucune indication distinctive ; un critère basé sur la soudure des
éléments dérivés versus la séparation des éléments des composés ne fonctionne que dans un
sens (la séparation des éléments indique un composé, leur non séparation n'indique rien) ; un
critère basé sur l'autonomie des éléments des composés est trop fragile pour être retenu ;
enfin, l'ordre d'apparition du déterminant et du déterminé n'est pas un critère absolu non plus,
puisqu'on y trouve de nombreux contre-exemples. Toutefois, cette étude portant sur la
dérivation suffixale et non préfixale, le critère portant sur la non-autonomie des suffixes est
valide en ce sens que si le deuxième élément d'un mot construit ne se rencontre jamais en
isolation sous quelque forme que ce soit, il s'agit alors d'un suffixe et le mot à partir duquel il
est formé est bien un dérivé et non un composé.
Passer ces différents critères en revue aura en outre permis d'affiner la définition de la
dérivation, par rapport à la composition aussi bien qu'en elle-même, ainsi que de prendre
position sur les cas tangents (philanthrope, nécrophile, etc.), ceci jouant un rôle évident dans
la constitution du corpus de travail.
Le processus de dérivation une fois distingué de celui de composition, il s'agit
maintenant d'envisager un autre cas avec lequel les frontières ne sont pas toujours très nettes,
à savoir la flexion.
3.3. Dérivation et flexion.
Flexion et dérivation se rejoignent en ce qu'elles font intervenir toutes deux des
morphèmes grammaticaux liés (cf. par exemple Niklas-Salminen 1997 : 19-20).
La flexion se caractérise par l'ajout d'une désinence qui ne crée pas de nouveau lexème
mais qui apporte un changement au niveau grammatical : genre, nombre, personne, voix,
aspect, cas (fonctions syntaxiques). La flexion inclut la déclinaison (flexion nominale) et la
conjugaison (flexion verbale) (cf. Neveu 2000 : 44, Niklas-Salminen 1997 : 20). Elle ne
provoque pas de changement de catégorie lexicale.
326
Chapitre 4 – Délimitation de l'objet d'étude
En opposition à la flexion, la dérivation consiste en la création d'un nouveau lexème
par l'ajout d'un affixe (préfixe, infixe, suffixe) apportant un changement au niveau
sémantique. Quand il s'agit d'un ajout de suffixe, il provoque souvent un changement au
niveau de la catégorie lexicale (Spencer 1991 : 9-12 "derivation typically (though not
necessarily) induces a change in syntactic category."), plus rarement lorsqu'il s'agit d'un
préfixe (cf. Lehmann & Martin-Berthet 1998 : 113 ; pour ce qui concerne les "exceptions" à
cette règle, cf. 1998 : 118-119). Ainsi :
[!"kom&'se] : [!"] modifie sémantiquement le verbe, mais n'apporte aucune information
d'ordre grammatical (genre, nombre, fonction, personne) et ne modifie pas la catégorie
lexicale du terme auquel il est préfixé.
[mçXsyX] : [yX] donne une information sémantique ("résultat de"), ne modifie en rien les
attributs grammaticaux du terme auquel il se suffixe, mais modifie sa catégorie lexicale : le
verbe devient substantif.
A la flexion est rattaché le terme de désinence, à la dérivation le terme d'affixe,
comme le soulignent Lehmann & Martin-Berthet (1998 : 131) : "les affixes sont les préfixes
et les suffixes, marques de la dérivation. Les désinences sont les marques de la flexion". Les
termes d'affixe et de préfixe ne seront donc pas ici entendus comme des termes génériques
référant aux morphèmes dérivationnels et flexionnels (cf. par exemple Mounin 1994, NiklasSalminen 1997 : 20) mais uniquement dans leur aspect dérivationnel.
Le terme de forme fléchie renvoie aux unités lexicales comprenant une désinence,
celui de forme dérivée ou dérivé à celles comportant un affixe au minimum. Cette thèse
s'intéresse aux formes dérivées uniquement.
Dans le sens où elle donne une indication de mode, la "terminaison" verbale serait à
considérer comme une désinence (cf. Lehmann & Martin-Berthet 1998 : 131-132 , cf. Corbin
1987 : 124-129 pour une justification liée à la construction-même des mots).
Pourtant, certains linguistes considèrent qu'il s'agit plutôt d'un morphème
dérivationnel. Scalise (1984 : 150) est très clair à ce sujet : "the verbal suffix is not an
inflectional morpheme. It is a derivational suffix". En effet, cette "terminaison" change la
catégorie grammaticale de l’unité lexicale, alors que précisément "a fundamental difference
between DR's [derivational rules] and IR's [inflectional rules] is that the former, but not the
latter, may change the category of the base in the process of word formation" (Scalise 1984 :
327
Chapitre 4 – Délimitation de l'objet d'étude
148) ; le substantif calibre est lié au verbe calibrer par l'ajout du morphème verbal, le
substantif souci au verbe soucier, le substantif fin au verbe finir, l'adjectif pâle au verbe pâlir,
l'adjectif rouge au verbe rougir…
Dans le cadre de cette thèse, exclure d'emblée les terminaisons verbales reviendrait à
prendre position dans ce débat avant même d'avoir tenté l'expérience sur les données à traiter.
Si l'on observe des consonnes épenthétiques à la frontière entre le thème et la terminaison
verbale au même titre que l'on en constate devant un morphème dérivationnel, alors une des
interprétations possibles sera de considérer les terminaisons -er et -ir comme des suffixes et
non comme des désinences, la seconde étant d'envisager que l'épenthèse ne dépend pas de la
catégorie du morphème grammatical, dérivationnel ou flexionnel, auquel elle se trouve jointe.
Dans le cas où l'épenthèse au contraire ne se manifesterait jamais avec -er ou -ir mais avec
l'ensemble, ou du moins la grande majorité, des morphèmes dérivationnels, elle constituerait
un argument supplémentaire pour classer les terminaisons verbales parmi les désinences.
Après cette mise au point terminologique portant tant sur les termes employés dans le
cadre de la dérivation suffixale que sur la délimitation de celle-ci, intéressons-nous pour finir
ce bref aperçu lexicologique à la dérivation suffixale du point de vue syntaxique. Si la
dérivation est effectivement liée à la syntaxe, dans quelle mesure une thèse portant sur la
frontière dérivationnelle doit-elle s'intéresser à cet aspect syntaxique ?
3.4. La dérivation suffixale : problème syntaxique ou morphologique ?
Peu de linguistes contestent la place de la composition dans la syntaxe. Darmesteter
(1967 : 5) va jusqu'à affirmer que "ce n'est pas, en somme, à la partie de la linguistique qui
traite de la formation des mots, c'est à la syntaxe qu'appartient la composition, et sa théorie
entre tout entière dans celle de la construction de la phrase. Les rapports qui unissent la
composition à la syntaxe sont trop évidents pour qu'il soit besoin d'y insister. Un mot
composé est une proposition en raccourci". Pour Giurescu (1975 : 117), les composés relèvent
des transformations ; elle se range en effet "à l'opinion de W. Motsch quand il pense que les
procédés de la grammaire générativo-transformationnelle peuvent être utilisés à l'étude des
composés (…) Les procédés génératifs rendent plus rigoureuse l'analyse des processus de
composition." Mais qu'en est-il de la dérivation ?
328
Chapitre 4 – Délimitation de l'objet d'étude
Plusieurs théories ont tenté d'introduire l'étude des suffixes dans la syntaxe de la
phrase : la grammaire générative, la théorie de la transposition (cf. Debaty-Luca pour une
revue des différents cas). Dubois & Dubois-Charlier (1999 : 5) par exemple considèrent que
"dans l'optique des rapports entre lexique et grammaire on entend par dérivation suffixale un
ensemble de procédures syntaxiques aboutissant à constituer des formes lexicales à partir d'un
radical verbal, nominal ou adjectival et de suffixes."
Dans
le
cas
de
nominalisations,
d'adjectivisations,
de
verbalisations
et
d'adverbialisations, la dérivation peut apparaître comme un phénomène syntaxique, dans le
sens où un mot suffixé (ou un déverbal : Jean a démissionné ! la démission de Jean) peut
"remplacer" une partie d'une proposition en transformant la phrase (cf. Dubois & DuboisCharlier 1999 : 5-9) :
(4)
Les bûcherons abattent les arbres
Paul est inquiet
Ces propos qui doivent être condamnés
Le temps devient frais
De façon agréable
! l'abattage des arbres
! l'inquiétude de Paul
! ces propos condamnables
! le temps fraîchit
! agréablement
forme nominale d'un verbe
forme nominale d'un adjectif
forme adjectivale d'un verbe
forme verbale d'un adjectif
forme adverbiale d'un adjectif
Rey-Debove (1984 : 10) souligne cependant que c'est "moins d'un cinquième du
lexique courant qui relèverait de cette méthode respectant la forme, le sens et la syntaxe
productive". La place de la dérivation dans la syntaxe ne doit donc pas être exagérée.
Attendu cependant que la dérivation se situe au niveau de l'unité lexicale et non de la
phrase, elle se trouve dans tous les manuels de linguistique classée parmi les phénomènes
morphologiques et lexicologiques et non au sein de la syntaxe.
Pour ma part, je m'en tiendrai à la dérivation en tant que phénomène morphologique
et, tout en ne le niant aucunement, ne m'intéresserai pas à son aspect syntaxique. En effet, le
but que je recherche est l'analyse des épenthèses à la frontière morphologique et non une
représentation syntaxique du phénomène de la dérivation. Par ailleurs, la part syntaxique de la
création d'un dérivé a lieu en amont de la concaténation à proprement parler, et ne peut donc
jouer un rôle direct que par la catégorie lexicale de la base et celle du suffixe, que je prendrai
en compte lors de l'analyse.
329
Chapitre 4 – Délimitation de l'objet d'étude
Je vais maintenant me tourner vers deux aspects particuliers des suffixes qui vont se
révéler cruciaux dans l'élaboration du corpus : leur position dans l'unité lexicale construite
d'une part (section 3.5.1), les cas d'allomorphies suffixales d'autre part (section 3.5.2).
3.5. Aspects particuliers des suffixes
3.5.1. Position dans l’unité lexicale construite
Un suffixe est généralement défini comme un morphème se positionnant à droite de la
base. L'infixe se distingue du suffixe en ce sens qu'il est "à l'intérieur du radical" (Lehmann &
Martin-Berthet 1998 : 132). Si l'on s'en tient à ces définitions, il n'y aurait alors pas d'infixe en
français, puisque les cas comme celui de l'unité lexicale tapoter, composée des trois
morphèmes /tap/, /ot/ et /e/, sont analysés très simplement en un morphème de base suivi de
deux morphèmes suffixaux. Il n'y aurait donc pas d'infixe en français, tous les cas tendancieux
pouvant être analysés comme /tapote/. Ce qui découle de ce raisonnement est qu'un suffixe
n'est pas nécessairement à la finale, puisque /ot/ est situé entre le morphème de base et un
autre morphème suffixal.
D'autre part, que penser de l'allongement thématique (cf. section 3.1.2), positionné
également à droite de la base et pouvant se retrouver en finale d'unité lexicale (cf. Huot 2001 :
44-48) ? Doit-on dans certains cas le considérer comme un suffixe, dans d'autres uniquement
comme un formant ? Ne s'agirait-il pas plutôt d'une désinence ?
Considérons les formes suivantes :
(5)
form + at
faill + it(e)
agrég + at
mand + at
renég + at(e)
form + at + ion
agrég + at + ion
mand + at + aire
Si l'on récapitule ce que l'on sait de l'allongement thématique par rapport au suffixe, un
premier point commun est la non-autonomie de chacun d'eux (cf. section 3.1.2), un autre la
capacité de déterminer la catégorie lexicale des termes, ce qui n'est pas le cas des désinences
(cf. section 3.3).
Pourtant, selon Huot (2001 : 70), l'allongement thématique ne peut pas être considéré
comme un morphème dérivationnel, essentiellement du fait que sa valeur est plutôt
330
Chapitre 4 – Délimitation de l'objet d'étude
aspectuelle (Huot voit dans les formes comportant -at "quelque chose qui est de l'ordre de
l'accompli (un résultat ou une propriété acquise)"). L'allongement thématique ne relève
pourtant pas davantage de la désinence flexionnelle, n'ayant aucun lien avec l'expression de la
personne ou d'une quelconque valeur modale (à la différence de l'infinitif). Cette double non
appartenance fait de l'allongement thématique un morphème spécifique, qui se distinguerait
des suffixes et désinences (Huot 2001 : 134-135). Huot rapproche l'allongement thématique
du morphème du participe présent, et propose de lier les deux en un suffixe aspectuel se
réalisant sous les formes suivantes :
(6)
[-accompli]
Forme pleine
-ant
Forme réduite
[+accompli]
-at
-it
-e/-é
-i
-u
-t
-s
Les trois positions offertes par la littérature en ce qui concerne les éléments de type at- sont les suivantes :
- ils appartiennent au suffixe (cf. Scalise 1984 : 140-145 ; 153) ;
- ce sont des infixes ;
- il s'agit d'éléments "parasites" (Corbin 1987 : 237).
Il ne m'appartient de prendre parti que dans la mesure où si un tel segment appartient
au suffixe, alors c'est sa frontière gauche qui va intéresser cette étude de l'épenthèse entre
radical et suffixe. S'il s'agit d'un élément "parasite", je ne suis alors plus dans le contexte
recherché puisque les deux frontières morphologiques possibles sont alors radical + élément
parasite et élément parasite + suffixe. S'il s'agit d'un infixe, deux options sont à considérer :
soit il faut étendre le contexte d'étude à la frontière entre radical et infixe, soit il faut exclure
tous les cas pour lesquels il y a ambiguïté quant au statut d'un des éléments.
Là encore, prendre une décision avant d'observer le fonctionnement des épenthèses
après le radical conduirait à réduire le champ d'analyse de manière artificielle, sur des
présomptions plutôt que sur des faits.
331
Chapitre 4 – Délimitation de l'objet d'étude
Un deuxième cas particulier concerne les suffixes : l'allomorphie suffixale, qui se
révèlera problématique lors de la deuxième étape de filtration de la base de données (cf.
chapitre 6 section 2).
3.5.2. Allomorphie et homonymie suffixales
L'allomorphie suffixale fait en réalité partie de la question plus vaste de l'allomorphie
en général (cf. Corbin 1987 : 314-317). Elle doit être néanmoins abordée ici du fait de son
importance quant à la délimitation des suffixes.
A partir du moment où un signifié a été identifié, peut-on postuler des alternances
quant à son signifiant ? Et si tel est le cas, jusqu'à quel point peut-on considérer qu'il s'agit de
variantes d'un même signe ? Prenons par exemple le signifié "action de V", qui peut être
obtenu en suffixant [aZ] ou [mã] à une base verbale (représentée par V dans le signifié). Peuton postuler qu'il s'agit d'un seul suffixe ? Cette attitude semble extrême du fait que les deux
signifiants n'ont aucun phonème commun, ils seront donc considérés comme deux
homonymes. La décision est moins aisée en revanche lorsque l'on est en face d'allomorphes
de type [asj+'], [sj+'] et [j+'] par exemple (cf. Aronoff 1976, Scalise 1984 : 61). Il faudra donc se
pencher avec attention sur chaque suffixe considéré lorsque la base de données sera filtrée en
fonction de paramètres sémantiques portant sur le suffixe (cf. chapitre 6 section 2) et ne pas se
contenter d'une généralisation hâtive qui priverait le corpus de termes intéressants ou qui au
contraire en maintiendrait de non pertinents.
L'homonymie et la polysémie de suffixes sont quant à elles suffisamment fréquentes
pour que se pose le problème d'un éventuel dénombrement des suffixes en français. Pour ne
citer que quelques exemples, considérons le suffixe -eur, qui peut produire des substantifs de
sens "qualité d'être Adj" à partir d'adjectifs (grandeur, pâleur), ou des noms d'agent à partir de
verbes (coureur, contrôleur)" ; le suffixe -age dans certains cas permet de dériver des noms
d'action sur verbe (dérapage) et dans d'autres des substantifs collectifs à partir de substantifs
(feuillage)".
Après cette brève incursion du côté des suffixes, intéressons-nous un moment aux
dérivés et plus particulièrement à l'élaboration de leur signifié.
332
Chapitre 4 – Délimitation de l'objet d'étude
3.6. Compositionalité du sens des dérivés.
Peut-on poser l'équation suivante :
(7)
Sens du suffixe = sens du suffixé – sens de la base ?
Est-il vrai que le sens d'un suffixé n'est que la somme des sens de ses composés, ou
acquiert-il un sens propre, "produit" de ces deux sens ? Dans le cas où le sens du suffixé ne
serait pas exactement la somme du sens de ses composés, comment déterminer le sens du
suffixe ?
Pour Aronoff (1976 : 18), "this is the basic trouble with morphemes. Because words,
though they may be formed by regular rules, persist and change once they are in the lexicon,
the morphemes out of which words seem to have been formed, and into which they seem to
be analyzable, do not have constant meanings and in some cases they have no meaning at all."
Apothéloz (2002 : 83-84) distingue quatre processus graduels de construction du sens
du dérivé, au moins en ce qui concerne les suffixations transcatégorielles. Le premier est
essentiellement syntaxique, c'est l'opération de transcatégorisation elle-même. "Un suffixe
dont la fonction est de transformer un adjectif en nom va produire un mot dont le sens
premier, calculable, est la transcription de ce transfert syntaxique, soit un sens paraphrasable
comme 'qualité de ce qui est X'". De même, un suffixe transformant un nom en adjectif
apportera le sens "relatif à X", un adjectif en verbe "rendre X", etc. Le sens de ces suffixes est
donc prédictible.
Le second processus dépasse le simple phénomène de transcatégorisation puisqu'il
concerne l'apport sémantique du suffixe : -(i)fier a le signifié "rendre X" ou "transformer en
X".
La base apporte également un certain sens qui va modifier le sens du dérivé, ce qui
constitue le troisième processus identifié par Apothéloz. Humidifier et cocufier sont bien
formés à partir du même suffixe, mais humide est une propriété gradable au contraire de cocu,
si bien que le sens du premier sera "rendre plus humide" alors que le sens du second sera
simplement "rendre cocu".
Le quatrième processus est plus insaisissable, bien que son effet soit on ne peut plus
attesté. Pourquoi clouer n'a-t-il pas simplement le sens de "faire quelque chose en rapport
avec un ou des clous", ou encore "garnir de clous" comme meubler signifie "garnir de
meubles" ? Il s'agit là de contraintes extérieures à la langue mais qui pèsent sur elles ;
333
Chapitre 4 – Délimitation de l'objet d'étude
Apothéloz les qualifie de "pratiques". Dans ce dernier cas, le sens n'est plus prédictible à
partir du sens de ses composants (cf. également Corbin 1987 : 213-214 puis 221-231).
A chacun de ces processus correspond un ensemble de suffixes. On voit bien alors que
l'équation proposée en (7) ne concerne en aucun cas l'ensemble des suffixes de la langue,
puisque tous les suffixes relevant du quatrième processus en sont exclus, le suffixe formateur
de verbes -er en tête - si tant est qu'il s'agisse d'un suffixe.
Il sera donc nécessaire lors de l'utilisation du critère sémantique dans le processus
d'épuration du corpus (cf. chapitre 6) de ne pas travailler de manière trop "mathématique",
tout en restant rigoureux quant à la procédure de sélection.
Après cette mise au point sur les suffixes, je vais m'intéresser aux aspects de la
construction des dérivés pertinents pour cette thèse. Une dernière partie (section 3.8)
proposera une vision lexicologique des consonnes épenthétiques entre radical et suffixe.
3.7. Contraintes sur la formation des unités lexicales construites.
Seront abordés ici quelques concepts concernant la formation des unités construites
tels que les règles de formation des mots, l'ordre des morphèmes dans une unité construite et
leurs catégories, ainsi que la dérivation parasynthétique.
3.7.1. Règles de formation de mots
"Au-delà des irrégularités de tous ordres observables sur la partie attestée du lexique
des mots construits, celui-ci obéit à un ensemble hiérarchisé de règles et de principes dont la
nature, le contenu et le champ d'application doivent être déterminés par le linguiste." (Corbin
1987 : 1) Ces règles définissant les combinaisons de morphèmes en unités lexicales sont
appelées règles de construction des mots (RCM) ou word formation rules (WFR), et
s'inscrivent dans une grammaire générative, souvent dans leur propre composant. Il s'agit de
règles morphologiques, qui s'ajoutent aux composants syntaxiques, sémantiques et
phonologiques (cf. Scalise 1984 : 48).
Pour ne prendre qu'un exemple, considérons le composant lexical du modèle proposé
par Corbin (1987). Dans celui-ci, les RCM sont inscrites dans le composant dérivationnel où
figurent également les mots construits possibles en relation avec elles. Ce composant
334
Chapitre 4 – Délimitation de l'objet d'étude
dérivationnel est lui-même en relation avec le composant de base contenant les entrées
lexicales et les règles de base, et avec le composant conventionnel à sa sortie, qui contient
notamment les règles d'allomorphie et de troncation. Ce composant lexical est en relation à
chaque niveau avec les composants sémantique et phonologique (cf. Corbin 1987 : 415-423 ;
469-504 pour le composant dérivationnel).
3.7.2. Ordre des morphèmes
Parmi les contraintes liées à la formation des unités construites se trouve l'ordre
obligatoire entre morphèmes dérivationnels et flexionnels, les premiers étant nécessairement
plus proches du radical que les seconds si les deux types figurent au sein d'une même unité.
Autrement dit, alors que les morphèmes dérivationnels et donc les suffixes sont
nécessairement en contact avec le radical, les morphèmes flexionnels ne peuvent se
concaténer directement au thème qu'en l'absence de morphème dérivationnel.
Signalons également que parmi les affixes sont distinguées par certaines théories deux
ou plusieurs classes d'affixes en fonction également de leur position par rapport au radical
lorsque plusieurs d'entre eux cohabitent au sein d'une même unité lexicale (cf. Spencer 1991 :
179 ; chapitre 4, Scalise 1984 : 115-117, etc.).
Katamba (1989 : 273) utilise la métaphore de l'oignon pour expliciter la formation des
unités lexicales ; le radical forme le cœur de l'oignon, les affixes de niveau 1 une première
pellicule autour, "enveloppés" dans les affixes de niveau 2. J'ajouterai une pellicule
supplémentaire pour les morphèmes flexionnels, ce qui donne le schéma suivant :
(8)
[[morphème flexionnel] [[affixe de niveau 2] [affixe de niveau 1] radical [affixe de
niveau 1] [affixe de niveau 2]] [morphème flexionnel] ]
Non seulement les morphèmes doivent s'enchaîner dans un ordre prédéterminé, mais
leur combinaison dépend en outre de la catégorie lexicale de la base et de celle du suffixe.
335
Chapitre 4 – Délimitation de l'objet d'étude
3.7.3. Combinaison des morphèmes
Une contrainte supplémentaire pèse sur la construction des unités lexicales : tous les
suffixes ne s'attachent pas à tous les types de bases, toutes les bases ne peuvent pas recevoir
de suffixes (cf. Scalise 1984 : 46). De plus, "certains suffixes obéissent à des contraintes
morphophonologiques particulières et ne peuvent opérer sur certaines bases sans les
tronquer." (Apothéloz 2002 : 85).
La combinaison des morphèmes sera discutée lors du deuxième bassin de filtrage dans
lequel passe la base de données à partir de laquelle est construit le corpus sur lequel repose
l'analyse (chapitre 6 section 2), et sera directement exploitée dans le chapitre 7 concernant
l'élaboration d'un questionnaire visant à favoriser la production d'épenthèse entre radical et
suffixe.
Un dernier aspect de la construction des unités lexicales est abordé dans la soussection suivante : la parasynthèse.
3.7.4. Parasynthèse
Un mot enfin sur la dérivation parasynthétique (Darmesteter 1894 : 196)8, qui se
définit par l'ajout simultané d'un préfixe et d'un suffixe (cf. Lehmann & Martin-Berthet 1998 :
119), qui est alors parfois considéré comme un morphème discontinu particulier appelé
circonfixe, "a special kind of discontinuous affix" (Spencer 1991 : 13 ; cf. également
Apothéloz 2002 : 86-91) : /e…i/ dans élargit, /a…"/ dans alite, /a…i/ dans atterrit, etc.
Le critère déterminant est le fait que la base avec un seul des deux affixes n'existe pas
(cf. Scalise 1984 : 147, Lehmann & Martin-Berthet 1998 : 119) ; on ne trouve en effet ni
*élarge ni *largit par exemple. Outre ce cas du circonfixe, Apothéloz (2002 : 88-91)
distingue trois autres cas de figure.
Dans le cas de dérivés de type égrène ou étripe, le é- est doté d'un signifié propre que
l'on retrouve dans épépine ou épouille : la notion d'"enlever". Dans ce cas é- est un vrai
préfixe, mais qui se trouve nécessairement employé simultanément à un suffixe dérivateur de
verbes. Apothéloz qualifie ce cas de "couplage préfixe-suffixe". Pour Apothéloz, c'est à la fois
ces couples préfixe-suffixe et les affixes discontinus qui sont regroupés sous l'étiquette de
8
Cf. Corbin (1987 : 541 note 46) pour une considération sur le statut de l'analyse parasynthétique dans les
analyses existantes.
336
Chapitre 4 – Délimitation de l'objet d'étude
dérivés parasynthétiques, "appellation dont la paternité est traditionnellement attribuée à A.
Darmesteter".
Le deuxième cas concerne les antonymes, et se divise lui-même en trois parties. Tout
d'abord ce qu'illustrent les paires enracine / déracine ou encourage / décourage : un "système
à double marquage", chacun des deux termes comportant un préfixe. Les paires gèle / dégèle
ou masque / démasque exposent une deuxième variante, à savoir le "système à marquage
négatif": un seul des deux termes possède un préfixe marquant l'antonymie. Son pendant est le
"système à marquage du terme positif", "dans lequel un seul des termes est
morphologiquement marqué, celui doté d'un sens 'positif'", comme dans plume / emplume.
Ces systèmes ne sont pas étanches, comme l'illustrent les verbes encrasse vs décrasse, qui
relèvent du double marquage, mais qui sont également en relation avec le verbe désencrasse,
qui introduit alors un marquage à terme négatif.
Le dernier cas identifié par Apothéloz touche des verbes comme enrichir ou adoucir.
Les paires de type grandit / agrandit ou maigrit / amaigrit comportent une différence
aspectuelle : le verbe préfixé implique un résultat, et non le verbe sans préfixe. Que faire alors
du verbe enrichir, qui implique un résultat mais dont le pendant *richir "devenir riche" n'est
pas attesté ?
Certains linguistes distinguent base attestée et base virtuelle afin de réduire, voire de
supprimer les parasynthèses : il n'y aurait alors plus simultanéité, mais successivité de la
préfixation et de la suffixation (cf. Lehmann & Martin-Berthet 1998 : 119-121, Corbin 1987 :
134-137, Spencer 1991 : 13). Pour certaines unités construites, il n'est pas possible de
déterminer qui de la préfixation ou de la suffixation est intervenu avant l'autre (cf. Apothéloz
2002 : 54-59), y compris en synchronie, car les sens induits par chacun des chemins
dérivationnels sont proches ou sont tous deux possibles pour l'unité lexicale considérée.
Prenons pour s'en convaincre l'exemple de l'adverbe indirectement :
(1) direct ! indirect ! indirectement ("de manière indirecte")
(2) direct ! directement ! indirectement ("non directement")
L'analyse des parasynthétiques est pertinente ici notamment dans le cadre de la
création du corpus de travail : faut-il les considérer comme des éléments suffixés ou comme
une catégorie à part ? Je garderai la position que j'ai adoptée jusqu'ici, à savoir ne pas exclure
d'emblée, arbitrairement, une catégorie de termes, mais attendre de voir si l'analyse elle-même
337
Chapitre 4 – Délimitation de l'objet d'étude
leur attribue un statut particulier (pour les problèmes que ce choix peut induire dans la
création du corpus, cf. chapitre 5).
Ces quelques considérations sur les radicaux, les suffixes et les dérivés ne laissent
qu'une catégorie passée sous silence : les "éléments intermédiaires".
3.8. Les "éléments intermédiaires"
Nous avons étudié dans le chapitre 3 de la première partie les différentes analyses
phonologiques proposées en ce qui concerne l'épenthèse consonantique. Les lexicologues et
morphologues se sont bien sûr également penchés sur ces "éléments intermédiaires". Je ne
présenterai pas ici de théorie complète mais proposerai un échantillon de ce qui a été proposé
pour représenter et traiter le problème.
Huot (2001 : 26) parle d'un "son de transition" entre deux voyelles, c'est-à-dire lorsque
le thème se termine par une voyelle et que le suffixe commence également par une voyelle.
Gruaz (1988 : 60-61) s'intéresse à l'ensemble des "éléments intermédiaires" que sont à
la fois les extensions de suffixe relevant de l'allomorphie suffixale (cf. chapitre 6 section 2) et
les "phonèmes/ graphèmes placés après le syntagme fondamental (ex. n de journal) ou un
groupe séquent (ex. n de paternel, t de facultatif)." Il propose de les classer, avec les
consonnes latentes finales de radical, dans la catégorie des tenseurs, "éléments qui, tant par
leur position que par leur fonction, 'étendent', prolongent, le syntagme fondamental".
Dubois & Dubois-Charlier (1999) mentionnent les "additions" de consonnes lorsqu'ils
en constatent au hasard de l'étude d'un suffixe donné (par exemple p. 194) qu'ils appellent
aussi à d'autres endroits consonnes épenthétiques (par exemple p. 252) sans qu'il n'y ait
apparemment de différence de statut entre les deux types. Ils ne proposent pas de tentative de
représentation, ceci ne constituant pas l'objet de leur travail.
Pour Apothéloz (2002 : 67-68), ces segments sont "des ajouts inexplicables", qui
certes "trouvent presque toujours une explication" d'un point de vue diachronique mais qui
posent problème en synchronie puisqu'on ne peut leur attribuer de signifié. "La seule certitude
est qu'on ne peut pas les considérer comme des morphèmes."
Il distingue trois solutions théoriques : soit ces segments appartiennent à la base et
relèvent de l'allomorphie radicale, soit ils sont intégrés dans le suffixe et c'est cette fois
338
Chapitre 4 – Délimitation de l'objet d'étude
l'allomorphie suffixale qui est en jeu, soit il faut les considérer comme des "segments
intercalaires, pures séquences de signifiant intervenant entre les bases et les affixes." Il ajoute
une quatrième option : le segment serait la conséquence d'une mécoupure. Par exemple, le -lde tissulaire a vraisemblablement son origine dans une mécoupure d'adjectifs comme
musculaire, oculaire, etc., mécoupure qui a conduit à rattacher la consonne -l- au suffixe aire, créant ainsi, de fait, un allomorphe -laire.
La multiplicité des appellations souligne la difficulté de représentation de ces
segments parasites, qui ne correspondent à aucun élément du dérivé et qui pourtant y sont
présents.
Ceci conclut ce tour d'horizon sur la suffixation, mais aussi le premier chapitre de cette
partie consacrée à l'élaboration de matériaux de travail. Les concepts nécessaires et les critères
d'élaboration sont maintenant en place, il est temps de passer à la constitution d'une base de
données propre à servir de point de départ à une analyse portant sur l'épenthèse consonantique
entre radical et suffixe. Cette élaboration fait l'objet du chapitre suivant. Le chapitre 6 sera
consacré à l'épuration de cette base de données pour arriver au corpus à proprement parler.
Quant au chapitre 7, il fera le point sur l'apport de données au moyen d'un questionnaire dans
le cadre de la production d'épenthèses consonantiques à la dérivation suffixale.
339
Chapitre 5 – Constitution de la base de données
Chapitre 5.
Constitution de la base de données
"A vrai dire, un corpus est chose complexe ; il est fait à la fois
d'éléments déjà donnés, et d'éléments qu'on se donne, les uns et les
autres étant rassemblés selon certains critères qui commandent leur
choix". (Préface du TLF, vol. 1 : XXI).
"Il ne suffit pas de décrire et d'observer pour rendre compte d'un
objet linguistique; il faut encore le construire et l'interroger dans une
problématisation scientifique qui seule permet de le saisir comme
objet." (Durand & Lyche à paraître : 53).
S'interroger sur la création d'un corpus propre à l'analyse des épenthèses entre radical
et suffixe en français n'est pas trivial, le rassemblement des unités lexicales comme leur
traitement et leur tri devant nécessairement faire l'objet d'une réflexion approfondie, de façon
à ce que l'analyse s'appuie sur des données fiables.
Les données peuvent être de deux types : orales ou écrites. Chacun présente des
avantages comme des inconvénients, qui vont avoir pour conséquence l'impossibilité de se
limiter à l'un ou à l'autre pour la constitution du corpus.
Commençons par les données orales. Elles ont pour point fort par rapport à l'écrit la
plus grande spontanéité de leur réalisation (cf. Blanche-Benveniste & Jeanjean 1986 : 21),
assortie le plus souvent d'une vigilance métalinguistique plus faible (sauf éventuellement en
cas d'hypercorrection, comme on a le verra en ce qui concerne les épenthèses consonantiques
syntaxiques, cf. partie III). De ce fait, c'est à l'oral que sont créés la plupart des néologismes,
ceux qui vont perdurer comme ceux qui ne figureront jamais dans un dictionnaire de par leur
fugacité, mais qui ne sont pas moins révélateurs de la dynamique de la langue9. Enfin, ce qui
9
Pour Dumas (1978 : 87), les données orales sont les seules valides : "C'est au contraire dans le français parlé le
plus courant et dans le français populaire qu'il faut chercher les faits pertinents. Non seulement ce registre est
capable de les fournir tous, mais il est aussi le seul légitimé à le faire. En effet, c'est ce registre-là qui est
représentatif de la langue parce qu'il représente le produit linguistique le plus pur qu'il soit possible d'isoler.
Parce qu'il est lié à l'exercice de la parole dans les conditions pratiques de la vie individuelle et sociale, il est le
moins directement perméable à l'influence essentiellement conservatrice de la langue "cultivée", de la culture
livresque qui invoque l'histoire, le primat de la forme écrite, l'intention esthétique et tout le métalinguistique en
général comme les justifications supérieures de l'expression linguistique, et impose un "fétichisme de la langue"
très bien décrit par Bourdieu (1975)". Cette tirade passionnée étant produite à propos de la liaison en français, on
peut penser que la dérivation puisse également tirer profit des données orales.
340
Chapitre 5 – Constitution de la base de données
est produit verbalement n'est par définition pas "relu", et ne sera donc pas "corrigé" par le
"bon" terme, celui exigé par la norme, le cas échéant. Il est vrai que cette attitude correspond
à la tendance dénoncée par Blanche-Benveniste et Jeanjean (1986 : 21) de ne considérer dans
ce prologue que l'aspect familier du français parlé ; cependant, étant donné la méthode de
recueil aléatoire pour laquelle j'ai opté en ce qui concerne les données orales, ce défaut sera
corrigé de lui-même.
Par ailleurs, cette étude est avant tout phonologique et celle-ci "est d'abord confrontée
à l'hétérogénéité et à la dispersion des façons de parler. Elle cherche à dégager une analyse
unifiée de ces pratiques orales diversifiées et secondairement à reconstruire une norme
d'usage qui ne se livre jamais comme telle." (Laks 2002 : 6)
Les données orales - ou du moins celles qui le sont réellement, hors discours pré-écrits
par exemple - sont donc incontestablement plus intéressantes du point de vue de cette étude
que les éléments écrits, qui ne sont finalement bien souvent que le reflet des séquences
pérennes et négligent les mots bien construits en regard du fonctionnement de la langue mais
qui n'ont pas eu l'heur d'être relevés par un lexicographe ou entérinés au-delà d'un phénomène
de mode.
Cependant, c'est l'aspect technique de la récupération des données orales qui va
restreindre leur poids dans un corpus comme le nôtre.
Les données écrites en revanche sont bien plus faciles à la fois à collecter et à attester.
De plus, elles constituent bien évidemment le seul moyen d'accéder aux termes contenant des
épenthèses entre radical et suffixe créés antérieurement à l'époque actuelle, ou dans le
meilleur des cas antérieurement à l'apparition des premiers enregistrements oraux.
Il aurait toutefois été dommageable de se limiter aux données écrites dans le cadre de
cette étude, pour les raisons évoquées dans le paragraphe précédent, mais également parce que
leur incorporation dans le corpus doit faire l'objet d'un traitement préalable. Une grande
vigilance s'impose en effet quant à la date d'apparition des termes à retenir (l'étude porte sur le
français, non sur le latin), et nécessite donc un contrôle de chacun d'entre eux. De plus, et tout
particulièrement en ce qui concerne le français, la graphie pose de nombreux problèmes
d'identification des épenthèses, ce sur quoi je reviendrai plus en détail dans la partie suivante.
341
Chapitre 5 – Constitution de la base de données
1. Création d'un corpus à partir de sources écrites.
Travailler à partir de données écrites permet de multiplier les sources, étant donné que
le problème d'y accéder ne se pose pas dans les mêmes termes que pour les données orales. La
première étape a été une extraction automatique des termes dérivés susceptibles de contenir
une épenthèse consonantique (A). Cette première liste d'unités lexicales a été complétée par
des données issues de différents dictionnaires d'argot (B), par une recherche d'expressionsclés dans le Trésor de la Langue Française informatisé (C), par les termes proposés dans les
articles scientifiques comme dans la presse (D), par l'étude plus précise de termes liés aux
suffixes établis comme les plus fréquemment déclencheurs d'épenthèses (E), puis par le
dépouillement des Néologismes du français contemporain (H) et du Dictionnaire des mots
sauvages (K). La récolte ne s'est pas faite aussi linéairement que cette présentation ne le laisse
entrevoir ; les données, notamment celles issues d'articles ou recueillies à l'oral, ont été
incorporées au fur et à mesure de leur découverte et non en un seul bloc.
Avant de présenter plus en détail ces différentes sources, j'expliquerai pourquoi
certaines autres n'ont pas été exploitées dans la création de ce corpus.
1.1. Ressources non exploitées
Dans ce bilan sur les ressources utilisées et leur intérêt dans la constitution du corpus,
quatre sources sont à mentionner. Pourquoi en effet ne pas avoir exploité cette gigantesque
base de données qu'est Internet ? Pourquoi avoir rejeté l'exploitation des journaux disponibles
sur CD-ROM ? Pourquoi ne pas avoir tiré parti de la base de données Frantext ? Et puisque le
travail porte en grande partie sur les néologismes, pourquoi avoir négligé la base de
néologismes qu'est Bornéo?
Un corpus portant sur le "français d'aujourd'hui" peut tirer beaucoup de profit
d'Internet, dans le sens où il s'agit là sans doute de la plus grande base de données disponible.
De plus, certains outils d'extraction sont dorénavant disponibles pour exploiter les ressources
d'Internet, par exemple Webaffix (cf. Hathout & Tanguy 2002), développé à Toulouse par
Ludovic Tanguy et en accès libre sur le site http://www.univ-tlse2.fr/erss/textes/
pagespersos/tanguy/webaffix.html.
Ce logiciel permet d'isoler les néologismes construits trouvés sur Internet via le moteur
de recherche Altavista, en fonction de leur suffixe, pourvu que l'on ait fourni au programme
342
Chapitre 5 – Constitution de la base de données
une liste d'entrées lexicales attestées ainsi qu'une liste des séquences de trois lettres possibles
en initiale de mot dans la langue considérée.
Par ailleurs, divers journaux sont disponibles "en ligne" mais également sous la forme
de CD-ROMs, ce qui donne accès à des données récentes pouvant entrer dans le corpus.
S'ajoute à cela la base de données Frantext, rassemblant des textes littéraires du
XVIème au XXème siècle, datés.
Ces sources auraient certainement apporté beaucoup à un corpus comme celui présenté
ici ; en effet, "l'exploration systématique de bases textuelles numérisées pérennes (comme les
CD-ROM de journaux) ou éphémères (comme les pages web) permet d'amasser en très peu de
temps des données incomparablement plus nombreuses que l'antique lecture." (Plénat & al
2002 : 133). Cependant, cet apport ne peut se faire qu'à condition d'avoir un moyen d'accéder
aux données de manière automatique étant donnée leur ampleur, et de pouvoir trier les termes
par rapport à leurs suffixes, comme le propose le logiciel Webaffix par exemple, mais
également à leur base, de façon à isoler les éventuelles consonnes présentes à la frontière.
Une autre piste de travail intéressante est proposée par Mathieu et al. (1998), qui ont
extrait automatiquement 2840 néologismes à partir des 23 millions d'occurrences du corpus
du journal Le Monde de 1993, par une méthode semi-automatique : après un protocole
informatisé, seule l'extraction manuelle a permis de finaliser la recherche. Cependant, la
recherche de termes présentant une épenthèse entre radical et suffixe serait là encore un
travail manuel, comparable à la recherche dans des dictionnaires non informatisés (cf.
sections 1.3, 1.7 et 1.8).
En fait, il aurait fallu pouvoir appliquer le protocole d'exploitation testé sur la base de
données de 64.296 mots (cf. section 1.2). Or les données disponibles sur Internet comme sur
les cd-roms ou sur Frantext ne se prêtent pas à ce genre de traitement. Dans le meilleur des
cas, il est possible de les trier par suffixe, mais l'exploitation de la base de données par suffixe
(cf. section 1.6.) a montré le manque de rentabilité d'une telle pratique.
En dehors des difficultés inhérentes à l'extraction de données utilisables, l'exploitation
de ce type de sources se heurte à de nombreux autres inconvénients (cf. notamment Plénat &
al 2002 : 127-129, Tanguy & Hathout 2002 : 248, Grefenstette 1999 : 1) parmi lesquels le
"bruit" généré par les fautes de frappe ou de découpage de la chaîne, ainsi que le manque de
contrôle des sources : est-ce bien un locuteur natif qui a produit tel ou tel néologisme ?
Toutefois, ces sources restent un bon moyen de contrôle ou d'étude d'un suffixe
particulier, comme l'ont montré Plénat & al (2002).
343
Chapitre 5 – Constitution de la base de données
Une base de données constituée dans le cadre de l'Analyse et Traitement Informatique
de la Langue Française (atilf) de l'Institut National de la Langue Française (INaLF,
actuellement Institut de Linguistique Française) du Centre National de la Recherche
Scientifique (CNRS) était également intéressante a priori pour la constitution d'un corpus
cherchant à éclaircir les conditions d'occurrence des épenthèses consonantiques entre radical
et suffixe. Il s'agit de la Base d'Observation et de Recherche des Néologismes (Bornéo), qui
est un recueil de néologismes relevés "dans des énoncés de presse contemporaine" entre 1976
et 1997. De ce fait, elle était également fort tentante dans le cadre d'une analyse comme la
mienne. En effet, les néologismes sont une garantie d'actualité pour une éventuelle épenthèse.
Cependant, le mode d'interrogation de la base (mode de recherche Stella), en tout cas
au moment de la rédaction de cette thèse, ne permet pas l'extraction de termes épenthésés
puisque la recherche de termes se fait au moyen de mots, d'expressions ou de la flexion des
mots, mais pas par chaîne de caractères participant à un mot. Il n'est donc pas possible
d'extraire la liste des termes se terminant par tel ou tel suffixe ce qui, sans permettre
l'extraction directe de termes contenant une épenthèse, aurait néanmoins permis d'étudier plus
précisément un suffixe particulier. C'est pourquoi les ressources présentes dans cette base
n'ont malheureusement pas pu être exploitées.
Parmi les ressources effectivement utilisées dans le cadre de ce travail figure tout
d'abord un recueil de termes français disponible sur ordinateur, ceci permettant un traitement
en partie automatisé.
1.2. Liste informatisée de 64.296 mots du français (A)
La base de départ de cette source de mots construits contenant des épenthèses est une
liste informatisée de 64.296 mots français établie par le laboratoire Langues, textes, traitement
informatique, cognition (Lattice, UMR 8094) pour les besoins du traitement automatique des
langues, modifiée par quelques ajouts et troncations personnels, lorsque certains termes se
sont révélés inattestés (cachoutanique par exemple) ou manifestement le produit d'erreurs de
traitement. Cette liste a été exploitée sous le logiciel de gestion de bases de données Access,
de façon à en faciliter le tri et à autoriser la recherche de séquences intérieures de mot.
344
Chapitre 5 – Constitution de la base de données
1.2.1. Méthode et justification
L'idée sous-tendant la méthode d'extraction des unités lexicales comprenant une
épenthèse est la suivante : si une unité lexicale comporte une épenthèse entre le thème et le
suffixe, cette épenthèse n'appartient ni au thème ni au suffixe, selon les définitions données à
"thème" et à "suffixe" dans la partie sur les suffixes (cf. section 3.1) : un thème se définit par
rapport à toutes les unités lexicales associant un même sens à une même forme (pour les
alternances de radicaux, cf. section 1.2.5.1) ; un suffixe est considéré comme tel s'il se
retrouve avec le même sens ou un sens voisin, et la même forme.
La démarche envisagée serait donc dans un premier temps d'écarter les préfixes puis
les accents graphiques (aigus, graves, circonflexes), pour par la suite comparer
automatiquement les formes ainsi obtenues entre elles, en commençant par la gauche pour
isoler les thèmes, puis par la droite pour déceler les suffixes en reprenant ces formes une
deuxième fois.
1.2.2. Traitement préalable du corpus
Ce traitement n'a ni la prétention ni la vocation d'être linguistique. Il s'agit d'une
analyse portant sur des chaînes de caractères, ayant pour but de permettre au programme
informatique leur examen. A cette étape de la création du corpus en effet, il n'est fait nul appel
au sens ni même à un pré-découpage en morphèmes ; l'objectif est d'obtenir une première
"récolte" se basant uniquement sur la comparaison des unités lexicales entre elles et non sur
une liste de suffixes préalablement insérée, qui ne serait pas complètement objective
puisqu'elle constituerait nécessairement le fruit d'une analyse antérieure.
La première étape de la préparation du corpus consiste à retirer les préfixes des unités
lexicales en comportant, de façon à accéder directement aux thèmes. Pour ce faire, j'ai utilisé
la liste des préfixes du français offerte par le Tlfi (cf. annexe 1n), et ai procédé à un
"découpage" informatique avec vérification manuelle, faisant ainsi intervenir cette liste de
manière raisonnée. Utiliser une liste pré-existante de préfixes est moins dangereux dans le
protocole de préparation que d'exploiter une telle liste concernant les suffixes, dans le sens où
l'analyse ne porte pas sur les préfixes. Par ailleurs, la démarche se devait d'être au moins
partiellement manuelle, car une extraction automatique aurait conduit à nombre d'amputations
injustifiées, et de ce fait la part de subjectivité tant redoutée pour les suffixes était de toute
façon nécessaire en ce qui concerne le traitement des préfixes. En effet, "il n'est (…) pas
345
Chapitre 5 – Constitution de la base de données
surprenant que beaucoup de mots simples commencent ou se terminent par une séquence de
phonèmes identique à un affixe." (Apothéloz 2002 : 68).
Pour s'en convaincre, prenons le cas du préfixe ré-, que l'on trouve dans des termes
comme réinsérer, réouverture, réorienter, réopérer, réorganisateur, etc, mais qui semble
également formellement présent dans les unités lexicales réaliser, rétamer, résilier, répulsif,
réputation, réprimander, réussir, répéter, répondre, répartir, etc. Un traitement automatique
aurait supprimé le préfixe de la première série de termes, permettant d'obtenir respectivement
insérer, ouverture, orienter, opérer et organisateur. Mais cette découpe aveugle laisserait
également des segments orphelins tels que -aliser, -tamer, -silier, -primande, -ussir, aussi
bien que des segments qui se confondraient avec des termes appartenant à d'autres familles
lexicales : -péter, -putation, -pulsif, -pondre, -partir, etc.
Il ne s'agit pas d'un cas d'homographie isolée, comme en témoigne l'allomorphe représent dans retravailler, resituer, refaire, mais dont la graphie se retrouve aussi dans
rectifier, responsabilité, remiser ou restaurer. Pour ceux-ci, supprimer ces deux lettres leur
feraient perdre leur sens – et leur famille10. La suite graphique sur- est dans le même cas :
préfixe dans surabondance, suraigu ou surdéveloppé, elle n'est que partie de morphème dans
surdité, suranné ou surplomb (le rapport avec plomb n'étant pas immédiat…) ; la variante imdu préfixe privatif, que l'on trouve par exemple dans imperturbable, improbable, immortel se
révèle indissociable de sa suite dans imagé, imiter, imposable (malheureusement pas "ce
qu'on ne peut poser"), imprimable (qui n'est pas "ce à quoi on ne peut donner de prix" ou "ce
qu'on ne peut primer") ; dé-, préfixe dans défriper, défroisser ou dégarnir n'a plus le même
statut dans déguiser ou délai, et n'indique en aucun cas un lien sémantique entre déterminer et
terminer.
La méthode employée pour isoler les préfixes a donc consisté à prendre une liste de
préfixes, en l'occurrence celle fournie par le TLFi, et à partir de cette liste et du lexique
informatisé à notre disposition, d'isoler les listes de mots commençant par chaque préfixe.
Chaque unité lexicale a ensuite été analysée "humainement" pour déterminer si la séquence
10
Jalenques (2001) propose une analyse sémantique synchronique du cas de figure dans lequel "la forme
préfixale est morphologiquement identifiable au préfixe RE, mais dont le sens n'est pas intuitivement perçu
comme compositionnel par rapport au sens de RE et à celui de la base (tels que renier, remarquer, regarder)"
(2001 : 39). Le traitement que j'applique ici n'est pas linguistique mais pratique, il vise à permettre
l'identification de bases sans faire appel à la sémantique, aussi ai-je traité des verbes comme ceux cités par
Jalenques comme des dérivés de nier, marquer et garder respectivement, sans que cela implique un quelconque
parti pris linguistique.
346
Chapitre 5 – Constitution de la base de données
initiale était réellement un préfixe ou une simple homographie. Dans les cas où il s'agissait
réellement d'un préfixe, c'est-à-dire pour lesquelles l'ablation du préfixe laissait un segment
identifiable en tant que base, le préfixe a été ôté. L'étape finale a consisté à reprendre
l'ensemble du dictionnaire travaillé dans ce sens et à éliminer les doublons.
Une question peut ici se poser : n'aurait-il pas été plus simple de supprimer
directement les termes identifiés comme préfixés ? La réponse se trouve dans la position que
j'ai choisi de tenir en ce qui concerne les dérivés parasynthétiques, cf. section 3.7.4. Du fait
que j'adhère à l'hypothèse des bases virtuelles, ôter les préfixes peut laisser des formes non
attestées (°largir sur élargir, °richir sur enrichir, etc.) mais correspondant à un radical
français (large, riche). Pour les cas où le doute était permis, le contrôle par le dictionnaire du
TLF a levé l'ambiguïté et permis de prendre une décision. Pour les cas où le préfixe était en
cours de perte d'identité, mon choix a évidemment été subjectif : ce qui me semblait
facilement identifiable comme base, soit par rapport à une base existant effectivement, soit
par rapport à une base qui se dégageait de plusieurs mots préfixés (par exemple -scription sur
suscription, inscription, description), a été conservé. Des unités lexicales comme encombrer
en revanche, formé sur l'ancien français combre à l'aide du préfixe en-, n'ont pas été
décomposées, le préfixe n'étant plus guère analysable comme tel en synchronie.
Un second travail préliminaire à toute comparaison a consisté à éliminer les accents du
corpus, c'est-à-dire à remplacer notamment tous les é et è par un simple e. Cette étape se
situait nécessairement après l'ablation des préfixes, au moins pour la commodité du travail
manuel.
Ôter les accents a permis d'être en mesure de comparer sévère avec sévérité par
exemple, c'est-à-dire des unités lexicales de même famille qui portent des accents différents,
que l'ordinateur n'aurait par la suite pas reconnus comme tel ; les mots sans accents pourront
également être mis en regard des mots accentués correspondants, comme dans le cas de
liberté et libérer, café et cafetier ou cafetier et cafetière…
En ce qui concerne l'accent circonflexe, la "traduction" n'est pas un e simple mais une
séquence es, de façon à mettre sur le même plan forêt et forestier ou ancêtre et ancestral par
exemple. Il est vrai que dans une analyse purement synchronique, ces deux unités lexicales ne
devraient pas être mises au même niveau puisque précisément la base n'est pas la même ; il
me semble cependant que les locuteurs français identifient bien forestier comme étant de la
même famille que forêt, c'est pourquoi j'ai gardé cette identité commune. Dans le cas où
toutes les unités lexicales d'une famille donnée n'ont que la variante avec accent, sans
347
Chapitre 5 – Constitution de la base de données
alternance avec la variante en -s, le passage du ê à es ne change rien à la comparaison terme à
terme future : blême, blêmir, blêmissement seront analysées comme appartenant à une seule
famille, même si ces unités lexicales sont présentées sous la forme blesme, blesmir,
blesmissement. Quelques cas isolés d'homonymie causée par cette traduction, comme
apprêter qui, sans son préfixe et l'accent converti en s, peut être assimilé à la famille de
preste, ne m'ont pas semblé suffisants pour rejeter la formule de conversion.
Appliquer le même mécanisme aux autres voyelles se révèle inutile dans le cas de î et
û. En effet, le peu de cas avérés d'alternances possibles connaissent une modification
supplémentaire du terme, ce qui signifie que même si l'on remplace û par us, l'ordinateur ne
sera pas en mesure de coupler les termes de même famille : goût alterne certes avec un radical
comportant un -s, mais qui de plus est privé de la lettre o (gustatif). En ce qui concerne â,
deux cas sur les trois relevés subissent également une transformation supplémentaire : pâques
alterne avec pascal, c'est-à-dire qu'à l'ajout du s est couplé une modification de la consonne
graphique ; château et castel ont bien la même origine et ont toutes les chances d'être
identifiés par les locuteurs comme faisant partie de la même famille, mais le -h- présent dans
l'un et non dans l'autre interdit pareille identification par la machine. Dans le cas de ô, le
remplacement de la lettre accentuée par la séquence -os- est pertinent pour deux cas
uniquement : côte / costal et hôpital / hospitalier.
Pour peu rentable que soit le traitement de ces voyelles, il ne crée qu'un seul problème
de confusion avec d'autres unités lexicales : remplacer â par -as- confondra la famille de
pâtisserie avec pastis. L'objectif n'étant pas à cet endroit linguistique mais uniquement
graphique, les voyelles comportant un accent circonflexe ont donc été modifiées
manuellement dans le cas des voyelles autres que e de façon à éviter l'appariement
malheureux de pastis et pâtisserie, et le changement de ê par -es- a quant à lui été implémenté
automatiquement.
A l'intérieur de cette partie consacrée à l'harmonisation du corpus se trouve également,
après la suppression des préfixes et le traitement des accents, la conversion de ç en c, de façon
à être en mesure de comparer des termes comme glaçon et glace, amorçage et amorcer,
effaçable et effacer, etc. Bien sûr, ceci mettra également en regard des termes n'ayant
synchroniquement plus aucun lien, comme garçon et garce, mais ce manque de lien
synchronique (excepté, selon le Robert Etymologique, dans la région méditerranéenne où
garce a gardé son sens de "jeune fille", féminin de gars) est dû à des raisons sémantiques dont
je ne peux traiter dans cette thèse.
348
Chapitre 5 – Constitution de la base de données
Ce corpus une fois travaillé dans le sens de l'harmonisation des thèmes, la
comparaison terme à terme est alors possible. Cette comparaison va se faire en deux temps :
tout d'abord par la gauche, puis par la droite.
1.2.3. Comparaison des unités lexicales par la gauche
Comparer les unités lexicales par la gauche permet d'isoler des séquences communes,
qui doivent alors correspondre à des thèmes. Ce travail ne sera pas effectué manuellement
mais automatiquement, à partir d'un programme baptisé "épenthèse" réalisé par Yvon
Deschamps, maître de conférences de la faculté d'Orsay, pour les besoins de cette thèse, en
fonction de la méthode détaillée ci-dessous.
Il est nécessaire de commencer par rechercher les séquences communes les plus
longues possibles, de façon à obtenir des thèmes et non une liste en ordre alphabétique, ce que
nous aurions si nous avions commencé par une séquence commune la plus courte possible.
Pour s'en convaincre et expliciter pleinement la démarche, analysons le petit corpus suivant à
la manière de l'ordinateur :
(1). néon
(2). nu
(3). nudité
(4). nuire
(5). nuisible
(6). nuit
(7). nuitée
Si l'ordinateur commence par rechercher la séquence commune la plus courte, il
gardera l'ordre alphabétique de ce corpus : la séquence commune la plus courte est la lettre
n… L'ordinateur va donc commencer par chercher la séquence commune la plus longue
possible. Dans ce corpus, la séquence la plus longue est de huit caractères ; a priori, les
doublons ayant été éliminés il ne peut y avoir deux séquences avec huit caractères identiques.
L'ordinateur va donc passer à 7, en ne regardant que les séquences de plus de sept caractères,
en l'occurrence ici uniquement nuisible (huit caractères). Ne trouvant toujours pas deux
séquences comportant le nombre de caractères communs requis, l'ordinateur va essayer 6, puis
5, puis 4 caractères. A cette étape de la recherche, il isole les séquences (6) et (7) qui ont
quatre caractères communs, et les déclare comme étant de la même famille. Il les enlève alors
349
Chapitre 5 – Constitution de la base de données
du corpus pour les mettre dans un fichier à part (B), dans lequel le radical est isolé de la
terminaison. Voici schématiquement l'état du travail à cette étape :
(9)
Fichier A
(1)
(2)
(3)
(4)
(5)
Fichier B
néon
nu
nudité
nuire
nuisible
(1)
(2)
nuit
nuit
ée
Puis l'ordinateur continue son travail de comparaison avec 3 éléments communs ; l'état
des deux fichiers devient alors le suivant :
(10)
Fichier A
(1)
(2)
(3)
néon
nu
nudité
Fichier B
(1)
(2)
(3)
(4)
nuit
nuit
nui
nui
ée
r
sible
Avec deux caractères communs, nous obtenons :
(11)
Fichier A
(1)
néon
Fichier B
(1)
(2)
(3)
(4)
(5)
(6)
nuit
nuit
nui
nui
nu
nu
ée
r
sible
dité
A la fin du travail, il ne reste plus dans le fichier A que les unités lexicales n'ayant pas
de "partenaire", c'est-à-dire néon dans le cas de ce petit corpus de démonstration, mais dans le
cadre du corpus de 64.296 termes chaque terme "seul" se trouve accouplé avec au moins un
autre terme "seul" commençant par la même lettre.
Dans le cadre général de ce travail, il a été proposé à l'ordinateur de commencer par
rechercher 13 caractères communs, puis 12, puis 11, etc, en enlevant du Fichier A les unités
lexicales correspondantes dès qu'elles étaient trouvées. Le but est en effet d'éviter que nuitée
ne se retrouve en comparaison avec nuisible ou nu, dès lors que son partenaire a été établi.
350
Chapitre 5 – Constitution de la base de données
Cette première comparaison effectuée, il va ensuite être demandé à l'ordinateur de
travailler à partir du "déchet", c'est-à-dire de ce que l'ordinateur a établi ne pas être le radical,
ce qui se trouve dans notre exemple dans la troisième colonne du fichier B.
1.2.4. Comparaison du "déchet" par la droite
Il s'agit donc maintenant de distinguer les suffixes et de les écarter, pour qu'il ne reste
que la consonne (ou voyelle) épenthétique. A cet endroit une question peut se poser :
pourquoi ne pas partir d'une liste de suffixes, de la même manière que j'ai utilisé une liste de
préfixes pour mieux les éliminer ? Mon but était de construire une base de travail objective,
sans me laisser influencer, autant que possible, par d'autres travaux.
Là encore, on part de la séquence la plus longue possible ; dans le cas contraire,
l'ordinateur fournira la liste de tous les suffixes se terminant par exemple par -e, ceux se
terminant par -r, ceux se terminant en -x, etc, classant en "épenthèse" tous les caractères
précédents. Prenons par exemple les suffixes -ique, -iste, -isme et -ité, ce dernier ayant perdu
son accent lors des préliminaires à la comparaison ; comme tous se terminent par -e, si
l'ordinateur commençait par la séquence commune la plus courte il considérerait que -iqu-, ist-, -ism- et -it- sont des épenthèses.
Afin de mieux appréhender le mode de fonctionnement du processus en jeu ici,
considérons une nouvelle fois un corpus illustratif ; il s'agit d'un corpus de "déchets", dont la
provenance est allouée entre parenthèses :
(1). sible
(2). ible
(3). teur
(4). teur
(5). er
(6). ter
(nuisible comparé avec nuit, reste -sible)
(conductible comparé avec conducteur, reste -ible)
(folioteur comparé avec folio, reste -teur)
(agioteur comparé avec agio, reste -teur)
(accidenter comparé avec accident, reste -er)
(abriter comparé avec abri, rester -ter)
L'ordinateur va commencer par chercher la séquence la plus longue possible. Une
différence notable entre cette étape de comparaison et la précédente est que les doublons sont
cette fois non seulement admis mais même supposément fréquents, étant donné que l'on doit
trouver dans cette partie "déchets" notamment les suffixes qui sont employés sans épenthèse.
Les doublons étant permis dans ce corpus, comme l'illustrent par exemple les séquences (3) et
(4), la comparaison doit s'effectuer à partir du nombre maximal de caractères présent dans une
séquence, 5 en l'occurrence dans notre corpus. La séquence sible n'est présente qu'une fois,
351
Chapitre 5 – Constitution de la base de données
l'ordinateur peut donc passer à la comparaison de 4 caractères. Cette fois il trouve bien une
coïncidence entre les deux premières séquences, ce qui lui permet d'isoler -s-. Par ailleurs,
l'ordinateur compare les séquences (3) et (4) et identifie la même séquence, ce qui lui permet
de la basculer dans le fichier C de résultats. Nous obtenons alors les deux fichiers suivants :
(12)
Fichier B
(1)
(2)
accident
abri
er
ter
(1)
(2)
(3)
(4)
s
Fichier C
ible
ible
teur
teur
nuisible
conductible
folioteur
agioteur
La recherche de trois caractères communs reste sans résultat, mais l'ordinateur obtient
des résultats pour deux caractères communs, donnant aux fichiers l'allure suivante :
(13)
Fichier B
(1)
(2)
(3)
(4)
(5)
(6)
s
t
Fichier C
ible
ible
teur
teur
er
er
nuisible
conductible
folioteur
agioteur
accidenter
abriter
Le fichier C comporte alors, en regard du terme analysé, le suffixe isolé par
comparaison et surtout l'éventuelle consonne intermédiaire : s pour nuisible, t pour abriter.
Récapitulons les étapes de dépouillement de la base de données initiale dans le tableau
suivant, qui met en évidence le fonctionnement du protocole au travers d'un mini-corpus
composé des unités lexicales forêt, déforestation, glace, déglaçage, remorquage, remorque,
déglutir, déglutition :
352
Chapitre 5 – Constitution de la base de données
(14)
0.
1.
2.
3.
4.
5.
Etapes du
traitement
corpus brut
élision des
préfixes
traitement
des accents
traitement du
ç
comparaison
par la
gauche, en
commençant
par la
séquence la
plus longue
comparaison
par la droite,
en
commençant
par la
séquence la
plus longue
exemples
forêt
forêt
déforestation glace déglaçage remorquage remorque déglutir déglutition
glace glaçage
remorquage remorque déglutir déglutition
forestation
forest forestation
glace glaçage
remorquage
remorque
deglutir deglutition
forest
forestation
glace glacage
remorquage
remorque
deglutir
déglutition
ø
ation
e
age
age
e
r
tion
ø
a
ø
ø
ø
ø
r
ø
La première étape consiste à ôter les préfixes. Dans le mini-corpus proposé, six
séquences comportent à l'initiale une suite de lettres pouvant correspondre à un préfixe :
déforestation, déglaçage, remorquage, remorque, déglutir, déglutition. Pourtant, seules deux
d'entre elles vont se retrouver amputées, le traitement manuel permettant de "sauver"
remorque et remorquage d'une part, déglutir et déglutition d'autre part : *morque et *glutir ne
sont ni des unités lexicales attestées en français, ni même possibles par commutation avec
d'autres unités si l'on tient un tant soit peu compte du signifié.
L'étape suivante, à savoir le traitement des accents, permet d'une part de convertir le ê
de forêt en la séquence -es-, d'autre part d'ôter les accents des "faux préfixes" de déglutir et
déglutition. On obtient alors respectivement forest, deglutir et deglutition.
Le traitement du ç constitue la dernière étape du traitement préalable du corpus. Dans
les exemples donnés dans le tableau, seul glaçage est concerné et se voit transformé en
glacage.
Les étapes cinq et six sont celles que l'on trouve dans le programme Epenthèse. Il
s'agit de la comparaison des éléments, par la gauche d'abord, puis par la droite de ce qui reste.
Forêt, réécrit forest, et forestation permettent d'isoler la séquence -ation. Glace et
glacage, anciennement glaçage, détachent -age d'un côté et -e de l'autre, de même que
353
Chapitre 5 – Constitution de la base de données
remorquage et remorquer. La comparaison de déglutir et déglutition met quant à elle en
évidence les terminaisons -r et -tion.
La dernière étape du processus consiste à comparer ces terminaisons en commençant
par la séquence la plus longue et par la droite. Si l'on ne commençait pas par la séquence la
plus longue mais la plus courte, on obtiendrait -ag- pour -age comparé avec -e, ce qui serait
une aberration au regard de l'objectif poursuivi. En commençant par la séquence la plus
longue sont isolés -a- à partir de -ation et -tion, puis -r puisque ce mini-corpus n'en comporte
pas d'autre.
Cette méthode de travail, très rigoureuse et efficace sur le papier, a rencontré dans les
faits un certain nombre de problèmes que je vais détailler dans la section suivante.
1.2.5. Obstacles et difficultés
En effet se sont révélées toutes sortes de "complications", telles que les alternances de
radicaux et de suffixes, les homographes partiels ou totaux, des unités lexicales de même
famille présentant une même épenthèse, un suffixe donné présentant systématiquement la
même épenthèse, enfin le fait que la graphie masque certaines épenthèses. Puisque l'idée
développée ici est le traitement automatique de la liste de 64.296 mots, cette partie abordera
ces différents points sous l'angle de la graphie et non de la phonologie ou de la sémantique.
1.2.5.1. Alternances de radicaux
Les alternances de radicaux, auxquelles il a été fait allusion dans le chapitre 4 (section
3.1.2), constituent un premier obstacle à une recherche automatique de termes épenthésés.
Je n'inclus pas dans ce chapitre les alternances avec radicaux savants de type crédible /
croire, extinction / éteindre, pour lesquels le radical n'est pas prévisible à partir de la base.
Lehmann & Martin-Berthet (1998 : 139) précisent que "du point de vue historique, ce sont des
radicaux savants (…). Le locuteur rencontrant alacrité ne le mettra peut-être pas en relation
avec allègre, et il faut connaître l'étymologie pour savoir que diurne est une forme savante de
jour". Du fait que mon analyse se veut synchronique, opérable à un moment donné quel que
soit ce moment, un appel obligatoire à l'étymologie dans la définition des radicaux ne peut y
prendre place. Pour la même raison et de manière encore plus évidente, j'écarte du corpus les
radicaux supplétifs, pour lesquels "la forme du radical est totalement différente de celle du
354
Chapitre 5 – Constitution de la base de données
mot avec lequel le dérivé est en relation" (Lehmann & Martin-Berthet 1998 : 139) puisque
l'étymologie de la "base" est différente de l'étymologie du radical ; c'est le cas des paires céc(ité) / aveugle, lud-(ique) / jeu par exemple.
Certaines variations radicales, bien que classées parmi les variations savantes du fait
qu'il y a opposition entre radical savant, emprunté au latin ou au grec et peu modifié, et
radical populaire, qui a subi l'évolution phonétique du français, obéissent à des règles. Le
locuteur identifie alors les deux radicaux comme étant de la même famille. C'est le cas de v
qui alterne avec p devant -tion (recevoir / réception, percevoir / perception, concevoir /
conception, décevoir / déception, leurs dérivés et composés) ; [E] en syllabe fermée alterne
avec [e] en syllabe ouverte, ce qui avait déjà été partiellement corrigé par l'ablation des
accents mais qui subsiste dans des termes comme peine / pénal ; la séquence -eux en fin
d'adjectif est remplacée par -os dans la formation des dérivés en -ité, comme dans sinueux /
sinuosité, adipeux / adiposité, religieux / religiosité, contagieux / contagiosité, etc. ; la suite
graphique -qu- est remplacée par -c- dans les dérivés d'adjectifs en -ique (informatique /
informaticien, mécanique / mécanicien, technique / technicien, etc.) mais également dans les
dérivés suffixés de verbes en -quer (fabriquer / fabrication, abdiquer / abdication, alterquer /
altercation, etc.) ; les substantifs en -eur à partir desquels il y a dérivation avec le suffixe -iser
voient ce -eur remplacé par -or (faveur / favoriser, terreur / terroriser, valeur / valoriser,
etc.) ; les verbes en -ettre voient leurs dérivés en -ion exiger une modification en -iss- :
admettre / admission, commettre / commission, permettre / permission, etc. ; lorsqu'on forme
un dérivé à partir des adjectifs en -ible et en -able, la terminaison de l'adjectif est modifiée en
-ibil- (sensible / sensibilité, perceptible / perceptibilité, amovible / amovibilité, etc.) et -abil(adaptable / adaptabilité, calculable / calculabilité, implacable / implacabilité, etc)
respectivement ; etc…
Ces modifications de radical sont implémentables dans l'ordinateur : si je ne peux pas
lui demander par exemple de remplacer tous les v par p au risque que l'on confonde pie et vie,
valve et palpe, vulve et pulpe, etc., il est possible en revanche de remplacer -ption- par -vtion-,
c'est-à-dire l'ensemble de la séquence comprenant la lettre à changer et le contexte (57 termes
concernés dans le corpus de départ). Indiquer par un espace final la fin de mot (-ption -) n'est
pas nécessaire car les unités comprenant la séquence -ption- en leur sein sont issues de
séquences la comprenant à la finale : les seules unités recensées dans ce cas à partir du corpus
355
Chapitre 5 – Constitution de la base de données
de départ sont réceptionner, réceptionnaire, réceptionniste < réception ; optionnel (puis
optionnellement) < option, exceptionnel (puis exceptionnellement) < exception ;
perceptionnisme < perception ; anticonceptionnel < conception.
De la même manière, il faudrait remplacer la séquence -osité- par -euxité- (53 termes
dans le corpus de départ) de façon à rendre compte de la parenté de monstruosité avec
monstrueux par exemple. Outre le fait de permettre la reconnaissance des termes de même
famille, un autre avantage serait de déterminer clairement quelle est la base de l'unité lexicale
adiposité, puisque adipeux comme adipose existent, et donc de lever l'ambiguïté de sa
formation. Pour l'unité lexicale rugosité se pose le problème du u qui sera absent après le g
dans la forme modifiée rugeuxité, empêchant l'identification du substantif avec l'adjectif
rugueux, mais cette identification n'aurait de toute façon pas été possible en gardant
l'orthographe "normale". Un problème se pose en revanche en ce qui concerne les unités
morosité et virtuosité, dans le sens où elles ne proviennent pas d'adjectifs en -eux mais bien
d'adjectifs en -ose, et que la réécriture *moreuxité et *virtueuxité empêche d'identifier les
substantifs en -ité avec les adjectifs en -ose correspondants morose et virtuose.
Le corpus de départ recense quelques 259 unités lexicales comprenant la suite
graphique -ei- mais sans être -ein-, -oei- et -uei-, dont 76 en syllabe fermée (je considérerai
que des séquences -ei- suivies d'une syllabe dont la voyelle est un schwa, comme
appareillement, sont en réalité en syllabe fermée, cf. Rizzolo 2002) et 161 en syllabe ouverte
(22 sont des emprunts dont la prononciation en français est restée proche de la prononciation
d'origine et ne peut donc pas s'assimiler à [-] ou [e] : geischa, reichstag, lei…). Il est donc
difficile de soutenir que la graphie -ei- soit la marque de la syllabe ouverte par opposition à la
syllabe fermée ! En réalité, il semble que l'exemple de peine / pénal soit idiosyncratique, et
que seule cette paire soit à modifier.
Remplacer -ique- par -ice- ne pose pas de problème (4901 termes en -ique- dans le
corpus de départ, 80 en -icité, 36 en -ication provenant de verbes en -iquer sur 194 en -ication
au total) car cette modification s'applique aussi bien aux adjectifs en -ique (électrique sera
converti en électrice de façon à pouvoir être comparé avec électricité ; domestique réécrit en
domesticité sera facilement assimilable à la famille de domesticité ; authentique retranscrit en
authentice est maintenant confrontable à authenticité ; etc.) qu'aux adverbes qui en sont
356
Chapitre 5 – Constitution de la base de données
dérivés (électriquement, domestiquement, authentiquement, etc.), ainsi qu'aux verbes en iquer (mastiquer réécrit masticer sera facilement mis en relation avec mastication ; répliquer
sera traduit par l'ordinateur en réplicer, permettant de le comparer aisément avec réplication ;
intoxiquer sera identifié comme étant de la même famille que intoxication sous l'habillage
intoxicer ; etc.).
Trois remarques sont à évoquer ici. Tout d'abord le fait que dans le corpus de départ
ont pu être isolées 80 unités lexicales ne correspondant ni à un adjectif en -ique, ni à un
adverbe en -iquement, ni à un verbe en -iquer : une première série rassemblant des termes tels
que belliqueux, briquet, tourniquet, etc., pour lesquels la modification ne semble pas causer
de problème puisqu'ils sont soit seuls dans leur famille (tourniquet), soit à la base de dérivés
qui seront eux aussi modifiés (belliqueux, briquet) ; un deuxième ensemble comprenant des
unités lexicales comme chiqueur, critiqueur, trafiqueur, etc., pour lesquels non seulement la
modification ne pose pas de problème mais est nécessaire, de façon à pouvoir identifier ces
dérivés de verbes en -er avec leurs bases qui, elles, auront été modifiées.
Par ailleurs, en ce qui concerne les 4785 termes en -ique qui n'ont pas de dérivé en icité ni en -ication, la modification de -qu- par -c- ne semble pas poser de problème. Prenons
par exemple l'adjectif et substantif dynamique et regardons l'ensemble des unités lexicales de
sa famille : dynamicien, dynamiquement, dynamisation, dynamiser, dynamisme et dynamiste ;
pour les deux premiers termes, soit le -c- est déjà présent, soit il va intervenir lors de la
conversion de -qu- en -c- ; pour les quatre derniers, la lettre suivant le -i- n'est de toute façon
ni -q-, ni -c-, la transformation n'aura donc aucune conséquence néfaste quant à l'identification
de la famille. En outre, la proximité des familles de dynamique et de dynamite n'est pas
"aggravée" par un caractère commun supplémentaire.
Le troisième point à relever ici concerne plus particulièrement les termes en -ication
dont 36 sur 194 seulement proviennent de termes en -iquer. La majeure partie de ces
substantifs – 148 – sont en relation avec des verbes en -er sans -iqu-, en -ifier le plus
souvent : notifier / notification, purifier / purification, simplifier / simplification, mais aussi
multiplier / multiplication. Aucun de ceux-là n'est affecté par la modification qui touche les
séquences -ique-.
En revanche, ce ne sont pas seulement les verbes en -iquer qui sont susceptibles
d'alterner avec -ication, mais également d'autres verbes en -quer. Le corpus de départ
rassemble 293 verbes en -quer, dont 196 en -iquer (qui aura à cette étape déjà été traité par le
remplacement de "ique" en "ice"). Trois cas majoritaires se décèlent : le type "éduquer /
éducation", dans lequel le -qu- passe à -c- ; le type "bloc / bloquer / blocage", dans lequel le 357
Chapitre 5 – Constitution de la base de données
qu- alterne avec un -c- en amont comme en aval ; le type "arnaquer / arnaque", dans lequel il
n'y a pas d'alternance. Dans le cas d'alternance, remplacer -qu- par -c- permet l'harmonisation,
dans le cas où l'on trouve -qu- dans toutes les formes, le remplacer partout par -cn'empêchera pas l'identification.
De la même manière, harmoniser les substantifs en -eur avec leurs dérivés en -iser
semble pouvoir se faire simplement, en sélectionnant dans le corpus de départ tous les verbes
se terminant par la séquence -oriser et en les remplaçant par -euriser. Ainsi un substantif tel
que faveur ou terreur sera-t-il par la suite aisément reconnu par l'ordinateur comme étant de la
même famille que favoriser retranscrit faveuriser ou terroriser réécrit terreuriser.
Or dans le corpus de départ sont recensés 51 verbes en -oriser, dont 24 seulement sont
en relation avec des substantifs en -eur (moteur / motoriser et remotoriser, inférieur /
inférioriser, facteur / factoriser, vapeur / vaporiser, etc.). Les 27 verbes restants sont
également de formation savante mais pour eux, soit la base ne se retrouve pas directement en
français actuel car le substantif en -eur correspondant n'existe pas (arboriser / *arbeur ;
herboriser / *herbeur, est donné par le Robert Etymologique comme dérivé de herboriste ;
autoriser / *auteur, la retranscription aboutirait ici à une confusion de familles lexicales ;
corporiser / *corpeur ; temporiser / *tempeur ; marmoriser / *marmeur) ; soit ils sont issus
d'adjectifs ou de substantifs en -ore (sonoriser / sonore et ses trois dérivés, métaphoriser /
métaphore, phosphoriser / phosphore, météoriser / météore) ; soit ils sont en relation avec des
substantifs ou des noms propres en -or (sponsoriser / sponsor, ténoriser / ténor, transistoriser
/ transistor, fluoriser / fluor, tayloriser / Taylor) ; pour d'autres la base est un substantif en -ie,
à laquelle a été adjoint le suffixe -iser ou -er (allégoriser / allégorie, catégoriser / catégorie et
son dérivé recatégoriser, euphoriser / euphorie ou euphorique, théoriser / théorie, caloriser /
calorie ou calorique) ; d'autres encore sont à associer à des unités en -oire (historiser /
histoire ou historique, mémoriser / mémoire) ; reste enfin mordoriser, probablement issu de
mordoré mais dont l'étymologie n'a été confirmée ni par le Robert Etymologique ni par le
TLF.
Pour ces 27 verbes non issus de substantifs en -eur, quelle serait la conséquence d'une
retranscription abusive ? En d'autres termes, remplacer automatiquement -or- devant -iser par
-eur- bloquerait-il de quelque manière que ce soit l'identification de familles lexicales ? Un
premier élément de réponse se trouve dans le fait que les verbes en -oriser, qu'ils proviennent
de termes en -eur ou pas, ont à leur tour produit des dérivés, notamment en -ation :
inférioriser / infériorisation, factoriser / factorisation, valoriser / valorisation, etc., pour les
358
Chapitre 5 – Constitution de la base de données
verbes en relation avec des substantifs en -eur ; phosphoriser / phosphorisation, sponsoriser /
sponsorisation, mémoriser / mémorisation, etc. pour les verbes d'autres provenances. Il
faudrait alors, toujours pour sauvegarder l'intégrité des familles lexicales, modifier également
-or- en -eur- dans ce contexte et dans tous les autres correspondant à des dérivés possibles des
verbes en -oriser. Ceci reviendrait peu ou prou à modifier toute séquence -oris- du corpus de
départ, soit 177 unités lexicales. Parmi ces 177 unités, 51 sont les verbes en -oriser comme
factoriser, déjà traités plus haut ; 40 sont des substantifs en -orisation tels que factorisation,
également mentionnés précédemment ; 25 sont des substantifs en -orisme (pythagorisme,
phosphorisme, rigorisme, etc.) ; on trouve 20 substantifs en -oriste (rigoriste, folkloriste,
terroriste, etc.) ; puis pêle-mêle 7 termes en -orisant (désodorisant, dévalorisant, euphorisant,
historisant, ténorisant, terrorisant, valorisant), 6 -oristique (aoristique, aphoristique,
aprioristique, floristique, humoristique, hypocoristique), 6 -orisé (arborisé, autorisé,
catégorisé, herborisé, réflectorisé, vélomotorisé), 6 -oris (clitoris, coloris, doris, favoris,
loris, pyrrhocoris), 2 -orisable (autorisable, valorisable), 3 -orisateur (herborisateur,
temporisateur, vaporisateur), 1 -orissement (endolorissement), 1 -orise (pyrocorise), 1 oristiquement (humoristiquement), 3 -oriseur (déodoriseur, vaporiseur, terroriseur), 1 orisage (vaporisage). Cette transformation de -oris- en -euris- n'occasionnerait pas de
dommage dans la plupart des cas, mais il faut cependant garder à l'esprit deux familles de
mots qui se trouveraient touchées par pareille manipulation : la famille correspondant à
autoriser et celle correspondant à humoristique. Dans le premier cas, et comme il l'a déjà été
noté plus haut, autoriser réécrit auteuriser apparenterait erronément le verbe et ses dérivés
(autorisation, autorisable, autorisé) à la famille lexicale du terme auteur ; dans le deuxième
cas, la confusion engendrée par la retranscription de -or- en -eur- rattacherait humoristique,
humorisme, humoriste et humoristiquement à l'humeur et non à l'humour. Il semble donc que
la retranscription de -oris- en -euris- ne se fasse pas sans quelques accrocs à l'intégrité du
corpus.
Un second élément de réponse, incontestable cette fois, est la perte de reconnaissance
familiale d'une telle retranscription pour 21 des 27 verbes en -oriser mentionnés plus haut (les
21 derniers cités : sonoriser et ses trois dérivés, métaphoriser, phosphoriser, météoriser,
sponsoriser,
ténoriser,
transistoriser,
fluoriser,
tayloriser,
allégoriser,
catégoriser,
recatégoriser, euphoriser, théoriser, caloriser, historiser, mémoriser, mordoriser), puisque si
l'on remplace par exemple sonoriser par soneuriser, l'ordinateur perdra le radical et ne verra
que trois caractères communs avec sonore, au lieu de cinq. Remplacer la séquence -or- quel
que soit le contexte environnant permettrait certes d'homogénéiser les termes d'une même
359
Chapitre 5 – Constitution de la base de données
famille dans le cas présent, puisque sonore serait réécrit soneure et donc comparable avec
soneuriser ; cependant, le nombre d'unités lexicales en -or- dans le corpus de départ s'élevant
à 3576, il semble difficile d'être en mesure de contrôler toutes les conséquences d'une telle
retranscription. De plus, ce travail serait nécessairement manuel et fastidieux, pour un résultat
somme toute peu important en regard du but avoué de cette thèse.
Examinons maintenant les substantifs en -ission correspondant à des verbes en -ettre.
Le corpus de départ contient 25 substantifs en -ission, dont 18 sont en relation avec des verbes
en -ettre : admettre / admission / réadmission, commettre / commission, compromettre /
compromission, démettre / démission, émettre / émission / surémission, intromettre /
intromission, omettre / omission, permettre / permission, réadmettre / réadmission, réémettre
/ réémission, remettre / rémission, soumettre / soumission / insoumission, transmettre /
transmission / neurotransmission / retransmission / télétransmission / vidéotransmission. En
revanche, si promission a bien été lié à promettre, il ne l'est plus synchroniquement, promettre
étant maintenant en relation avec promesse ; il l'a pourtant été, et est noté comme "vieux ou
littéraire" par le TLF. Repromettre souffrira une analyse identique. De même on mettra
synchroniquement en relation mainmettre avec mainmise, mais mainmission existait en
moyen français ; manumission, présent en synchronie, est rattaché à la fois par le sens et par
l'étymologie à mainmettre, mais moins par la forme : lors de la recherche automatique
l'ordinateur va rapidement le mettre de côté. Mission, si l'on s'en tient à la règle de
correspondance entre les formes en -ission et les verbes en -ettre édictée plus haut, devrait
être relié à mettre ; il s'agit là d'un mauvais partenariat, même s'ils sont effectivement reliés
étymologiquement, puisque le sens synchronique n'est pas en relation : la mission n'est pas le
résultat de mettre. Fission, scission et rescission n'ont pas de verbe correspondant en français
actuel, ils seront considérés comme seuls représentants de leurs familles respectives,
rescission étant éliminé à l'étape de l'enlèvement des préfixes. Le seul problème rencontré par
le traitement automatique de -ission en -ettrion se porte sur mission et son assimilation avec la
famille du verbe mettre.
Le dernier cas de réécriture envisagé ici est celui concernant des alternances de type
mer / maritime, clair / clarté, pour lesquels l'alternance est certes contextuellement justifiable
par la présence vs. l'absence d'un morphème suffixal, mais que l'on ne peut en aucune manière
implémenter dans l'ordinateur. Dans le corpus de départ en effet on dénombre 3209 termes
comprenant la séquence -er- en leur sein (en-dehors de ceux la comprenant à la finale) ce qui
360
Chapitre 5 – Constitution de la base de données
condamne un remplacement hâtif de -er- par -ar-, et 4777 termes comportant la suite
graphique -ar-, ce qui engendre le même interdit ; le contexte n'étant pas son donné mais la
présence d'une syllabe suivante, il ne reste aucun moyen de réécrire les termes de façon à faire
apparaître leur lien de parenté.
Certaines variations sont plus ponctuelles ; ainsi le -t final de court, fort et effort
passant à -c- dans accourcir, forcir et efforcer ne subit pas la même modification en ce qui
concerne désert, import et confort qui permettent de former respectivement déserter, importer
et conforter ; un -x final (en-dehors de la terminaison -eux déjà traitée) se verra remplacé par ss- dans la création de certains dérivés (roux / roussir), par -c- pour d'autres (doux / douceur),
ou encore par -s- (époux / épouser), cette variation n'étant nullement due à la qualité de la
voyelle précédente, à la catégorie de la base ou à celle du dérivé ; un -d- devant le morphème
infinitif de premier groupe sera remplacé lors de la dérivation tantôt par -s- (corroder /
corrosion, décider / décision, tendre / tension, etc.), tantôt par -ss- (accéder / accession,
concéder / concession, succéder / succession, etc.) ; dans le même contexte, un -t- sera parfois
maintenu (affecter / affection, éditer / édition, compacter / compaction, etc.), parfois remplacé
par -s- (apparemment deux cas seulement : convertir / conversion, pervertir / perversion et
leurs dérivés), parfois remplacé par -ss- (discuter / discussion, percuter / percussion,
connecter / connexion, etc.)… Dans tous ces cas, un traitement automatique de remplacement
d'une ou de plusieurs lettres par une ou plusieurs autres ne donnera que peu de résultats pour
beaucoup d'erreurs, c'est pourquoi il doit être rejeté. Il faudra donc tenir compte, dans les
résultats finaux de recherche "automatique" de termes épenthésés, de ces variations qui
produiront autant d'erreurs.
Si beaucoup des allomorphies de radicaux peuvent somme toute être traitées de façon
satisfaisante par l'ordinateur, qu'en est-il des allomorphies de suffixes ?
1.2.5.2. Allomorphies suffixales
L'allomorphie de suffixes est si l'on peut dire plus "gênante", dans le sens où elle porte
sur l'ajout ou l'enlèvement d'un son précisément à la frontière avec le morphème radical (cf.
chapitre 4 section 3.5.2). Dans le cadre de cette étude, la confusion peut se faire entre une
consonne allomorphique et une consonne épenthétique ; c'est pourquoi il est nécessaire de
définir le plus précisément possible ce que l'on entend par allomorphie suffixale et ce qu'elle
361
Chapitre 5 – Constitution de la base de données
recouvre concrètement dans un premier temps, puis de se pencher plus précisément sur des
cas d'allomorphies suffixales faisant intervenir des consonnes à la frontière radical / suffixe.
Prenons un cas d'allomorphie suffixale dans lequel les allomorphes peuvent comporter
une initiale vocalique aussi bien que consonantique : le morphème /sjõ/ que l'on trouve sous
les formes -tion (distribu + tion, conven + tion, prémuni + tion, contribu + tion, etc.), -ation
(admir + ation, accélér + ation, harmonis + ation, etc.), -ition (abol + ition, fin + ition, pun
+ ition, mais aussi décompos + ition, impos + ition, inhib + ition, etc.) et -ion (édit + ion,
adopt + ion, infus + ion, etc.)11. Un certain nombre de grammaires s'accordent pour donner tion comme forme de base du suffixe (par exemple Lehmann & Martin-Berthet 1998 : 140).
Étudions de plus près la distribution de ces variantes. L'allomorphe -ition est présent à la
finale de 105 unités lexicales du corpus de départ : 44 ne sont pas dérivés de verbes, au moins
synchroniquement (dentition, partition, tradition, etc.) ; 5 sont dérivables synchroniquement
de verbes du troisième groupe (apparition, réapparition, disparition, perdition, déperdition) ;
seuls 15 proviennent de verbes en -ir (déglutition, punition, expédition, etc.) alors que 41 sont
en relation avec des verbes en -er (déposition, imposition, superposition, etc.). Ces deux
derniers nombres mettent à mal l'hypothèse selon laquelle la variante -ition apparaîtrait après
les verbes en -ir. Il est à noter que dans le cas des 15 termes issus de verbes en -ir, le
découpage est malaisé, comme nous l'avions noté dans le paragraphe concernant le morphème
/-mã/ : faut-il considérer que le -i appartient au radical (puni + tion) ou qu'il est au contraire la
propriété du suffixe (pun + ition) puisque le découpage du morphème verbal -ir laisse au
radical cette forme sans -i ? Lehmann & Martin-Berthet (1998 : 141) proposent même de
classer ce -i en voyelle de transition, donc de considérer qu'il n'appartient ni au radical, ni au
suffixe. La quatrième possibilité logique serait que le radical comme la base comportent un -i,
et que les deux -i en contact se seraient simplifiés en surface. Cette dernière hypothèse
s'appuierait sur un parallèle fait avec les consonnes géminées (cf. Ségéral & Scheer 2001b).
L'allomorphe -ation est présent en finale de quelque 2139 substantifs, dont on peut supposer
qu'ils correspondent à des verbes en -er. On trouve la variante -tion non seulement
éventuellement combinée avec des radicaux issus de verbes en -ir, comme nous l'avons vu
plus haut (abolition, démolition, répartition, etc.), mais également avec des participes passés
en -u (parution, irrésolution, etc.).
11
Je rappelle que je ne considère pas ici la parenté étymologique mais celle que l'on peut déceler en synchronie.
362
Chapitre 5 – Constitution de la base de données
Un autre cas d'allomorphie suffixale concerne les suffixes -er et -iser. Le suffixe -iser
est reconnu dans le TLF, qui lui donne le sens de "rendre" + adjectif (collectiviser,
extérioriser, sensibiliser, etc.), "transformer en" + substantif (carboniser, miniaturiser,
caraméliser, etc.) et/ou "soumettre à (l'action de)" + substantif (alcooliser, javelliser,
islamiser, etc.), mais qui parmi les modifications morphologiques imposées lors de la
suffixation ne mentionne pas la perte du -i-. Comment considérer alors des formes comme
allégoriser, aïoliser ou anatomiser ? Si l'on regarde ce que le TLF propose pour chaque
entrée, on se rend compte qu'il estime que toutes ces formes sont suffixées en -iser, quand
bien même il n'indique pas cette possibilité de modification dans la partie "morphologie" du
suffixe. La sémantique peut-elle aider à départager les dérivés comportant le suffixe -iser de
ceux comportant le suffixe -er ? Je reviendrai sur ce point précis en section [6] 1.5.1.
D'autre part, il faut rappeler qu'à un suffixe formel peuvent correspondre plusieurs
suffixes de fait, c'est-à-dire qu'il existe des cas d'homonymie de suffixes (cf. section [4] 3)
dont l'ordinateur ne peut tenir compte puisqu'il n'est pas possible d'implémenter pour chaque
entrée du corpus de départ une analyse sémique du suffixe.
L'aspect sémantique des suffixes sera traité dans le troisième chapitre de cette même
partie (section II [ 6] 2).
En dehors des cas d'allomorphies radicale et suffixale, un troisième point vient gêner
le découpage automatique des séquences. Il s'agit de l'homographie de radicaux, qui peut être
partielle ou même totale.
1.2.5.3. Homographie de radicaux
Le problème ne se pose pas dans le cas d'unités lexicales très proches de type
dynamisme / dynamite, mentionné plus haut, car dans ce cas les dérivés de chacun permettront
de distinguer les deux familles : dynamicien, dynamique, dynamiquement, dynamisation,
dynamiser, dynamisme, dynamiste d'une part ; dynamitage, dynamiter, dynamite, dynamiterie,
dynamiteur, d'autre part. L'ordinateur va distinguer trois cas : dynamis- et dynamit-, mais
également dynamic- correspondant aux trois premiers termes (les -ique- étant d'ores et déjà
passés à -ice-, cf. section 1.2.5.1). La reconnaissance des familles ne va donc pas être parfaite,
mais au moins n'y aura-t-il pas confusion entre deux familles, ce qui n'est pas le cas en ce qui
concerne les homographes partiels comportant le même nombre de caractères identiques.
363
Chapitre 5 – Constitution de la base de données
Dans le cas d'homographes partiels de type communisme / communiquer en effet12,
l'ordinateur va considérer les deux termes comme étant de la même famille, la base commune
étant communi-. Si une telle homonymie se produit à l'encontre de deux termes similaires,
mais dont l'un présenterait une épenthèse là où l'autre aurait une consonne parfaitement
intégrée, l'épenthèse sera invisible au découpage automatique.
C'est d'ailleurs très exactement ce qui se passe dans le cas d'une homographie totale
comme celle de briqueterie / briqueterie : l'un des deux termes est formé sur brique à l'aide du
suffixe -erie avec intercalation d'un -t-, l'autre vient de briquette, toujours avec le suffixe erie, mais sans épenthèse. L'ordinateur n'a aucun moyen de déceler l'épenthèse du premier
terme : il va comparer avec le mot ayant le nombre maximal de caractères identiques, en
l'occurrence briquet, et ne verra pas l'épenthèse puisque briquet comporte un -t- à l'endroit
même de l'épenthèse dans briqueterie. Outre le fait qu'il n'associera pas le dérivé avec la base
correcte, le traitement automatique appauvrira le corpus d'une unité lexicale épenthésée.
Quand bien même une préparation soigneuse du corpus permettrait de pallier les
inconvénients dus aux phénomènes d'allomorphie et d'homographie, se dresserait sur le
chemin menant au corpus une difficulté supplémentaire : que faire lorsque plusieurs unités
lexicales d'une même famille comportent la même épenthèse ?
1.2.5.4. Epenthèse commune à une famille lexicale
Le cas ne semble pas isolé. Prenons pour s'en convaincre et illustrer notre propos les
deux séries suivantes :
1/ bijou, bijouter, bijoutier, bijouterie, bijoutaille
2/ caoutchouc, caoutchouter, caoutchoutage, caoutchouteux
L'ordinateur commence par rechercher la séquence la plus longue en commun dans
une série : bijouter- dans la série (1), caoutchoute- dans la (2), ce qui lui permet d'"éliminer"
bijouter et bijouterie d'une part, caoutchouter et caoutchouteux d'autre part.
(15)
Fichier A
1/
bijou, bijoutier, bijoutaille
2/
caoutchouc, caoutchoutage
Fichier B
bijouter
bijouter
caoutchoute
caoutchoute
ie
r
ux
12
Je rappelle que je travaille sur les liens synchroniques entre les termes et non sur un rapport étymologique ;
sémantiquement parlant, communisme et communiquer ne partagent rien actuellement.
364
Chapitre 5 – Constitution de la base de données
Notons à cet endroit que les déchets correspondants à bijouter et caoutchouter, à
savoir rien vs. -r, montrent un autre problème de traitement que je n'approfondirai pas, celuici pouvant en effet être résolu par la grande masse des données traitées : d'autres verbes du
premier groupe seront tantôt divisés avant le -e-, tantôt après.
Puis l'ordinateur passera à bijoute- et ne trouvera rien, donc à bijout- et caoutchout-,
éliminant bijoutier et bijoutaille, mais gardant caoutchoutage puisque ne pouvant le comparer
à une autre séquence dont les dix premiers caractères seraient également caoutchout-.
(16)
1/
bijou
2/
Fichier A
caoutchouc, caoutchoutage
Fichier B
bijouter
bijouter
bijout
bijout
caoutchoute
caoutchoute
ie
ier
aille
r
ux
Dans une troisième étape, il lui reste dans la première série bijou, seul et non mis en
relation avec ses dérivés, dans l'autre caoutchouc et caoutchoutage, pour lequel il isolera la
base caoutchou-.
(17)
1/
bijou
Fichier A
2/
Fichier B
bijouter
bijouter
bijout
bijout
caoutchoute
caoutchoute
caoutchou
caoutchou
ie
ier
aille
r
ux
c
tage
A terme, la machine n'aura pas décelé d'épenthèse dans la première série, et n'en aura
décelé (potentiellement) qu'une sur trois dans la seconde.
Je mentionnerai ici une question à laquelle je répondrai plus longuement tout au long
de la section 2, et qui est la suivante : lorsque plusieurs termes de la même famille ont la
même épenthèse, comment puis-je déterminer qu'il s'agit bien d'une épenthèse et non d'une
consonne sous-jacente ?
365
Chapitre 5 – Constitution de la base de données
De même que plusieurs termes de la même famille peuvent comporter la même
épenthèse, il se peut qu'un même suffixe rencontre plusieurs fois la même épenthèse.
1.2.5.5. Epenthèse identique devant un même suffixe
Prenons pour illustrer notre propos les unités lexicales suivantes :
1/ abri, abriter, numéro, numéroter, piano, pianoter, biseau, biseauter
2/ Chicago, chicagotesque, méga, mégatesque, kafka, kafkatesque, manga, mangatesque (cf.
Plénat & al. 2002 pour les données).
Dans un premier temps, l'ordinateur aura comparé les termes simples avec les termes
dérivés, et aura gardé, pour la série (1) quatre fois le "déchet" -ter, pour la série (2) quatre fois
le "déchet" -tesque. Lors de la deuxième étape, qui consiste à comparer les déchets par la
droite en commençant par la séquence la plus longue possible, l'ordinateur ne va donc pas être
en mesure d'isoler le -t- dans la première comme dans la deuxième série puisque tous les
éléments à comparer le possèdent. Quand bien même on ajouterait à la liste de déchets des
suffixes simples (-er, -esque dans les cas présents), du fait que l'ordinateur commence par la
séquence la plus longue commune à au moins deux séquences, il n'identifiera toujours pas le t- comme un élément à part.
Un problème plus insidieux car difficilement identifiable est celui de la graphie
pouvant masquer certaines épenthèses.
1.2.5.6. Aveuglement graphique
Étudions par exemple le cas de l'unité lexicale abricot et de ses dérivés. L'étymologie
diachronique informe que abricot provient de l'arabe al barkouq ; ceci signifie que le -t final
n'est qu'un artefact graphique qui ne correspond en aucune façon à une consonne sous-jacente,
comme c'est le cas par exemple pour l'adjectif petit, dont la forme féminine indique le statut
sous-jacent de la consonne finale. De ce fait le -t-, présent dans les dérivés abricoté,
abricotée, abricoter, abricotier, abricotin, abricotine, abricotis, est vraisemblablement
épenthétique, ce que le TLF explique comme étant un "cas de dissimilation des 2 [k] dont le
2e est remplacé par une autre occlusive sourde [t]."
Entre le XVIème et surtout le XVIIIème siècle, la langue française a connu beaucoup
de réfections orthographiques, du type du -g- réintroduit dans la graphie de doigt d'après le
366
Chapitre 5 – Constitution de la base de données
latin digitus (cf. Bourciez 1967 : 145). Certaines de ces réfections orthographiques peuvent
maintenant conduire à une disparité de formes au sein d'une même famille d'unités lexicales,
pourtant identifiable synchroniquement comme telle.
L'ordinateur n'a bien entendu aucun moyen de "deviner" si la consonne graphique
correspond ou non à une réalité étymologique.
1.2.6. Bilan
Toutes ces difficultés sont néfastes à un traitement automatique satisfaisant du corpus.
S'il est vrai que les alternances de radicaux peuvent être traitées en partie, il n'en est pas de
même en ce qui concerne les alternances de suffixes et les homographes ; les radicaux de
même famille comportant la même épenthèse, tout comme un suffixe donné comportant
plusieurs fois la même consonne épenthétique, ne sont pas non plus traitables par la machine,
qui n'aura aucun moyen de reconnaître d'éventuelles épenthèses ; enfin, les erreurs dues à la
graphie sont difficilement évaluables et quantifiables.
Tous ces motifs concourent à conférer à l'analyse automatique, malgré son apparence
plutôt prometteuse, des résultats médiocres. Ce traitement informatique ne donne en effet que
les épenthèses uniques avec un suffixe donné, pourvu que le radical soit le même dans les
deux termes comparés. En ajoutant après ce travail mécanique tous les termes de mêmes
familles présents dans le TLF et dans le Robert Etymologique, par exemple bleuter lié à
bleusaille, on obtient en tout et pour tout les 21 termes suivants :
(18)
1
2
3
4
5
6
7
8
9
10
11
12
13
terme potentiellement porteur
d'une épenthèse
banlieusard
bleusaille
bleuter
bleuterie
chevaucher
chimiatrie
diablotin
dortoir
harnacher
joufflu
noircir
portraicturien
roitelet
consonne
épenthésée
z
z
t
t
1
t2
(o)t
t
1
f
s
k
t
base
banlieue
bleu
bleu
bleu
cheval
chimie
diable
dor(mir)
harnais
joue
noir
portrait
roi
suffixe
ard
aille
er
erie
er
ie
in
oir
er
lu
ir
urien
elet
367
Chapitre 5 – Constitution de la base de données
14
15
16
17
18
19
20
21
traquenard
verdâtre
verdelet
verdeur
verdier
verdir
verdoyer
verdure
n
d
d
d
d
d
d
d
traque(r)
vert
vert
vert
vert
vert
vert
vert
ard
âtre
elet
eur
ier
ir
oyer
ure
Cette liste était bien évidemment à compléter, non seulement par la recherche
systématique, pour un suffixe apparemment déclencheur, de termes correspondants (cf.
section 1.4), mais également par des sources différentes, plus proches de l'oral que ne peuvent
l'être des dictionnaires usuels : les dictionnaires d'argot.
1.3. Dictionnaires d'argot (B)
Un travail sur le français actuel ne pouvait laisser de côté les dictionnaires de français
populaire et de français argotique, pour cette raison que, pour citer Henri Bauche en 1920
(repris par Caradec 2000 : VIII), le français populaire est "l'idiome parlé couramment et
naturellement par le peuple". Boudard (2001 : préface de Colin, Mével & Leclère) présente
quant à lui l'argot comme une langue que l'on utilise "tout naturellement", ce qui en fait un
fournisseur de séquences originales à ne pas négliger.
1.3.1. Dictionnaire de l'argot français et de ses origines
Le premier dictionnaire retenu pour la recherche de termes épenthésés est le
Dictionnaire de l'argot français et de ses origines de Colin et al., publié chez Larousse en
1990 puis 2001. Ce dictionnaire a en effet le double avantage de ses 863 pages, soit "environ
7000 entrées, auxquelles s'ajoutent quelques centaines de sous-entrées présentant variantes et
dérivés", et de fournir l'origine des unités lexicales proposées.
Les termes recensés datent de la fin du XVIIIème siècle jusqu'à nos jours, et les
auteurs indiquent avoir "recensé les mots et les locutions qui, ou bien sont encore (au moins
un peu) vivants à l'heure actuelle, ou bien l'ont été au cours du XIXème (…) L'exhaustivité
n'était, en tout état de cause, pas possible : nous avons négligé certains archaïsmes très
passagers, pour lesquels aucune attestation fiable ne se présentait, ainsi que des termes plus
patoisants qu'argotiques (…). Nous avons exclu également des mots rares, liés à une actualité
368
Chapitre 5 – Constitution de la base de données
fugace, qui, aujourd'hui, ne sont plus employés ni compris". Du fait que ce dictionnaire est un
"dictionnaire-papier", le travail est nécessairement "manuel", et cette indication étymologique
permet d'associer directement un terme à sa base, donc de repérer immédiatement les
épenthèses éventuelles.
L'étymologie proposée pour chaque terme par les lexicographes s'appuie sur "le
dépouillement de nombreux dictionnaires anciens (…) Par ailleurs, la parution en 1994 du 16e
et dernier volume du Trésor de la Langue Française ainsi que celle du Bouquet des
expressions imagées (…) nous ont permis de corriger un assez grand nombre de datations ou
d'étymologies."
Ce dictionnaire rassemble en outre les argots spécifiques suivants : bello, brution,
calaõ, calo, cant, canut, coa, faria, fayau, fourbesque, germania, ghos, jargon, javanais,
jobelin, joual, largonji, louchébem, lunfardo, ménédigne, mormé, mourmé, poissard, rochois,
romani, rotwelsch, slang, terratsu et verlan (cf. annexe 1p).
La méthode de dépouillement a été la suivante : pour chaque terme listé dans le
dictionnaire, j'ai identifié à l'aide de l'étymologie indiquée, ou de recherches dans le TLF et le
Robert Etymologique le cas échéant, la base et le radical (papelard a ainsi été écarté avec
certitude puisqu'il est issu de papier, certes, mais par substitution des suffixes -el et -ard,
enquiquiner provient certes de quiqui comme l'indique le Dictionnaire de l'argot, mais il est
dérivé avec le suffixe -iner, le -n- n'est donc pas épenthétique), de façon à déterminer s'il
comportait une épenthèse ou non. Dans le cas où l'unité lexicale considérée semble comporter
une épenthèse consonantique, je l'intègre au corpus de travail.
Le relevé "brut" des termes pouvant présenter une épenthèse entre le radical et le
suffixe comporte quarante-trois éléments, auxquels vont s'ajouter ceux issus d'un second
dictionnaire d'argot.
1.3.2. Dictionnaire du français argotique et populaire
Un deuxième dictionnaire a été consulté dans le but de compléter l'apport "argotique"
de termes épenthésés à notre corpus, tout en introduisant une dimension plus "familière",
moins technique. Il s'agit du Dictionnaire du français argotique et populaire de François
Carradec, publié en 2000, dans lequel cohabitent "tous les mots de la tchatche et du français
bien vivant d'aujourd'hui. Un passionné de la vie du langage les a recueillis dans les cafés, les
transports et autres lieux publics, aux portes des écoles ou des lycées, en famille ou entre
369
Chapitre 5 – Constitution de la base de données
amis, dans la presse et dans les livres, à l'écoute de la radio et de la télévision." Cet ouvrage
répond donc à la volonté de ne faire intervenir dans notre corpus du "français actuel" - il
prétend rejeter ce qu'il qualifie de "mots d'argot fossiles" - et apporte cette dimension orale
qui manquait tant à notre première élaboration du corpus. L'inconvénient majeur de cet
ouvrage est qu'il n'indique pas l'étymologie des termes proposés : "En indiquer l'étymologie
(ce qui est parfois tentant) serait prendre le risque de détourner l'attention de leur sens actuel".
Ce dictionnaire de 219 pages comporte environ 4700 termes. Vingt-deux termes
susceptibles de comporter une épenthèse à l'endroit intéressé ont été ajoutés aux quarante-trois
précédemment relevés dans l'autre dictionnaire d'argot consulté, une fois qu'ont été éliminés
les termes suspects présents dans les deux dictionnaires.
1.3.3. Récapitulatif des termes relevés dans les dictionnaires d'argot
Les soixante-quatre mots relevés sont présentés dans le tableau suivant, classés par
terminaisons dans l'ordre décroissant du nombre de termes concernés :
(19)
Terminaison
Nombre de termes
er
16
on
7
eux
4
ard
3
erie
3
Base
bagou
berlue
caf(ard)
cran
crapahut
cul
flou
glagla
miro
pieu
pipeau
tabac
tafia
yoyo
zieu
biffe
caf(é)
from(age)
grive
gueule
mec
pav(é)
caf(ard)
cinéma
cra(sseux)
sida
faffe
queue
vice
cul
Nombre de termes
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
Termes
bagouler
berlurer
caf(e)ter
cranter
crapahuter
trouducuter
flouter
glaglater
miro(i)ter
pieuter ; dépieuter (se)
pipeauter
tabasser
tafiater
yoyoter
zieuter
biffeton
cafeton
frometon
griveton
gueuleton
mecton
paveton
cafeteux
cinémateux
crapoteux
sidateux
faflard
queutard
vicelard
cuterie ; trouducuterie
370
Chapitre 5 – Constitution de la base de données
ier
3
age
2
dé
2
eur
2
go
2
ière
2
in
2
bar
2
ance
bri
caille
dé
é
ième
in
ingue
mar
mon
ot
iat
ar
té
27 terminaisons
1
1
1
1
1
1
1
1
1
1
1
1
1
1
64 termes
marlou
cul
marlou
marlou
zieu
foin
fouigne
caf(ard)
zyeu
ici
là-bas
lolo
rue
auver(gnat)
marlou
colis
cro(quis)
cuis(ine)
colis
ici
jour
noix
combien
gosse
louf
café
café
gosse
marlou
cam(ion)
con
46 bases différentes
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
marlouserie
trouduculier
marloupier ; marlousier
marloutage
zieutage
foindé
fouignedé
cafeteur
zyeuteur
icigo
labago
lolotière
rutière
auverpin
marloupin
colibar
crobard
cuistance
colibri
icicaille
jourdé
noité
combientième
gosselin
louftingue
cafemar
cafemon
gosselot
marloupiat
camtar
conceté
Après le traitement automatisé d'une liste de mots et la consultation de dictionnaires
argotiques, le corpus a été enrichi également à partir d'une recherche systématique des
expressions renvoyant à l'épenthèse consonantique au sein de la version informatisée du TLF.
1.4. Recherche à partir d'expressions dans le TLFi (C)
La mise à disposition du TLF sur Internet depuis 2001 a également permis d'interroger
cette base de données à partir d'expressions liées à la notion d'épenthèse. L'utilisation du mode
de recherche appelé "recherche complexe", "la manière la plus avancée d'utiliser le TLF"
selon les propres concepteurs du programme, autorise en effet à s'intéresser à des expressions
susceptibles d'apparaître dans les articles qui correspondent à des entrées comportant une
épenthèse consonantique.
Le TLF a été établi à partir de sources diverses telles que des "dictionnaires,
inventaires de toute nature (inventaires proprement dits du type I.G.L.F. [Inventaire Général
371
Chapitre 5 – Constitution de la base de données
de la Langue Française], index, glossaires, concordances), thèses, livres, articles de
périodiques et de journaux" (préface du TLF, vol. 1 : XXI) auxquels s'est ajouté "un nombre
important de textes susceptibles de nous livrer une langue relativement proche de la langue
parlée : journaux intimes, correspondances, mémoires, théâtre en prose, parties dialoguées des
romans, poésie lyrique jusqu'à un certain point." (préface du TLF, vol. 1 : XXIII). La liste des
textes exploités pour la constitution du TLF, à savoir 1002 ouvrages littéraires (416 pour le
XIXème siècle, 586 pour le XXème) représentant environ 70 millions d'occurrences,
auxquelles se sont ajoutés 20 millions d'occurrences issues de textes techniques, est
disponible dans le premier volume du TLF (préface : XVIX-XCVII).
L'utilisation du TLF dans la constitution du corpus avait permis d'observer une grande
hétérogénéité dans l'indication de consonnes susceptibles de relever d'une épenthèse.
Figuraient pour mentionner le cas des expressions comme "t anal", "consonne de liaison",
"épenthétique", "parasite", etc. La recherche systématique de ces expressions dans le TLFi a
permis de compléter le corpus préalablement établi ; il est à noter qu'une recherche portant sur
"anal" dans le TLFi recense tous les termes comportant cette séquence, donc portera
également sur "anal.", "analogie" et "analogique", ceci fonctionnant pour toutes les séquences
raccourcies, comme la non distinction entre minuscules et majuscules. Les résultats de chaque
requête sont récapitulés dans le tableau suivant :
(20)
Expression recherchée
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
anal
t anal
d anal
s anal
t de trans
d de trans
s de trans
t de liaison
d de liaison
s de liaison
-t- anal
-d- anal
-s- anal
addition de
-t-
16
-d-
Nombre d'entrées
concernées
13538
1
1
0
1
0
0
1
0
0
1
0
0
96
3282
33
Entrées concernées
-age (suffixe)
-eau
aspertule (au moyen-âge)
voilà (ne voilà-t-il pas)
bijoutaille
deux pertinents : bijoutaille, papetier
inclues les épenthèses syntaxiques type ajouta-t-il
barreaudage (-d- de soutien)
brelander (-d- de transition)
calembourdier
cauchemarder, cauchemardesque
engendrer (consonne transitoire)
faisander
et "passages de -t- à -d-, de -s- à -d-, etc."
372
Chapitre 5 – Constitution de la base de données
17
-s-
98
18
consonne de
25
19
épenthétique
36
20
épenthèse
16
21
parasite
431
(graphies, prononciations)
cambrésine (-s- consonne de liaison)
halloysite (-s- de transition)
myrosine (-s- épenthétique)
odalisque (-s- parasite)
pertinents :
barreaudage
bourriauder (picard), bourreauder
cafetier, cafetière
caillouter, caillouté, cailloutis
cambrésine (de Cambrai)
chaotique
chichiteux (dans article chichi)
conchyoline
congolais
échotier
froufrouter
lambdatique (dans article -ique)
médiumnique (dans article -ique)
clamecycois (dans article -ais)
souriquois (dans article -ais)
spadois (dans article -ais)
graylois (dans article -ais)
togolais (dans article -ais)
vinçanais (dans article -ais)
pouillyzois (dans article -ais)
arroutain (dans l'article -ain)
broutain (dans l'article -ain)
samaritain (dans l'article -ain)
pierrefeucain (dans l'article -ain)
valéricain (dans l'article -ain)
pertinents :
amadouvier
atlastique
calendrier
calfeutrer
casserole prononcé castrole
colombe
dépiauter
filouter
gueuleton
juter, juteux
masselote
mendigot
mycélium
myrosine
pivoine
poireauter
pertinents :
dénoyauter (épenthèse euphonique)
filandre
patraque
polacre
vrille
pertinents :
accoutrer
baroufle
cible
odalisque
tringle
373
Chapitre 5 – Constitution de la base de données
22
adventice
50
23
24
1
83
28
consonne transitoire
transitoire
-t- de soutien / t de
soutien
-d- de soutien / d de
soutien
-s- de soutien / s de
soutien
additionnelle
29
consonne graph
1
30
[t]
103
31
[d]
35
32
[z]
101
33
inorganique
56
25
26
27
pertinents :
agioter
dompter
engendrer
pertinent : engendrer
0
0
0
15
pertinent : dompter
montpelliérain (articulation de la consonne
graphique -r de la base)
indications de prononciation, de graphie ou de
contexte
casserole prononcé castrole
indications de prononciation, de graphie ou de
contexte
pertinents :
banlieusard (addition de [z])
bondieusard (addition de [z])
pertinent : éreinter
Certains des termes isolés par cette recherche avaient déjà été découverts et traités par
ailleurs : amadouvier, barreaudage, cauchemarder et cauchemardesque, faisander, cafetier et
cafetière, caillouter et cailloutis, chaotique, échotier, dépiauter, filouter, juter et juteux,
poireauter, éreinter. Ceux-ci ne seront bien sûr pas intégrés à nouveau dans le corpus.
Le traitement du TLFi a mis en exergue, outre des épenthèses syntaxiques (ne voilà-til pas, ajouta-t-il, etc.), des termes savants comportant une épenthèse (myrosine, cambrésine,
halloysite, conchyoline, mycélium), des suffixations de toponymes, (arroutain, broutain,
clamecycois, congolais, graylois, javanais, pierrefeucain, pouillyzois, samaritain, souriquois,
spadois, togolais, valéricain et vinçanais), et des termes "normaux" (atlastique, bourreauder,
brelander, calembourdier, chichiteux, froufrouter, gueuleton, lambdatique et médiumnique).
Il semble logique d'intégrer à ce paragraphe les quelques termes trouvés dans les
articles correspondants aux suffixes dans le TLF, dans la mesure où certains d'entre eux sont
apparus par le tri sus-cité. Ont bien sûr été ôtés les termes déjà présents dans le corpus,
comme filoutage ou numérotage, ce qui ne laisse que les deux termes suivants : bamboutage,
pinceautage. Le Robert historique mentionne également pinceauter, dont serait dérivé
pinceautage.
Au total, les quarante-huit termes suivants ont été intégrés dans le corpus :
374
Chapitre 5 – Constitution de la base de données
(21)
Terminaison
à déterminer
Nombre de termes
9
Base
à déterminer
à déterminer
er
9
ain
5
ois
5
ais
4
age
3
ier
3
ine
3
ique
3
ement
eux
ien
ite
12 terminaisons
1
1
1
1
48 termes
bourreau
brelan
chichi
froufrou
pinceau
arrou
brou
pierrefeu
samarie
valéry
clamecy
gray
pouilly
souris
spa
congo
java
togo
vinça
à déterminer
bambou
pinceau
à déterminer
brelan
calembour
à déterminer
Cambrai
myro
atlas
lambda
médium
à déterminer
chichi
Cambrai
Halloy
27 bases identifiées
Nombre de termes
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Termes
barouf(le)
cible
coudre
filandre
mycélium
patraque
polacre
tringle
vrille
accoutrer
calfeutrer
dompter
engendrer
bourreauder
brelander
chichiter
froufrouter
pinceauter
arroutain
broutain
pierrefeucain
samaritain
valéricain
clamecycois
graylois
pouillyzois
souriquois
spadois
congolais
javanais
togolais
vinçanais
calfeutrage
bamboutage
pinceautage
calendrier
brelandier
calembourdier
conchyoline
cambrésine
myrosine
atlastique
lambdatique
médiumnique
calfeutrement
chichiteux
cambrésien
halloysite
En-dehors du traitement semi-automatique d'une liste de mots, du dépouillement
manuel de dictionnaires d'argot, de l'interrogation du TLFi par mots clés, une source
supplémentaire de termes contenant potentiellement des épenthèses a été, tout au long de la
375
Chapitre 5 – Constitution de la base de données
constitution du corpus, l'exploitation des données relevées dans les articles, linguistiques mais
aussi de diverses sources non scientifiques.
1.5. Données issues d'articles (D)
D'autres termes se sont en effet ajoutés au corpus, fournis par les articles et les livres
mentionnant le sujet ou trouvés au hasard de lectures personnelles. La liste ci-dessous les
récapitule en regard de leur source respective quand ces termes sont issus d'articles
linguistiques, et en liste alphabétique pour ceux trouvés dans des articles non linguistiques.
Ont été ôtés les termes déjà recensés (piétaille, escobarderie, voyouterie, etc.).
(22)
articles linguistiques
amiganesque
kafkatesque
ferblantesque
goyatesque
chicagotesque
gargantuanesque
gargantualement)
gargantualesque
cacatesque (d'où cacatoire)
ceaucesculesque
Plénat & al. (2003)
Lehmann & MartinBerthet (1998 : 132)
Wetzels (1987 : 285 ;
287)
Schane (1968)
Dubois & DuboisCharlier (1999 : 193 ;
206)
Temple (1996 : 318-328)
articles non linguistiques
abritement (d'où abriter)
absolutisme (d'où absolutiste)
bénitier
blaireauter
butorderie
(d'où cadeauter
delducatesque
escargotesque
gogotesque (d'où gogotisme)
hugolesque (d'où hugolien, hugolâtre)
hugotesque
mangagesque
manganesque
mangatesque
mégatesque
shungatesque
zolatesque
enfourner
hugotesque (id Plénat & al.)
silotage (d'où ensiloter)
ronéoter
bazardier
papousie
partisan
gueusaille (d'où gueuser, gueuserie,
gueusard)
cachimantier
rapiaterie (d'où rapiater)
grigouterie
janoterie (d'où janotisme)
canulardesque
caviardage (d'où caviarder)
dénoyauter
(d'où
dénoyautage,
dénoyauteur)
dieutelet
élancer
ensiloter
épauletier
favoritisme
fermeté
gruauter
hiverner
météoriser
onusienne
piapiatage
sidatique
sidénologue
têtutesse
tissulaire
tissuterie
tissutier
zougloutique
376
Chapitre 5 – Constitution de la base de données
Les quatre-vingt-quatorze termes ainsi recueillis se répartissent de la manière suivante
en fonction de leur terminaison :
(23)
Terminaisons
Nombre de
termes
esque
21
er
13
erie
ier
isme
age
on
ique
iser
ement
ien
ière
ir
aie
aille
aire
an
ard
âtre
é
eau
elet
esse
eur
eux
ie
iste
oire
ologue
29
terminaisons
6
6
6
5
5
4
4
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Termes
amiganesque ; cacatesque ; canulardesque ; ceaucesculesque ; chicagotesque ;
delducatesque ; escargotesque ; ferblantesque ; gargantualesque ; gargantuanesque ;
gogotesque ; goyatesque ; hugolesque ; hugotesque ; kafkatesque ; mangagesque ;
manganesque ; mangatesque ; mégatesque ; shungatesque ; zolatesque
abriter ; blaireauter ; cadeauter ; caviarder ; dénoyauter ; élancer ; enfourner ;
ensiloter ; gruauter ; gueuser ; hiverner ; rapiater ; ronéoter
butorderie ; grigouterie ; gueuserie ; janoterie ; rapiaterie ; tissuterie
bazardier ; bénitier ; cachimantier ; épauletier ; escargotier ; tissutier
absolutisme ; favoritisme ; gogotisme ; hugotisme ; janotisme ; médiatisme
caviardage ; dénoyautage ; escargotage ; piapiatage ; silotage
aileron ; bûcheron ; mancheron1 ; mancheron2 ; tâcheron
hugotique ; médiatique ; sidatique ; zougloutique
eczématiser (s') ; médiatiser1 ; médiatiser2 ; météoriser
abritement ; gargantualement
hugolien ; onusienne
boucautière ; escargotière
beausir ; durcir
aspergeraie
gueusaille
tissulaire
partisan
gueusard
hugolâtre
fermeté
manchereau
dieutelet
têtutesse
dénoyauteur
eczémateux
papousie
absolutiste
cacatoire
sidénologue
94 termes
L'article de Plénat & al (2002), de par le fait qu'il porte précisément sur les dérivés en esque, a grossi le nombre de termes présentant une épenthèse pour un seul suffixe. Il
conviendra donc d'en tenir compte au moment du décompte final par suffixe. C'est d'ailleurs
une des deux raisons pour lesquelles je n'ai pas intégré dans ce corpus les dérivés proposés par
Plénat (1997, 1999) : ces articles portant précisément sur l'épenthèse devant trois suffixes
particuliers, l'ajout des termes afférents aurait conduit à une disproportion du corpus en termes
de représentation de ces suffixes mais aurait également faussé toute généralisation relative au
type de segment final de radical ou initial de suffixe. De plus, il n'est pas apparu avec
377
Chapitre 5 – Constitution de la base de données
certitude, après évaluation des données, que l'on puisse attribuer la consonne à une épenthèse
et non à une variante du suffixe (cf. section I [1] 3.3.2.1.2 pour une discussion).
La méthode de recueil que le lecteur va découvrir maintenant a elle aussi biaisé en
partie le nombre de termes contenant une épenthèse par suffixe, dans le sens où elle s'est faite
en exploitant à nouveau la base de 64.296 termes (cf. I [5] 1.2), mais de façon ciblée et
manuelle cette fois, à la recherche de certains suffixes. Cependant, il s'agit de suffixes dont il
est apparu la fréquence dans la base de données, le choix de ces suffixes étant ainsi mieux
justifié que par la simple disponibilité de la source.
1.6. Examen systématique des termes présentant les suffixes -ier, -age et -erie (E)
Un moyen supplémentaire de compléter le corpus a été de dresser la liste des termes
de la base de données exploitée en section 1.1 présentant le suffixe -ier, puis le suffixe -age,
enfin le suffixe -erie, et de trier ces listes manuellement.
Ces trois suffixes ont été sélectionnés à partir d'une liste intermédiaire des suffixes les
plus fréquemment rencontrés après une épenthèse consonantique. Cette liste ne correspond
pas au cumul des suffixes trouvés jusqu'à présent mais à celle établie à un moment M de la
constitution de ce corpus, alors que la plupart des moyens d'extraction étaient en cours mais
non aboutis : les termes issus d'articles comme les données orales ont été insérés
continuellement dans le corpus et non à un instant précis. Le suffixe le plus fréquemment lié à
une épenthèse est -er, mais il concerne 9992 termes dans la base de données, ce qui représente
un très gros travail manuel qui ne se justifierait que par une rentabilité intéressante de cette
méthode d'extraction, rentabilité qui ne s'est pas avérée. Venaient ensuite et dans cet ordre les
suffixes -ier, -age et -erie. L'expérience n'a pas été poussée plus avant étant donné le manque
de productivité de la méthode par rapport au temps investi.
Un premier tri dans la matière première constituée des listes de mots en -ier (1238
termes dans la liste de mots de départ), -age (2293 termes) et -erie (470 termes) a permis
d'extraire 350 candidats, qui se répartissent par terminaison de la manière suivante :
378
Chapitre 5 – Constitution de la base de données
(24)
Terminaisons
Nombre de
termes
er
106
ier
70
age
62
erie
48
é
8
eur
8
in
on
ement
aire
eau
et
eux
fier
ie
ière
aille
4
4
3
2
2
2
2
2
2
2
1
Termes
aborder ; acclimater ; affûter ; agioter ; ajouter ; argenter ; argoter ; arpenter ;
badauder ; bahuter ; biseauter ; boiser ; bonneter ; border ; briqueter1 ; briqueter2
; cafarder ; caillouter ; chaluter ; chamoiser ; cimenter ; clabauder ; cliqueter ;
coqueliner ; cureter ; déliter ; dépiauter ; dépiéter ; dévergonder ; diamanter ;
doigter ; ébruiter ; écanguer ; échafauder ; écoqueter ; emblaver ; émeriser ;
empiéter ; épisser ; épousseter ; équeuter ; ergoter ; escobarder ; essarter ; fagoter
; faisander ; farder ; farter ; fauberder ; fauberter ; faucarder ; feuilleter ; filouter ;
folioter ; formater ; ganter ; garancer ; hourder ; jeter ; jobarder ; jointer ; joncher
; larder ; luter ; mailleter ; maquereauter ; marauder ; marchander ; massicoter ;
mégot(t)er ; merceriser ; minauder ; miroiter ; moiser ; moleter ; mortaiser ;
moucheter ; organsiner ; pailleter ; panneauter ; papilloter ; paqueter ; parqueter ;
patenter ; pelleter ; piéter ; plomber ; pointer ; porter ; puiser ; queuter ; rabioter ;
raboter ; rabouter ; ravauder ; saborder ; soucheter ; tableauter ; tamiser ;
tan(n)iser ; tarauder ; terreauter ; tricoter ; truander ; vagabonder ; venter
abricotier ; aiguilletier ; alfatier ; alleutier ; amadouvier ; arbalétrier ; archetier ;
argotier ; avocatier ; bahutier ; bonnetier ; brancardier ; briquetier ; buandier ;
bufettier ; canotier ; cédratier ; chaînetier ; chalutier ; chocolatier ; cocotier ;
coquetier1 ; coquetier2 ; cordelier ; courtier ; dinandier ; doigtier ; dossier ;
drapier ; fagotier ; faisandier ; ferblantier ; ferratier ; forestier ; fournier ; gazetier
; giletier ; grainetier1 ; grainetier2 ; gravatier ; guichetier ; îlotier ; jambosier ;
kolatier ; laitier ; lingotier ; lotier ; maquereautier ; matelassier ; minotier ;
miroitier ; panetier ; papetier ; paquetier ; paradisier ; peaucier ; peaussier ;
pelletier ; potier ; prime(-)sautier ; puisatier ; quartier ; rivetier ; sagoutier ;
tableautier ; tabletier ; taillandier ; taxaudier ; vivandier ; vomiquier
aciérage ; agiotage ; argotage ; badaudage ; barreaudage ; biseautage ; boisage ;
bouvetage ; brigandage ; briquetage1 ; briquetage2 ; cailloutage ; chalutage ;
chariotage ; clavetage ; courtage ; crabotage ; déhourdage ; délutage ; démâtage ;
dépiautage ; échevet(t)age ; écointage ; écoquetage ; emboucautage ; émerisage ;
enfantillage ; épiétage ; épincetage ; époutissage ; esquimaudage ; esquimautage ;
fardage ; faucardage ; ferroutage ; filoutage ; folletage ; foulardage ; fournage ;
gobetage ; îlotage ; laitage ; maf(f)iotage ; maquereautage ; masselottage ;
matelotage ; millerandage ; moyettage ; museletage ; palotage ; paquetage ;
partage ; platelage ; pontage ; ridelage ; souchetage ; sténosage ; terreautage ;
torsinage ; trématage ; versage ; zérotage
afféterie ; archeterie ; badauderie ; baguenauderie ; bigoterie ; bimbeloterie ;
biscuiterie ; bluterie ; boiserie ; boiterie ; bouverie ; briqueterie1 ; briqueterie2 ;
briqueterie3 ; buffleterie ; cagoterie ; closerie ; descenderie ; dinanderie ; droiterie
; escobarderie ; faisanderie ; ferblanterie ; filouterie ; finauderie ; fonderie ;
forfanterie ; fruiterie ; gailleterie ; goujaterie ; graineterie ; homarderie ; huisserie
; loterie ; manécanterie ; marqueterie ; matoiserie ; miroiterie ; mousqueterie ;
musarderie ; passementerie ; pelleterie ; retorderie ; robinetterie ; rustauderie ;
tabletterie ; vanterie ; verroterie
abricoté ; barreaudé ; biseauté ; écoté ; effronté ; joncé ; miroité ; vignet(t)é ;
agioteur ; argoteur ; bardeur ; biseauteur ; coqueleur ; paqueteur ; soucheteur ;
taxateur
coquebin ; fagotin ; piétin ; tableautin
enfançon ; moucheron ; piéton ; vigneron
empiètement ; miroitement ; piètement
moscoutaire ; sursitaire
faisandeau ; ponceau
coquelet ; coqueret
caillouteux ; coqueleux
cocufier ; statufier
baraterie ; daterie
coquetière ; giletière
piétaille
379
Chapitre 5 – Constitution de la base de données
asser
ation
elle
eter
euse
if
ifier
ine
iner
ion
ique
ir
is
isme
iste
ot
otte
otter
ourde
ton
uche
ure
39
terminaisons
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
350
termes
avocasser
colorisation
coquerelle
piqueter
émeriseuse
taxatif
salifier
abricotine
piétiner
taxation
argotique
accourcir
cailloutis
argotisme
argotiste
queusot
masselotte
picoter
coquelourde
cureton
coqueluche
fourniture
A ce stade de l'élaboration du corpus, il est apparu que l'étude des néologismes
recueillis par différents auteurs pouvait contribuer à enrichir les données sur lesquelles allait
porter l'étude. Deux ouvrages ont été sélectionnés à cet effet, choisis en fonction de l'étendue
des sources auxquelles ils ont fait appel.
1.7. Données issues de Néologismes du français contemporain (H)
Le premier recueil de néologismes utilisé dans cette étude a été publié par l'Institut
National de la Langue Française dans la collection Datations et documents lexicologiques.
Dans cet ouvrage sont rassemblés par K.E.M. George les néologismes trouvés entre 1971 et
1991, issus de trois sources :
- le roman "populaire", représenté par Albertine Sarrazin, Victoria Thérame, Christiane
Rochefort, Raymond Queneau, René Fallet et Alphonse Boudard.
- la presse, au moyen des Archives du français contemporain et de La quinzaine littéraire.
- des travaux lexicologiques et lexicographiques sur l'argot des poilus d'Esnault, le parler des
jeunes d'Obalk, Soral et Pasche, le Répertoire de termes inventés par la SF de Scherwinsky,
divers dictionnaires d'argot parmi lesquels celui de Marks, Johnson & Pratt.
Les termes relevés à l'issue du dépouillement de ces sources ont ensuite été contrôlés
dans des dictionnaires "de référence" tels que le Dictionnaire des anglicismes de Rey-Debove
380
Chapitre 5 – Constitution de la base de données
& Gagnon (1982), le Dictionnaire de l'argot français et de ses origines de Colin, Mével &
Leclère (1990), le Dictionnaire du français non-conventionnel de Cellard & Rey (1980), le
Dictionnaire des mots contemporains de Gilbert (1980), l'Insolite, Dictionnaire des mots
sauvages de Rheims (1989, cf. paragraphe suivant), mais également des dictionnaires plus
"normatifs" tels que le Grand Larousse de la langue française coordonné par Guilbert et al.
(1971-1978), le Grand Robert de la langue française de Robert & Rey (1985), le Dictionnaire
de la langue française de Littré (1863-1872 et ses suppléments de 1877), le Trésor de la
Langue Française, etc.
L'avantage de ce recueil de néologismes est de répertorier la date de parution du
néologisme en regard de l'entrée correspondante et de se limiter à une période relativement
courte et proche de nous, ce qui permettra, si les résultats de l'analyse l'imposent, de statuer
sur la création d'épenthèses à différentes périodes de l'histoire du français et notamment du
français "actuel".
Un tri manuel a permis d'opérer une première sélection, en éliminant les termes dont la
nouveauté consistait à changer de catégorie grammaticale ou de sens, mais sans qu'il s'agisse
d'une création lexicale mettant en jeu la dérivation suffixale. Ont également été écartés des
termes formés certes par la suffixation, mais préférant la troncation à l'épenthèse, comme
comme alibabesque. Tous les termes pour lesquels il n'a pas été possible de trouver une
première attestation ont été gardés, dans le sens où l'ouvrage dont ils sont extraits porte
précisément sur les néologismes. Les termes précédemment enregistrés dans le corpus,
comme embijouté ou gagater, n'ont bien sûr pas été ajoutés.
Au final, ce sont vingt-cinq termes supplémentaires qui ont trouvé le chemin de la
base de données. Le tableau suivant permet de les découvrir en fonction de leur terminaison :
381
Chapitre 5 – Constitution de la base de données
(25)
Terminaison
Nombre de
termes
er
7
erie
3
ée
2
eur
2
ure
2
aille
ant
asse
ation
é
esque
eux
ton
ude
1
1
1
1
1
1
1
1
1
14
terminaisons
25 termes
Base
calor
glaviot
mélimélo
MRP
pogo
tatami
vravra
pageot
ripou
tutu
boche
yeux
cul
glaviot
cuir
yeux
hobereau
trotski
biberon
calor
cambouis
alibaba
biscoto
boche
breton
20 bases
différentes
Nombre de
termes
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Terme
caloriser
glavioter
méliméloter (se)
émerpiner
pogoter
tatamiser (se)
vravrater
pageoterie
ripouserie
tututerie
bochetée
yeutée
trouducuteur
glavioteur
cuirture
yeuture
hobereautaille
trotskisant
biberondasse
calorisation
cambouité
alibababesque
biscotonneux
bocheton
bretonnitude
Il a été fait appel à un deuxième recueil de termes susceptibles de contenir une
épenthèse, le Dictionnaire des mots sauvages de Rheims (1990).
1.8. Données issues de L'insolite, Dictionnaire des mots sauvages (K)
Ce dictionnaire a pour vocation de rassembler "les mots insolites, les néologismes
recueillis dans les œuvres des XIXème et XXème siècles" (quatrième de couverture). Rheims
a puisé dans des ouvrages de Guillaume Apolinaire, Céline, Jean Giono, Victor Hugo, Honoré
de Balzac, Edmont Rostand, aussi bien que de Gaston Bachelard, Jean-Paul Sartre, George
Sand ou San Antonio, pour proposer une liste de termes qui "obéissent aux règles de
formation du français et sont aptes à faire carrière".
Le même protocole manuel de tri a été opéré, permettant de ne pas faire figurer à
nouveau des termes déjà recensés par ailleurs. Les soixante-et-un termes recrutés dans ce
dictionnaire sont présentés dans le tableau ci-dessous :
382
Chapitre 5 – Constitution de la base de données
(26)
Terminaison
Nombre de
termes
er
18
é
5
eur
5
ique
4
on
4
ement
3
erie
3
esque
3
iser
3
ette
2
aille
ant
âtre
1
1
1
do
1
Base
adulte
drapeau
fumant
génie
glou
glouglou
glue
infini
maou
museau
névralgie
perle
perlouse
roulis
Stromboli
symétrie
you
crachat
képi
phraséologie
pluie
porche
blaireau
chou
glouglou
radio
symétrie
centauresse
déchet
drapeau
épopée
double
bleui(r)
igloo
société
glouglou
hip hip hourra
piou
bousard
hurluberlu
rococo
escouba (prov)
piou
sofa
abruti
Othello
radio
source
tarte
bedeau
glouglou
égo
cul (botte au
cul)
Nombre de
termes
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Terme
adultiner
drapeauter
enfumanter
engéniser
glouter
glouglouter
englumer (s')
infiniser, infinitiser
mamaouter
musotter
névralgiser
emperlizer
emperlouser
rouliser
stromboliser
symétriser
youyouter
crachaté
enképissé
phraséologisé
pluité
emporchézé
blaireauteur
chouteur
glouglouteur
radioteur
symétriseur
centaurestique
déchétique
drapeautique
épopétique
doublezon
bleuison
iglouchon
sociéteton
glougloutement
hipipourassement
pioutement
bousarderie
hurluberluterie
rococoterie
escoubellesque
pioup(i)esque
sofalesque
abrutiliser
othellotiser (s')
radiotiser
sourcelette
tartelette
bedeaudaille
glougloutant
égolâtre
botocudo
383
Chapitre 5 – Constitution de la base de données
ien
ier
in
ir
isme
iste
ure
1
1
1
1
1
1
1
21
terminaisons
61 termes
lune
figaro
bouc
glouglou
Naga
néant
noir
52 bases
différentes
1
1
1
1
1
1
1
lunaisien
figarotier
bouquetin
glougloutir
nagualisme
néantiste
noirdure
L'Insolite constitue la dernière source écrite exploitée dans la création de la base de
données, première étape vers le corpus sur lequel portera l'analyse. Il convient donc
maintenant de s'arrêter quelques instants pour faire un premier bilan de ces différentes
ressources.
1.9. Bilan des ressources écrites.
Les ressources écrites exploitées dans le cadre de l'élaboration du corpus sur lequel
s'établira l'analyse ont été diverses, tant par les méthodes d'extraction que par les sources
elles-mêmes.
Certains dépouillements ont en effet été fortement automatisés, comme le tout premier
envisagé à savoir l'exploitation d'une liste de mots informatisée (A), et la recherche à partir
d'expressions clés dans le TLFi disponible en ligne (C). D'autres ont été entièrement manuels,
comme l'extraction dans les dictionnaires d'argot (B) ou de néologismes (H et K). Toutes ces
méthodes ont cependant en commun leur rigueur : l'ensemble de chaque base de données
disponible a été exhaustivement dépouillé. Une étude reposant en partie sur des néologismes
ne pouvait se passer cependant de ces termes que l'on trouve au hasard d'une lecture
personnelle ou, de manière moins hasardeuse, dans les articles traitant du sujet.
Plusieurs suffixes se détachent des autres par la fréquence avec laquelle ils se
rencontrent accompagnés d'une épenthèse consonantique. Il convient toutefois de tempérer la
prépondérance de certains d'entre eux au regard de la méthode d'extraction. Ainsi le suffixe esque est-il extrêmement représenté, du fait que Plénat & al (2002) ont fourni 19 des 20
termes relevés ici. Les suffixes -ier, -age et -erie sont de même quantitativement
surreprésentés puisqu'un des moyens d'extraction a été précisément d'effectuer une recherche
par suffixe.
384
Chapitre 5 – Constitution de la base de données
Ce corpus ne saurait être complet sans une incursion du côté des données orales, ce qui
permet de capturer des épenthèses qui n'auront pas nécessairement été répertoriées à l'écrit,
considérées comme des "fautes" ou tout simplement de durée de vie limitée.
2. Introduction de données uniquement orales (G)
Il était nécessaire d'exploiter les données orales pour rendre compte au mieux du
phénomène synchronique d'épenthèse consonantique. Pour ce faire cependant, la méthode
d'extraction a été plus aléatoire puisque soumise en grande partie au hasard.
Aux unités lexicales extraites de données écrites se sont greffés les termes entendus à
la radio ou à la télévision (loftstorisant), ou obligeamment proposés par des collègues ou amis
sensibilisés à la question (stabiloter, pyjamateux, faucuseté, etc.), totalisant 196 termes se
répartissant par terminaison de la manière suivante :
(27)
Terminaison
er
Nombre de
termes
55
Base
bazar
bec
bijou
bilan
bisou
blabla
bobo
boyau
cacao
cach(er)
caoutchouc
catégorie
cauchemar
chapeau
chèvrot
chipie
chouchou
clou
coin
coucou
dépôt
dieu
favori
fayot
gaga
gateux
jus
macadam
Nb de termes
associés
1
1
1
1
1
1
1
2
1
2
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
Terme
bazarder
becqueter
bijouter
bilanter
bisouter
blablater
boboter
boyauder ; boyauter
cacaoter
cachotter ; cachotterie
caoutchouter
catégoriser
cauchemarder
chapeauter (dé)
chevroter
chipieter
chouchouter
clouter
coincer
coucouler
déposer
bondieuser ; débondieuser
favoriser
fayoter
gagater
gatouser
juter
macadamiser
385
Chapitre 5 – Constitution de la base de données
ier
15
age
14
eur
13
marabou
Marivaux
noyau
numéro
pansement
piano
poireau
pou
poutou
psycho
rebus
recrue
rein (é)
sabot
sauv(er)
sirop
stabilo
tango
texto
tour
tuyau
verge
voyou
zozo
bijou
boyau
cacao
cach(er)
caf(é)
caoutchouc
colza
domino
écho
grue
indigo
morue
mot (gros)
obus
sort
bazar
caoutchouc
chimie
fayot
jus
marais
Marivaux
noyau
numéro
piano
poireau
pourri
sauv(er)
tuyau
bazar
fayot
indigo
noyau
numéro
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
(dé)marabouter
marivauder
noyauter
numéroter
pansementer
pianoter
poireauter
pouiller
poutouner
psychoter
rebuter
recruter
éreinter
saboter
sauveter
siroter
stabiloter
tangoter
textoter
tourner
tuyauter
vergeter
voyouter
zozoter
bijoutier
boyaudier
cacaotier
cachottier
cafetier
caoutchoutier, ière
colzatier
dominotier
échotier
grutier
indigotier
morutier
gromotier
obusier
sorcier
bazardage
caoutchoutage
chimicage
fayot(t)age
jutage
marécage
marivaudage
noyautage
numérotage
pianotage
poireautage
pourrissage
sauvetage
tuyautage
bazardeur
fayoteur
indigoteur
noyauteur
numéroteur
386
Chapitre 5 – Constitution de la base de données
erie
10
eux
9
ique
8
é
7
ement
5
ure
5
ière
4
isme
4
piano
pourri
recrue
sabot
sauv(er)
sirop
sorc(ier)
tuyau
bijou
boyau
clou
cul
dieu
domino
indigo
lama
sorc(ier)
tuyau
cafard
caoutchouc
cauchemar
coma
grisou
jus
pyjama
velours
verrue
bureau
caoutchouc
chaos
climat
climat
Jura
schéma
tennis
bijou
cheveu
rein
royal
soudain
velours
verge
bazar
piano
pourri
recrue
sorc(ier)
cheveu
ferm(er)
nourri
pourri
verge
cacao
caf(é)
souris
tabac
dieu
gaga
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
pianoteur
pourrisseur, euse
recruteur
saboteur
sauveteur
siroteur
ensorceleur
tuyauteur
bijouterie
boyauderie
clouterie
cucuterie
bondieuserie
dominoterie
indigoterie
lamaserie
sorcellerie
tuyauterie
cafardeux
caoutchouteux, -euse
cauchemardeux
comateux
grisouteux
juteux
pyjamateux
velouteux
verruqueux
bureautique
caoutchoutique
chaotique
climatérique
climatique
jurassique
schématique
tennistique
bijouté (e)
échevelé
reinté
royauté
soudaineté
velouté
vergeté
bazardement
pianotement
pourrissement
recrutement
ensorcellement
chevelure
fermeture
nourriture
pourriture
vergeture
cacaotière
cafetière
souricière
tabatière
bondieusardisme
gagatisme
387
Chapitre 5 – Constitution de la base de données
iser
3
oir
3
on
3
al
3
eau
3
able
2
ain
2
ard
2
ation
2
aute
2
té
2
(o)logie
aille
ant
axie
éen
eler
eraie
esque
et
ette
ie
ien
ille
ine
ir
oire
oque
u
ude
ume
43
terminaisons
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
196 termes
inapproprié
Je m'en fous
climat
ghetto
schéma
dépôt
pourri
vomi
coin (é)
nourri
œil
cul
horizon
vie
lion
louve
souris
catégorie
pourri
amalfi
chef
dieu
catégorie
numéro
aqua
cochon
cul
climat
bijou
loft story
zoo
saba
sorc(ier)
bambou
cauchemar
vers
Barbie
tabac
Jura
brin
indigo
bout(a)
aléa
chin(ois)
cheveu
dégourdi
amer
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
inappropriétisme
je(-)m'en(-) foutisme
climatiser
ghettoriser
schématiser
dépotoir
pourrissoir
vomitoir
écoinçon
nourrisson
oeilleton
soucutal
horizontal
vital
lionceau
louveteau
souriceau
catégorisable
pourrissable
amalfitain
cheftaine
bondieusard ; bondieusarderie
catégorisation
numérotation
aquanaute ; cosmonaute
cochonceté
faucuseté
climatologie
bijoutaille
loftstorysant
zootaxie
sabatéen
ensorceler
bambouseraie
cauchemardesque
verset
barbinette
tabagie
jurassien
brindille
indigotine
aboutir
aléatoire
chinetoque
chevelu
dégourditude
amertume
97 bases
388
Chapitre 5 – Constitution de la base de données
3. Bilan sur les méthodes de constitution du corpus
L'annexe 3a récapitule l'ensemble des 859 termes recueillis en fonction de leur origine,
qui est indiquée par la lettre majuscule correspondante, en regard du nombre de mots
récupérés pour chaque. Le tableau suivant rappelle quelques-uns de ces termes :
Recherche
suffixe
par
E.
Termes
G.
recueillis à l'oral
Articles divers
D.
Dictionnaires
d'agot
B.
Dictionnaire des
K.
mots sauvages
Expressions clés
C.
dans le TLFi
Néologismes du
H.
français
Liste de mots
A.
informatisée
Nombre de
termes
Type de source
Code
(28)
Termes
aborder ; abricoté ; abricotier ; abricotine ; acclimater ; accourcir ; aciérage ;
350 afféterie ; affûter ; agiotage ; agioter ; agioteur ; aiguilletier ; ajouter ; alfatier ;
al(l)eutier ; amadouvier ; arbalétrier ; archeterie ; archetier ; etc.
(dé)marabouter ; aboutir ; aléatoire ; amalfitain ; amertume ; aquanaute ;
196 bambouseraie ; barbinette ; bazardage ; bazardement ; bazarder ; bazardeur ;
becqueter ; bijoutaille ; bijouté ; bijouter ; bijouterie ; bijoutier ; etc.
abritement ; abriter ; absolutisme ; absolutiste ; aileron ; amiganesque ;
94 aspergeraie ; bazardier ; beausir ; bénitier ; blaireauter ; boucautière ; bûcheron
; butorderie ; cacatesque ; cacatoire ; cachimantier ; etc.
auverpin ; bagouler ; berlurer ; biffeton ; caf(e)ter ; cafemar ; cafemon ; cafeteur ;
64 cafeteux ; cafeton ; camtar ; cinémateux ; colibar ; colibri ; combientième ;
conceté ; cranter ; crapahuter ; crapoteux ; crobard ; etc.
abrutiliser ; adultiner ; bedeaudaille ; blaireauteur ; bleuison ; botocudo ;
61 bouquetin ; bousarderie ; centaurestique ; chouteur ; crachaté ; déchétique ;
doublezon ; drapeauter ; drapeautique ; égolâtre ; emperlizer ; etc.
accoutrer ; arroutain ; atlastique ; bamboutage ; baroufle ; bourreauder ;
48 brelander ; brelandier ; broutain ; calembourdier ; calendrier ; calfeutrage ;
calfeutrement ; calfeutrer ; cambrésien ; cambrésine ; chichiter ; etc.
alibababesque ; biberondasse ; biscotonneux ; bochetée ; bocheton ; bretonnitude
25 ; calorisation ; caloriser ; cambouité ; cuirture ; émerpiner ; glavioter ; glavioteur
; hobereautaille ; méliméloter (se) ; pageoterie ; etc.
banlieusard ; bleusaille ; bleuter ; bleuterie ; chevaucher ; chimiatrie ; diablotin ;
21 dortoir ; harnacher ; joufflu ; noircir ; portraicturien ; roitelet ; traquenard ;
verdâtre ; verdelet ; verdeur ; verdier ; verdir ; verdoyer ; verdure
859
La source qui s'est révélée la plus prolifique en termes comportant potentiellement une
épenthèse entre radical et suffixe est la recherche systématique, à l'intérieur de la liste de
64.296 termes, de ceux se terminant par les suffixes -ier, -age et -erie : plus de la moitié des
mots relevés à partir de sources écrites (350 termes sur 663 issus de sources écrites)
proviennent de ce traitement. C'est ensuite l'origine orale qui se distingue (196 termes), puis
les données issues d'articles (94 termes). Les dictionnaires d'argot, de néologismes et autres
mots sauvages sont moins bien représentés (64, 25 et 61 termes respectivement), la recherche
par expressions-clés dans le TLFi n'ayant quant à elle fourni que 48 items.
389
Chapitre 5 – Constitution de la base de données
Le tableau suivant permet d'évaluer la part prise par chaque source dans la constitution
de la base de données, à l'intérieur des sources écrites pour celles qui sont concernées puis par
rapport à l'ensemble du corpus.
(29)
21
64
48
94
350
taux dans le corpus
"écrit"
3.17 %
9.66 %
7.24 %
14.18 %
52.79 %
taux dans le corpus
total
2.44 %
7.45 %
5.59 %
10.95 %
40.74 %
H.
K.
25
61
3.77 %
9.20 %
2.91 %
7.10 %
G.
663
196
100 %
/
77.18 %
22.82 %
type de source
Code
liste de 64.296 termes
dictionnaires d'argot
interrogation du TLFi
articles
étude des suffixes -ier, -age et
-erie
dictionnaire des néologismes
dictionnaire des mots
sauvages
total sources écrites
sources orales
A.
B.
C.
D.
E.
total du corpus
termes sélectionnés
859
/
100 %
Un peu moins d'un quart des termes contenus dans la base de données proviennent de
sources orales (22.82 %), ce qui est près du double de ce qu'une répartition moyenne des
termes par source aurait laissé supposer (12.50 %).
Les sources n'ont dans la réalité pas été exploitées aussi linéairement que ne le suggère
ce tableau, mais parfois en parallèle : un terme entendu à la télévision a pu être ajouté au
même moment qu'était procédé au traitement automatique (A.), puis un autre alors que les
dictionnaires d'argot étaient dépouillés, etc. Etant donné que la règle était "first arrived, first
served", c'est-à-dire qu'une fois qu'une unité lexicale était introduite dans le corpus par
quelque source que ce soit, elle disqualifiait ses éventuelles autres occurrences trouvées par
un autre biais, les sources exploitées vers la fin de la constitution de la base de données
(dictionnaires de néologismes) semblent moins riches qu'elles ne l'étaient en réalité. En effet,
la source dépouillée en second n'a pas été créditée des mots déjà enregistrés dans la liste car
présents dans la première, les items proposés par la troisième source n'ont été retenus que
dans la mesure où les deux premières ne les avait pas proposés, etc. Ce choix certes biaise
partiellement la comparaison par source, mais pointe de manière encore plus cruciale le
manque de succès de la recherche automatique, première source exploitée, par rapport aux
autres : bien que tous les termes qu'elle a offerts ont été retenus au contraire des autres sources
utilisées, elle est malgré tout celle qui en a fourni le moins.
390
Chapitre 5 – Constitution de la base de données
Il ne s'agit ici que de la première étape de sélection des unités lexicales qui figureront
dans le corpus sur lequel se basera l'analyse. Il sera plus pertinent de comparer les différentes
sources entre elles après que la base de données sera passée à travers deux filtres distincts (cf.
chapitre 6 de cette partie II), de façon à évaluer la validité des méthodes d'extraction ici
exploitées.
De même qu'un premier bilan quant aux différentes origines de constitution du corpus
a été dressé, intéressons-nous aux terminaisons de ces 859 unités lexicales.
4. Bilan sur les terminaisons représentées dans le corpus
On ne peut parler à cette étape de suffixes étant donné qu'aucune analyse sémantique
n'a encore permis de les établir ici. Le tableau ci-dessous, récapitulant pour chaque
terminaison le nombre de termes concernés, a donc uniquement une valeur indicative,
antérieurement à tout filtre étymologique ou sémantique effectué sur la base de données. On
en trouvera la version complète triée à l'intérieur de chaque terminaison par la consonne
supposée épenthésée en annexe 3b.
er
ier
age
erie
eur
on
esque
é
ique
eux
ement
isme
ure
iser
ière
ard
in
ir
ain
?
eau
aille
ois
oire
Nombre de
termes
Terminaison
(30)
Termes
226
99
85
75
32
26
26
25
20
18
14
11
10
10
10
10
9
7
7
7
6
6
5
5
abriter ; aborder ; boiser ; adultiner ; coincer ; chevaucher ; accoutrer ; bagouler...
abricotier ; bazardier ; dossier ; jambosier ; cordelier ; arbalétrier ; vomiquier ; fournier...
agiotage ; badaudage ; masselottage ; époutissage ; boisage ; chimicage ; fournage ...
afféterie ; badauderie ; baguenauderie ; boiserie ; sorcellerie ; huisserie ; bouverie...
agioteur ; argoteur ; bardeur ; bazardeur ; coqueleur ; ensorceleur ; pourrisseur...
biffeton ; aileron ; bûcheron ; écoinçon ; enfançon ; bleuison ; iglouchon ; cafemon...
cacatesque ; ceaucesculesque ; amiganesque ; canulardesque ; alibababesque...
abricoté ; bijouté ; barreaudé ; foindé ; enképissé ; joncé ; emporchézé ; échevelé...
argotique ; atlastique ; bureautique ; médiumnique ; jurassique
cafeteux ; cafardeux ; cauchemardeux ; verruqueux ; coqueleux ; biscotonneux...
abritement ; empiètement ; ensorcellement ; hipipourassement ; bazardement...
absolutisme ; argotisme ; favoritisme ; gagatisme ; gogotisme ; hugotisme ; nagualisme...
cuirture ; fermeture ; fourniture ; nourriture ; pourriture ; vergeture ; noirdure...
climatiser ; eczématiser (s') ; médiatiser1 ; abrutiliser ; ghettoriser
boucautière ; cacaotière ; cafetière ; coquetière ; escargotière ; giletière ; souricière...
banlieusard ; bondieusard ; faflard ; vicelard ; crobard ; traquenard ; queutard
bouquetin ; diablotin ; fagotin ; piétin ; tableautin ; auverpin ; coquebin ; gosselin...
accourcir ; durcir ; noircir ; aboutir ; glougloutir ; verdir ; beausir
amalfitain ; arroutain ; broutain ; samaritain ; cheftaine ; pierrefeucain ; valéricain
filandre ; patraque ; polacre ; tringle ; vrille ; baroufle ; cible
lionceau ; ponceau ; souriceau ; faisandeau ; manchereau ; louveteau
bijoutaille ; hobereautaille ; piétaille ; bleusaille ; gueusaille ; bedeaudaille
clamecycois ; souriquois ; spadois ; graylois ; pouillyzois
aléatoire ; cacatoire ; dépotoir ; dortoir ; vomitoir
391
Chapitre 5 – Constitution de la base de données
ine
ien
ie
ation
ais
té
iste
ette
et
elet
âtre
ar
ant
al
aire
ude
ot
go
fier
ée
aute
able
urien
ume
uche
u
ri
re
oyer
ourde
otter
otte
oque
ologue
oir
o
lu
ium
ite
is
ion
ingue
iner
ille
ifier
if
ième
iat
euse
eter
esse
eraie
elle
eler
éen
dé
caille
axie
5
5
5
4
4
3
3
3
3
3
3
3
3
3
3
2
2
2
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
abricotine ; indigotine ; cambrésine ; myrosine ; conchyoline
cambrésien ; lunaisien ; onusienne ; hugolien ; jurassien
baraterie ; daterie ; tabagie ; chimiatrie ; papousie
calorisation ; catégorisation ; colorisation ; numérotation
congolais ; togolais ; javanais ; vinçanais
cochonceté ; conceté ; faucuseté
absolutiste ; argotiste ; néantiste
sourcelette ; tartelette ; barbinette
coquelet ; coqueret ; verset
dieutelet ; roitelet ; verdelet
égolâtre ; hugolâtre ; verdâtre
cafemar ; colibar ; camtar
loftstorysant ; trotskisant ; glougloutant
vital ; horizontal ; soucutal
moscoutaire ; sursitaire ; tissulaire
bretonnitude ; dégourditude
gosselot ; queusot
icigo ; labago
cocufier ; statufier
bochetée ; yeutée
aquanaute ; cosmonaute
pourrissable ; catégorisable
portraicturien
amertume
coqueluche
chevelu
colibri
coudre
verdoyer
coquelourde
picoter
masselotte
chinetoque
sidénologue
pourrissoir
botocudo
joufflu
mycélium
halloysite
cailloutis
taxation
louftingue
piétiner
brindille
salifier
taxatif
combientième
marloupiat
émeriseuse
piqueter
têtutesse
bambouseraie
coquerelle
ensorceler
sabatéen
jourdé
icicaille
zootaxie
392
Chapitre 5 – Constitution de la base de données
asser
asse
ance
an
aie
(o)logie
(ill)age
89
1
1
1
1
1
1
1
859
avocasser
biberondasse
cuistance
partisan
aspergeraie
climatologie
enfantillage
Quatre-vingt-neuf terminaisons différentes sont recensées à ce stade de la création du
corpus. Les plus fréquemment observées sont -er13 (226 unités lexicales, soit 26.30 % de
l'ensemble), -ier (99 termes, soit 11.53%), -age (85 mots, 9.9 %) et -erie (75 items, 8.73 %),
résultat à contempler avec précaution étant donné que la source la plus productive de termes a
précisément été la recherche systématique de mots comportant ces trois derniers suffixes.
Par ailleurs, quarante-trois de ces terminaisons, soit près de la moitié d'entre elles
(48.31 %) ne sont représentées qu'une fois dans la base de données.
Cette base de données ne constitue qu'une matière brute qu'il va maintenant falloir
nettoyer. Les étapes de filtre successives par lesquelles elle est passée pour fournir le corpus
sur lequel pourra se fonder l'analyse font l'objet du chapitre suivant.
13
Hors -ier, -eter et les terminaisons autrement distinguées dans le tableau.
393
Chapitre 6 – De la base de données au corpus de travail
Chapitre 6.
De la base de données au corpus de travail
La base de données ainsi réunie contient 859 termes présentant potentiellement une
épenthèse consonantique entre radical et suffixe. Elle comporte cependant beaucoup de
"bruit". En effet, tous les termes retenus à cette étape de la constitution du corpus ne
contiennent pas tous réellement une épenthèse, comme l'indique par exemple, dans une
certaine mesure, l'étymologie ou les alternances radicales ou suffixales ; par ailleurs, les
termes restant en lice nécessitent des regroupements permettant une analyse unifiée autant que
possible et non au cas par cas.
Le corpus brut constitué de la mise en commun des termes soupçonnés présenter une
épenthèse à l'endroit intéressé va donc passer par deux filtres différents.
Le premier consistera à l'épurer des termes pour lesquels l'épenthèse n'est pas à
l'endroit souhaité et de ceux pour lesquels l'étymologie ou les alternances radicales ou
suffixales excluent l'épenthèse.
Un second filtre s'intéressera plus particulièrement aux suffixes devant lesquels semble
se produire une épenthèse et tâchera d'étudier chaque cas en fonction des bases possibles et
des signifiés de la base, du suffixe et du terme dérivé.
A chaque traitement du corpus trois cas seront distingués. Un premier ensemble
rassemblera les termes définitivement rejetés comme non pertinents pour l'analyse ; un second
groupe sera constitué des éléments pour lesquels le manque ou l'hétérogénéité des
informations recueillies ne permet pas de décider de leur rejet ni de leur acceptation ; enfin,
dans une troisième catégorie seront identifiées les unités lexicales contenant une consonne
épenthétique, c'est-à-dire celles qui relèvent de l'étude envisagée ici.
394
Chapitre 6 – De la base de données au corpus de travail
1. Premier filtre : étymologies et consonnes sous-jacentes
Ce premier filtre a pour mission d'épurer le corpus brut des termes identifiés comme
non pertinents pour l'analyse, que ce soit par l'étymologie ou du fait des alternances de
radicaux ou de suffixes. Sont rejetés également les termes récupérés par les moyens
automatiques, notamment par l'analyse du TLFi par séquences clés (méthode de recueil C.),
pour lesquels l'épenthèse n'est pas à l'endroit voulu. On trouvera le traitement des 859 termes
de la base de données initiale en annexe 3c. Pour chaque terme écarté est indiquée en regard
la cause de cette exclusion, de façon à assurer la traçabilité de son traitement.
Les deux premières causes de rejet sont extérieures à la dérivation : il s'agit de
l'introduction malheureuse d'unités lexicales composées et non dérivées, ou dont l'épenthèse
n'est pas à l'endroit souhaité. Viennent ensuite les différents traitements liés à l'étymologie,
suivis de l'étude des consonnes sous-jacentes non apparentes diachroniquement mais révélées
par le féminin de la base. Les alternances radicales et suffixales poursuivent ce premier filtre.
Seront ensuite présentées trois familles lexicales (pied, sorcier, coq) afin d'appréhender de
manière plus ciblée l'impact de traitement de cette première étape vers un corpus fiable.
1.1. Terme composé et non dérivé
Six termes se sont avérés relever du phénomène de composition et non de dérivation,
ce qui les écarte d'emblée de l'étude, d'une part parce que celle-ci porte sur l'épenthèse dans le
cas particulier de dérivation qu'est la concaténation d'un radical et d'un suffixe, d'autre part du
fait que l'éventuelle consonne épenthésée correspondait en réalité au début du second élément
de composition. Ainsi dans hugolâtre ne doit-on pas supposer une concaténation du radical
hugo et du suffixe par ailleurs attesté -âtre, mais une composition dudit radical avec l'élément
-lâtre "adorer".
Les termes composés (cf. chapitre 4 section 3.2) portent la marque de cette élimination
du corpus sous la forme de l'indication "comp" portée en regard de chacun d'eux dans la
colonne "code explicatif". Le tableau suivant en fournit la liste en fonction de la source
d'extraction de chaque terme :
395
Chapitre 6 – De la base de données au corpus de travail
(31)
Méthode de
recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nb de termes
concernés
0
0
0
1
1
3
0
1
6
Termes éliminés motif "comp"
hugolâtre
coquelourde
aquanaute ; cosmonaute ; zootaxie
égolâtre
Une autre catégorie de termes a été éliminée préalablement à toute analyse car ne
correspondant pas à l'objectif visé dans cette étude ; il s'agit de ceux comportant certes une
épenthèse consonantique, mais pas à la frontière morphologique entre radical et suffixe.
1.2. Epenthèse mal placée
La méthode de recueil par recherche de séquences clés telles que "épenthèse" ou
"consonne de transition" dans le TLFi (cf. section [5] 1.4) a permis de récupérer 48 termes,
parmi lesquels 8 ne contiennent pas l'épenthèse entre radical et suffixe mais ailleurs dans le
mot, ce qui exclut ces termes du champ de cette étude14. Ces termes seront identifiés dans le
corpus par une étiquette "mp" pour "mal placée", faisant référence au positionnement de
l'épenthèse consonantique, et seront exclus définitivement du corpus.
(32)
Nombre de termes
issus de C.
Nombre de termes
présentant une
épenthèse mal placée
Termes éliminés motif "mp"
48
8
baroufle ; cible ; coudre ; engendrer ; filandre ;
polacre ; tringle ; vrille
Ces huit termes ont été incorporés dans la base de données initiale du fait de la
méthode de recueil exploitée, c'est pourquoi l'erreur "d'aiguillage" porte sur ce petit nombre
seulement.
Si la mauvaise position de l'épenthèse ne concerne somme toute que 8 unités sur 859,
un nombre bien plus conséquent de termes en revanche se verront exclus du fait de leur
étymologie.
14
On notera que ces termes sont dus à ce que "le groupe formé de consonne+r étant favorisé par la langue, il en
est résulté qu'à des époques diverses un r parasite a été inséré" (Bourciez 1967 : 181).
396
Chapitre 6 – De la base de données au corpus de travail
1.3. Etymologie
Dans cette section sont rassemblées les raisons liées à l'étymologie justifiant de
l'exclusion de certaines unités lexicales ou du maintien d'autres.
Le but d'une recherche étymologique pour chacune des unités lexicales recensées dans
la base de données est double :
- d'une part écarter les épenthèses qui sont antérieures au français et remontent au latin (voire
au grec) type amaritudinem pour amertume ;
- d'autre part écarter les consonnes sous-jacentes en synchronie mais diachroniquement
présentes, dont on peut supposer qu'elles ont laissé une trace dans le morphème (bleusaille :
dérivé de bleuse, féminin dialectal de bleu)
En revanche, les "fausses" épenthèses, c'est-à-dire celles qu'une étymologie populaire
ou un peu hâtive indiqueraient comme telles sans qu'elles en soient (clouter < gallo-roman
clouster, dérivé de clouet et non de clou), souvent mises en évidence dans les dictionnaires,
n'ont pas été écartées. En effet, dans quelle mesure l'interprétation populaire de la formation
de ces termes intervient-elle dans l'analogie ? Donc dans la création d'épenthèses ?
Trois dictionnaires ont été utilisés pour établir l'étymologie des unités lexicales sous
intérêt : le Trésor de la Langue Française (version papier puis informatisée), le Robert,
Dictionnaire historique de la langue française (1992 [2000], dorénavant Rey et al.), et le
Dictionnaire étymologique de la langue française de Bloch & Von Wartburg (1932 [1968] ;
dorénavant Bloch & Wartburg).
Le Bloch & Wartburg est destiné à un public non spécialiste et ne contient "que le
vocabulaire usuel du français contemporain au sens large du mot : ce vocabulaire comprend
de nombeux mots techniques, auxquels l'usage et la langue écrite donnent une diffusion". Les
auteurs ont écarté les termes jugés archaïques s'ils ne sont plus employés même dans la langue
littéraire, ainsi que les termes très techniques. En revanche, ils ont intégré beaucoup de termes
du français populaire, usuels dans la langue parlée, bien qu'ayant à peine trouvé place dans les
dictionnaires", tout en excluant l'argot jugé "souvent passager, et qui pose des problèmes
délicats ou insolubles dans l'état de nos connaissances." (1968 : XIX).
Considérant que "l'étymologie ne consiste que dans l'histoire des mots et des notions
qu'ils expriment" (1968 : XX), Bloch & Wartburg ont choisi de présenter l'histoire de chaque
mot depuis le latin, en donnant des dates précises notamment quant à la première apparition et
397
Chapitre 6 – De la base de données au corpus de travail
l'entrée réelle en usage d'un terme. Ils ont exploité en ce sens nombre d'ouvrages,
dictionnaires ou histoires de la langue française (cf. 1968 : XXI), parmi lesquels le
Dictionnaire général de la langue française, de Darmesteter et al., les ouvrages de Sainéan,
"surtout ceux qu'il a consacrés au français populaire du XIXe siècle et à l'argot", l'Histoire de
la langue française de Brunt, celle de Brunot, les travaux de Gilles Ménage, et surtout, et de
plus en plus au fur et à mesure des rééditions du Bloch & Wartburg et de l'avancée du FEW,
le Französisches Etymologisches Wörterbuch (FEW) de Wartburg.
Le Robert, Dictionnaire historique de la langue française (Rey & al) a pour objet
d'étude "le vocabulaire du français moderne" (1992 : VIII).
Il ne s'arrête pas au latin mais mentionne également les origines indoeuropéennes ou
sémitiques. Comme le Bloch & Wartburg, il se réclame de ses nombreux prédécesseurs Gilles Ménage, Friedrich Diez, Walter von Wartburg, Kurt Baldinger, mais également Pierre
Guiraud - ainsi que de moults dictionnaires - le Grand Robert, le Grand Larousse de la
langue française et le Trésor de la Langue Française : "toutes les sources publiées et
raisonnablement diffusées ont été utilisées ici ; même des travaux non publiés nous ont été
communiqués" (1992 : XIV). La datation proposée se veut là encore la plus précise possible,
compte tenu du manque d'information quant à la date précise de certains textes et surtout du
fait qu'il ne s'agit que des sources attestées, ne préjugeant pas de la première apparition du
terme à l'oral ou dans d'autres ouvrages non répertoriés.
Le Trésor de la Langue Française est un dictionnaire réalisé à partir de plus de 1500
oeuvres littéraires des XIXème et XXème siècles (qui constituent actuellement la moitié
environ des oeuvres contenues dans la base de données Frantext), à partir desquelles ont été
extraits à l'aide de l'ordinateur les 100 000 termes et les 430 000 exemples que compte le
dictionnaire. La parution du TLF s'étale sur près d'un quart de siècle (1971 - 1994), et ce
dictionnaire est disponible depuis 2001 en accès libre sur le réseau internet
(http://www.atilf.fr/_ie/index_TLFi.htm).
Le TLF se veut "un dictionnaire descriptif et non normatif - le dictionnaire de la
langue écrite et parlée du XIXème et du XXème siècle. Il s'attache au génie de la langue qu'il
décrit dans sa richesse, dans ses renouvellements, dans sa spontanéité, telle qu'elle apparaît
"parlée" dans les textes littéraires" (Présentation du Trésor de la langue française : 2). Par
ailleurs, le TLF s'est efforcé d'intégrer de nombreux termes scientifiques aussi bien que
398
Chapitre 6 – De la base de données au corpus de travail
techniques, "pour rendre compte de la diffusion des vocabulaires de spécialité, en particulier
au cours de la seconde moitié du XXe siècle". (Présentation TLF : 2).
Le TLF a également la vocation, à travers sa rubrique Etymologie et Histoire que l'on
trouve pour chaque article, de constituer "un passionnant dictionnaire historique de la langue
française d'une richesse exceptionnelle, véritable dictionnaire caché dans le dictionnaire. On y
trouve les différentes étapes de l'histoire du mot et de ses divers sens dès leur première
apparition dans la langue. On y apprend qui, dans l'état actuel de nos connaissances, a très
probablement osé utiliser pour la première fois le mot ou le sens" (présentation TLF : 4). La
partie historique du dictionnaire est basée sur le FEW de Wartburg et "quelques autres
dictionnaires étymologiques modernes, ceux notamment des principales langues romanes "
(TLF vol. 1 : XLIII). C'est cette richesse étymologique déclarée qui m'a conduite à utiliser le
TLF en sus des deux autres dictionnaires, plus ouvertement historiques, que sont le Bloch &
Wartburg et le Robert historique.
Consulter ces dictionnaires permet également de distinguer dans certains cas des
homophones formés sur des bases différentes, dont l'un présente une épenthèse intéressante.
Arrêtons-nous un instant sur le terme briqueterie. Un détour par le TLF démontre que l'on a
en réalité affaire à trois termes différents : briqueterie1 formé sur brique, briqueterie2 sur
briquette et briqueterie3 sur briquet, les signifiés confirmant ces formations. De ce fait,
briqueterie1 est maintenu dans le corpus mais ses deux acolytes sont rejetés.
En revanche, les dictionnaires ne seront pas considérés comme arbitres dans la
décision finale relative à une consonne candidate à l'épenthèse dans un terme donné.
Prenons pour définir le propos le cas du dérivé agiotage. Le TLF le considère comme
dérivé du verbe agioter, alors que Bloch & Wartburg le rattachent directement à agio. Dans
un cas il y a épenthèse et le terme est intéressant pour l'analyse, dans l'autre l'épenthèse n'est
qu'"empruntée". Il en est de même pour le terme biseautage : le TLF et le Rey & al le lient au
verbe biseauter, mais le Bloch & Wartburg le dérivent sur le substantif biseau. Que faire si
l'on a pris comme critère décisionnel absolu l'avis des dictionnaires étymologiques et qu'il ne
s'entendent pas ? Il conviendra plutôt de prendre une décision en fonction de l'étude du suffixe
-age et des bases sur lesquelles il peut s'adjoindre, concernant l'ensemble des dérivés en -age :
sont-ils tous rattachables à un verbe en -er, attesté ou virtuel ?
Le suffixe -oter pose également problème si l'on tente de trouver un traitement unifié
pour un suffixe donné. Considérons pour s'en convaincre les termes ergoter et agioter. Le
399
Chapitre 6 – De la base de données au corpus de travail
premier est dit dérivé de ergo à l'aide du suffixe -oter, mais le second à l'aide du suffixe -er et
d'une épenthèse. Faut-il néanmoins postuler un traitement unifié pour les deux, à partir du
moment où la base est de même longueur et se termine pas la même voyelle ? Faut-il au
contraire s'en tenir aux étymologies proposées par les dictionnaires consultés ? Là encore, ce
n'est qu'un examen plus approfondi des suffixes -er et -oter qui permettra de proposer une
solution.
Cet examen des suffixes attestés dans le corpus ne fait pas l'objet de ce premier filtre,
on le trouvera en section 2 de ce même chapitre.
Les raisons liées à l'étymologie concernant le statut d'une unité lexicale sont au
nombre de cinq, dont trois en faveur du rejet des termes concernés. Un premier ensemble de
termes sera en effet exclu du fait qu'il ne s'agit pas d'unités lexicales dérivées en français, mais
que la consonne potentiellement intéressante appartient en réalité à un terme latin. Les bases
qui comportent une consonne sous-jacente à la finale, indiquée par leur étymologie,
disqualifient les dérivés associés. Un troisième groupe de termes éliminés, plus modeste,
contient les dérivés pour lesquels la consonne potentiellement épenthésée n'est que graphique
et ne correspond à aucun élément étymologique ni phonologique.
Certains dérivés font l'objet d'un croisement de plusieurs étymologies, rendant
malcommode l'appréhension de leur formation ; c'est pourquoi ils inaugurent la catégorie des
"indécis" du corpus, c'est-à-dire des termes pour lesquels il n'est pas possible, au moins à cette
étape de leur traitement, de décider de leur maintien ou de leur rejet.
Enfin seront examinés dans une dernière sous-section les termes pour lesquels
l'étymologie indique une consonne en finale de base, mais pas la même que celle qui est
épenthésée dans le dérivé correspondant. Les unités lexicales concernées seront maintenues
dans le corpus au terme de ce premier filtre.
1.3.1. Héritage d'un terme latin
Une première cause d'exclusion du corpus est le fait qu'un terme peut avoir été
directement hérité d'une forme latine contenant la consonne dont on aurait pu penser qu'elle
était épenthétique.
C'est le cas par exemple du terme noircir, dont on pouvait supposer la dérivation à
partir de l'adjectif noir à l'aide du suffixe -ir, et semblait de ce fait présenter une épenthèse de
400
Chapitre 6 – De la base de données au corpus de travail
[s]. Une vérification de l'étymologie du mot établit son origine latine (lat pop °nigrescre),
l'excluant par là-même du corpus de travail.
Vingt-trois termes de la base de données initiale sont concernés de manière certaine,
auxquels se rajoutent quatre termes pour lesquels la base n'est pas certaine. Ces termes sont
identifiés par le code "2a" porté en regard de leur entrée dans la colonne "code explicatif"
pour ceux-là, le code "2" pour ceux-ci. Le tableau suivant récapitule les termes exclus par ce
critère en fonction de leur provenance en termes de méthodes de recueil :
(33)
Méthode de
recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nombre de termes
Termes éliminés motif "2a"
concernés
4
chevaucher ; dortoir ; joufflu ; noircir
0
2
calendrier ; mycélium
2
fermeté ; hiverner
daterie ; enfançon ; grainetier2 ; jeter ; luter ; manécanterie ; piétaille ;
10 +2
piéter ; porter ; taxation ; (forestier) ; (ponceau)
aléatoire ; amertume ; climatérique ; nourrisson ; sorcier ; tourner ;
9+2
verruqueux ; vital ; vomitoir ; (chevelure) ; (soudaineté)
0
0
27+4
Outre un héritage direct excluant tout processus de dérivation en français, l'étymologie
peut également indiquer la présence d'une consonne sous-jacente dans le radical.
1.3.2. Présence de la consonne dans la base
Une consonne n'apparaissant pas en surface, dans la réalisation d'une base en isolation,
peut en effet être mise en évidence par l'établissement de la forme dont elle est issue. Prenons
pour illustrer le propos le cas des dérivés de la famille de vert : verdeur, verdure, verdâtre,
verdelet, verdir, verdoyer ; deux hypothèses proposées par les dictionnaires : soit ils sont issus
de vert lui-même du latin viridis, comportant donc un -d- dans la position correspondant à la
fin du radical, soit du terme moyen-âgeux verde dans lequel le -d est audible en finale. Quelle
que soit l'hypothèse retenue, le [d] est présent dans le radical, soit en tant que consonne sousjacente (en concurrence avec [t] qui apparaît à la liaison), soit en finale de radical dans la
deuxième option considérée. Le [d] n'étant pas épenthétique, ces termes sont disqualifiés, ce
qui est indiqué par un code "2b" dans la colonne "code explicatif".
Sont également marqués par le code "2b" les termes pour lesquels on trouve trace
d'une forme comportant la consonne à une période postérieure au latin ou dans une langue
401
Chapitre 6 – De la base de données au corpus de travail
régionale indiquée comme source par les dictionnaires consultés. C'est le cas par exemple
pour le terme traquenard, issu d'une forme occitane, gasconne ou languedocienne tracanart,
dérivée de tracan.
Le tableau suivant récapitule l'ensemble des 229 termes "réformés 2b" de la base de
données initiale, en fonction de la méthode de recueil dont ils sont issus, augmentés des
quatre termes cités dans le paragraphe précédent pour lesquels la motivation de rejet est
incertaine.
(34)
Méthode
de recueil
Nombre de
termes concernés
A.
9
B.
3
C.
7
D.
9
E.
140+2
G.
51+2
H.
K.
1
6
226+4
total
Termes éliminés motif "2b"
diablotin ; traquenard ; verdâtre, ; verdelet ; verdeur ; verdier ; verdir ; verdoyer ;
verdure
bagouler ; cinémateux ; trouduculier
accoutrer ; calembourdier ; calendrier ; calfeutrage ; calfeutrement ; calfeutrer ;
conchyoline ; patraque
absolutisme ; absolutiste ; bénitier ; élancer ; enfourner ; épauletier ; médiatiser1 ;
météoriser ; partisan
aborder ; accclimater ; accourcir ; aciérage ; affèterie ; affûter ; aiguilletier ;
ajouter ; arbalétrier ; archèterie ; archetier ; argenter ; avocatier ; baguenauderie ;
baraterie ; bigoterie ; biscuiterie ; bluterie ; boisage ; boiser ; boiserie ; boiterie ;
border ; bouverie ; bouvetage ; brigandage ; briquetage2 ; briqueter2 ; briqueterie2
; briqueterie3 ; cédratier ; chamoiser ; chariotage ; chocolatier ; cimenter ;
clavetage ; closerie ; cordelier ; cureter ; déliter ; délutage ; démâtage ; descenderie
; dévergonder ; diamanter ; doigter ; doigtier ; dossier ; drapier ; droiterie ; ébruiter
; échevet(t)age ; écoté ; effronté ; emblaver ; enfantillage ; épisser ; époutissage ;
essarter ; fardage ; farder ; farter ; fonderie ; forfanterie ; formater ; fournage ;
fournier ; fruiterie ; gailleterie ; ganter ; garancer ; gazetier ; guichetier ; hourder ;
huisserie ; îlotage ; îlotier ; jambosier ; joncé ; joncher ; laitage ; laitier ; larder ;
loterie ; lotier ; mailleter ; marchander ; marqueterie ; matelassier ; matelotage ;
mégot(t)er ; merceriser ; minotier ; moiser ; moleter ; mortaiser ; mousqueterie ;
moyettage ; organsiner ; pailleter ; papilloter ; paquetage ; paqueter ; paqueteur ;
paquetier ; paradisier ; parqueter ; partage ; patenter ; peaucier ; peaussier ;
platelage ; plomber ; pointer ; pontage ; potier ; prime(-)sautier ; puiser ; quartier ;
raboter ; rabouter ; ravauder ; retorderie ; rivetier ; robinetterie ; saborder ; salifier
; sténosage ; tamiser ; torsinage ; trématage ; tricoter ; truander ; vagabonder ;
vanterie ; venter ; verroterie ; versage ; vignet(t)é ; vomiquier ; (forestier) ;
(ponceau)
(dé)marabouter ; aboutir ; bondieusard ; bondieusarderie ; bondieusardisme ;
bondieuser ; bondieuserie ; cheftaine ; chevelu ; chevroter ; climatique ; climatiser ;
climatologie ; coincer ; colzatier ; comateux ; coucouler ; débondieuser ; dépotoir ;
échevelé ; écoinçon ; gromotier ; horizontal ; je(-)m'en(-) foutisme ; jurassien ;
jurassique ; lionceau ; louveteau ; marécage ; nourriture ; obusier ; oeilleton ;
pouiller ; pourrissable ; pourrissage ; pourrissement ; pourrisseur ; pourrissoir ;
poutouner ; rebuter ; saboter ; saboteur ; sauvetage ; sauveter ; sauveteur ;
schématique ; schématiser ; souriceau ; souricière ; tabagie ; verset ; (chevelure) ;
(soudaineté)
pageoterie
bleuison ; bouquetin ; emperlouser ; nagualisme ; néantiste ; pioupesque
Cet effectif constitue la majeure partie des termes rejetés du fait de leur étymologie.
Parmi les termes exclus sous le motif "2b" une sous-classe a été constituée, rassemblant les
402
Chapitre 6 – De la base de données au corpus de travail
termes pour lesquels certes une consonne est identifiable en finale de la base en diachronie,
certes ladite consonne correspond bien à celle qui est épenthésée, mais cette consonne
n'apparaît qu'au génitif latin et non au nominatif. Ceci concerne onze termes, identifiés par le
label "cl" pour climat, qui sert de prototype pour cette sous-catégorie.
(35)
Méthode de
recueil
A.
B.
C.
D.
E.
Nombre de termes
concernés
/
/
/
/
4
G.
7
H.
K.
/
/
11
total
Termes éliminés motif "2b" appartenant au sous-ensemble "cl"
/
/
/
/
acclimater ; diamanter ; époutissage ; trématage
climatique ; climatiser ; climatologie ; comateux ; horizontal ; schématique
; schématiser
/
/
Jusqu'à présent nous avons envisagé les cas où un terme est exclu du corpus parce qu'il
existait déjà dérivé en latin avec la consonne suspecte ou qu'il est issu d'une base comportant
la consonne candidate en fin de radical. Une troisième cause d'éviction est constituée par le
leurre graphique que peut constituer une consonne indiquée à l'écrit mais qui d'une part n'est
jamais prononcée, d'autre part ne correspond à aucun phonème dans l'histoire du mot.
1.3.3. Consonne uniquement graphique
Deux termes de la base de données initiale présentent une consonne à l'écrit entre le
radical et le suffixe, ce qui justifie de leur intégration dans le corpus dans un premier temps,
mais sans que cette consonne ne corresponde à un élément phonologique. Dans les termes
portraicturien (origine A.) et dompter (origine C.) en effet, les consonnes -c- et -p- ne sont
jamais réalisées, ni ne sont attestées dans l'étymologie. Les dictionnaires consultés parlent à
leur encontre de "consonne graphique" due à de l'analogie ou à une volonté de donner un
"aspect archaïque" au terme.
Seront donc écartés du corpus, dès cette première étape de sélection, trois types
d'unités lexicales :
- celles pour lesquelles la consonne incriminée n'est que graphique et ne correspond à aucune
réalité phonologique, passée ou actuelle ;
403
Chapitre 6 – De la base de données au corpus de travail
- celles pour lesquelles la consonne possiblement épenthésée se trouve en réalité en finale de
radical, ce qui est indiqué par l'étymologie du terme ;
- celles enfin qui remontent à un terme comportant déjà l'épenthèse, ou d'une manière plus
large la consonne soupçonnée d'être épenthétique, en latin.
Tournons-nous maintenant vers le cas où l'étymologie n'est pas clairement établie, les
dictionnaires consultés ne fournissant pas une source mais plusieurs s'influençant l'une l'autre.
1.3.4. Croisement de plusieurs étymologies
Trois termes dans la base de données ont des étymologies croisées, c'est-à-dire qu'ils
sont réputés issus de certaines unités lexicales mais avec l'influence d'autres unités, celles-ci
comportant précisément une consonne dans la position sous intérêt. Il s'agit de coquebin,
vivandier et déposer, les deux premiers étant de source E. (examen des termes par suffixe, cf.
section [5] 1.6) et le troisième d'origine G (données orales, cf. section [5] 2). Il est nécessaire
de préciser ici que la modestie du nombre de termes concernés est due au fait que ne sont
considérés ici que les termes pour lesquels ce n'est pas seulement la base qui est source de
multiples interprétations, mais l'ensemble du dérivé.
Les trois termes coquebin, vivandier et déposer ont été écartés du corpus final du fait
précisément de l'impossibilité de déterminer leur formation, sans être pour autant éliminés
avec certitude. Ils sont marqués dans le corpus par le code "3" porté dans la colonne "code
explicatif" en regard de leur entrée.
Un dernier cas en relation avec l'étymologie est ici considéré, mais dans le sens d'un
maintien des séquences concernées et non de leur rejet ou de leur mise à l'écart. Il s'agit des
unités lexicales correspondant à des bases comportant une consonne en finale, sans que cette
consonne s'identifie avec la consonne épenthésée dans le dérivé correspondant.
1.3.5. Consonne différente de celle de l'épenthèse
Cette section traite des termes présentant effectivement, après vérification
étymologique, une consonne en finale de base. Cependant, cette consonne n'est pas la
consonne qui apparaît à la dérivation. De ce fait, la consonne qui apparaît à la dérivation est
soit un avatar de la consonne en finale de base, soit une consonne réellement épenthétique. A
404
Chapitre 6 – De la base de données au corpus de travail
cette étape de l'élagage du corpus, aucune décision ne peut être prise dans un sens ou dans
l'autre, c'est pourquoi ces termes sont maintenus dans le corpus, accompagnés du label "P"
pour "position".
Dans le cas où la consonne est considérée comme épenthétique, une sous-distinction
est possible par rapport aux consonnes épenthétiques insérées derrière une base ne présentant
aucune consonne finale sous-jacente ; en effet, dans le cas présent on ne sait pas si la
consonne épenthétique est simplement une épenthèse de mélodie sur une position fournie par
la consonne finale de la base, ou s'il s'agit d'une épenthèse "totale", à savoir mélodie et
position.
Soixante-quatre termes présentent une consonne entre radical et suffixe différente de
celle qui est flottante à la finale de la base. Il faut retrancher à ces soixante-quatre termes les
quatre de la famille de sorcier : ensorceler, ensorceleur, ensorcellement, sorcellerie, qui
seront traités plus particulièrement en section 1.7.2. Les soixante termes restants se
répartissent, en fonction des différentes sources à l'origine de la base de données initiale, de la
manière suivante :
(36)
Méthode de
recueil
A.
B.
C.
D.
E.
G.
H.
K.
Total
Nombre de termes
Termes retenus étiquette "P"
concernés
2
banlieusard ; harnacher
0
3
brelander ; brelandier ; myrosine
6
dieutelet ; escargotage ; escargotesque ; escargotier ; escargotière ;
ferblantesque
32 (+7)
abricoté ; abricotier ; abricotine ; al(l)eutier ; arpenter ; bahuter ; bahutier
; colorisation ; dépiéter ; échafauder ; écointage ; (émerisage) ; (émeriser) ;
(émeriseuse) ; empiètement ; empiéter ; équeuter ; esquimautage ;
faisandeau ; faisander ; faisanderie ; faisandier ; (fayot(t)age) ; (fayoter) ;
ferblanterie ; ferblantier ; (giletier) ; (giletière) ; miroité ; miroitement ;
miroiter ; miroiterie ; miroitier ; piètement ; piétin ; piétiner ; piéton ;
sursitaire ; taillandier
9 (+1)
bilanter ; boyauder ; boyauderie ; boyaudier ; (fayoteur) ; jutage ; juter ;
juteux ; reinté ; tabatière
0
0
52 (+8)
Les termes de la famille d'émeriser (émerisage, émeriser, émeriseuse) seront
comptabilisés avec les suffixes en -iser (section 1.5.1.), ceux de la famille de giletier (giletier
et giletière) avec les suffixes en -eter (section 1.5.2.) et ceux de la famille de fayoter
(fayotage, fayoter et fayoteur) avec les suffixes en -oter (section 1.5.3.), de façon à pouvoir
les conserver pour une raison supplémentaire. C'est pourquoi ils sont ici indiqués entre
405
Chapitre 6 – De la base de données au corpus de travail
parenthèses. Seuls cinquante-deux termes seront donc considérés comme définitivement
traités au terme de cette section.
Au terme de cette première série de critères de filtre, récapitulons leur impact quant au
contenu du corpus par rapport à la base de données initialement constituée.
1.3.6. Bilan sur l'apport de l'étymologie sur la constitution du corpus
1.3.6.1. En fonction des critères retenus.
Dans le tableau ci-dessous figurent le nombre de termes traités jusqu'à présent avec les
critères détaillés dans les sections précédentes, avec un rappel du code explicatif
correspondant au critère décisionnel et le code de couleur employé dans la présentation du
corpus (annexe 3c).
(37)
Section
Détail
Code
explicatif
Traitement
après 1er
filtre
Code de
couleur
Nombre de
termes
concernés
1.3.1.
héritage d'un mot déjà dérivé
avec la consonne en latin
2a
rejeté
vert
31
1.3.2.
présence de la consonne dans
l'étymologie de la base
2b
rejeté
vert
226
G
rejeté
vert
2
3
indécision
rose
3
P
maintien
1.3.3.
1.3.4.
1.3.5.
la consonne graphique n'est
pas prononcée, l'étymologie
n'indique rien
croisement
de
plusieurs
étymologies
l'étymologie présente une
consonne, mais pas celle de
l'épenthèse
bleu
52
Illustration
chevaucher
fermeté
diablotin
emperlousé
nagualisme
;
;
;
portraicturien ;
dompter
coquebin
vivandier
abricotier
jutage
faisander
;
;
;
314
1.3.6.2. En fonction de la provenance des termes possiblement porteurs d'une épenthèse
A cette étape du filtrage des dérivés arrêtons-nous un instant pour prendre un
instantané de leur traitement, en fonction de la méthode d'extraction de chaque terme et des
critères envisagés jusqu'à présent, c'est-à-dire de ceux correspondant à la nature du mot
construit ("comp"), à l'emplacement de l'épenthèse ("mp") et aux divers critères liés à
l'étymologie ("2a", "2b", "G" ; "3" ; "P").
406
Chapitre 6 – De la base de données au corpus de travail
(38)
A.
B.
C.
D.
E.
G.
H.
K.
"comp"
"mp"
"2a"
"2b"
"G"
total rejetés
"3" - indécis
0
0
0
1
1
3
0
1
6
0
0
8
0
0
0
0
0
8
4
0
2
2
10 +215
9 +2
0
0
27 +4
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
14
3
18
12
153
65
1
7
273
0
0
0
0
2
1
0
0
3
"P" maintenus
2
0
3
6
32
9
0
0
52
Le plus gros apport, en termes de quantité de termes traités, de l'étymologie dans le
traitement de la base de données a été de mettre à jour les consonnes sous-jacentes présentes
en fin de base du fait de son origine.
Les consonnes sous-jacentes peuvent cependant être révélées par un autre moyen, à
savoir le féminin du terme considéré - lorsqu'il existe.
1.4. Consonne sous-jacente révélée par le féminin
L'étymologie des dérivés et des bases a permis de mettre en évidence les consonnes
sous-jacentes de 269 termes. Ce n'est pas cependant la seule méthode de mise au grand jour
des consonnes sous-jacentes. Celles-ci peuvent en effet apparaître à la liaison (un petit [t]
enfant) ou au féminin (une grande amie).
Les termes pour lesquels il est possible d'accéder au féminin, à savoir les adjectifs
qualificatifs et certains substantifs, ont donc bénéficié d'un garde-fou supplémentaire destiné à
s'assurer du caractère réellement épenthétique de la consonne suspecte entre radical et suffixe.
Le tamis étymologique ayant déjà éliminé la plupart d'entre eux, ne restent ici que les termes
pour lesquels le féminin fait apparaître une consonne sans que cette consonne soit présente
dans l'étymologie du mot ; ces termes seront alors exclus du corpus sous la mention "C f"
pour "consonne sous-jacente apparaissant au féminin".
Sont concernés les dix-neuf termes suivants :
15
Les termes étiquettés "2" figurent arbitrairement dans cette colonne "2a" plutôt que "2b".
407
Chapitre 6 – De la base de données au corpus de travail
(39)
Méthode de
recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nombre de termes
Termes éliminés motif "C f"
concernés
0
0
0
8
butorderie ; favoritisme ; gueusaille ; gueusard ; gueuser ; gueuserie ;
rapiater ; rapiaterie
8
finauderie ; jointer; matoiserie ; rustauderie ; badaudage ; badauder ;
badauderie ; esquimaudage
2
chouchouter ; voyouter
0
1
chouteur
19
Ces dix-neuf termes correspondent à douze bases différentes, se rassemblant en neuf
types de finales différentes comme on peut le voir dans le tableau suivant, mettant en regard
le type de terminaisons, les dérivés et le nombre de bases correspondant :
(40)
Terminaison
de la base
-at
-aud
-eux
-i
-ois
-ord
-ou
Dérivés concernés
rapiater
rapiaterie
badaudage
badauder
badauderie
esquimaudage
finauderie
rustauderie
gueusaille
gueusard
gueuser
gueuserie
favoritisme
matoiserie
butorderie
chouchouter
voyouter
chouteur
Nombre de bases
correspondant
1 base
Source des dérivés
considérés
D.
4 bases
E.
1 base
D.
1 base
1 base
1 base
3 bases
D.
E.
D.
G., K.
Type de sources
sources écrites
source orale
Plusieurs cas sont à distinguer ici. En effet, il n'est pas possible de considérer que les
consonnes établies comme sous-jacentes du fait de leur mise en évidence au féminin sont
épenthétiques au même titre que celles démontrées par l'étymologie, dans le sens où dans le
cas du féminin non établi par l'étymologie il y a bien eu épenthèse consonantique à un
moment donné.
Je distinguerai ici trois cas particuliers, correspondants à trois types de terminaisons de
la base : les bases en -aud, les terminaisons en -at et la famille de gueux. Dans une dernière
sous-section j'attirerai l'attention sur les dérivés constitués à partir de bases en [u].
408
Chapitre 6 – De la base de données au corpus de travail
1.4.1. Bases en -aud
Six termes sur les dix-neuf considérés dans cette section sont formés à partir d'une
base en -aud. Parmi ces six termes, distinguons deux cas : d'une part les termes effectivement
dérivés à l'aide du suffixe -aud, d'autre part ceux pour lesquels les dictionnaires indiquent une
réfection à l'aide de ce suffixe à partir d'une autre terminaison, homophone, de la base.
Dans le premier compartiment sont rangés les dérivés finauderie et rustauderie,
respectivement formés sur finaud(e) et rustaud(e), pour lesquels donc l'identité de la consonne
sous-jacente est confirmée par la nature du suffixe (cf. section 1.6.2.3).
Dans la seconde catégorie se trouvent les quatre termes restants, soit en réalité deux
bases différentes : badaud et esquimau. Ces deux bases sont indiquées par les dictionnaires
consultés comme étant formés à partir de badau de suffixe provençal -au et esquimau ou
esquimo, terme emprunté à l'amérindien. Le suffixe -aud n'est donc que secondaire, et sans
doute supposé par les dictionnaires précisément à cause de l'apparition de la consonne [d] à la
jonction entre le radical en [o] et le suffixe suivant. Dans ce cas, ces quatre termes devraient
être normalement considérés comme maintenus dans le corpus, puisque l'analogie n'est pas
prise en compte à cette étape de sa constitution.
Cependant, le féminin de badaud se fait à l'aide d'un [d], soit comme si la réfection de
suffixe avait vraiment eu lieu. Donc il s'agit d'une sous-classe particulière de termes avec une
consonne sous-jacente n'apparaissant qu'à la dérivation et non en diachronie : c'est le féminin
qui fait apparaître une consonne, c'est vrai, mais cette consonne correspond à celle attendue
s'il y a eu réfection du suffixe. Ce cas n'est donc pas à mettre sur le même plan que les cas où
le féminin fait apparaître une consonne alors que la terminaison radicale ne correspond à
aucun suffixe répertorié, type [u] dans chou ou voyou. Le traitement est le même pour
esquimaudage, dont on peut supposer que d'autres dérivés construits sur la même base
présenteront la même consonne épenthétique.
1.4.2. Terminaison en -at
Les termes rapiater et rapiaterie sont formés sur la base rapiat dont l'origine n'est pas
claire. Peut-on rattacher cette base aux unités lexicales formées sur un radical concaténé au
suffixe -at (cf. section 1.6.2.) ? Quelle que soit son origine, la base présente au féminin une
consonne finale qui correspond précisément à celle présente à la dérivation des termes sous
intérêt. C'est pourquoi, bien qu'en l'absence de toute certitude quant à sa formation, la base
rapiat et les termes qui en sont dérivés sont exclus du corpus dès ce premier filtre.
409
Chapitre 6 – De la base de données au corpus de travail
1.4.3. La famille de gueux
Prolifique, la base gueux a produit quatre dérivés, tous présentant un [z] entre radical
et suffixe, [z] que l'on retrouve au féminin de l'adjectif. Ce [z] pourtant n'est pas présent dans
l'étymologie du terme, emprunté au moyen néerlandais guit fournissant gueu en français, sans
consonne sous-jacente. Le -x en fin de base n'est en effet que graphique, il n'indique
aucunement un [z] sous-jacent. Cependant, les dictionnaires proposent d'expliquer l'apparition
du [z] au féminin, et a fortiori dans la dérivation, par une réinterprétation de la terminaison
par le suffixe -eux.
Là encore, ce n'est pas la réinterprétation du suffixe qui a emporté la décision d'exclure
les termes dérivés de gueux du corpus, mais la présence de la consonne au féminin de
l'adjectif.
1.4.4. Terminaison en [u]
Sur les six termes restants, à savoir favoritisme, matoiserie, butorderie, chouchouter,
voyouter et chouteur, trois sont dérivés à partir d'une base en [u] et tous trois comportent la
même consonne au féminin : [t]. La relative importance de cette terminaison est-elle
indicatrice d'un phénomène d'épenthèse propre à ce contexte ? Une fois l'ensemble du corpus
totalement traité, il sera intéressant d'établir l'existence éventuelle d'une tendance générale à
épenthéser une consonne après [u], que ce soit au féminin ou à la dérivation, et si cette
consonne est bien [u]. Un questionnaire basé notamment sur les terminaisons du corpus (cf.
II[7]) permettra également de répondre à cette question.
Du fait que l'étymologie n'a pas établi de consonne sous-jacente pour les dix-neuf
termes examinés dans cette section, la consonne qui apparaît au féminin est épenthétique dans
le sens où elle a été créée ex nihilo. Il n'est pas possible de déterminer, pour huit cas sur les
dix-neuf, si c'est le féminin qui a reçu l'épenthèse le premier pour ensuite la communiquer à la
dérivation, ou l'inverse. C'est pourquoi tous ces termes seront exclus du corpus.
1.4.5. Bilan du premier filtre à ce niveau du traitement
Le tableau suivant récapitule les dérivés examinés jusqu'à maintenant en fonction de la
décision finale – rejet du corpus, indécision ou maintien – et de l'origine de ces termes.
410
Chapitre 6 – De la base de données au corpus de travail
(41)
A.
B.
C.
D.
E.
G.
H.
K.
"comp"
"mp"
"2a"
"2b"
"G"
"C f"
total rejetés
"3" - indécis
0
0
0
1
1
3
0
1
6
0
0
8
0
0
0
0
0
8
4
0
2
2
10 +2
9 +2
0
0
27 +4
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
0
0
0
8
8
2
0
1
19
14
3
18
20
161
67
1
8
292
0
0
0
0
2
1
0
0
3
"P" maintenus
2
0
3
6
32
9
0
0
52
La première étape de filtrage de la base de données initiale a tenu compte du type de
construction des termes, de l'emplacement de la consonne épenthésée, de l'étymologie des
bases comme des dérivés et des éventuelles consonnes sous-jacentes mises en évidence par le
féminin des adjectifs et de certains substantifs.
Tournons-nous maintenant du côté de l'initiale des suffixes, également en contact avec
la frontière morphologique.
1.5. Alternances suffixales (en début de suffixe du dérivé)
Trois cas sont distingués ici, correspondant à trois alternances en initiale de suffixe du
dérivé. Dans un premier temps, je m'arrêterai sur le suffixe -iser en relation avec le suffixe -er
et sur le critère permettant d'établir la présence de l'un ou de l'autre dans un dérivé. J'étudierai
ensuite les terminaisons en -et(t)er, pour lesquelles je distinguerai d'une part le suffixe -eter
du suffixe -er, d'autre part le suffixe diminutif -et en finale de base. Un traitement parallèle
concernera ensuite les terminaisons en -ot(t)er. Dans un deuxième temps, je présenterai
quelques suffixes argotiques.
1.5.1. -iser vs. -er
Le corpus rassemble vingt-et-un termes se terminant par la séquence -iser, -iseur, iseuse, -isant ou -isable, indiqués par le code "1" dans la colonne "code catégoriel" :
catégorisable, catégorisation, catégoriser, colorisation, émerisage, émeriser, émeriseuse,
favoriser, infiniser, loftstorysant, macadamiser, merceriser, névralgiser, phraséologisé,
rouliser, stromboliser, symétriser, symétriseur, tan(n)iser, tatamiser (se) et trotskisant.
Trois cas sont distingués ici, dont deux conduisent au rejet des unités lexicales
correspondant :
411
Chapitre 6 – De la base de données au corpus de travail
- la consonne [z] appartient au terme considéré et non au suffixe -iser. C'est le cas de
merceriser, issu non pas de mercerie mais de l'anglais mercerize. Rejeté, ce terme se voit
adjoint le code "2b" que j'ai détaillé en section 1.3.2.
- le sens du dérivé correspond à "rendre X" ou "transformer en X" selon que la base est un
adjectif ou un substantif, X représentant la base. Ceci concerne six termes de la base de
départ. Dans ce cas, l'unité lexicale est considérée comme étant bien formée à l'aide de l'infixe
-is- suivi d'un des suffixes -er, -eur, -euse, -ant ou -able, et non de l'un de ces suffixes
augmenté d'une épenthèse de [z], aussi sera-t-elle écartée du corpus et marquée du code "Su"
dans la colonne "code explicatif".
Les termes en -iser rejetés se répartissent en fonction de leur origine dans la base de
données initiale de la manière suivante :
(42)
Méthode
Nombre de
de recueil termes éliminés
A.
/
B.
/
C.
/
D.
/
E.
1
G.
1
H.
1
Nombre
motif "2b"
/
/
/
/
1
/
/
Terme éliminé motif
"2b"
/
/
/
/
merceriser
/
/
Nombre
motif "Su"
/
/
/
/
/
1
1
K.
5
/
/
5
total
8
1
/
7
Termes éliminés motif "Su"
/
/
/
/
/
favoriser
tatamiser
infiniser ; stromboliser ;
symétriser ; symétriseur ;
rouliser
/
Le troisième cas envisagé ici est le pendant du cas précédent. Seront considérées
comme réellement porteuses d'une épenthèse les unités lexicales pour lesquelles ne peut pas
être mis en évidence, au moins directement (cf. section 2.7.2.2), le sens "rendre X" ou "se
transformer en X". Le code explicatif sera également "Su" puisqu'il s'agit tout autant d'une
justification par le suffixe, mais le traitement sera différent puisque ces termes sont maintenus
dans le corpus à cette étape du traitement. Sont concernés les douze termes suivants :
(43)
Méthode
de recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nombre de
termes maintenus
/
/
/
/
5
5
1
2
13
Termes maintenus motif "Su"
/
/
/
/
colorisation ; émerisage ; émeriser ; émeriseuse ; taniser
catégorisable ; catégorisation ; catégoriser ; loftsorysant; macadamiser
trotskisant
névralgiser ; phraséologisé
412
Chapitre 6 – De la base de données au corpus de travail
Les deux alternances suffixales suivantes sont proches à la fois par leur traitement et
par le signifié du premier suffixe supposé. Il s'agit en effet de -eter vs. -et + -er d'une part, de ot(t)er vs. -ot et -er d'autre part, dans lesquelles -et et -ot véhiculent tous deux l'idée de
petitesse.
1.5.2. -eter vs. -et + -er
La base de données initiale rassemble quarante-deux unités lexicales se terminant par
une séquence pouvant être analysée comme base + -et- + suffixe ou base + -eter/-etage/etier/-etique/-eteur/-eterie.
Le traitement de ces cas va les distribuer dans les trois compartiments que sont les
termes rejetés, indécis et maintenus déjà établis plus haut.
Les termes rejetés le seront pour l'un des deux critères appliqués également aux termes
en -iser (cf. 1.5.1.), à savoir :
- soit le sens du dérivé indique que celui-ci est fait sur le diminutif de la base et non sur la
base elle-même, comme dans le cas de archetier "fabricant d'archet" ou paqueter "faire des
paquets", autrement dit de "petits packs". C'est le cas pour douze des termes considérés ici.
- soit le sens du dérivé indique l'emploi du suffixe -eter introduisant une idée de fréquence,
comme dans piqueter "parsemer de petits points, de petits trous, de petites tâches". Trois
termes sont ainsi éliminés.
(44)
Méthode
de recueil
A.
B.
C.
D.
Nombre de
termes
éliminés
/
/
/
/
Nombre
motif
"2b"
/
/
/
/
E.
15
12
G.
H.
K.
2
/
/
17
1
/
/
13
total
Termes éliminés motif "2b"
/
/
/
/
archeterie ; archetier ;
bouvetage ; grainetier2 (motif
2a) ; guichetier ; marqueterie
; paquetage ; paqueter ;
paqueteur ; paquetier ;
parqueter ; robinetterie
louveteau
/
/
Nombre
motif
"Su"
/
/
/
/
Termes éliminés motif "Su"
/
/
/
/
cliqueter
piqueter
;
moucheter
;
3
1
/
/
4
becqueter
/
/
413
Chapitre 6 – De la base de données au corpus de travail
Seront maintenus en revanche les termes pour lesquels il n'est possible de mettre en
évidence ni l'aspect fréquentatif propre au suffixe -eter (feuilleter ne signifie pas *"parsemer
de feuilles" par exemple) ni la dimension de petitesse invoquée par le diminutif -et (un
chaînetier ne fabrique pas uniquement des chaînettes mais est spécialisé dans les chaînes en
général). Parmi ces termes figurent ceux pour lesquels les dictionnaires indiquent une
"réfection de suffixe" ou une "substitution de suffixe", comme giletier ou buffleterie.
(45)
A.
B.
C.
D.
E.
Nombre de
termes
maintenus
/
/
/
/
14
G.
H.
K.
total
2
/
1
17
Méthode
de recueil
Termes maintenus motif "Su"
/
/
/
/
buffleterie ; chaînetier ; coquetier1 ; écoquetage ; écoqueter ; feuilleter ; giletier ;
giletière ; grainetier1 ; graineterie ; museletage ; pelleter ; pelleterie ; pelletier
clouter ; clouterie
/
déchétique
Pour huit unités lexicales enfin, le traitement du suffixe se combine avec une
identification malaisée de la base, c'est pourquoi ils seront classés parmi les indécis.
(46)
Méthode
de recueil
A.
B.
C.
D.
E.
Nombre de
termes
indécis
/
/
/
/
8
G.
H.
K.
total
/
/
/
8
Termes indécis
/
/
/
/
bonneter ; bonnetier ; bufettier ; courtage ; courtier ; épincetage ; épousseter ;
gobetage
/
/
/
Les cinq cas de figure rencontrés dans cette section sont récapitulés dans le tableau cidessous :
(47)
Détail
le sens du dérivé indique que celui-ci est fait sur le diminutif de la base
le sens du dérivé indique que celui-ci est fait en utilisant -eter
impossible de décider, problème de base en sus
"réfection" ou "substitution de suffixe" (type -ot, -et)
aucun des cas précédents
Code
Traitement
Code de
couleur
2b
Su
rejet
vert
indécision
rose
maintien
bleu
Su
Su
414
Chapitre 6 – De la base de données au corpus de travail
1.5.3. -ot(t)er vs. -ot + -er
Les cinq mêmes cas que pour les terminaisons comportant la séquence -ot- avant un
éventuel suffixe sont distingués ici.
Sur trente-sept unités lexicales correspondant à cette section, quinze sont rejetés pour
une des deux raisons suivantes :
- le sens du dérivé indique que celui-ci est formé sur le diminutif de la base pour neuf termes ;
- le sens du dérivé indique que celui-ci est formé à partir du suffixe fréquentatif -eter en ce qui
concerne quatre termes.
(48)
A.
B.
C.
D.
Nombre de
termes
éliminés
1
/
/
/
Nombre
motif
"2b"
1
/
/
/
E.
7
6
G.
4
1
H.
K.
total
1
/
13
1
/
9
Méthode
de recueil
Terme éliminé motif "2b"
diablotin
/
/
/
chariotage ; îlotage ; îlotier ;
minotier ; tricoter ; verroterie
chevroter
pageoterie
/
Nombre
motif
"Su"
/
/
/
/
1
3
/
/
4
Termes éliminés motif "Su"
/
/
/
/
picoter
cachotter ;
cachottier
/
/
cachotterie
;
Sept termes sont maintenus, qu'il s'agisse d'une "réfection de suffixe" selon les
dictionnaires comme pour canotier ou non, le critère décisionnel étant qu'il n'est pas possible
de mettre en évidence un quelconque aspect fréquentatif ou diminutif.
(49)
Méthode
de recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nombre de
termes
maintenus
/
/
/
/
2
3
2
/
7
Termes maintenus motif "Su"
/
/
/
/
canotier ; lingotier
fayotage ; fayoter ; fayoteur
glavioter ; glavioteur
/
Pour dix-sept termes enfin, la base n'est pas suffisamment claire pour qu'il soit
possible de prendre une décision à cette étape de la constitution du corpus. Ces termes se
répartissent de la manière suivante :
415
Chapitre 6 – De la base de données au corpus de travail
(50)
A.
B.
C.
D.
E.
Nombre de
termes
indécis
/
/
/
/
16
G.
H.
K.
total
1
/
/
17
Méthode
de recueil
Termes indécis
/
/
/
/
argotage ; argoter ; argoteur ; argotier ; argotique ; argotisme ; argotiste ;
bimbeloterie ; cagoterie ; crabotage ; ergoter ; fagoter ; fagotier ; fagotin ; palotage
; rabioter
déposer (motif 3)
/
/
Le tableau suivant récapitule les différents cas de figure répertoriés en ce qui concerne
les terminaisons en -oter et -eter. Il rappelle les conséquences des choix adoptés dans la
constitution du corpus ainsi que les codes directement liés aux décisions prises et les codes
explicatifs indiqués dans le corpus en annexe 3c.
(51)
Détail
le sens du dérivé indique que celui-ci est fait sur le diminutif de la base
le sens du dérivé indique que celui-ci est fait en utilisant -eter ou -oter
impossible de décider, problème de base en sus
"réfection" ou "substitution de suffixe" (type -ot, -et)
aucun des cas précédents
Code
Décision
Code de
couleur
2b
Su
rejet
vert
indécision
rose
maintien
bleu
Su
Su
1.5.4. Suffixes argotiques
Une place à part doit être réservée aux suffixes argotiques, dans le sens où ce n'est pas
le signifié qui donne une indication de l'identité du suffixe, mais le registre de langue. Ces
suffixes sont d'ailleurs identifiés comme tels dans le Colin, Mével & Leclère (1990).
Certains dérivés ont donc été écartés, parce que dérivés à l'aide d'un suffixe présentant
une consonne à l'initiale, suffixe identifié par le dictionnaire lui-même en tant qu'entrée dans
bien des cas : ainsi le suffixe -ton, "suffixe servant à former de nombreux substantifs
argotiques : biffeton, cureton, frometon, mecton, paveton, etc., auxquels il communique une
nuance d'humour ou de dédain", a-t-il permis d'éliminer, outre les termes cités en exemple,
griveton, gueuleton, cafeton et sociéteton. De même les suffixes -go et -caille ont élagué le
corpus de icigo, icicaille et labago. Le suffixe -dé n'est pas indiqué en tant qu'entrée dans le
Colin, Mével & Leclère (1990), mais est présent dans un certain nombre de dérivés :
fouignedé, foindé, jourdé, dans lequel il est indiqué comme une "suffixation argotique".
416
Chapitre 6 – De la base de données au corpus de travail
Sont considérées comme "sûres" des unités lexicales pour lesquelles la base est
reconnue par le Dictionnaire (miroter et miroiter sont dans l'article miro, pieuter est indiqué
comme dérivé de pieu, etc.) et le suffixe aisément identifiable, c'est-à-dire attesté dans la liste
des suffixes préalablement établie ou le cas échéant indiqué dans le Dictionnaire.
Un problème se posait avec le suffixe -(t)ance présent dans cuistance : fallait-il
considérer qu'il s'agit d'un suffixe argotique ou d'une épenthèse précédant le suffixe -ance ?
L'explication analogique des dictionnaires, qui mettent en parallèle cuistance avec bectance,
n'est pas suffisante pour justifier de l'existence d'un suffixe -tance ; en effet, bectance est
possiblement formé sur le verbe becter par ailleurs attesté, alors qu'on ne trouve pas trace de
*cuister. En revanche, la base de données initiale (cf. A.) révèle un autre terme en -tance,
bouffetance, qui lui non plus ne correspond pas à un verbe *bouffeter mais à *bouffer, sans [t]
et qui correspond au même registre de langue. Il semblerait donc bien que -tance constitue lui
aussi un suffixe argotique, c'est pourquoi cuistance est éliminé du corpus.
Le tableau suivant récapitule les différents suffixes argotiques en mettant en regard les
dérivés du corpus correspondant avec une indication de leur origine.
(52)
Suffixe
-lard
-ance
-bar
-bri
-caille
-dé
-do
-go
-mar
-mon
-oque
-piat
-pier
-pin
-tar
Nombre de
termes
éliminés
Origine
Nombre de
termes
maintenus
2
1
2
1
1
1
1
2
1
1
1
1
1
2
1
1
8
-ton
Total
Termes éliminés motif
catégorie "arg"
1
27
cuistance
colibar ; crobard
colibri
icicaille
jourdé
botocudo
icigo ; labago
cafemar
cafemon
chinetoque
marloupiat
marloupier
auverpin ; marloupin
camtar
bocheton
biffeton ; cafeton ; cureton
; frometon ; griveton ;
gueuleton ;
mecton ;
paveton
sociéteton
Termes maintenus motif
catégorie "arg"
faflard ; vicelard
Origine
B.
B.
B.
B.
B.
B.
K.
B.
B.
B.
G.
B.
B.
B.
B.
H.
B.
K.
2
417
Chapitre 6 – De la base de données au corpus de travail
Sur les vingt-neuf termes pour lesquels est portée en regard la mention "arg" dans la
colonne "code catégoriel", seuls deux sont maintenus dans le corpus : vicelard16 et faflard,
pour lesquels le suffixe argotique -lard n'est pas explicitement relevé dans les dictionnaires
argotiques alors que le suffixe -ard existe bel et bien.
Les suffixes argotiques ne sont pas les seuls à avoir fait l'objet d'une attention
particulière. D'autres suffixes ou variantes ont été étudiées de façon à éclaircir le sort de plus
d'une vingtaine de termes incertains.
1.5.5. Autres variantes suffixales
Vingt-quatre termes restent pour lesquels deux cas se distinguent, décidant de
l'élimination ou du maintien sous condition des dérivés.
Huit unités lexicales - bochetée, royauté, avocasser, cocufier, statufier, pansementer,
pansementerie et chimiatrie - avaient été mal indexées, ou plus exactement les suffixes à
partir desquels elles avaient été constituées avaient été mal identifiés, pour des raisons
orthographiques (bochetée comportant un -e en finale orientait l'analyse vers le suffixe -ée et
non -té ; on notera à cet endroit que le terme yeutée ne peut pas être analysé pareillement,
attendu que le suffixe -té d'une part ne se forme que sur des adjectifs (cf. Dubois & DuboisCharlier 1999 : 222-224), d'autre part que le signifié en est "qualité de A" où A est la base
adjectivale ; or yeutée est formé sur le substantif yeux et son sens n'est pas "qualité des yeux"
mais "vue, coup d'oeil"), de cumul de suffixe (chimiatrie n'est pas formé sur chimie suivi du
suffixe -ie mais sur chimie + atre + ie) ou de manque d'analyse du signifié (statufier et
cocufier indiquent respectivement "transformer en statue" et "transformer en cocu", renvoyant
bien au suffixe -(i)fier). Deux termes, pansementer et pansementerie, se distinguent en ce sens
que c'est le suffixe substantif -ment pour lequel la consonne finale sous-jacente [t] devait être
mise en évidence indépendamment. Une recherche dans la base de données exploitée sous A.
indique quarante-quatre dérivés en -menter et deux en -menterie formés à partir de substantifs
en -ment, établissant ainsi le [t] sous-jacent final.
16
En ce qui concerne vicelard, Corbin (1987 : 780 note 12) propose de le construire sur le nom °vicier de
signifié "N [+hum] en rapport avec le vice", lui-même construit à l'aide du suffixe -ier "profession, état habituel"
sur le nom vice, vicier ayant subi une allomorphie r ~ l. Cependant, vicieux existant déjà avec précisément ce
signifié, l'hypothèse ne me paraît pas suffisamment convaincante pour exclure vicelard de la suite des
opérations.
418
Chapitre 6 – De la base de données au corpus de travail
Quinze termes sont à classer parmi les indécis. Six d'entre eux appartiennent à la
famille lexicale de coq, sur laquelle je reviendrai en section 1.7.3. Les autres se séparent en
deux catégories : d'une part les suffixes présentant une variante suffixale non répertoriée dans
les dictionnaires, de type -chon dans iglouchon (mais -ichon existe), -itude dans bretonnitude
et -ture dans pourriture et fourniture (-ature est cependant attesté, cf. section 2.5.15) ; d'autre
part les suffixes dont la variante est répertoriée et attestée plusieurs fois, mais sans qu'elle
corresponde à un signifié particulier. Ce dernier cas concerne les suffixes -ette et -on, pour
lesquels les variantes -elette (sourcelette, tartelette) et -eron (aileron ; bûcheron ;
mancheron1 ; mancheron2 ; tâcheron ; moucheron ; vigneron) correspondent au même
signifié : pourquoi tarte se voit adjoint la variante -elette et non -ette, le signifié étant dans les
deux cas "petite" ? Pourquoi une petite mouche est-elle indiquée par le signifiant moucheron
et non mouchon ? Les dix-huit termes concernés seront donc classés dans la catégorie
"indécis".
(53)
Suffixe
-té
-asser
-fier
-er
-erie
-ie
-elle
Nombre de
termes
éliminés
Termes éliminés
motif "Su"
Origine
2
1
2
1
1
1
bochetée ; royauté
avocasser
cocufier ; statufier
pansementer
passementerie
chimiatrie
G.
E.
E.
G.
E.
A.
Nombre de
C
termes
épenthésée
indécis
Origine
r
coquerelle
E.
1
l
coquelet
E.
1
r
coqueret
1
-et
Termes indécis
motif "Su"
E.
-ette
2
l
-eur
1
l
sourcelette
tartelette
coqueleur
-eux
1
l
coqueleux
E.
l
coqueliner
E.
-iner
1
;
E.
1
1
aileron ; bûcheron ;
mancheron1
;
mancheron2
;
tâcheron
moucheron
;
vigneron
iglouchon
-ude
1
t
bretonnitude
-ure
2
t
pourriture
fourniture
5
r
2
r
-on
Total
8
K.
;
D.
E.
K.
H.
G.
E.
19
Des vingt-quatre termes considérés ici, aucun ne fera partie du corpus final, tous ayant
été écartés dès cette première étape.
419
Chapitre 6 – De la base de données au corpus de travail
Au terme de ce tour d'horizon des alternances suffixales, établissons un bilan des
termes rejetés, de ceux qui restent indécis et de ceux qui continuent l'aventure.
1.5.6. Bilan sur les alternances suffixales
Le tableau suivant propose une synthèse du traitement réservé aux termes se terminant
par -iser, -eter et -oter ainsi que des suffixes particuliers abordés dans cette section, en
rappelant la section dans laquelle les explications sont fournies et le code explicatif indiqué
dans le corpus en annexe 3c.
(54)
Paragraphe
code
"Su"
"2b"
1.5.1.
1.5.2.
1.5.3.
1.5.4.
1.5.5.
Total
"1" : -iser
"9" : -et(er)
"10" : -ot(er)
"arg"
autres
2
4
4
26
8
44
6
13
9
/
/
28
total
rejetés
8
18
13
27
8
74
total
indécis
/
8
17
/
19
44
"3"
/
/
1
/
/
1
maintenus
total
12
17
7
2
19
42
37
29
24
151
38
Cent cinquante-et-une unités lexicales ont été envisagées ici. Près de la moitié ont été
exclues, et seules 38, soit un quart de l'effectif, se sont maintenues dans le corpus.
Avant de passer à l'examen des alternances radicales, récapitulons le traitement de
l'ensemble des 478 termes examinés jusqu'à présent dans ce premier filtre.
1.5.7. Récapitulatif du traitement du corpus jusqu'à présent
Les termes rejetés aux motifs "2b" et "3" avaient déjà été comptabilisés. S'ajoutent
donc seulement ceux marqués "Su", les termes indécis et les termes maintenus.
(55)
A
B
C
D
E
G
H
K
comp
mp
2a
2b
G
Cf
Su
total
rejetés
3
indécis
total
indécis
P
main
tenus
0
0
0
1
1
3
0
1
6
0
0
8
0
0
0
0
0
8
4
0
2
2
10 +2
9 +2
0
0
31
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
0
0
0
8
8
2
0
1
19
1
23
0
0
8
9
2
7
50
15
26
18
20
169
76
3
15
342
0
0
0
0
2
1
0
0
3
0
0
0
5
33
1
1
3
43
0
0
0
5
36
2
1
3
46
2
0
3
6
32
9
0
0
52
0
2
0
0
21
9
3
3
38
total
main
tenus
2
2
3
6
53
18
3
3
90
420
Chapitre 6 – De la base de données au corpus de travail
Plus de soixante-dix pour cent des unités ont été rejetées, moins d'un cinquième de
l'ensemble des termes examinés figureront dans le corpus à l'issue du premier filtre.
Tournons-nous maintenant vers les alternances radicales.
1.6. Alternances radicales
Je distinguerai deux cas d'alternances radicales : les bases incertaines d'une part,
certains suffixes présents en fin de base d'autre part.
1.6.1. Bases incertaines
Les soixante-et-un termes relevant de cette catégorie, outre ceux déjà traités en même
temps que les alternances suffixales (cf. section 1.2.5.2), sont identifiés par la mention "B"
pour "base" dans la colonne "code catégoriel".
Plusieurs cas de figure se présentent, selon le type de bases supposées. Si toutes les
bases proposées par les dictionnaires comportent la consonne que l'on trouve dans le dérivé à
leur finale, les dérivés sont rejetés sous le motif "2" ou "2b" (cf. section 1.3.2). Dix-huit
termes sont ainsi exclus du corpus.
Seuls six termes sont maintenus dans le corpus final. Il s'agit des termes pour lesquels
parmi les bases proposées, au moins une est actuelle, c'est-à-dire réanalysable en synchronie
comme étant dérivée dans le français "contemporain". Le cas de figure s'était posé avec
clouter et clouterie, traités avec les termes en -et : si l'on considère que clouter est formé sur
clouet et non sur clou, il faut expliquer ce qu'est devenu le [e] ; s'il s'est schwaïsé comme
l'alternance " / - dans appeler / appelle, comment peut-on mettre en évidence cette
alternance ? Dans les termes considérés ici, l'exemple phare est bleusaille : ce terme est-il
dérivé sur bleu ou sur bleuse ? En synchronie, il est réanalysé comme étant formé sur bleu. Ce
n'est que l'examen du suffixe au terme de l'analyse qui permettra éventuellement d'écarter par
la suite ce dérivé.
Tous les autres termes, soit 37 sur les 61 détaillés ici, restent frappés du sceau de
l'indécision, soit parce qu'ils comportent plusieurs bases qu'on ne peut départager, soit que la
base reste désespérément obscure. Là encore, ce ne seront que les filtres suivants qui
permettront de reclasser une partie d'entre eux.
Le tableau suivant récapitule le traitement de chacun des soixante-et-un termes ici
considérés en fonction de leur origine :
421
Chapitre 6 – De la base de données au corpus de travail
(56)
Méthode
de recueil
A.
Nombre
termes
rejetés
Termes rejetés
motif "2(b)"
7
verdâtre ;
verdelet ;
verdeur ;
verdier ; verdir
; verdoyer ;
verdure
B.
C.
D.
Nombre
termes
indécis
4
vivandier
G.
20
3
3
chevelure ;
œilleton ;
soudaineté
Termes
maintenus
foindé ; fignedé
; louftingue
calfeutrage ;
calfeutrement ;
calfeutrer ;
conchyoline
partisan
1
Nombre
termes
mainte
nus
1
3
4
Autres termes
indécis
bleusaille ;
bouverie ;
forestier ;
ponceau
E.
Termes indécis
motif "3"
5
5
durcir ;
manchereau ;
sidénologue ;
zougloutique
bardeur ;
brancardier ;
clabauder ;
coqueluche ;
déhourdage ;
écanguer ;
emboucautage ;
épiétage ;
fauberder ;
fauberter ;
faucardage ;
faucarder ;
ferratier ;
ferroutage ;
folletage ;
maffiotage ;
masselottage ;
millerandage ;
ridelage
chimicage ;
gatouser ;
velouté ;
velouteux ;
zozoter
chalutage ;
chaluter ;
chalutier ;
dinanderie ;
dinandier
5
H.
5
K.
total
5
18
37
doublezon ;
emperlizer ;
enfumanter ;
englumer ;
escoubellesque
6
Le traitement des bases incertaines peut conduire les termes incriminés dans les trois
compartiments précédemment définis : soit ils sont rejetés au motif que la base comporte de
fait la consonne suspectée ; soit au moins une des bases proposées est analysable actuellement
422
Chapitre 6 – De la base de données au corpus de travail
et son dérivé peut donc être considéré comme faisant partie des termes maintenus ; soit la
base reste désespérément obscure, aussi ne peut-on placer les termes que dans la catégorie des
indécis.
(57)
Détail
Si toutes les bases proposées comportent de toute façon la consonne dans
la bonne position
Si indiquée "origine obscure" et aucune explication ou qu'aucune
étymologie n'est trouvée
Si plusieurs bases sont proposées sans qu'il soit possible de les départager
Si deux bases sont proposées dont une actuelle
Code
Décision
Code de
couleur
2(b)
rejet
vert
indécision
rose
maintien
bleu
3
Dans le tableau récapitulatif de l'ensemble des termes analysés jusqu'à maintenant ne
figureront pas les termes rejetés sous le motif "2" ou "2b", puisqu'ils ont déjà été
comptabilisés ; ne seront indiqués donc que les 35 indécis et les 6 maintenus, en regard de
leur source d'origine :
(58)
A
B
C
D
E
G
H
K
com
p
mp
2a
2b
G
Cf
Su
0
0
0
1
1
3
0
1
6
0
0
8
0
0
0
0
0
8
4
0
2
2
12
11
0
0
31
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
0
0
0
8
8
2
0
1
19
1
23
0
0
8
9
2
7
48
total
reje
tés
15
26
18
20
169
76
3
15
342
3
0
0
0
0
2
1
0
0
3
indéc indéc
is
is
"B"
0
0
0
3
0
0
5
4
33
20
1
5
1
0
3
5
43
37
total
indé
cis
0
3
0
9
55
7
1
8
83
P
2
0
3
6
32
9
0
0
52
maint maint total
enus enus main
"B" tenus
0
1
3
2
0
2
0
0
3
0
0
6
21
5
58
9
0
18
3
0
3
3
0
3
38
6
96
A l'intérieur de cette section sur les alternances radicales figure un deuxième chapitre,
celui concernant certains suffixes présents en fin de base pour lesquels il faut établir la
présence ou l'absence d'une consonne sous-jacente finale.
1.6.2. Suffixes présents en fin de thème
Quatre suffixes seront ici étudiés : -ard, -at, -aud et -is. A la différence des suffixes
étudiés dans la section concernant les alternances suffixales (1.5), c'est ici leur frontière droite
qui est sous intérêt puisqu'ils sont situés dans la base.
423
Chapitre 6 – De la base de données au corpus de travail
1.6.2.1. -ard : foulardage, bousarderie, musarderie, jobarder
Les quatre termes de la base de données présentant la terminaison [ar] en fin de radical
ont été marqués d'un label "Su -ard" dans la colonne "code explicatif". C'est en effet parce
qu'ils comportent ce suffixe qu'ils ont été écartés du corpus dès ce premier filtre.
Le suffixe -ard est issu de l'adjectif allemand hart "dur", dans lequel la consonne
finale est prononcée. De ce fait, il semble raisonnable de supposer que le suffixe français
comporte une consonne sous-jacente /d/ à la finale.
Pour les termes comme faucardage et faucarder, pour lesquels la base est incertaine
comme on l'a vu en section 1.6.1., aucune décision n'a été prise quant à leur éviction étant
donné justement qu'il n'était pas possible d'établir avec certitude la présence du suffixe -ard.
Par ailleurs ce suffixe, lorsqu'il est inclus dans un adjectif qualificatif, permet
précisément à un [d] final de se réaliser au féminin (cf. section 2.6.3).
1.6.2.2. -at : gravatier, goujaterie / crachaté / taxateur, taxatif
Cinq termes seraient candidats à recevoir le label "Su -at" et donc à être éliminés du
corpus, le suffixe -at étant issu d'un suffixe latin -atus ou -atum, présentant donc un [t] sousjacent à la finale. Il convient cependant de distinguer les termes gravatier et goujaterie, dans
le sens où la séquence -at à la finale de leurs bases respectives n'est pas due au suffixe
suscité : pour gravats, il est donné comme formé sur gravois par les dictionnaires ; quant à
goujat, il s'agit d'un terme provençal se terminant en [a] et possiblement re-suffixé. Gravatier
et goujaterie sont donc maintenus dans le corpus à l'issue de ce premier filtre.
Restent les termes crachaté, taxateur et taxatif. Deux cas sont représentés ici :
- crachaté est réellement formé à partir du suffixe -at provenant du latin -atus ou -atum. De ce
fait, il est éliminé. On notera à cet endroit que rapiater et rapiaterie, parce qu'ils sont formés
sur l'adjectif rapiat présentant un [t] final au féminin, avaient déjà été éliminés du corpus.
- taxateur et taxatif présentent quant à eux un élément -at possiblement dû à un allongement
thématique ; ils seront traités avec les termes en -ation lors de la deuxième étape de filtrage, et
restent pour le moment en lice.
424
Chapitre 6 – De la base de données au corpus de travail
1.6.2.3. -aud : marauder, minauder, rustauderie, finauderie, badaudage, badauder,
badauderie, esquimaudage
Les termes de la famille de badaud – badaudage, badauder et badauderie –,
esquimaudage ainsi que finauderie et rustauderie ont déjà été traités – et exclus du corpus –
du fait que le féminin de l'adjectif atteste l'existence d'un [d] sous-jacent. Par ailleurs,
finauderie et rustauderie sont clairement dérivés à l'aide du suffixe -aud au contraire de la
famille de badaud ; or le suffixe -aud est issu du suffixe francique -wald, de walden
"gouverner", comportant donc bien un [d] sous-jacent.
Cependant, cette vérification d'une éventuelle consonne sous-jacente n'est pas possible
pour marauder et minauder, maraud et minaud n'étant pas attestés au féminin. C'est
l'étymologie du suffixe qui permet d'enlever la décision : il y a bien un [d] sous-jacent, les
deux termes sont donc exclus.
1.6.2.4. -is : roulis
Le suffixe -is provient d'une forme -ëiz en ancien français, du latin -aticiu. Le [z] est
donc bien sous-jacent, disqualifiant ainsi le terme roulis.
Au terme de cet examen des suffixes identifiés en fin de base, récapitulons le
traitement choisi pour chacun.
1.6.2.5. Récapitulatif
Le tableau suivant permet de visualiser le traitement appliqué aux unités lexicales
construites à partir d'une base se terminant par l'un des suffixes traités dans les paragraphes
précédents, en indiquant les codes explicatifs que l'on trouve en annexe 3c.
425
Chapitre 6 – De la base de données au corpus de travail
(59)
Suffixe
considéré
Code
explicatif
provient
de
l'adjectif
allemand hart "dur"
-ard
Su -ard
-aud
Su -aud
-is
Su -is
-at
Nombre de
dérivés
Origine du suffixe
suff a f -alt du suffixe
francique -wald de walden
"gouverner"
-ëiz du latin -aticiu
provient du suffixe latin atus ou -atum
simple terminaison et non
suffixe
-at- suppose une base en ation ; cf. 2ème filtre
Su -at
4
8
1
1
2
2
Illustration
foulardage
bousarderie
jobarder
musarderie
minauder
marauder
badauder…
roulis
crachaté
gravatier
goujaterie
taxateur
taxatif
18
Décision
Code de
couleur
rejet
vert
maintien
bleu
14 rejets, 4 maintiens
Sur ces dix-huit termes, huit avaient déjà été traités par ailleurs. Seuls dix sont donc
nouvellement intégrés, qu'ils soient rejetés ou maintenus, dans l'ensemble des termes évalués.
(60)
Méthode
Nombre de
Nombre
de recueil termes traités motif "Su
X"
A.
/
/
B.
/
/
C.
/
/
D.
/
/
E.
7
5
G.
H.
/
/
/
/
K.
3
3
total
10
8
Termes éliminé
motif "Su X"
/
/
/
/
foulardage, jobarder,
musarderie, minauder,
marauder
/
/
crachaté, roulisé,
bousarderie
Nombre
motif "Su"
/
/
/
/
Termes maintenus
motif "Su X"
/
/
/
/
taxateur, taxatif
2
/
/
/
/
/
/
2
Au terme de ce premier filtre, il convient de dresser un tableau récapitulatif des termes
étudiés jusqu'à présent :
(61)
A
B
C
D
E
G
H
K
comp
m
p
2a
2b
G
Cf
Su
0
0
0
1
1
3
0
1
6
0
0
8
0
0
0
0
0
8
4
0
2
2
12
11
0
0
31
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
0
0
0
8
8
2
0
1
19
1
23
0
0
8
9
2
7
50
0
0
0
0
5
0
0
3
8
total
reje
tés
15
26
18
20
174
76
3
18
350
3
0
0
0
0
2
1
0
0
3
indé indé total P main main
tenus tenus
cis cis indé
"B"
"B" cis
0
0
0
2
0
1
0
3
3
0
2
0
0
0
0
3
0
0
5
4
9
6
0
0
33 20
55 32 21
5
1
5
7
9
9
0
1
0
1
0
3
0
3
5
8
0
3
0
43 37
83 52 38
6
0
0
0
0
2
0
0
0
2
total
main
tenus
3
2
3
6
60
18
3
3
98
426
Chapitre 6 – De la base de données au corpus de travail
La section suivante permet d'évaluer le poids des choix pris quant au maintien ou au
rejet des dérivés dans trois familles lexicales, particulièrement prolixes.
1.7. Trois familles lexicales particulières
Seront abordées ici les familles des bases pied, sorcier et coq, de façon à apprécier
l'hétérogénéité de traitement possible au sein d'une même famille.
1.7.1. La famille de pied
Les termes de la famille de pied sont au nombre de neuf dans la base de données
initiale. Parmi eux, deux ont été rejetés au motif que la soi-disant épenthèse était en réalité
présente dès le latin (motif "2a") : piétaille et piéter. Les sept termes restant – dépiéter,
empiéter, empiètement, piétement, piétin, piétiner et piéton - sont possiblement formés à partir
de la base pied, dont l'étymologie indique qu'elle est formée à partir du latin pedem, accusatif
de pes, pedis. Selon les critères établis plus haut, ils ont donc été maintenus dans le corpus,
puisque la consonne apparaissant entre le radical et le suffixe n'est pas la consonne sousjacente.
A l'intérieur d'une même famille lexicale donc, des termes semblant relever du même
cas de figure puisque présentant la même consonne épenthétique au même emplacement,
seront pourtant traités différemment en regard de ce premier filtre. Au terme du deuxième
filtre, la situation aura encore évolué au sein de cette famille.
Une seconde famille considérée est la famille de sorcier, pour laquelle seul un terme a
été étudié jusqu'à présent.
1.7.2. La famille de sorcier
La famille des termes en rapport avec sorcier comprend cinq termes. Sorcier lui-même
a été exclus du fait qu'il correspond à un terme latin comportant déjà la consonne suspecte
(motif "2a").
Les quatre autres termes (ensorceler, ensorcellement, ensorceleur et sorcellerie) en
revanche avaient été "mis de côté" en section 1.3.5. car s'ils correspondent à un terme
comportant déjà une consonne, la consonne en question est un -r- et non un -l-, c'est pourquoi
les dictionnaires analysent le -l- présent dans ces unités lexicales comme due à de la
427
Chapitre 6 – De la base de données au corpus de travail
dissimilation. Autrement dit, il n'y aurait pas épenthèse à proprement parler puisque la
position comme le matériel lexical sont déjà disponibles. C'est cette ambivalence de
traitement qui m'a conduite à réserver mon jugement quant à ces termes, qui seront au terme
de ce premier filtre classés parmi les indécis.
La dernière famille examinée ici est celle de coq, comportant elle aussi quelques
termes qui n'ont pas encore été abordés dans ce filtre.
1.7.3. La famille de coq
Cette famille comporte 14 termes :
- un composé : coquelourde ;
- un terme de base incertaine codé "B" : coqueluche ;
- un terme pour lequel plusieurs bases sont proposées, référencé "3" : coquebin ;
- six termes pour lequel la base est incertaine, donc notés "Su" : coquelet, coqueret,
coquerelle, coqueleur, coqueleux, coqueliner ;
- trois termes traités avec les terminaisons en -eter et maintenus dans le corpus : coquetier1,
écoquetage, écoqueter ;
- deux termes enfin non encore traités du fait qu'ils n'ont rien de particulier et semblent
présenter une épenthèse pertinente pour l'analyse : coquetier2 et coquetière.
Le tableau ci-dessous permet de visualiser le traitement des quatorze unités de la
famille de coq, dont seules cinq parviennent jusqu'au second filtre.
(62)
Eliminés
Nombre de
dérivés
1
Indécis
8
Maintenus
5
Consonne
épenthésée
l
Code
explicatif
comp
Nombre de dérivés
concernés
1
l
Su
4
r
b
l
t
Su
3
B
2
1
1
2
t
Su, 9
3
Termes
coquelourde
coqueleux ; coqueliner ;
coquelet ; coqueleur
coquerelle ; coqueret
coquebin
coqueluche
coquetier2 ; coquetière
coquetier1 ; écoquetage ;
écoqueter
14
428
Chapitre 6 – De la base de données au corpus de travail
1.7.4. Bilan
Le sort de chacune 535 unités lexicales de la base de données initiale faisant l'objet
d'un traitement particulier est rappelé dans le tableau suivant :
(63)
A
B
C
D
E
G
H
K
comp mp 2a
2b
G
Cf
Su
0
0
0
1
1
3
0
1
6
9
3
7
9
140
51
1
6
226
1
0
1
0
0
0
0
0
2
0
0
0
8
8
2
0
1
19
1
23
0
0
8
9
2
7
50
0
0
8
0
0
0
0
0
8
4
0
2
2
12
11
0
0
31
total
3
rejetés
0
0
0
0
5
0
0
3
8
15
26
18
20
174
76
3
18
350
0
0
0
0
2
1
0
0
3
indé
indé
cis
cis
"B"
0
0
0
3
0
0
5
4
33
20
1
5
1
0
3
5
43
37
total
sorc
indé
ier
cis
0
0
0
3
0
0
0
9
0
55
4
11
0
1
0
8
4
87
P
2
0
3
6
32
9
0
0
52
main
main
tenus
tenus
"B"
0
1
2
0
0
0
0
0
21
5
9
0
3
0
3
0
38
6
0
0
0
0
2
0
0
0
2
total
main
tenus
3
2
3
6
60
18
3
3
98
Parmi les termes maintenus, certaines sous-catégories ont été identifiées au fur et à
mesure du traitement de la base de données. La section suivante rappelle ces sous-ensembles.
1.8. Codage des termes maintenus
Il est apparu au cours de l'examen des 859 termes de la base de données préalablement
rassemblée que certains dérivés étaient formés à partir de bases comportant une consonne à la
finale sans que ce soit celle de l'épenthèse, ou qu'ils renvoyaient à des noms de pays ou
d'habitants, possiblement issus de formation savante. Sans que ces précisions soient sources
de rejet, elles ont toutefois été encodées dans le corpus.
1.8.1. Position
Un P marque les termes pour lesquels la base présente une consonne dans la position
occupée par l'épenthèse, mais sans que cette consonne soit celle choisie par la dérivation.
Puisque ce n'est pas cette consonne qui est choisie, la consonne présente dans le mot construit
doit être considérée comme épenthétique.
Au total, 64 termes comportent cette indication P (dont 52 ne comportent que cette
seule indication), dont 4 font partie de la catégorie des indécis (ceux de la famille de sorcier).
60 termes sont donc maintenus avec indication de position (cf. section 1.3.5).
429
Chapitre 6 – De la base de données au corpus de travail
1.8.2. Formation savante : noms d'habitants et de pays
D'autres termes sont vraisemblablement de formation savante dans le corpus : la
graphie de lunaisien ou le sens très spécialisé de myrosine en sont des indices. Toutefois seuls
ont été indexés les noms de pays et surtout d'habitants, ceux-ci étant formés à l'aide de
suffixes particuliers sur lesquels je reviendrai en section 2.2.
(64)
noms d'habitants
Ha
bleu
14
noms de pays (suff-ie)
Hb
bleu
1
1.8.2.1. Nom de pays
Un nom de pays est recensé dans le corpus : Papousie, formé sur papou (origine D.).
Le code "Hb" est porté dans la colonne "code explicatif".
1.8.2.2. Noms d'habitants
Quatorze substantifs ont été codés "Ha" pour les identifier en tant que nombre
d'habitants. Parmi eux, un seul est d'origine orale (amalfitain), tous les autres sont issus de C.
Ils se répartissent, en fonction des suffixes à partir desquels ils sont dérivés, de la
manière suivante :
(65)
Suffixe
Nombre de
termes
concernés
-ain
6
-ais
4
-ois
4
Consonne
épenthésée
t
k
t
l
n
k
l
z
d
Nombre de
termes par
consonne
3
2
1
2
2
1
1
1
1
Dérivés
amalfitain ; arroutain ; broutain
pierrefeucain ; valéricain
samaritain
congolais ; togolais
javanais ; vinçanais
clamecycois
graylois
pouillyzois
spadois
14
430
Chapitre 6 – De la base de données au corpus de travail
1.9. Bilan au terme du premier filtre
Les 859 unités lexicales de la base de départ se répartissent au terme de ce premier
filtre de la manière suivante :
- 350 termes ont été définitivement rejetés, soit 40.75 % de l'ensemble ;
- pour 87 cas, soit 10.13 %, il n'a pas été possible de prendre une décision, ni pour leur
éviction ni en faveur de leur maintien ;
- 422 termes ont passé avec succès cette première étape de sélection, ce qui signifie que près
de la moitié (49.13 %) de la base de données initiale n'est pas rejetée par des critères
étymologiques ou allomorphiques ou du fait de la présence d'une consonne sous-jacente.
Parmi les 422 termes maintenus, certains ont pourtant été directement testés lors du
premier filtre, ce sont les 98 qui figurent dans le dernier tableau récapitulatif (cf. (63)). Quinze
autres sont référencés comme relatifs à des noms de peuples ou de pays par la mention des
codes Ha et Hb en regard de leur entrée dans le corpus (cf. section 1.8.2). Les 310 restants ne
comportent aucune mention particulière, puisqu'ils n'entrent dans aucune des catégories
répertoriées lors de ce premier "écrémage".
1.9.1. Bilan des méthodes de recueil
1.9.1.1. Récapitulatif des termes rejetés, indécis et maintenus
Le tableau suivant permet de visualiser, pour chaque source exploitée, le nombre de
termes qui ont été rejetés au terme de ce premier filtre, ceux pour lesquels aucune décision n'a
pu être prise, et ceux qui poursuivent leur chemin jusqu'au second filtre.
(66)
Méthode
de recueil
A.
B.
C.
D.
E.
G.
H.
K.
total
Nombre
termes
rejetés
15
26
18
20
174
76
3
18
350
Exemples
accoutrer
bagouler
calendrier
élancer
enfançon
aléatoire
pageoterie
infiniser
Nombre
termes
indécis
Exemples
0
3
0
9
55
11
1
8
87
louftingue
tâcheron
coquebin
sorcellerie
bretonnitude
tartelette
Nombre
termes
mainte
nus
6
35
30
65
121
110
20
35
422
Exemples
Total
banlieusard
berlurer
atlastique
canulardesque
agiotage
bambouseraie
cuirture
bedeaudaille
21
64
48
94
350
197
24
61
859
431
Chapitre 6 – De la base de données au corpus de travail
1.9.1.2. Evaluation du succès de chaque méthode
Le tableau suivant offre une vision synoptique de l'intérêt relatif de chaque source
dans la création du corpus à cette étape.
(67)
termes
taux dans
sélectionnés la bdd
A liste de 64.296 termes
21
2.44 %
B dictionnaires d'argot
64
7.45 %
C interrogation du TLFi
48
5.59 %
D articles
94
10.95 %
E étude des suffixes -ier, -age et
350
40.74 %
-erie
H dictionnaire des néologismes
25
2.91 %
K dictionnaire des mots sauvages
61
7.10 %
total sources écrites
663
77.18 %
G sources orales
196
22.82 %
total du corpus
859
100 %
type de source
termes
retenus
6
35
30
65
121
20
35
312
110
422
taux de taux dans
réussite le corpus
28.57 %
1.42 %
54.69 %
8.29 %
62.5 %
7.11 %
69.15 % 15.40 %
34.57 % 28.67 %
80 %
57.38 %
47.06 %
56.12 %
49.13 %
4.74 %
8.29 %
73.93 %
26.07 %
100 %
La colonne "taux de réussite" réfère au pourcentage de termes maintenus par rapport
aux termes de la base de donnée de départ, pour chacune des sources. Ceci permet d'évaluer la
pertinence de l'utilisation de chacune dans la composition d'un corpus portant sur l'épenthèse
consonantique.
Le taux de réussite le plus faible est enregistré par la première méthode d'extraction
exploitée, à savoir la recherche semi-automatique à partir de la liste de termes (A.) : elle a
perdu plus de 70 % de son effectif dès ce premier filtre. Sa part dans le corpus réduit de plus
de 40 % puisqu'elle passe de 2.44 % de la base de données de 859 mots à 1.42 % du corpus de
422 termes.
Le résultat à ce niveau de la création du corpus est à peine meilleur en ce qui concerne
la recherche par suffixe (E.) : plus de 65 % des unités lexicales ainsi obtenues sont dès à
présent rejetées, ce qui représente une perte importante pour le corpus puisqu'il s'agissait là de
sa source la plus prolifique. Son importance dans le corpus chute de 30 % au cours de ce
premier filtre (40.74 % des 859 mots, mais plus que 28.67 % des 422 termes).
La source la plus intéressante en termes de succès à ce niveau de la constitution du
corpus est le dictionnaire des néologismes, puisque 80 % de son effectif est maintenu, même
si sa part dans le corpus total est de moins de 5 %. Son succès se vérifie si l'on compare la
place de cette source dans la base de données (2.91 %) à sa place dans le corpus tel qu'il est
constitué après le premier filtre (7.74 %) : elle a pratiquement triplé (265.95 %).
432
Chapitre 6 – De la base de données au corpus de travail
Je ne commenterai pas davantage ce tableau étant donné que le corpus n'est pas encore
arrivé à sa phase finale. Il ne s'agit pour le moment que de tendances qui demandent à être
réévaluées après le deuxième filtre.
Avant de passer à cette deuxième étape de filtration du corpus, arrêtons-nous un
instant pour observer la composition des termes restants à ce niveau.
1.9.2. Composition des 422 termes maintenus dans le corpus
1.9.2.1. En fonction de la méthode de recueil du terme dans le corpus
Le tableau ci-dessous (reprenant une partie des informations fournies en section 1.9.1.)
récapitule le nombre de termes retenus pour chaque source d'extraction. On trouvera en
annexe 1a l'ensemble des 422 termes en regard de leur source, triés pour chacune en fonction
de la base puis de la consonne épenthésée supposée.
(68)
Méthode de recueil
A
B
C
D
E
H
K
liste de 64.296 termes
dictionnaires d'argot
interrogation du TLFi
articles
étude des suffixes -ier, -age et -erie
dictionnaire des néologismes
dictionnaire des mots sauvages
total sources écrites
G sources orales
total du corpus
termes
retenus
6
35
30
65
121
20
35
312
110
422
taux dans le
corpus
1.42 %
8.29 %
7.11 %
15.40 %
28.67 %
4.74 %
8.29 %
73.93 %
26.07 %
100 %
Exemples
banlieusard
berlurer
atlastique
canulardesque
agiotage
cuirture
bedeaudaille
bambouseraie
1.9.2.2. Tri en fonction de la base des dérivés
Les 422 unités lexicales correspondent à 254 bases différentes, de abri à Zola, dont on
trouvera le détail en annexe 1b.
1.9.2.3. Tri en fonction de la finale de la base
La finale de la base peut se révéler constituer un élément déclencheur dans l'apparition
d'une épenthèse consonantique, aussi est-il nécessaire d'évaluer dans quelle mesure n'importe
433
Chapitre 6 – De la base de données au corpus de travail
quel son peut se trouver à la gauche du suffixe, et si certains phonèmes sont prépondérants
dans cette position.
1.9.2.3.1. Et des bases elles-mêmes
Les termes sont ici présentés en fonction d'une part du dernier son précédant la
consonne épenthésée (ou supposée comme telle à l'issue du premier filtre), d'autre part de la
liste de chaque base accompagnée du nombre de termes dérivés pour chacune. On trouvera en
annexe 1c le détail pour chacun des 422 termes encore en lice.
(69)
Finale de
la base
Nombre
Termes
o
132
a
53
u
46
i
31
y
31
r
20
ø
18
&'
15
e
10
s
10
k
-'
9
7
6
Bases (nombre de termes associés)
noyau (6) ; biseau (4) ; boyau (4) ; escargot (4) ; indigo (4) ; numéro (4) ; piano (4) ;
tuyau (4) ; abricot (3) ; agio (3) ; cacao (3) ; fayot (3) ; Hugo (5) ; maquereau (3) ;
tableau (3) ; barreau (2) ; blaireau (2) ; domino (2) ; drapeau (2) ; glaviot (2) ; gogo (2)
; Janot (2) ; Marivaux (2) ; piau (2) ; pinceau (2) ; poireau (2) ; radio (2) ; silo (2) ;
sirop (2) ; terreau (2) ; beau (1) ; bedeau (1) ; biscoto (1) ; bobo (1) ; boucau (1) ;
bourreau (1) ; bureau (1) ; cadeau (1) ; canot (1) ; chaos (1) ; chapeau (1) ; Chicago (1)
; coco (1) ; Congo (1) ; échafaud (1) ; écho (1) ; esquimau (1) ; figaro (1) ; folio (1) ;
ghetto (1) ; gruau (1) ; hobereau (1) ; lingot (1) ; lolo (1) ; massicot (1) ; mélimélo (1) ;
miro (1) ; museau (1) ; myro (1) ; Othello (1) ; panneau (1) ; peau (2) ; pipeau (1) ; pogo
(1) ; psycho (1) ; rococo (1) ; ronéo (1) ; stabilo (1) ; tango (1) ; taraud (1) ; texto (1) ;
togo (1) ; yoyo (1) ; zéro (1)
miroi(r) (5) ; Gargantua (3) ; manga (3) ; média (3) ; caca (2) ; eczéma (2) ; gaga (2) ;
sida (2) ; alfa (1) ; alibaba (1) ; amiga (1) ; blabla (1) ; cra(sseux) (1) ; del Duca (1) ;
glagla (1) ; goujat (1) ; goya (1) ; gravats (1) ; hip hip hourra (1) ; java (1) ; kafka (1) ;
kola (1) ; lama (1) ; lambda (1) ; méga (1) ; noix (1) ; piapia (1) ; pyjama (1) ; roi (1) ;
saba (1) ; shunga (1) ; sofa (1) ; spa (1) ; tabac (1) ; tafia (1) ; vinça (1) ; vravra (1) ;
zola (1)
bijou (5) ; caoutchouc (5) ; glouglou (5) ; caillou (4) ; filou (3) ; marlou (3) ; bambou (2)
; clou (2) ; amadou (1) ; Arrou (1) ; bisu (1) ; Bou (1) ; Ceaucescu (1) ; flou (1) ; froufou
(1) ; glou (1) ; grigou (1) ; grisou (1) ; maou (1) ; Moscou (1) ; Papou (1) ; piou (1) ;
ripou (1) ; sagou (1) ; you (1)
catégorie (3) ; émeri (3) ; abri (2) ; chichi (2) ; abruti (1) ; amalfi (1) ; Barbie (1) ;
cambouis (1) ; chipie (1) ; Clamecy (1) ; coloris (1) ; dégourdi (1) ; génie (1) ; képi (1) ;
loft story (1) ; névralgie (1) ; phraséologie (1) ; pluie (1) ; Pouilly (1) ; puits (1) ;
Samarie (1) ; souris (1) ; sursis (1) ; Trotsky (1) ; Valéry (1)
cul (7) ; chahut (3) ; jus (3) ; recrue (3) ; tissu (3) ; bahut (2) ; berlue (1) ; bu(er) (1) ;
crapahut (1) ; grue (1) ; hurluberlu (1) ; morue (1) ; ONU (1) ; rue (1) ; têtu (1) ; tutu (1)
bazar (5) ; cauchemar (3) ; cafard (2) ; calor (2) ; caviar (2) ; escobar (2) ; canular (1) ;
cuir (1) ; homard (1) ; noir (1)
(z)yeux (5) ; queue (4) ; bleu (3) ; pieu (2) ; al(l)eu (1) ; banlieue (1) ; dieu (1) ; pierrefeu
(1)
faisan (4) ; fer-blanc (3) ; brelan (2) ; Dinant (2) ; arpent (1) ; bilan (1) ; cachiman (1) ;
cran (1)
pied (7) ; épopée (1) ; inapproprié (1) ; MRP (1)
gosse (2) ; taxe (2) ; atlas (1) ; centauresse (1) ; masse (1) ; taxus (1) ; tennis (1) ; vice
(1)
coq (5) ; brique (4)
Cambrai (2) ; gilet (2) ; déchet (1) ; Gray (1) ; harnais (1)
rein (2) ; brin (1) ; coin (1) ; combien (1) ; pain (1)
434
Chapitre 6 – De la base de données au corpus de travail
f
n
l
1
<
ç'
3
m
j
p
t
23 sons
3
2
1
1
422
6
5
5
4
4
caf(ard) (3) ; caf(é) (2) ; faffe (1)
graine (2) ; chaîne (1) ; lune (1) ; tan (1)
pelle (1) ; table (2) ; buffle (1) ; musel(er) (1)
souche (3) ; porche (1)
verge (3) ; asperge (1)
biberon (1) ; cochon (1) ; con (1)
ferm(er) (1) ; macadam (1) ; médium (1)
feuille (1) ; taill(er) (1)
pap(ier) (1)
adulte (1)
Cent trente-deux termes sur 422 sont formés à partir de bases se terminant par le son
[o], ce qui représente plus de 30% de l'ensemble alors que 23 sons différents sont possibles
dans cette position, ce qui correspondrait à une moyenne d'environ 18 termes par son (environ
4.27 % de dérivés pour chacun dans le corpus). Se situent également au-dessus de cette
moyenne théorique les sons [a] (53 mots construits, 12.56 % de l'ensemble), [u] (46 unités
lexicales, 10.90 %), [i] et [y] (31 items chacun, soit 7.35 %), et [r] (20 termes, 4.74 %). [ø] est
quant à lui exactement dans la moyenne.
Deux tendances se dégagent ici, qui seront à vérifier dans la version finale du corpus.
Tout d'abord, peu de bases se terminant par une consonne sont suivies par une épenthèse
consonantique (70 sur 422, soit 16.6 % pour 12 sons différents sur 23), et la plupart de ces
consonnes finales concernent peu de termes. Seul [r] semble pouvoir être classé parmi les
"gros déclencheurs".
Un second point est à souligner ici : les voyelles en fin de base qui sont corrélées à la
présence d'une consonne épenthétique sont majoritairement arrondies, comme le tableau
suivant le met en exergue :
(70)
Voyelles arrondies en finale de base
132
o
46
u
31
y
18
ø
15
&'
3
ç'
245
Voyelles non arrondies en finale de base
31
i
10
e
7
6
-'
total
54
53
a
107
435
Chapitre 6 – De la base de données au corpus de travail
Le résultat varie du simple au double selon que la voyelle finale est arrondie ou pas.
Cette tendance qui apparaît à cette étape de la création du corpus devra être vérifiée à l'issue
du second filtre : la nature de la voyelle précédant l'épenthèse détermine-t-elle la présence de
celle-ci ?
1.9.2.3.2. Et de la consonne épenthésée
Le détail de ce tri figure en annexe 1d. Le tableau ci-dessous permet son évaluation
quantitative.
(71)
Finale de la base
Nombre de termes associés à la
finale de la base
o
132
a
53
u
46
i
31
y
31
r
20
ø
18
&'
15
e
10
s
10
Consonne épenthésée (nombre de
termes associés)
t (113)
d (11)
l (4)
z (2)
n (1)
r (1)
t (39)
n (5)
l (3)
z (2)
b (1)
d (1)
g (1)
s (1)
t (39)
z (5)
l (1)
v (1)
t (12)
z (13)
k (3)
l (1)
n (1)
s (1)
t (26)
z (2)
d (1)
l (1)
r (1)
d (17)
z (2)
t (1)
t (14)
z (3)
k (1)
d (8)
t (7)
t (9)
n (1)
t (5)
436
Chapitre 6 – De la base de données au corpus de travail
k
9
-
7
-'
6
f
6
n
5
l
5
1
4
<
4
ç'
3
m
3
j
2
p
t
1
1
422
l (4)
d (1)
t (9)
t (3)
z (2)
1 (1)
l (1)
t (5)
d (1)
t (5)
l (1)
t (3)
z (2)
t (5)
t (3)
z (1)
t (3)
r(1)
s (2)
d (1)
n (1)
t (1)
z (1)
t (1)
d (1)
t (1)
n (1)
Il ne semble pas que l'on puisse faire un lien entre la finale de la base et la nature de la
consonne épenthésée. En effet, il n'y a pas d'adéquation entre un type de son final de base et
une consonne épenthétique particulière, la distribution semble aléatoire et correspond en fait à
ce qui est statistiquement attendu du fait de la prépondérance du [t] et des coronales en
général dans les consonnes épenthésées.
L'épenthèse consonantique sous intérêt apparaît à une frontière morphologique dont on
vient d'étudier l'impact possible de la marge gauche. Le pendant de cette attitude est
d'observer ce qui est présent à la frontière droite lorsque l'on constate une épenthèse.
1.9.2.4. Tri en fonction de l'initiale du suffixe
Peut-on observer là encore une prépondérance des voyelles arrondies dans le contexte
immédiat de la consonne épenthésée, ou est-ce une autre tendance qui se dégage en regard de
la frontière droite de l'épenthèse ?
437
Chapitre 6 – De la base de données au corpus de travail
1.9.2.4.1. Et du suffixe
Le tableau ci-dessous présente les résultats du tri des termes en fonction de l'initiale du
suffixe, puis des suffixes eux-mêmes. On en trouvera la version exhaustive en annexe 1e.
(72)
Initiale du
suffixe
e
j
a
"
i
Nombre de
termes
Suffixe
Nombre de
termes
er
108
é
13
ée
éen
1
1
ier
49
ière
9
ien
4
ième
1
age
36
aille
4
ard
4
ation
4
able
al
asse
1
1
1
erie
32
ement
11
elet
eraie
2
1
ique
14
iser
6
ine
4
123
63
51
46
38
Consonne
épenthésée
t
d
z
n
S
r
t
z
d
s
t
t
t
d
v
z
t
z
l
t
t
d
z
t
d
z
l
t
z
z
t
z
t
d
t
d
z
t
d
l
s
t
z
t
n
t
l
r
t
Nombre de
termes
85
12
7
2
1
1
9
2
1
1
1
1
39
8
1
1
9
3
1
1
31
4
1
2
1
1
2
1
1
3
1
1
1
1
24
5
3
8
1
1
1
2
1
13
1
4
1
1
2
Exemple
dépiauter
bazarder
caloriser
adultiner
harnacher
berlurer
abricoté
empochézé
barreaudé
enképissé
yeutée
sabatéen
alfatier
taxaudier
amadouvier
marlousier
cacaotière
cambrésien
hugolien
combientième
dépiautage
barreaudage
émerisage
bijoutaille
bedeaudaille
bleusaille
faflard
queutard
banlieusard
calorisation
numérotation
catégorisable
soucutal
biberondasse
bijouterie
boyauderie
lamaserie
abritement
bazardement
gargantualement
hiphipourrassement
dieutelet
bambouseraie
atlastique
médiumnique
eczématiser (s')
abrutiliser
ghettoriser
abricotine
438
Chapitre 6 – De la base de données au corpus de travail
-
34
œ
21
ø
14
-'
y
w
isme
6
ir
2
ie
if
ille
iner
is
ite
1
1
1
1
1
1
esque
24
ais
4
aire
3
aie
esse
ette
1
1
1
eur
21
eux
13
euse
1
ain
6
in
3
ure
5
ude
1
ois
5
oire
1
ant
3
ot
2
eau
1
9
7
6
&'
3
o
3
t
3
té
3
+
+'
1
1
422
otte
on
1
1
422
z
t
t
z
z
t
d
t
t
z
t
l
n
d
b
l
n
t
l
r
t
n
t
d
t
d
n
z
t
k
t
l
t
d
t
k
d
l
z
t
z
2
6
1
1
1
1
1
1
1
1
13
4
3
2
1
2
2
2
1
1
1
1
20
1
10
2
1
1
4
2
2
1
4
1
1
2
1
1
1
1
2
cambrésine
gagatisme
glougloutir
beausir
papousie
taxatif
brindille
piétiner
cailloutis
halloysite
cacatesque
ceaucesculesque
amiganesque
canulardesque
alibababesque
congolais
javanais
moscoutaire
tissulaire
aspergeraie
têtutesse
barbinette
agioteur
bazardeur
cafeteux
cafardeux
biscotonneux
émeriseuse
amalfitain
pierrefeucain
piétin
gosselin
cuirture
noirdure
dégourditude
clamecycois
spadois
graylois
pouillysois
cacatoire
loftstorysant
t
l
z
d
s
z
l
t
1
1
1
1
2
1
1
1
422
glougloutant
gosselot
queusot
faisandeau
cochonceté
faucuseté
masselotte
piéton
La tendance inverse à celle observée pour les voyelles finales de base s'observe ici :
les voyelles corrélées à une épenthèse sont cette fois-ci les voyelles antérieures, dans une
proportion encore plus marquée que les voyelles postérieures dans le cas précédent.
439
Chapitre 6 – De la base de données au corpus de travail
(73)
Voyelles non arrondies en début de suffixe
123
e
63
j
51
a
46
"
38
i
34
9
-'
364
Voyelles arrondies en début de suffixe
21
œ
14
ø
7
y
6
w
3
&'
3
o
1
+
1
+'
56
86.26 % des épenthèses consonantiques se situent devant une voyelle non arrondie. Si
cette forte tendance se confirme dans le corpus final, il ne sera pas possible d'écarter ce
paramètre du conditionnement d'apparition des consonnes entre radical et suffixe.
1.9.2.4.2. Et de la consonne épenthésée
Le détail pour chacun des dérivés figure en annexe 1f. Le tableau suivant permet la
visualisation quantitative des consonnes étudiées en regard de l'initiale du suffixe suivant.
(74)
Initiale suffixe
Nombre de termes
e
123
j
63
a
51
"
46
i
38
C épenthésée
t
d
z
n
r
s
S
t
d
z
l
v
t
z
d
l
t
d
z
l
s
t
z
d
Nombre de termes
96
13
9
2
1
1
1
48
8
4
1
1
36
7
6
2
34
6
4
1
1
29
5
1
Exemple
abriter
bazarder
caloriser
adultiner
berlurer
enképissé
harnacher
abricotier
bazardier
cambrésien
hugolien
amadouvier
agiotage
calorisation
barreaudage
faflard
bijouterie
boyauderie
lamaserie
gargantualement
hiphipourrassement
atlastique
cambrésine
brindille
440
Chapitre 6 – De la base de données au corpus de travail
-
34
œ
21
ø
14
-'
9
y
6
w
6
&'
3
o
3
t
3
+'
+
1
1
422
l
n
r
t
l
n
d
b
g
r
t
d
t
d
n
z
t
k
l
t
d
k
d
l
t
z
z
t
d
l
z
s
z
t
l
1
1
1
16
7
6
2
1
1
1
20
1
10
2
1
1
6
2
1
5
1
2
1
1
1
1
2
1
1
1
1
2
1
1
1
422
abrutiliser
médiumnique
ghettoriser
cacatesque
ceaucesculesque
amiganesque
canulardesque
alibababesque
mangagesque
aspergeraie
agioteur
bazardeur
cafeteux
cafardeux
biscotonneux
émeriseuse
amalfitain
pierrefeucain
gosselin
cuirture
noirdure
clamecycois
spadois
graylois
cacatoire
pouillysois
loftstorysant
glougloutant
faisandeau
gosselot
queusot
cochonceté
faucuseté
piéton
masselotte
De même que pour le rapport entre le son final de la base et la nature de la consonne
épenthésée, on ne peut rien conclure de la mise en parallèle de l'initiale du suffixe et de la
consonne sous intérêt. Là encore, on trouve dans tous les cas une majorité de [t] quel que soit
le son suivant l'épenthèse, aussi peut-on supposer à ce stade de l'élaboration du corpus que la
nature de la consonne épenthésée est indépendante des sons qui l'entoure.
1.9.2.5. Tri en fonction de la consonne épenthésée
La consonne la plus épenthésée en français comme dans de nombreuses autres langues
est [t], consonne coronale prototypique. Le tableau suivant (détail en annexe 1g) confirme
ceci dans le contexte spécifique de la frontière morphologique entre radical et suffixe. De
plus, c'est la classe entière des coronales qui est plébiscitée puisque seuls 7 termes sur 422
441
Chapitre 6 – De la base de données au corpus de travail
présentent une épenthèse autre, dont 5 de vélaires, qui est considérée comme le second lieu
d'articulation le moins marqué après les coronales (et les glottales, cf. partie I [5]).
(75)
Consonne
épenthésée
t
d
z
l
n
k
s
r
1
b
A
v
Nombre de
termes
304
42
35
16
10
4
4
3
1
1
1
1
422
Termes
abriter ; abricotier ; agiotage ; bijouterie ; agioteur ; cacatesque ; atlastique...
barreaudage ; bedeaudaille ; biberondasse ; barreaudé ; faisandeau ; bazarder...
caloriser ; calorisation ; cambrésien ; lamaserie ; cambrésine ; emporchézé...
tissulaire ; congolais ; gargantualement ; ceaucesculesque ; hugolien...
javanais ; vinçanais ; adultiner ; amiganesque ; barbinette ; biscotonneux...
pierrefeucain ; valéricain ; clamecycois ; souriquois
cochonceté ; conceté ; enképissé ; hipipourassement
aspergeraie ; berlurer ; ghettoriser
harnacher
alibababesque
mangagesque
amadouvier
Un autre critère, morphologique cette fois, peut encore être envisagé : la catégorie
lexicale, de la base comme du dérivé.
1.9.2.6. Tri en fonction de la catégorie lexicale
1.9.2.6.1. De la base puis de celle du dérivé
Le relevé de chacun des termes figure en annexe 1h, il ne sera fait mention ici que de
l'évaluation quantitative de ce tri.
Du fait que plusieurs catégories de bases, et parfois de dérivés, sont possibles (cf.
section 2 de ce même chapitre), chacune a été distinguée par une entrée différente. Le nombre
de dérivés n'est donc pas ici de 422 mais de 453. Par ailleurs, les sigles de type ONU ou SIDA
ont été répertoriés parmi les substantifs (l'Onu, le sida) et certains termes (méga, lambda, etc.)
n'ont pas d'indication de base, celle-ci n'étant pas aisément identifiable. En outre ne seront
considérées comme bases en noms propres que les séquences non attestées en tant que
substantifs ; escobar ou figaro sont certes issus de noms de personnes mais ils sont attestés en
tant que substantifs et seront donc préférentiellement considérés comme tels, au contraire de
Marivaux par exemple pour lequel le substantif *marivaux n'existe pas. Enfin, tous les
participes (présents et passés) ont été classés en adjectifs car c'est précisément ce classement
en dehors de la classe verbale qui leur a valu d'être maintenus en entrées indépendantes (cf.
section 2 de ce même chapitre pour une réévaluation de ces termes).
442
Chapitre 6 – De la base de données au corpus de travail
Ont été maintenues comme catégories pour la base non pas celles proposées par les
dictionnaires mais celles supposées par défaut. Ainsi pour agioteur, ce n'est pas agioter qui a
été considéré comme base mais agio, tant que l'étude des suffixes (section 2 de ce chapitre)
n'aura pas déterminé précisément la base. Je rappelle les réserves quant au classement
proposé, du fait qu'il porte sur une étape intermédiaire de création du corpus et non sur le
corpus final.
(76)
Cat lex base
incertaine
incertaine
Nb termes
4
1
Cat lex dérivé
ADJ
V
N
N
NP
360
Nb termes
4
1
190
C épenthésée
t
t
t
d
z
l
s
n
r
v
t
d
z
n
r
1
l
t
z
d
n
l
b
A
k
s
t
l
Nb termes
4
1
148
17
15
5
2
1
1
1
86
12
6
2
2
1
1
40
6
4
4
2
1
1
1
1
10
7
V
110
ADJ
60
ADJ
28
k
n
3
3
24
z
d
t
z
d
3
2
8
5
4
55
N
Exemple
lambdatique
psychoter
abritement
barreaudage
bambouseraie
faflard
cochonceté
barbinette
aspergeraie
amadouvier
dépiauter
barreaudé
caloriser
adultiner
berlurer
harnacher
abrutiliser
abricoté
catégorisable
biberondasse
amiganesque
sofalesque
alibababesque
mangagesque
souriquois
enképissé
broutain
ceaucesculesq
ue
clamecycois
gargantuanes
que
cambrésien
canulardesque
amalfitain
cambrésien
marivaudage
443
Chapitre 6 – De la base de données au corpus de travail
ADJ
V
2
k
l
n
d
t
ADV
1
l
1
t
z
d
s
t
l
n
z
n
t
t
d
t
14
2
1
1
5
1
1
1
1
1
2
2
1
N
18
V
8
ADJ
2
28
V
4
N
4
ADV
1
453
N
1
3
2
2
1
1
clamecycois
congolais
javanais
marivauder
othellotiser
(s')
gargantualem
ent
bleuterie
bleusaille
noirdure
conceté
bleuter
abrutiliser
adultiner
beausir
médiumnique
crapoteux
fermeture
buandier
combientième
Les dérivés présentant des épenthèses sont majoritairement formés à partir de
substantifs : 360 mots construits sur 453, soit 79.47 % pour cette seule classe. Si on la
regroupe avec les noms propres, on arrive même à 415 dérivés, soit plus de 91 %. Ceci ne
laisse que peu de place aux constructions à base adjectivale (28 dérivés, 6.18 %), verbale (4
termes, 0.88 %) ou adverbiale (un seul dérivé, 0.22 %).
1.9.2.6.2. Du dérivé puis de celle de la base
Le détail du classement pour chaque dérivé se trouve en annexe 1i. Le tableau cidessous en récapitule les résultats.
(77)
Cat lex dérivé
N
Nb termes
235
Cat lex base
Nb termes
N
189
NP
23
C épenthésée
t
d
z
l
s
n
r
v
t
Nb termes
147
17
15
5
2
1
1
1
8
Exemple
abritement
barreaudage
bambouseraie
faflard
cochonceté
barbinette
aspergeraie
amadouvier
amalfitain
444
Chapitre 6 – De la base de données au corpus de travail
V
ADJ
18
V
4
ADV
1
N
111
ADJ
8
NP
2
122
1
ADJ
ADV
NP
N
60
NP
28
ADJ
2
NP
NP
4
1
1
94
1
1
453
d
z
k
l
n
t
z
d
s
t
d
t
t
d
z
n
r
1
l
t
l
n
z
d
t
t
t
z
d
n
l
b
A
k
s
t
l
k
n
z
d
n
t
t
l
z
4
4
3
2
2
14
2
1
1
2
2
1
87
12
6
2
2
1
1
5
1
1
1
1
1
1
40
6
4
4
2
1
1
1
1
10
7
3
3
3
2
1
1
4
1
1
dinanderie
cambrésien
clamecycois
congolais
javanais
bleuterie
bleusaille
noirdure
conceté
fermeture
buandier
combientième
abriter
barreaudé
caloriser
adultiner
berlurer
harnacher
abrutiliser
bleuter
abrutiliser
adultiner
beausir
marivauder
othellotiser (s')
psychoter
abricoté
catégorisable
biberondasse
amiganesque
sofalesque
alibababesque
mangagesque
souriquois
enképissé
broutain
ceaucesculesque
clamecycois
gargantuanesque
cambrésien
canulardesque
médiumnique
crapoteux
lambdatique
gargantualement
papousie
445
Chapitre 6 – De la base de données au corpus de travail
Ce sont là encore les substantifs qui tirent leur épingle du jeu, mais en tant que dérivés
cette fois, et de façon plus modérée qu'en tant que base : le corpus contient 235 substantifs
(51.87 %), 122 verbes (26.93 %), 94 adjectifs (20.75 %), un adverbe et un nom propre
(0.22 %).
Ces résultats doivent toutefois être mis en relation avec la proportion de substantifs,
verbes et adjectifs dans l'ensemble du vocabulaire français.
Un autre critère possible de déclenchement de l'épenthèse est la taille du radical : les
épenthèses sont-elles liées à des radicaux courts, de façon à atteindre une taille minimum de
dérivé requise par la langue ?
1.9.2.7. Tri en fonction de la taille du radical
La taille du radical sera corrélée tout d'abord avec la base, puis avec la consonne
épenthésée.
1.9.2.7.1. Puis de la base
En annexe 1j figure le tri détaillé des termes en fonction de la taille du radical et de la
base associée à chacun. Le tableau suivant en donne un aperçu par base ; il est classé par ordre
décroissant du nombre de termes par taille de radical.
446
Chapitre 6 – De la base de données au corpus de travail
Nb termes par
base
Nombre de
bases
Nombre de
termes
Taille du
radical
(78)
6
5
4
3
2
2
245
145
1
1
104
58
7
5
4
3
2
1
3
64
41
5
4
3
2
1
4
7
5
5
2
422
2
254
3
1
1
Base
noyau
bazar ; bijou ; glouglou ; hugo ; miroi(r)
biseau ; boyau ; caillou ; faisan ; piano ; tuyau
agio ; cauchemar ; chalut ; émeri ; fayot ; fer-blanc ; filou ; manga ; maquereau
; marlou ; média ; recrue ; tableau ; tissu
abri ; bahut ; bambou ; barreau ; blaireau ; brelan ; cafard ; calor ; caca ;
Cambrai ; caviar ; chichi ; Dinant ; drapeau ; gaga ; gilet ; glaviot ; gogo;
Janot ; pinceau ; poireau ; radio ; sida ; silo ; sirop ; terreau
adulte ; al(l)eu ; alfa ; arpent ; arrou ; atlas ; banlieue ; Barbie ; bedeau ;
berlue ; biberon ; bilan ; bisou ; blabla ; bobo ; boucau ; bourreau ; bureau ;
cadeau ; cambouis ; canot ; chaos ; chapeau ; chipie ; clamecy ; cochon ; coco ;
combien ; congo ; déchet ; écho ; folio ; froufrou ; génie ; ghetto ; glagla ;
goujat ; goya ; gravats ; grigou ; grisou ; gruau ; Halloy ; harnais ; hobereau ;
homard ; java ; kafka ; képi ; kola ; lama ; lambda ; lingot ; lolo ; maou ;
médium ; méga ; miro ; morue ; moscou ; museau ; musel(er) ; myro ; panneau ;
papou ; piapia ; pierrefeu ; pipeau ; pogo ; pouilly ; psycho ; ripou ; ronéo ;
saba ; sagou ; shunga ; sofa ; souris ; sursis ; tabac ; tafia ; tango ; taraud ;
taxus ; tennis ; têtu ; texto ; togo ; trotski ; tutu ; vinça ; vravra ; yoyo ; zéro ;
zola
pied ; cul
coq ; (z)yeux
brique ; queue
bleu ; caf(ard) ; jus ; souche ; verge
caf(é) ; clou ; gosse ; graine ; peau ; piau ; pieu ; rein ; table ; taxe
beau ; brin ; brou ; bu(er) ; buffle ; chaîne ; coin ; con ; cra(sseux) ; cran ; cuir
; dieu ; faffe ; ferm(er) ; feuille ; flou ; glou ; gray ; grue ; lune ; masse ; noir ;
noix ; pain ; pap(ier) ; pelle ; piou ; pluie ; porche ; puits ; roi ; rue ; spa ;
taill(er) ; tan ; vice ; you
caoutchouc
escargot ; indigo ; numéro
abricot ; cacao ; Gargantua
domino ; eczéma ; escobar ; Marivaux
abruti ; amadou ; amalfi ; Amiga ; biscoto ; cachiman ; canular ; Ceaucescu ;
centauresse ; chicago ; coloris ; crapahut ; dégourdi ; Del duca ; échafaud ;
épopée ; esquimau ; figaro ; loft story ; macadam ; massicot ; MRP ; névralgie ;
ONU ; Othello ; pyjama ; rococo ; samarie ; stabilo ; valéry
catégorie
alibaba ; hip hip hourra ; hurluberlu ; mélimélo
inapproprié ; phraséologie
Contrairement à l'hypothèse précédemment formulée, ce ne sont pas les radicaux les
plus courts qui font appel à l'épenthèse lors de la dérivation. Ce sont les bisyllabes qui sortent
grands vainqueurs : 245 termes sont formés à partir de radicaux de deux syllabes, soit 58 %
du corpus, ce qui se retrouve au niveau des bases concernées : 145 sur 254 au total, soit 57 %.
Viennent ensuite les monosyllabes, qui ne représentent qu'un peu moins d'un quart des
radicaux impliqués dans le phénomène de l'épenthèse à la dérivation suffixale.
447
Chapitre 6 – De la base de données au corpus de travail
Les radicaux de trois syllabes et plus sont également représentés : 17.3 % du corpus
leur sont dévolus.
Ces résultats devront faire l'objet d'un double contrôle : d'une part à l'issue du
traitement complet du corpus, c'est-à-dire après le deuxième filtre, d'autre part en fonction de
la composition du lexique français en termes de taille des radicaux, si tant est qu'une telle
estimation soit possible.
Etant donné qu'aucun critère n'a encore pu être corrélé à la nature de la consonne
épenthésée, pourquoi ne pas tester si la taille du radical aurait une quelconque influence ?
1.9.2.7.2. Puis de la consonne épenthésée
Le détail de ce traitement se trouve en annexe 1k, le tableau suivant permet d'en
apprécier les résultats au moyen d'un exemple pour chacun.
448
Chapitre 6 – De la base de données au corpus de travail
(79)
Taille du radical
Nombre de termes
2
245
1
104
3
64
4
7
5
2
Consonne épenthésée
t
d
z
l
n
k
r
s
1
A
t
z
l
d
s
t
d
z
l
n
k
v
z
t
b
s
t
z
Nombre de termes
174
31
19
6
6
3
3
2
1
1
84
7
6
5
1
43
6
5
4
4
1
1
3
2
1
1
1
1
Exemple
abritement
barreaudage
bambouseraie
congolais
adultiner
clamecycois
berlurer
cochonceté
harnacher
mangagesque
bleuter
beausir
faflard
brindille
conceté
abricoté
canulardesque
colorisation
abrutiliser
amiganesque
valéricain
amadouvier
catégorisable
hurluberluterie
alibababesque
hipipourassement
inappropriétisme
phraséologisé
422
Il ne s'agit de toute évidence pas encore du bon critère de détermination de la qualité
de la consonne épenthétique : [t] est toujours majoritaire, quelle que soit la taille du radical
auquel il est adjoint. Seule exception : les radicaux de quatre syllabes semblent préférer [z] à
[t], mais la différence entre les deux est minimale et sera peut-être gommée, voire inversée, à
l'issue du traitement complet du corpus.
Le dernier critère envisagé est le suffixe lui-même : certains suffixes sont-ils aptes à
déclencher une épenthèse au contraire de certains autres, ou tous sont-ils égaux face à
l'épenthèse ?
449
Chapitre 6 – De la base de données au corpus de travail
1.9.2.8. Tri par suffixe
Ainsi que l'illustre le tableau ci-dessous, certains suffixes sont particulièrement
associés au phénomène de l'épenthèse consonantique, au contraire d'autres. On trouvera en
annexe 1l ces suffixes classés par ordre alphabétique avec la liste exhaustive des dérivés
concernés, et en annexe 1m, pour chaque suffixe, un tri en fonction de la nature de la
consonne épenthésée.
(80)
Suffixe
er
ier
age
erie
esque
eur
é
eux
ique
ement
ière
ain
ure
iser
ois
isme
aille
ais
ard
ation
ien
ine
aire
ant
in
té
elet
ir
ot
able
al
asse
eau
ée
éen
eraie
esse
ette
euse
ie
ième
if
ille
Nombre
termes
108
49
36
32
24
21
13
13
13
11
8
6
5
6
5
5
4
4
4
4
4
4
3
3
3
3
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Exemples de termes
abriter ; bazarder ; caloriser ; adultiner ; berlurer ; harnacher
abricotier ; al(l)eutier ; bazardier ; boyaudier ; amadouvier ; marlousier
dépiautage ; barreaudage ; émerisage
bijouterie ; bleuterie ; boyauderie ; dinanderie ; lamaserie ; marlouserie
cacatesque ; ceaucesculesque ; amiganesque ; canulardesque ; alibababesque
agioteur ; biseauteur ; blaireauteur ; bazardeur
abricoté ; bijouté ; phraséologisé ; emporchézé ; barreaudé ; enképissé
cafeteux ; caillouteux ; cafardeux ; cauchemardeux ; biscotonneux
atlastique ; bureautique ; caoutchoutique ; médiumnique
abritement ; glougloutement ; bazardement ; gargantualement ; hipipourassement
cacaotière ; cafetière ; coquetière ; escargotière ; giletière ; lolotière ; rutière
amalfitain ; arroutain ; broutain ; samaritain ; pierrefeucain ; valéricain
cuirture ; fermeture ; vergeture ; yeuture ; noirdure
eczématiser (s') ; médiatiser ; othellotiser (s') ; radiotiser ; abrutiliser ; ghettoriser
clamecycois ; souriquois ; spadois ; graylois ; pouillyzois
gagatisme ; gogotisme ; inappropriétisme ; janotisme ; médiatisme
bijoutaille ; bedeaudaille ; bleusaille
congolais ; togolais ; javanais ; vinçanais
queutard ; banlieusard ; faflard ; vicelard
calorisation ; catégorisation ; colorisation ; numérotation
cambrésien ; lunaisien ; onusienne ; hugolien
abricotine ; indigotine ; cambrésine ; myrosine
moscoutaire ; sursitaire ; tissulaire
loftstorysant ; trotskisant ; glougloutant
piétin ; tableautin ; gosselin
cochonceté ; conceté ; faucuseté
dieutelet ; roitelet
glougloutir ; beausir
gosselot ; queusot
catégorisable
soucutal
biberondasse
faisandeau
yeutée
sabatéen
bambouseraie
têtutesse
barbinette
émeriseuse
papousie
combientième
taxatif
brindille
450
Chapitre 6 – De la base de données au corpus de travail
iner
is
ite
oire
on
otte
ude
50 suffixes
1
1
1
1
1
1
1
422
piétiner
cailloutis
halloysite
cacatoire
piéton
masselotte
dégourditude
Le suffixe -er est de loin le plus représenté avec 108 termes sur 422 (soit 25.59 %),
suivi des suffixes -ier (49 mots, 11.61 %), -age (36 dérivés, 8.53 %), -erie (32 éléments,
7.58 %) et -esque (24 mots, 5.69 %). Ces résultats sont cependant en partie biaisés par les
méthodes de recueil, notamment la recherche directe par certains de ces suffixes et
l'exploitation d'un article de Plénat & al (2002) sur les néologismes en -esque. Il conviendra
donc de reconsidérer ces résultats une fois le deuxième filtre effectué, et en gardant à l'esprit
cette réserve.
Par ailleurs, le nombre de terminaisons s'est réduit drastiquement : de 89 dans les 859
termes ne restent que 50 suffixes dans le corpus de 422 dérivés.
1.10. Conclusion de la section
Le passage des 859 séquences de la base de données brute aux 422 séquences retenues
à l'issue de ce premier filtre, faisant intervenir l'étymologie des dérivés comme celle des
bases, permet d'entrevoir certaines tendances : la nature des segments immédiatement
adjacents à la consonne sous intérêt semble pertinente ; la catégorie lexicale des bases comme
des dérivés peut également jouer un rôle ; en revanche, la taille du radical n'a apparemment
pas de rôle à jouer, contrairement à ce que l'intuition aurait indiqué, dans l'apparition d'une
épenthèse (cf. chapitre 7 de cette partie II pour des résultats à partir d'un questionnaire) ;
enfin, la nature de la consonne épenthésée apparaît réfractaire à tout conditionnement.
Comme il l'a été plusieurs fois indiqué dans cette dernière section, les résultats qui semblent
se dégager à l'issue de ce premier filtre doivent être vérifiés dans le corpus définitif.
Celui-ci ne sera obtenu qu'après un examen attentif des suffixes impliqués dans la
dérivation, ce qui sera l'objet de la seconde étape de traitement des dérivés, explicitée dans la
section suivante.
451
Chapitre 6 – De la base de données au corpus de travail
2. Deuxième filtre : les écueils de la morphologie dérivationnelle française qu'est-ce qui est dérivé de quoi ?
Ce deuxième filtre porte sur l'examen de chacun des 50 suffixes identifiés dans les
dérivés à l'issue du premier filtre. Il s'agira d'établir s'il s'agit bien du suffixe supposé, en
fonction du type de base auquel celui-ci est réputé s'adjoindre et surtout des signifiés, celui du
suffixe comme celui du dérivé considéré (cf. chapitre 4 section 3.6 pour une brève discussion
concernant la compositionalité du sens des dérivés par rapport aux signifiés de leurs
composants). Cette section s'appuiera sur les données de plusieurs références en matière de
lexicologie du français, du fait que je ne suis pas spécialisée dans ce domaine et n'ai donc pas
les compétences pour évaluer les différentes propositions offertes pour chaque suffixe. Je ne
prétendrai donc ici nullement prendre parti pour une analyse plutôt qu'une autre et ne me
positionnerai qu'en tant qu'usagère des analyses proposées. S'il existe ne serait-ce qu'une
analyse mettant en doute la formation d'un dérivé à l'aide d'une épenthèse consonantique,
j'exclurai ce dérivé de l'ensemble des termes maintenus. Cette position sera illustrée tout au
long de la section et se traduira par le rejet de 260 séquences du corpus, ne laissant après le
deuxième filtre que 259 dérivés dont la fiabilité sera renforcée.
Les termes qui auront changé de catégorie à l'issue de leur passage par ce second filtre
seront identifiés dans le corpus final par une encoche dans une colonne particulière baptisée
"2ème tour".
Pour faciliter le cheminement du lecteur dans le dédale des suffixes abordés, un
regroupement est proposé en 7 rubriques, les premières axées sur le sens et les secondes sur la
catégorie lexicale : les suffixes diminutifs seront abordés en premier, suivis par les suffixes
ethniques et les suffixes scientifiques ; seront ensuite présentés les suffixes purement
adjectivaux, nominaux, "mixtes" et verbaux, étant entendu que ce classement ne tient compte
que de leur emploi dans les dérivés du corpus.
452
Chapitre 6 – De la base de données au corpus de travail
2.1. Suffixes diminutifs
2.1.1. -eau
Le suffixe -eau permet de former des substantifs diminutifs à partir de substantifs17
(Apothéloz 2002 : 78, Corbin 1987 : 239 ; 662, Dubois & Dubois-Charlier 1999 : 191 ; 194 ;
198-199) : renardeau sur renard, sapineau sur sapin. L'unité lexicale faisandeau du corpus
correspond à ce paradigme et comporte donc bien une épenthèse de [d] ; elle est donc
maintenue dans le corpus à l'issue de ce second filtre.
2.1.2. -(el)et(te)
Deux termes dans le corpus se terminent par -elet (dieutelet, roitelet).
Corbin (1987 : 239) présente le suffixe -elet comme la concaténation des deux suffixes
diminutifs -eau et -et. Apothéloz (2002 : 78) préfère considérer un seul suffixe en -elet.
Dubois & Dubois-Charlier analysent -et et -elet comme les variantes d'un même morphème à
valeur atténuative, sans se prononcer quant à leur distribution.
Quelle que soit l'hypothèse de formation retenue, elle n'affecte en rien l'initiale du
suffixe -eau ou -elet, ce qui signifie que le [t] présent dans dieutelet et roitelet est bien
épenthétique et que ces deux termes doivent donc figurer dans le corpus.
Considérons maintenant le terme barbinette, seule trace dans le corpus du suffixe au
féminin. La consonne éventuellement épenthétique est [n] et non [l], et le suffixe -et(te) n'est
pas réputé comporter un allomorphe en -net(te). Aussi barbinette doit-il continuer à faire
partie de l'aventure.
2.1.3. -in
Ne sera mentionné ici que le suffixe diminutif -in et non le suffixe ethnique, attendu
que des trois termes en -in du corpus (gosselin, piétin, tableautin), aucun n'est dérivé à partir
d'un nom de lieu.
17
Corbin (1987 : 108) mentionne le cas de renouveau comme formation de substantif à partir d'un adjectif, mais
il s'agit d'une dérivation sans ajout d'affixe ; Dubois & Dubois-Charlier (1999 : 184) citent le cas des agents en eau de type damoiseau/damoiselle, pastoureau/pastourelle, maquereau/maquerelle, peu nombreux et non
représentés dans notre corpus.
453
Chapitre 6 – De la base de données au corpus de travail
Aucun non plus n'est formé à partir d'un adjectif. Aussi ne pousserai-je pas plus loin
l'étude des paires de type blond / blondin ou roux / rouquin (cf. Dubois & Dubois-Charlier
1999 : 164 ; Corbin 1987 : 484).
Corbin s'intéresse également aux formations nominales indiquant l'agent, à partir d'un
verbe (1987 : 71), de type plaisantin sur plaisanter, mais aucun des trois termes du corpus
n'est agent.
Le suffixe que l'on retrouve dans le corpus est en réalité le suffixe -in à valeur
diminutive ou dépréciative (cf. TLFi, suffixe -in, -ine II18) : gosselin "petit gosse, petit
garçon" est formé à partir du substantif gosse et présente donc une épenthèse de [l] ; de même,
tableautin "petit tableau" est un mot construit sur le nom tableau, avec une épenthèse de [t].
Seule la formation de piétin reste obscure ; le TLFi rapproche le suffixe -in de la
terminaison d'une autre maladie animale, le farcin formé sur le latin farcinem, sans que l'on
trouve trace de ce suffixe ailleurs dans la littérature. Néanmoins, la base pied est attestée par
le sens (cf. également Corbin 1987 : 745 qui le cite en exemple pour l'alternance d~t) et par le
fait que la seule suffixation de -in sur un verbe produit un signifié de type agentif, ce qui n'est
pas le cas de piétin. Aussi le maintiendrai-je dans le corpus, bien que le suffixe à partir duquel
il est formé ne semble pas attesté par ailleurs.
Le signifié du terme jusqu'alors indécis fagotin "petit fagot" indique que ce dernier est
bien formé à partir du suffixe diminutif mais ne le réhabilite pas pour autant, attendu qu'il
avait été écarté pour des raisons d'obscurité de la base et non de suffixe.
2.2. Suffixes ethniques
On verra à l'occasion de l'étude du suffixe -ier qu'il peut permettre de former des
adjectifs référant à un nom de lieu : chaudefonnier sur Chaux-de-fond. Il ne s'agit cependant
là que d'un cas particulier du sens général "relatif à N". D'autres suffixes en revanche sont
clairement consacrés à former des substantifs ou des adjectifs à partir de noms de lieux, du
moins dans la limite du corpus : un suffixe comme -ain n'est pas limité à la fonction locative
dans l'absolu, mais c'est le cas dans le corpus, ce qui justifie son classement dans cette section.
18
Ce suffixe n'est cité ni par Corbin (1987), ni par Apothéloz (2002), ni par Dubois & Dubois-Charlier (1999),
ces derniers faisant au mieux état du suffixe -in "relatif à N" dont le dérivé peut être substantivé s'il s'agit d'un
"humain qui appartient à telle communauté, telle institution politique, économique, etc.". Ce qui peut expliquer
la formation de gosselin mais ne rend pas compte de la dimension diminutive du terme, et ne permet pas
d'analyser tableautin.
454
Chapitre 6 – De la base de données au corpus de travail
Ne seront par ailleurs abordés ici que les suffixes ayant permis de former des dérivés présents
dans le corpus, le but de cette étude n'étant pas une classification précise et exhaustive des
suffixes mais l'évacuation des mots construits ne présentant pas d'épenthèse consonantique du
corpus de travail.
2.2.1. -ain(e)
En tant que suffixe "entrant dans la formation des adjectifs ethniques" (Dubois &
Dubois-Charlier 1999 : 152), le suffixe -ain n'est pas parmi les plus productifs mais il entre
tout de même dans la composition de napolitain sur Naples, romaine sur Rome ou africain sur
Afrique. Il a pour signifié "(celui) qui vient de N" et permet de former des substantifs aussi
bien que des adjectifs (Corbin 1987 : 106-107, Dubois & Dubois-Charlier 1999 : 152-153,
Apothéloz 2002 : 77).
Aucune variante suffixale n'est relevée, aussi peut-on considérer que les six termes se
terminant par -ain dans notre corpus - amalfitain, arroutain, broutain, samaritain,
pierrefeucain et valéricain - comportent bien une consonne épenthétique entre le nom propre
radical et ledit suffixe.
Rappelons pour mémoire que ce suffixe s'applique également aux noms propres de
personne pour former des adjectifs de signifié "relatif à NP" (élisabéthain sur Elisabeth,
Dubois & Dubois-Charlier 1999 : 159) ; aux substantifs de façon à construire des adjectifs de
sens "qui est de la forme, de la couleur, de la nature de N" (républicain sur république,
Dubois & Dubois-Charlier 1999 : 144-145) ; à certains adverbes ou adjectifs nominalisés
(hautain sur l'adverbe haut et non sur l'adjectif homophone, Dubois & Dubois-Charlier 1999 :
145) ; à des substantifs enfin, ou plus exactement à des "groupes nominaux comportant un
nom de nombre dans un domaine précis" (Dubois & Dubois-Charlier 1999 : 214) pour former
des substantifs (quatrains sur quatre, cf. également Corbin 1987 : 94-95). En outre, s'il est
suivi d'un autre suffixe, -ain prend la forme -an- (mondanité sur mondain, cf. Corbin 1987 :
316 ; 517 note 6 ; 544 note 66 ; 759).
2.2.2. -ais(e)
Le suffixe -ais est d'acceptions et de distribution moins diversifiées, dans le sens où il
ne s'applique qu'à un type de bases, les noms propres, pour ne former que des adjectifs
ethniques (Apothéloz 2002 : 77, Dubois & Dubois-Charlier 1999 : 152-153, Corbin 1987 :
455
Chapitre 6 – De la base de données au corpus de travail
544) : marseillais sur Marseille, lyonnaise sur Lyon, français sur France. Ces adjectifs
peuvent ensuite être substantivés : un Marseillais, une Lyonnaise, un Français. Ce suffixe est
très productif et tendrait à s'appliquer aux noms de villes plutôt qu'à ceux d'agglomérations
plus petites (Dubois & Dubois-Charlier 1999 : 152).
Le suffixe ne présente pas d'alternance, aussi peut-on conclure que les [l] et [n]
présents à sa frontière gauche dans les quatre termes du corpus relèvent du phénomène
épenthétique : congolais, togolais, javanais et vinçanais sont ainsi maintenus dans le corpus.
2.2.3. -ois(e)
Ce suffixe ethnique, comme -ais, est à la fois très productif et d'utilisation très ciblée
puisqu'il n'est employé que dans cet aspect spécifique. Comme il l'a été mentionné dans le
paragraphe précédent (2.2.2.), il s'appliquerait surtout aux noms d'agglomérations quelle que
soit leur taille, au contraire du suffixe -ais qui se spécialiserait davantage dans les villes
(Dubois & Dubois-Charlier 1999 : 152). On le trouve par exemple dans aixois sur Aix,
bruxellois sur Bruxelles ou brestoise sur Brest, les adjectifs pouvant également être
substantivés (un Aixois, un Bruxellois, une Brestoise) mais également dans villageois sur le
substantif village, toujours avec le sens de "(celui) qui est originaire de N(P)".
Ce suffixe ne manifestant pas d'alternance, les cinq termes du corpus le comportant clamecycois, souriquois, spadois, graylois et pouillyzois - seront donc maintenus à l'issue de
ce second filtre puisque la consonne qu'ils contiennent à la gauche du suffixe est ainsi
épenthétique.
2.2.4. -ie
Un seul terme est réputé comporter ce suffixe dans le corpus de 420 unités lexicales
ayant passé le premier filtre : Papousie, qui réfère à la Nouvelle Calédonie.
La littérature consultée ne fait pas mention du suffixe -ie en tant que formateur de
noms de pays. Corbin (1987 : 108) et Dubois & Dubois-Charlier (1999 : 204-205) l'abordent
par le signifié "état d'être Adj" : la jalousie est l'état d'être jaloux, la diplomatie d'être
diplomate, la bigamie d'être bigame. Si l'on ne trouve pas trace du suffixe -ie avec l'acception
que l'on distingue dans Papousie, le suffixe *-sie quant à lui n'est pas attesté du tout, ce qui
exclut le [z] de Papousie du suffixe.
456
Chapitre 6 – De la base de données au corpus de travail
Par ailleurs, le suffixe -ie est parfois envisagé comme variante ou partie du suffixe erie (cf. section 2.6.1.4.), qui aurait sens "lieu où N exerce son activité" (le boulanger travaille
dans une boulangerie, le cordonnier dans une cordonnerie). Cette formation se faisant sur le
substantif et le signifié impliquant la notion de lieu, il est possible de rattacher Papousie à ce
suffixe -ie à condition d'adapter le signifié "lieu en relation avec N".
Si Papousie avait été substantif et non nom propre, il aurait été possible de dresser la
liste de ses semblables à partir de la base de données initiale utilisée pour la recherche
automatique de termes (origine A.) puisque l'on peut interroger celle-ci à partir de séquences
de lettres finales. Cette option n'étant pas ouverte, tâchons de réunir tout de même un petit
corpus de noms de pays en -ie : Abyssinie, Algérie, Amazonie, Arménie, Australie,
Austronésie, Bolivie, Calédonie, Californie, Colombie, Estonie, Ethiopie, Haïti, Indonésie,
Italie, Jordanie, Lithuanie, Mauritanie, Mésopotamie, Mongolie, Océanie, Pennsylvanie,
Polynésie, Sibérie, Syrie, Tahiti.
En dehors de Australie formé sur l'adjectif austral, tous ces termes sont rattachés à des
noms d'habitants et adjectifs en -ien : algérien, amazonien, arménien, etc. (cf section T pour
l'étude des dérivés en -ien).
Papousie n'est pas lié à un adjectif ou substantif *papousien mais au substantif papou,
aussi ne peut-on le rattacher à cette série en supposant un dérivé régressif, pas plus qu'on ne
peut le considérer formé sur un adjectif comme l'est Australie.
Il semblerait donc que l'explication de formation pour ce terme la plus plausible serait
à l'aide du suffixe -ie "lieu en relation avec N", avec une influence possible des noms propres
de pays se terminant en -ie. Cette influence ne peut toutefois pas rendre compte du [z] puisque
l'on relève quantité de noms propres en -ie précédés d'une autre consonne (23 sur 26 dans le
petit corpus ci-dessus). Aussi peut-on maintenir Papousie dans le corpus.
2.3. Suffixes scientifiques
Un statut particulier doit être accordé aux suffixes scientifiques, du fait qu'ils
"n'entrent pas dans le système des adjectivisations ou nominalisations suffixales ; ils jouent un
rôle différent par leurs propriétés lexicales et syntaxiques, dépassant en général le seul cadre
du français" (Dubois & Dubois-Charlier 1999 : 262).
457
Chapitre 6 – De la base de données au corpus de travail
2.3.1. -ine
Ce suffixe peut être utilisé pour former le féminin de noms propres : Christine sur
Christian, Pauline sur Paule (Dubois & Dubois-Charlier 1999 : 187).
Son acception principale est cependant d'ordre scientifique, dans le domaine
particulier de la chimie organique (Dubois & Dubois-Charlier 1999 : 265-266). Les quatre
termes du corpus ne relèvent pas tous de la chimie pour autant ; seul myrosine "diastase
présente dans la graine de moutarde noire" semble correspondre à ce suffixe.
Cependant, l'absence de suffixe -tine d'une part, et la détermination aisée de la base
des trois termes restants d'autre part, permettent d'identifier les consonnes à la jointure comme
épenthétiques, même en l'absence de signifié pour abricotine. L'indigotine est un "principe
colorant" pour lequel on peut éventuellement établir un lien avec la chimie générale à défaut
de la chimie organique. La cambrésine enfin, du nom propre Cambrai, désigne une "fine toile
de lin fabriquée dans le nord de la France".
Abricotine, cambrésine, indigotine et myrosine sont donc maintenus dans le corpus.
2.3.2. -ite
Le suffixe -ite a dans la langue "courante" la faculté de former des adjectifs ethniques
à partir de noms propres : yéménite sur Yémen, moscovite sur Moscou (Dubois & DuboisCharlier 1999 : 154).
Cependant, le seul terme en -ite du corpus ne renvoie pas à ce suffixe mais à l'un de
ses homonymes scientifiques. -ite est connu dans son sens médical d'"inflammation" :
appendicite "inflammation de l'appendice", trachéite "inflammation de la trachée" (Apothéloz
2002 : 78, Dubois & Dubois-Charlier 1999 : 273-274) et est dans ce sens formateur de
substantifs à partir de substantifs. Ici c'est l'affixe minéralogique et géologique permettant de
dériver un type de roche qui concerne halloysite "silicate hydraté d'aluminium", le terme du
corpus. Plusieurs types de bases nominales sont possibles (Dubois & Dubois-Charlier 1999 :
269) parmi lesquelles les noms propres, comme c'est le cas ici puisque la base d'halloysite est
le nom du géologue Halloy. A cette étape de traitement du corpus, halloysite est donc
maintenu puisque le [z] ne provient ni du suffixe, ni du radical.
458
Chapitre 6 – De la base de données au corpus de travail
2.4. Suffixes purement adjectivaux
2.4.1. -al(e)
Le suffixe -al permet de former des adjectifs sur des bases substantives avec un
signifié très large de type "relatif à N" : automnal sur automne, théâtral sur théâtre, génial sur
génie (Dubois & Dubois-Charlier 1999 : 137, Apothéloz 2002 : 77, Corbin 1987 : 64).
Aucune variation concernant la frontière gauche du suffixe n'est attestée dans la littérature.
Dans ce cadre, le mot construit soucutal "placé sous le fessier" est maintenu dans le corpus en
tant que terme porteur d'une épenthèse consonantique à l'endroit sous intérêt.
2.4.2. -(at)aire
Deux bases sont possibles en ce qui concerne ce suffixe :
- la base nominale, qui permet de créer des adjectifs ayant pour signifié "relatif à N" (Corbin
1987 : 64, Apothéloz 2002 : 77, Dubois & Dubois-Charlier 1999 : 134-136) comme dans
alimentaire formé sur aliment ou bénéficiaire sur bénéfice, ou des substantifs dont le sens
correspond à "agent en relation avec N" (Apothéloz 2002 : 78, Dubois & Dubois-Charlier
1999 : 135), que l'on trouve ainsi dans disquaire sur disque ou dans littéraire sur lettre ;
- la base verbale à partir de laquelle sont dérivés des substantifs ayant pour valeur sémantique
"agent qui V" (Corbin 1987 : 377, Dubois & Dubois-Charlier 1999 : 121-122, Apothéloz
2002 : 76) comme dans incendiaire sur incendier et protestataire sur protester, ou
"bénéficiaire de l'action de V" (Corbin 1987 : 377-378, Dubois & Dubois-Charlier 121-122 ;
47, Apothéloz 2002 : 76) que l'on trouve dans donataire sur donner et destinataire sur
destiner par exemple.
Le tableau suivant récapitule les catégories de dérivés possibles à l'aide du suffixe (at)aire :
(81)
dérivé
base
verbale
substantive
substantif masculin ou féminin
"agent qui V" : incendiaire
"bénéficiaire de V" : donataire
"agent en relation avec N" : disquaire
adjectif
/
"relatif à N" : alimentaire
459
Chapitre 6 – De la base de données au corpus de travail
Seuls trois termes sont dérivés à partir du suffixe -aire dans le corpus : moscoutaire,
sursitaire et tissulaire. Pour aucun d'entre eux ne se pose le problème de l'allongement en -at-.
Moscoutaire "qui reçoit ses directives de Moscou" est un terme péjoratif qui
présuppose un verbe °moscouter "donner des directives depuis Moscou" (vs. moscovite) de
façon à se rattacher au signifié "bénéficiaire de V". Une autre hypothèse serait de supposer sa
formation à partir du substantif °moscou "siège central de l'administration soviétique" issu du
nom propre Moscou, ce qui permettrait d'une part de résoudre le problème de la concurrence
entre moscoutaire et moscovite, d'autre part d'expliquer le type de relation entre la ville et la
personne, relation qui est particulière et non générale : moscoutaire ne réfère pas à une
relation simple entre Moscou et un de ses habitants mais entre Moscou et un fonctionnaire
subalterne à l'administration centrale dont le siège est à Moscou.
L'avantage de la formation à partir du verbe °moscouter est la justesse du signifié
attribué à moscoutaire par rapport au signifié général du suffixe -aire "bénéficiaire de V".
L'inconvénient est la catégorie lexicale du terme : moscoutaire est dans ce sens adjectif et non
substantif.
D'un autre côté, supposer la dérivation de moscoutaire à partir de la base °moscou
permet certes de justifier la catégorie lexicale, mais oblige à perdre la notion de "hiérarchie"
entre °moscou qui donne les ordres, et moscoutaire qui les reçoit.
Il n'est pas possible de choisir une hypothèse de formation de façon certaine, aussi
classerai-je moscoutaire parmi les indécis.
Le traitement de sursitaire est plus directement appréhensif. Le signifié de ce dérivé,
"bénéficiaire d'un sursis", présuppose le verbe °sursiter "donner un sursis" et ne peut être
simplement formé sur sursis, "relatif à un sursis" n'étant pas le sens attesté de sursitaire.
Seule l'unité lexicale tissulaire "relatif aux tissus d'un organisme vivant" est donc
maintenue dans le corpus : puisqu'il s'agit d'un adjectif formé sur la base tissu, le -l- est bien
épenthétique.
Le bilan des dérivés en -aire est le suivant : un rejeté (sursitaire), un dont le traitement
n'est pas suffisamment clair pour prendre une décision définitive (moscoutaire), un maintenu
(tissulaire).
460
Chapitre 6 – De la base de données au corpus de travail
2.4.3. -esque
Le suffixe -esque permet de construire des adjectifs à valeur augmentative ou
méliorative (cf. Dubois & Dubois-Charlier 1999 : 160-161, Apothéloz 2002 : 78) sur des
bases nominales : hugolesque sur hugo (qui aurait par rapport à hugolien "une valeur
emphatique ou littéraire"), éléphantesque sur éléphant. On peut paraphraser le signifié de esque par "de la nature de N" (carnavalesque "de la nature du carnaval", gaguesque "de la
nature du gag") ou, lorsque la base est un nom propre, par "propre à NP" ou "digne de,
comparable à NP" : moliéresque "propre à Molière" ou "comparable à (celui ou celle de)
Molière".
Dubois & Dubois-Charlier relèvent de "rares ethniques en -esque", et uniquement des
emprunts : barbaresque sur Barbarie.
Le corpus compte vingt-quatre termes en -esque à l'issue du premier filtre :
alibababesque dont le contexte d'emploi permet de déterminer le signifié "comparable à
alibaba",
amiganesque,
l'impression
d'un
cacatesque,
cauchemar",
canulardesque,
ceaucesculesque,
cauchemardesque
chicagotesque,
"qui
produit
delducatesque,
escargotesque, ferblantesque, gargantualesque "qui évoque Gargantua" (vs. gargantuesque,
attesté), gargantuanesque, gogotesque, goyatesque, hugolesque, hugotesque, kafkatesque,
mangagesque, manganesque, mangatesque, mégatesque, shungatesque, sofalesque "qui
rappelle l'abandon et la nonchalance auxquels invite un sofa" d'où "relatif au sofa",
zolatesque.
L'absence de signifié pour certains termes n'occasionne pas leur mise à l'écart étant
donné que le suffixe -esque ne recèle pas d'ambiguïté de formation : un seul type de base (les
noms propres étant assimilables aux substantifs en tant que catégorie majeure) pour une seule
catégorie de dérivés (les rares substantifs en -esque étant soit des emprunts comme arabesque
ou soldatesque, soit des substantivations d'adjectifs tel que le romanesque). C'est pourquoi
tous seront maintenus à l'issue de cette étape de filtre.
Le tableau suivant établit cette décision en même temps qu'il rappelle les deux autres
termes en -esque présents dans la base de données initiale. Les lignes indiquent le traitement à
l'issue du premier filtre, les colonnes le résultat après la deuxième étape de filtre :
461
Chapitre 6 – De la base de données au corpus de travail
(82)
Indécis
escoubellesque
/
/
Indécis
Rejeté
Rejeté
/
pioupesque
/
Maintenu
Maintenu
/
/
alibababesque ; amiganesque ; cacatesque ;
canulardesque ; cauchemardesque ; ceaucesculesque ;
chicagotesque ; delducatesque ; escargotesque ;
ferblantesque ; gargantualesque ; gargantuanesque ;
gogotesque ; goyatesque ; hugolesque ; hugotesque ;
kafkatesque ; mangagesque ; manganesque ;
mangatesque ; mégatesque ; shungatesque ; sofalesque
; zolatesque
Ce qui en termes quantitatifs donne le tableau suivant :
(83)
Indécis
Rejeté
Maintenu
Total
Indécis
1
/
/
1
Rejeté
/
1
/
1
Maintenu
/
/
24
24
Total
1
1
24
26
2.4.4. -ième
Le suffixe -ième permet de former des adjectifs numéraux ordinaux à partir d'adjectifs
numéraux cardinaux (Apothéloz 2002 : 78, Dubois & Dubois-Charlier 1999 : 165-166) :
deuxième, vingtième, millième. Ces adjectifs peuvent être nominalisés : le deuxième, etc.
Combien n'est pas un adjectif numéral cardinal mais un adverbe ou un substantif. Pour
autant, il est bien la base du dérivé combientième (variante de quantième) présent dans le
corpus, qui présente donc bien une épenthèse. Pour l'anecdote, le TLFi atteste d'une
construction parallèle combien-nième.
2.4.5. -ien et -éen
Le suffixe -ien permet de former des adjectifs, éventuellement substantivés, à partir de
substantifs. Ces adjectifs peuvent être ethniques (Corbin 1987 : 71-72 ; 451, Dubois &
Dubois-Charlier 1999 : 152) ou plus généraux (Apothéloz 2002 : 77, Dubois & DuboisCharlier 1999 : 144-146, Corbin 1987 : 544) : corrézien sur Corrèze, parisien sur Paris ;
aoûtien sur août, informaticien sur informatique.
Dans son sens ethnique, il alterne avec -(é)en, variante "utilisée pour conserver le
radical de la base" (Dubois & Dubois-Charlier 1999 : 152) : guinéen sur Guinée, européen sur
Europe.
462
Chapitre 6 – De la base de données au corpus de travail
Aucun allomorphe à initiale consonantique n'est enregistré, si bien que si un terme est
formé à partir d'une base à finale vocalique et de ce suffixe, toute consonne intermédiaire doit
être considérée comme une épenthèse.
Le corpus de 422 termes rassemble quatre termes en -ien et un en -éen. Ce dernier,
recueilli à l'oral, n'a malheureusement pas de signifié associé, si bien que l'on ne peut établir
avec certitude qu'il est bien une variante de sabéen sur la base du nom de pays Saba et non sur
sabbat, comportant une consonne sous-jacente puisqu'issu du latin sabbatum, le suffixe
n'ayant pas seulement la valeur d'ethnique. Sabatéen est donc classé parmi les indécis.
Hugolien "relatif à Victor Hugo", cambrésien "de Cambrai", et onusien "relatif à
l'ONU" sont maintenus dans le corpus puisque la consonne qu'ils présentent à la frontière
gauche du suffixe ne provient ni du suffixe lui-même, ni du radical. Le dernier terme relevé
dans le corpus, lunaisien, n'a pas de signifié attesté mais le contexte permet de déterminer
qu'il s'agirait des "habitants de la Lune", donc de la substantivation d'un adjectif lunaisien
"relatif à la lune". Cependant, la base de cet adjectif reste obscure : il ne peut s'agir
directement de lune puisque la forme serait alors °lunien ; force est donc de supposer
lunaison19 comme base, qui permet de rendre compte également de la présence du [-] mais
qui disqualifie le [z] de lunaisien de la classe des épenthèses.
Des cinq termes en -éen et -ien, seuls hugolien, cambrésien et onusien poursuivent
donc leur chemin dans l'analyse.
2.4.6. -if (-ive)
Deux types de bases sont possiblement concaténables au suffixe -if : les bases verbales
et les bases nominales.
Suffixé à une base nominale, -if ajoute le signifié "qui relève de N" : instinctif sur
instinct, excessif sur excès (Dubois & Dubois-Charlier 1999 : 146, Corbin 1987 : 544,
Apothéloz 2002 : 77). Apothéloz (2002 : 85-86) note que ce suffixe "sélectionne des bases se
terminant par les consonnes [t], [z], [s] et [d]", avec une grande majorité pour [t] (plus de deux
cents adjectifs), et seulement deux adjectifs pour [d] (maladif et tardif), les finales [zif]
(abusif) et [sif] (défensif) concernant chacune une vingtaine d'adjectifs. Cependant, les dérivés
19
Lunaison lui-même est issu du latin lunatio par resuffixation avec -aison.
463
Chapitre 6 – De la base de données au corpus de travail
les plus fréquents avec ce suffixe ne se font pas sur ce type de radicaux mais à partir d'un
terme en -ion.
S'il est adjoint à une base en -ion, -if ne se concatène pas au suffixe mais s'y substitue :
exclamative sur exclamation, conclusif sur conclusion (Dubois & Dubois-Charlier 1999 : 147,
Apothéloz 2002 : 85).
Pour Apothéloz (2002 : 86), il a fini par se forger un suffixe -atif par coalescence du
fait du grand nombre de dérivés en -if sur des bases en -ation, "puisqu'il n'existe en principe
pas de noms bourration, lucration, optation, palliation, performation". Sans prendre parti
quant à l'existence ou non de ce morphème, je ne peux cependant exclure l'hypothèse de son
existence dans l'analyse du terme en -if du corpus.
Pour conclure ce panorama des dérivés en -if sur des bases nominales, précisons que si
-if est à son tour suivi d'un morphème, il apparaît sous la forme -iv- : sportivité, excessivité.
La base verbale est également possible selon Corbin (1987 : 65 ; 492), Apothéloz
(2002 : 86) ou Dubois & Dubois-Charlier (1999 : 116), le suffixe y ajoutant le sens "qui V" :
directif sur diriger, vomitif sur vomir, cumulatif sur cumuler. Cependant, pour nombre de ces
dérivés il est difficile de déterminer si la base est verbale ou nominale (cf. Apothéloz 2002 :
87, Dubois & Dubois-Charlier : 139) : décisif est-il formé s