L`épenthèse consonantique en français
Transcription
L`épenthèse consonantique en français
UNIVERSITÉ DE NICE SOPHIA-ANTIPOLIS U.F.R. L.A.S.H., DÉPARTEMENT DE LINGUISTIQUE LABORATOIRE 'BASES, CORPUS ET LANGAGE' (UMR 6039) Thèse de doctorat nouveau régime L'épenthèse consonantique en français Ce que la syntaxe, la sémantique et la morphologie peuvent faire à la phonologie : parles-en de ta numérotation impossible origine syntaxique, morphologique, sémantique position forte Gouv [C V] V | C0 V Lic épenthèse présentée par Claudine Pagliano sous la direction de Tobias Scheer Volume 1 – L'épenthèse consonantique dans les langues en général Remerciements C'est un plaisir pour moi, arrivée au terme de cette thèse, d'exprimer ma gratitude aux personnes qui ont participé, chacune à sa manière, à en améliorer les conditions d'élaboration. Je tiens à remercier tout d'abord les personnes qui ont contribué à sa réalisation matérielle : Yvon Deschamps, qui a informatisé le protocole de recherche semi-automatique exploité dans la création du corpus ; les douze locuteurs qui se sont prêtés au jeu du questionnaire avec bonne humeur et le plus honnêtement possible ; les courageuses relectrices qui ont énergiquement traqué coquilles et tournures maladroites. Ma reconnaissance s'adresse également aux membres du laboratoire Bases, Corpus et Langage (UMR 6039) pour leur soutien. Elisabetta Carpitelli, Michèle Olivieri et Carole de Féral m'ont fait profiter de leurs conseils dans leurs domaines de prédilection respectifs. Annie Veissière m'a fait bénéficier autant de son bon sens à toute épreuve que de ses jugements précieux de locuteur non linguiste. Je remercie tout particulièrement Sylvie Mellet pour son écoute, l'aide efficace qu'elle m'a apportée à divers moments difficiles de la thèse, et sa disponibilité. Merci à ma famille de m'avoir laissée dans ma bulle durant les mois les plus chargés de la rédaction. Mention toute particulière à Dylan et Megan, arrivés au monde durant la gestation de cette thèse. J'ai également apprécié le soutien de mes amis, et je remercie particulièrement Margareta, Mojca et Estelle pour leur aide logistique autant que morale. J'ai eu la chance de bénéficier des critiques, des idées et du soutien de mes deux "copains phonologues", Delphine Seigneur et Olivier Rizzolo. Merci enfin à Tobias Scheer, qui a fait preuve de beaucoup de disponibilité et dont les commentaires ont énormément apporté à cette thèse. A vous tous, pour votre patience et votre présence, merci. iii Conventions employées dans la thèse Organisation générale de la thèse et renvoi aux différentes sections La thèse se présente sous la forme de quatre volumes : les trois premiers correspondent aux trois parties de la thèse, le dernier contient les annexes. Au début de chaque volume figure un sommaire abrégé de la thèse, la table des matières complète se trouvant en fin de volume. Un index des langues étudiées dans la première partie est proposé en fin du premier volume ; un index général est fourni à la fin de chaque volume, avant la table des matières. Les références figurent à la fin du troisième volume. Chacune des trois parties de la thèse comporte trois à cinq chapitres. La numérotation des chapitres est continue, c'est-à-dire qu'elle n'est pas réinitialisée en deuxième et troisième parties, de façon à faciliter le repérage au sein de la thèse. Les sections, les puces et les notes, en revanche, sont réinitialisées à chaque nouvelle partie. Les renvois à d'autres sections de la thèse se font au moyen du code suivant : le numéro de la partie est donné en chiffres romains, celui du chapitre entre crochets, suivi du numéro de la section concernée. Ainsi, pour renvoyer à la section 3.3.2 du chapitre 9 de la partie 3 le code utilisé sera-t-il le suivant : I [9] 3.3.2. Si les renvois concernent le chapitre dans lequel on se situe, ne sera précisé que le numéro de la section. iv Abréviations et notations Au niveau mélodique : C = consonne V = voyelle T = obstruante R = sonante L = liquide N = nasale X = segment quelconque [CÕC] = domaine de gouvernement infrasegmental (CV) chute d'une unité [CV] = Au niveau syllabique : σ = syllabe A = attaque R = rime N = noyau C = coda x = position squelettale Relations : G = gouvernement GP = gouvernement propre GIS = gouvernement infrasegmental L = licenciement LG = licenciement pour gouverner ECP = Principe des Catégories Vides *mot = réalisation impossible d'un mot °mot = base virtuelle Divers : Sommaire Sommaire Introduction générale 1 PARTIE I. L'ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN GÉNÉRAL Introduction Chapitre 1. Distribution géographique, variation qualitative, contextes d'apparition et causalités 1. Définition 2. Substance des épenthèses consonantiques dans les langues du monde 3. Les épenthèses en français Chapitre 2. Le caractère particulier des consonnes coronales : phonétique, phonologie, théories 1. Les coronales : quelques faits phonétiques 2. Le statut particulier des coronales : phonologie 3. Le statut particulier des coronales : les théories génératives Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français : liaison et épenthèse 1. Epenthèse et alternances consonne ~ zéro 2. Analyses antérieures de l'épenthèse Conclusion 5 PARTIE II. L'ÉPENTHÈSE CONSONANTIQUE DEVANT SUFFIXE DÉRIVATIONNEL EN FRANÇAIS : LES FAITS Introduction Chapitre 4. Délimitation de l'objet d'étude 1. Français standard, populaire, ordinaire... 2. Le français dans sa dimension temporelle 3. Point sur la suffixation Chapitre 5. Constitution de la base de données 1. Création d'un corpus à partir de sources écrites. 2. Introduction de données uniquement orales (G) 3. Bilan sur les méthodes de constitution du corpus 4. Bilan sur les terminaisons représentées dans le corpus Chapitre 6. De la base de données au corpus de travail 1. Premier filtre : étymologies et consonnes sous-jacentes 2. Deuxième filtre : les écueils de la morphologie dérivationnelle française - qu'est-ce qui est dérivé de quoi ? Chapitre 7. De l'intérêt d'un questionnaire. 1. Etapes préliminaires 2. Élaboration d'un questionnaire portant sur les conditions d'apparition des épenthèses 3. Résultats du questionnaire 4. Bilan général du questionnaire Conclusion 6 7 7 12 88 109 109 119 144 204 204 259 299 300 301 302 302 309 311 340 342 385 389 391 394 395 452 543 543 549 560 593 594 Sommaire PARTIE III. EPENTHÈSE CONSONANTIQUE EN FRANÇAIS : DISTRIBUTION D'UNE UNITÉ [CV] PAR LA SYNTAXE, LA SÉMANTIQUE ET LA MORPHOLOGIE, ET SES CONSÉQUENCES PHONOLOGIQUES Introduction Chapitre 8. Cadre théorique 1. Phonologie de Gouvernement et cadre CVCV 2. Position forte et Coda-Miroir (Scheer & Ségéral 2001) Chapitre 9. [CV] sémantique : les conséquences phonologiques de l'emphase 1. Préliminaires 2. Emphase et géminées 3. Emphase et épenthèse 4. Bilan sur le [CV] sémantique Chapitre 10. [CV] syntaxique : les conséquences phonologiques de l'enclise 1. Mise en place de la problématique 2. Analyse 3. Bilan sur le [CV] syntaxique Chapitre 11. [CV] morphologique : les conséquences phonologiques de la dérivation 1. Interaction morphologie / phonologie 2. Formation des adverbes en -ment en français (Pagliano 1999a) 3. Classes de suffixes 4. Dérivés suffixaux et épenthèses consonantiques 5. Bilan sur le [CV] morphologique Chapitre 12. Prolongements de l'analyse : la position forte 1. Emphase, intensif et gémination 2. Nature de l'épenthèse en français 3. Position forte et épenthèse consonantique en français : réciprocité ? Conclusion de la partie III 595 596 599 599 603 614 614 622 628 664 669 669 673 725 728 729 731 767 779 803 804 804 808 812 819 Conclusion générale 822 Index 825 Références 827 Annexes 859 Table des matières Table des matières Introduction générale 1 PARTIE I. L'ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN GÉNÉRAL 5 Introduction 6 Chapitre 1. Distribution géographique, variation qualitative, contextes d'apparition et causalités 1. Définition 1.1. Epenthèse, étymologie et sous-jacence 1.2. Eléments épenthésables 1.3. Epenthèses et environnement phonologique 1.3.1. Les épenthèses "avatar" 1.3.2. Les épenthèses ex nihilo 2. Substance des épenthèses consonantiques dans les langues du monde 2.1. Nature de la consonne épenthésée 2.1.1. Vélaires 2.1.2. Glottales 2.1.2.1. Fricative h 2.1.2.1.1. Langues gabaritiques 2.1.2.1.2. Langues amérindiennes 2.1.2.1.3. Langue austronésienne 2.1.2.2. Occlusive ! 2.1.2.2.1. Langues austronésiennes 2.1.2.2.2. Langues gabaritiques 2.1.2.2.3. Langues amérindiennes 2.1.2.2.4. Continent asiatique 2.1.2.2.5. Continent africain 2.1.2.2.6. Continent européen 2.1.2.2.7. Bilan sur le coup de glotte 2.1.3. Coronales 2.1.3.1. Liquides 2.1.3.1.1. Continent africain 2.1.3.1.2. Continent australien 2.1.3.1.3. Continent asiatique 2.1.3.1.4. Continent européen 2.1.3.2. Nasale 2.1.3.3. s, z 2.1.3.4. t, d 2.1.3.4.1. Langues amérindiennes 2.1.3.4.2. Autres continents 2.1.3.5. Bilan sur les coronales 2.1.4. Récapitulatif des langues et des consonnes concernées 2.1.4.1. Classement par son épenthésé 2.1.4.2. Classement par région géographique 2.1.5. Contextes syllabiques d'épenthèse en fonction du son épenthésé 7 7 8 9 9 9 11 12 12 13 16 16 16 16 18 19 20 25 26 26 28 28 30 31 31 31 33 33 33 35 37 37 38 39 41 41 41 43 44 Table des matières 2.1.5.1. Sons épenthésables en coda 2.1.5.1.1. Fin de proposition 2.1.5.1.2. Fin de mot 2.1.5.1.3. Fin de syllabe 2.1.5.2. Sons épenthésables en attaque 2.1.5.2.1. Début d'unité supérieure 2.1.5.2.2. Début de mot 2.1.5.2.3. Début de syllabe 2.1.5.3. Tableau récapitulatif 2.1.6. Bilan de la section 2.2. Pourquoi 2.2.1. Coarticulation et résolution de groupes de consonnes interdits 2.2.1.1. Epenthèses après sonantes 2.2.1.1.1. Devant obstruantes 2.2.1.1.2. Devant sonante ou obstruante 2.2.1.2. Epenthèse devant liquide 2.2.1.3. Epenthèses en finale après consonne : diachronie de l'allemand 2.2.2. Contraintes structurales 2.2.2.1. Structure de la proposition 2.2.2.2. Structure de l'unité lexicale 2.2.2.2.1. Finale de mot 2.2.2.2.2. Début de mot 2.2.2.3. Structure syllabique 2.2.2.3.1. Coda requise 2.2.2.3.2. Attaque requise = résolution d'hiatus 2.2.3. Conditionnement morphologique 2.2.3.1. A l'intérieur d'un morphème ? 2.2.3.2. Frontière morphologique 2.2.3.2.1. Entre deux mots 2.2.3.2.2. Dans les composés ? 2.2.3.2.3. Entre préfixe et radical 2.2.3.2.4. Entre radical et suffixe ou désinence 2.2.3.3. Bilan sur les frontières morphologiques 2.2.4. Bilan général du conditionnement interne 2.2.4.1. Conditionnement morphologique 2.2.4.2. Conditionnement phonologique 2.2.4.3. Résumé 2.2.5. Facteurs non linguistiques 2.2.5.1. Influence de l'orthographe 2.2.5.2. Analogie et remotivation 2.2.5.3. Motivations sociales et contextuelles 2.2.6. Bilan sur les conditionnements 3. Les épenthèses en français 3.1. Au sein d'un groupe consonantique 3.2. Epenthèses syntaxiques 3.2.1. En français "régional" 3.2.2. En français "standard" 3.3. Epenthèses à la frontière morphologique interne 3.3.1. Entre préfixe et radical 44 44 45 46 46 47 47 48 50 52 53 54 54 55 57 58 60 62 62 63 63 65 66 66 67 72 72 73 74 75 76 77 79 79 81 83 84 84 85 86 87 88 88 89 91 91 92 94 95 Table des matières 3.3.2. Entre radical et suffixe 3.3.2.1. Après consonne : Plénat (1997, 1999) 3.3.2.1.1. Présentation des données 3.3.2.1.2. Analyse des données 3.3.2.1.3. Bilan 3.3.2.2. Après voyelle 3.3.2.2.1. En hiatus 3.3.2.2.2. Devant consonne 3.4. Bilan sur le français 3.5. Bilan du chapitre 1 Chapitre 2. Le caractère particulier des consonnes coronales : phonétique, phonologie, théories 1. Les coronales : quelques faits phonétiques 1.1. Les coronales en phonétique acoustique. 1.2. Phonétique articulatoire : lame de la langue. 1.3. Lieux d'articulation des coronales 1.3.1. Coronales antérieures 1.3.2. Coronales palato-alvéolaires 1.3.3. Coronales rétroflexes 1.3.4. Coronales alvéopalatales 1.3.5. Coronales palatales 2. Le statut particulier des coronales : phonologie 2.1. Fréquence 2.1.1. Dans les langues du monde 2.1.2. Au sein d'une langue 2.1.3. Dans l'inventaire des sons 2.1.4. Dans le discours 2.1.5. Dans leur distribution 2.1.6. Bilan sur la fréquence 2.2. Transparence 2.3. Assimilation 2.4. Neutralisation 2.5. Marque et implication 2.6. Chute 2.7. Cooccurrence 2.8. Dérivation ? 2.9. Aphasie 2.9.1. Substitution 2.9.2. Syncope 2.9.3. Epenthèse 2.10. Bilan sur la singularité des coronales 3. Le statut particulier des coronales : les théories génératives 3.1. Chomsky & Halle (1968) 3.2. Géométrie des Traits 3.2.1. Structure interne des éléments 3.2.2. La sous-spécification 3.2.2.1. Sous-spécification radicale et marque 3.2.2.1.1. La notion de marque 3.2.2.1.2. Sous-spécification radicale 96 97 97 101 104 106 107 107 107 108 109 109 109 110 112 115 115 116 117 118 119 119 119 120 121 121 121 122 123 128 131 133 133 136 138 139 139 140 141 143 144 145 147 148 153 155 155 158 Table des matières 3.2.2.2. Spécification contrastive 3.2.2.3. Spécification contrastive modifiée 3.2.3. Contre la sous-spécification des coronales ? 3.2.3.1. Rice (1996) 3.2.3.2. Goad (1995) 3.2.4. Bilan sur la sous-spécification 3.3. Les théories monovalentes 3.3.1. Phonologie de Dépendance 3.3.2. Phonologie de Gouvernement 3.3.2.1. cadre général 3.3.2.2. L'élément R 3.3.2.2.1. Projet de l'école londonienne 3.3.2.2.2. Rejet de R 3.3.2.2.3. Szigetvári (1994) 3.3.2.2.4. Cyran (1997) 3.3.2.2.5. Scheer (1996) 3.3.2.3. Bilan sur la représentation des coronales au sein de la Phonologie de Gouvernement 3.4. Théorie de l'Optimalité 3.4.1. Présentation générale du cadre 3.4.2. Les coronales dans le modèle 3.4.2.1. La classe des coronales 3.4.2.1.1. Coronales vs. labiales et vélaires 3.4.2.1.2. Coronales vs. glottales 3.4.2.2. Au sein de la classe des coronales 3.4.3. Bilan sur les coronales en OT 3.5. Bilan sur la représentation des coronales dans les théories phonologiques Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français : liaison et épenthèse 1. Epenthèse et alternances consonne ~ zéro 1.1. Analyses antérieures de la liaison 1.1.1. La consonne appartient au premier morphème 1.1.1.1. Supplétion 1.1.1.1.1. Cadre non génératif 1.1.1.1.2. Cadre génératif linéaire 1.1.1.1.3. Cadre génératif multilinéaire 1.1.1.1.4. Bilan sur la supplétion 1.1.1.2. Présence de la consonne au niveau lexical, à la finale 1.1.1.2.1. Cadre pré-génératif 1.1.1.2.2. Cadre génératif linéaire 1.1.1.2.3. Cadre génératif multilinéaire 1.1.1.2.4. En théorie de l'Optimalité 1.1.1.2.5. Bilan sur la consonne en fin de premier mot 1.1.2. La consonne appartient au deuxième morphème 1.1.2.1. Supplétion 1.1.2.2. Présence de la consonne au niveau lexical, à l'initiale 1.1.2.3. La consonne est le deuxième morphème impliqué 1.1.3. La consonne n'appartient à aucun des deux morphèmes 1.1.3.1. Cadre pré-génératif 161 162 164 164 166 169 170 172 177 178 180 180 181 185 187 188 190 191 191 192 192 193 195 202 202 203 204 204 207 208 208 208 209 210 210 211 212 212 216 223 227 228 228 228 229 230 231 Table des matières 1.1.3.2. Cadre génératif linéaire 1.1.3.3. Cadre génératif multilinéaire 1.1.3.4. Bilan sur l'épenthèse 1.1.4. Bilan sur les analyses antérieures de la liaison 1.2. Liaisons obligatoires, facultatives et impossibles 1.2.1. Après un "pluriel" 1.2.2. Après un singulier 1.2.2.1. Liaison facultative 1.2.2.2. Liaison obligatoire 1.2.2.2.1. A l'intérieur du syntagme nominal 1.2.2.2.2. A l'intérieur du syntagme verbal 1.2.2.2.3. Entre deux syntagmes 1.2.2.3. Liaison interdite 1.2.2.3.1. Après substantif 1.2.2.3.2. Après pronom sujet 1.2.2.3.3. Après verbe : devant préposition ou déterminant 1.2.2.4. Récapitulatif par catégorie lexicale du premier terme 1.2.3. Bilan sur la liaison 1.3. La flexion 1.3.1. Flexion nominale 1.3.1.1. Nombre 1.3.1.1.1. Une seule forme sous-jacente 1.3.1.1.2. Allomorphie 1.3.1.2. Genre 1.3.1.2.1. Consonne sous-jacente 1.3.1.2.2. Epenthèse 1.3.1.1.3. Bilan sur la flexion nominale de genre 1.3.2. Flexion verbale 1.3.2.1. Mode 1.3.2.2. Personne 2. Analyses antérieures de l'épenthèse 2.1. Cadre non syllabique : insertion d'une consonne 2.1.1. Epenthèse en hiatus : Pupier (1971) 2.1.1.1. Présentation de l'analyse 2.1.1.2. Critique 2.1.1.2.1. Frontière morphologique 2.1.1.2.2. Fléchage dans le lexique 2.1.1.2.3. Surgénération des sites d'épenthèse 2.1.2. Epenthèse et mélodie des consonnes contextuelles : Wetzels (1985), Picard (1987a, 1987b, 1989), Clements (1987) 2.1.2.1. Présentation de l'analyse 2.1.2.1.1. Occlusives intrusives 2.1.2.1.2. Epenthèses consonantiques 2.1.2.2. Critique 2.1.3. Epenthèse en hiatus et frontière morphologique : Wetzels (1987) 2.1.3.1. Présentation de l'analyse 2.1.3.2. Critique 2.1.4. Bilan sur le cadre non-syllabique 2.2. Cadre syllabique : présence d'une position consonantique 231 234 235 236 237 238 239 241 241 242 243 243 244 244 245 245 246 246 247 247 247 248 248 249 250 251 251 256 256 257 259 260 260 260 263 263 263 264 265 265 266 268 270 270 270 274 275 276 Table des matières 2.2.1. Epenthèse consonantique et syllabation : Piggott & Singh (1985), Itô (1989) 2.2.1.1. Piggott & Singh (1985) 2.2.1.1.1. Présentation de l'analyse 2.2.1.1.2. Critique 2.2.1.2. Itô (1989) 2.2.1.2.1. Présentation de l'analyse 2.2.1.2.2. Critique 2.2.1.3. Bilan sur le cadre syllabique 2.2.2. Epenthèse, syllabation et morphologie : Théorie de l'Optimalité 2.2.2.1. Prince & Smolensky (1993) : FILL theory. 2.2.2.1.1. Epenthèse en attaque 2.2.2.1.2. Epenthèse en coda ? 2.2.2.1.3. Bilan 2.2.2.2. McCarthy & Prince (1995) : DEP theory. 2.2.2.2.1. Principe général 2.2.2.2.2. Illustration : épenthèse de [l] en coda 2.2.2.3. Critique 2.2.3. Epenthèse et accent : Scheer (2000a) 2.2.3.1. Présentation de l'analyse 2.2.3.2. Critique 2.2.4. Bilan Conclusion 276 276 276 279 280 280 282 282 283 283 285 286 287 288 289 290 291 293 293 295 297 299 Table des matières PARTIE II. L'ÉPENTHÈSE CONSONANTIQUE DEVANT SUFFIXE DÉRIVATIONNEL EN FRANÇAIS : LES FAITS 300 Introduction 301 Chapitre 4. Délimitation de l'objet d'étude 1. Français standard, populaire, ordinaire... 1.1. Français standard 1.1.1. Standard, norme et communauté linguistique 1.1.2. Standard et correctitude de la langue 1.1.3. Standard et naturalité 1.1.4. Bilan sur le français standard 1.2. Français populaire 1.3. Français ordinaire 1.4. Variations régionale et sociale 1.5. Bilan 2. Le français dans sa dimension temporelle 3. Point sur la suffixation 3.1. Mise au point terminologique 3.1.1. Mot et lexique 3.1.1.1. Mots et unités lexicales. 3.1.1.2. Que trouve-t-on dans le lexique ? 3.1.2. Racines et radicaux, thèmes et bases 3.2. Formation des unités lexicales : composition et dérivation 3.2.1. Critère paradigmatique. 3.2.2. Amalgame sémantique. 3.2.3. Critère graphique 3.2.4. Autonomie des éléments formant les composés 3.2.5. Non-autonomie des éléments formant les dérivés 3.2.6. Ordre déterminant / déterminé dans les unités lexicales construites 3.2.7. Bilan 3.3. Dérivation et flexion. 3.4. La dérivation suffixale : problème syntaxique ou morphologique ? 3.5. Aspects particuliers des suffixes 3.5.1. Position dans l'unité lexicale construite 3.5.2. Allomorphie et homonymie suffixales 3.6. Compositionalité du sens des dérivés. 3.7. Contraintes sur la formation des unités lexicales construites. 3.7.1. Règles de formation de mots 3.7.2. Ordre des morphèmes 3.7.3. Combinaison des morphèmes 3.7.4. Parasynthèse 3.8. Les "éléments intermédiaires" 302 302 302 304 305 305 306 306 307 307 309 309 311 311 312 312 315 316 318 319 320 321 322 323 324 326 326 328 330 330 332 333 334 334 335 336 336 338 Chapitre 5. Constitution de la base de données 1. Création d'un corpus à partir de sources écrites. 1.1. Ressources non exploitées 1.2. Liste informatisée de 64.296 mots du français (A) 1.2.1. Méthode et justification 1.2.2. Traitement préalable du corpus 340 342 342 344 345 345 Table des matières 1.2.3. Comparaison des unités lexicales par la gauche 1.2.4. Comparaison du "déchet" par la droite 1.2.5. Obstacles et difficultés 1.2.5.1. Alternances de radicaux 1.2.5.2. Allomorphies suffixales 1.2.5.3. Homographie de radicaux 1.2.5.4. Epenthèse commune à une famille lexicale 1.2.5.5. Epenthèse identique devant un même suffixe 1.2.5.6. Aveuglement graphique 1.2.6. Bilan 1.3. Dictionnaires d'argot (B) 1.3.1. Dictionnaire de l'argot français et de ses origines 1.3.2. Dictionnaire du français argotique et populaire 1.3.3. Récapitulatif des termes relevés dans les dictionnaires d'argot 1.4. Recherche à partir d'expressions dans le TLFi (C) 1.5. Données issues d'articles (D) 1.6. Examen systématique des termes présentant les suffixes -ier, -age et -erie (E) 1.7. Données issues de Néologismes du français contemporain (H) 1.8. Données issues de L'insolite, Dictionnaire des mots sauvages (K) 1.9. Bilan des ressources écrites. 2. Introduction de données uniquement orales (G) 3. Bilan sur les méthodes de constitution du corpus 4. Bilan sur les terminaisons représentées dans le corpus 349 351 354 354 361 363 364 366 366 367 368 368 369 370 371 376 378 Chapitre 6. De la base de données au corpus de travail 1. Premier filtre : étymologies et consonnes sous-jacentes 1.1. Terme composé et non dérivé 1.2. Epenthèse mal placée 1.3. Etymologie 1.3.1. Héritage d'un terme latin 1.3.2. Présence de la consonne dans la base 1.3.3. Consonne uniquement graphique 1.3.4. Croisement de plusieurs étymologies 1.3.5. Consonne différente de celle de l'épenthèse 1.3.6. Bilan sur l'apport de l'étymologie sur la constitution du corpus 1.3.6.1. En fonction des critères retenus. 1.3.6.2. En fonction de la provenance des termes possiblement porteurs d'une épenthèse 1.4. Consonne sous-jacente révélée par le féminin 1.4.1. Bases en -aud 1.4.2. Terminaison en -at 1.4.3. La famille de gueux 1.4.4. Terminaison en [u] 1.4.5. Bilan du premier filtre à ce niveau du traitement 1.5. Alternances suffixales (en début de suffixe du dérivé) 1.5.1. -iser vs. -er 1.5.2. -eter vs. -et + -er 1.5.3. -ot(t)er vs. -ot + -er 1.5.4. Suffixes argotiques 394 395 395 396 397 400 401 403 404 404 406 406 406 380 382 384 385 389 391 407 409 409 410 410 410 411 411 413 415 416 Table des matières 1.5.5. Autres variantes suffixales 1.5.6. Bilan sur les alternances suffixales 1.5.7. Récapitulatif du traitement du corpus jusqu'à présent 1.6. Alternances radicales 1.6.1. Bases incertaines 1.6.2. Suffixes présents en fin de thème 1.6.2.1. -ard : foulardage, bousarderie, musarderie, jobarder 1.6.2.2. -at : gravatier, goujaterie / crachaté / taxateur, taxatif 1.6.2.3. -aud : marauder, minauder, rustauderie, finauderie, badaudage, badauder, badauderie, esquimaudage 1.6.2.4. -is : roulis 1.6.2.5. Récapitulatif 1.7. Trois familles lexicales particulières 1.7.1. La famille de pied 1.7.2. La famille de sorcier 1.7.3. La famille de coq 1.7.4. Bilan 1.8. Codage des termes maintenus 1.8.1. Position 1.8.2. Formation savante : noms d'habitants et de pays 1.8.2.1. Nom de pays 1.8.2.2. Noms d'habitants 1.9. Bilan au terme du premier filtre 1.9.1. Bilan des méthodes de recueil 1.9.1.1. Récapitulatif des termes rejetés, indécis et maintenus 1.9.1.2. Evaluation du succès de chaque méthode 1.9.2. Composition des 422 termes maintenus dans le corpus 1.9.2.1. En fonction de la méthode de recueil du terme dans le corpus 1.9.2.2. Tri en fonction de la base des dérivés 1.9.2.3. Tri en fonction de la finale de la base 1.9.2.3.1. Et des bases elles-mêmes 1.9.2.3.2. Et de la consonne épenthésée 1.9.2.4. Tri en fonction de l'initiale du suffixe 1.9.2.4.1. Et du suffixe 1.9.2.4.2. Et de la consonne épenthésée 1.9.2.5. Tri en fonction de la consonne épenthésée 1.9.2.6. Tri en fonction de la catégorie lexicale 1.9.2.6.1. De la base puis de celle du dérivé 1.9.2.6.2. Du dérivé puis de celle de la base 1.9.2.7. Tri en fonction de la taille du radical 1.9.2.7.1. Puis de la base 1.9.2.7.2. Puis de la consonne épenthésée 1.9.2.8. Tri par suffixe 1.10. Conclusion de la section 2. Deuxième filtre : les écueils de la morphologie dérivationnelle française - qu'est-ce qui est dérivé de quoi ? 2.1. Suffixes diminutifs 2.1.1. -eau 2.1.2. -(el)et(te) 418 420 420 421 421 423 424 424 425 425 425 427 427 427 428 429 429 429 430 430 430 431 431 431 432 433 433 433 433 434 436 437 438 440 441 442 442 444 446 446 448 450 451 452 453 453 453 Table des matières 2.1.3. -in 2.2. Suffixes ethniques 2.2.1. -ain(e) 2.2.2. -ais(e) 2.2.3. -ois(e) 2.2.4. -ie 2.3. Suffixes scientifiques 2.3.1. -ine 2.3.2. -ite 2.4. Suffixes purement adjectivaux 2.4.1. -al(e) 2.4.2. -(at)aire 2.4.3. -esque 2.4.4. -ième 2.4.5. -ien et -éen 2.4.6. -if (-ive) 2.4.7. -ique 2.4.8. -(at)oire 2.5. Suffixes purement nominaux 2.5.1. -age 2.5.2. -aille 2.5.3. -ée 2.5.4. -esse 2.5.5. -ille 2.5.6. -(at)ion 2.5.7. -is 2.5.8. -isme 2.5.9. -iste 2.5.10. -(it)ude 2.5.11. -(e)ment 2.5.12. -on 2.5.13. -ot(e) 2.5.14. -(i)té 2.5.15. -(at)ure 2.6. Suffixes "mixtes" 2.6.1. -ier et variantes 2.6.1.1. -andier 2.6.1.2. autres -ier 2.6.1.3. -ière 2.6.1.4. -(er)ie 2.6.1.5. -(er)aie 2.6.2. -(at)eur et -(at)eux 2.6.2.1. -(at)eur, -(at)euse, -(at)rice 2.6.2.2. -(at)eux 2.6.3. -ard, -asse 2.6.3.1. Le suffixe -ard 2.6.3.2. -ass(e) 2.6.3.3. La terminaison -ar 2.7. Suffixes verbaux 2.7.1. Suffixes en relation avec verbe en -er 453 454 455 455 456 456 457 458 458 459 459 459 461 462 462 463 465 467 468 468 473 474 474 474 475 476 477 478 478 479 481 483 484 484 486 486 486 488 497 499 503 504 504 507 510 510 512 513 515 515 Table des matières 2.7.1.1. -é(e) (participe passé) 2.7.1.2. -ant (participe présent) 2.7.1.3. -able 2.7.2. Suffixes infinitifs 2.7.2.1. -iner 2.7.2.2. -iser 2.7.2.2.1. Le suffixe -iser 2.7.2.2.2. La terminaison -iser 2.7.3. Les suffixes infinitifs 2.7.3.1. -ir 2.7.3.2. -er 2.8. Ajouts au corpus liés à ce second filtre 2.8.1. Verbes en -er 2.8.2. Dérivés en -ier 2.8.3. Dérivé en -eur 2.9. Bilan au terme du deuxième filtre 2.9.1. Répartition des 435 termes traités 2.9.1.1. Termes rejetés 2.9.1.2. Termes indécis 2.9.1.3. Termes maintenus 2.9.1.4. Termes ajoutés 2.9.1.5. Bilan quantitatif des 435 termes 2.9.2. Bilan concernant les termes jusqu'alors "indécis" 2.9.3. Représentation schématique de l'ensemble de la base de données à ce stade 2.9.4. Evaluation des méthodes de recueil 2.9.5. Composition des 272 termes maintenus dans le corpus 2.9.5.1. Tri en fonction de la base 2.9.5.2. Tri en fonction de la finale de la base 2.9.5.3. Tri en fonction de l'initiale du suffixe 2.9.5.4. Tri en fonction de la consonne épenthésée 2.9.5.5. Tri en fonction de la catégorie lexicale 2.9.5.6. Tri en fonction de la taille du radical 2.9.5.7. Tri en fonction du suffixe 2.10. Conclusion 515 518 519 519 520 520 520 521 522 522 523 523 523 525 526 526 526 526 526 527 527 527 527 528 Chapitre 7. De l'intérêt d'un questionnaire. 1. Etapes préliminaires 1.1. Etablissement d'une liste de suffixes vitaux 1.1.1. Productivité et vitalité des suffixes 1.1.2. Sources exploitées 1.2. Questionnaire portant sur la productivité des suffixes. 2. Élaboration d'un questionnaire portant sur les conditions d'apparition des épenthèses 2.1. Conditionnements phonologiques 2.1.1. Voyelle finale du radical 2.1.2. Voyelle initiale du suffixe 2.1.3. Taille de la base 2.2. Conditionnements morphologiques 2.2.1. Catégorie lexicale de la base 2.2.2. Catégorie de suffixe 543 543 544 544 545 546 549 550 550 553 553 555 555 556 529 530 531 531 534 537 539 540 541 542 Table des matières 2.2.3. Suffixes 2.3. Détails pratiques 2.3.1. Elaboration des questions en fonction des critères phonologiques et morphologiques 2.3.2. Mode de questionnement 2.3.3. Répartition de l'échantillon de locuteurs. 3. Résultats du questionnaire 3.1. Etiquetage des résultats. 3.2. Résultats par locuteur 3.3. Résultats en fonction de la voyelle finale du radical 3.3.1. Concaténation simple 3.3.2. Epenthèse 3.3.3. Autres 3.3.4. Bilan 3.4. Résultats en fonction de la voyelle initiale du suffixe 3.4.1. Concaténation simple 3.4.2. Epenthèse 3.4.3. Autres 3.4.4. Bilan 3.5. Résultats en fonction de la taille du radical 3.5.1. Concaténation simple 3.5.2. Epenthèse 3.5.3. Autres 3.5.4. Bilan 3.6. Résultats en fonction de la catégorie lexicale de la base 3.6.1. Concaténation simple 3.6.2. Epenthèse 3.6.3. Autres 3.6.4. Bilan 3.7. Résultats en fonction de la catégorie du suffixe 3.7.1. Concaténation simple 3.7.2. Epenthèse 3.7.3. Autres 3.7.4. Bilan 3.8. Résultats en fonction du suffixe 4. Bilan général du questionnaire 556 557 557 558 560 560 561 563 567 568 570 572 573 574 574 575 578 579 580 580 581 582 583 583 583 584 585 585 586 586 588 588 589 590 593 Conclusion 594 Table des matières PARTIE III. EPENTHÈSE CONSONANTIQUE EN FRANÇAIS : DISTRIBUTION D'UNE UNITÉ [CV] PAR LA SYNTAXE, LA SÉMANTIQUE ET LA MORPHOLOGIE, ET SES CONSÉQUENCES PHONOLOGIQUES 595 Introduction 596 Chapitre 8. Cadre théorique 1. Phonologie de Gouvernement et cadre CVCV 2. Position forte et Coda-Miroir (Scheer & Ségéral 2001) 2.1. Etablissement de la position forte 2.2. Début de mot = [CV] (Lowenstamm 1999) 2.3. Unicité des contextes de position forte 2.4. Gouvernement et licenciement : définition unitaire 599 599 603 604 606 609 610 Chapitre 9. [CV] sémantique : les conséquences phonologiques de l'emphase 1. Préliminaires 1.1. Représentation de l'accent dans le cadre CVCV 1.1.1. Allongement compensatoire en italien 1.1.2. Aspiration des occlusives en anglais 1.1.3. Bilan 1.2. manifestations de l'accent en français 1.2.1. Accent tonique 1.2.2. Accent d'insistance 2. Emphase et géminées 2.1. Géminées consonantiques 2.2. Géminées vocaliques : formidaaable ! 2.3. Bilan 3. Emphase et épenthèse 3.1. Devant voyelle : épenthèse de [!] 3.1.1. A l'initiale de mot : c'est [!] incroyable 3.1.2. En hiatus interne 3.1.2.1. A proximité d'une frontière morphologique : co[!]opérer 3.1.2.2. A l'intérieur d'un morphème : caca[!]o 3.1.3. Bilan 3.2. Devant coup de glotte : épenthèse de [!] 3.2.1. Représentations des mots à initiale en "h aspiré" 3.2.1.1. Encrevé (1988a) 3.2.1.2. Phonologie de Gouvernement 3.2.1.3. Coup de glotte lexical 3.2.1.4. Coup de glotte lexical et position forte 3.2.2. Emphase et mots à "h aspiré" 3.2.3. Statut particulier du coup de glotte 3.2.3.1. Coup de glotte et emphase 3.2.3.2. Coup de glotte et gémination 3.2.3.3. Définition d'un domaine phonologique 3.2.3.4. Coup de glotte et domaine phonologique 3.2.3.5. Bilan 3.3. Application 3.3.1. Verbe à finale en "attaque branchante" : vivre où ? 614 614 615 615 618 619 619 620 620 622 622 625 627 628 628 628 630 631 631 632 634 635 635 637 638 639 640 641 641 641 642 643 646 646 647 Table des matières 648 649 650 651 652 3.3.1.1. Avec enchaînement : [vivru], [vivruu] 3.3.1.2. Sans enchaînement 3.3.1.2.1. Vα gouverne Cα : [vivr&u] 3.3.1.2.2. Vα ne gouverne pas Cα : [viv!u] 3.3.1.2.3. Réalisations emphatiques : [vivr&!u], [viv!u], [viv|!u] 3.3.2. Verbe à finale "coda-attaque" : porte où ? 3.3.2.1. Avec enchaînement : [p(rtu], [p(rtuu] 3.3.2.2. Sans enchaînement : [p(rt&u] vs.[p(rt&!u] 3.3.3. Verbe à finale vocalique : manger où ? 3.3.3.1. Sans enchaînement 3.3.3.1.1. Sans emphase : [m+,-eu] 3.3.3.1.2. Avec emphase : [m+,-euu], [m+,-e!u] 3.3.4. Verbe à finale consonantique simple : partir où ? 3.3.4.1. Avec enchaînement : [partiru], [partiruu] 3.3.4.2. Sans enchaînement : [partir!u] 3.3.5. Bilan de l'étude des séquences [verbe + où] 3.4. Bilan de l'épenthèse en relation avec l'emphase 4. Bilan sur le [CV] sémantique 655 655 656 657 658 658 659 660 660 661 662 663 664 Chapitre 10. [CV] syntaxique : les conséquences phonologiques de l'enclise 1. Mise en place de la problématique 1.1. Inversion du sujet 1.2. Impératif 2. Analyse 2.1. La consonne de liaison appartient au verbe 2.1.1. La consonne relève de la flexion 2.1.1.1. Liaison hors inversion 2.1.1.2. Morphèmes personnels 2.1.1.3. Deux catégories de verbes 2.1.1.4. Bilan 2.1.2. La consonne est flottante en fin de radical 2.1.3. Séparabilité du verbe et de la consonne de liaison 2.1.4. Bilan 2.2. La consonne de liaison est attachée au clitique 2.2.1. Démonstration 2.2.1.1. Position de la consonne 2.2.1.2. Français régional 2.2.1.3. Contexte mélodique 2.2.1.4. Constance de la nature de la consonne 2.2.1.5. Présence obligatoire de la consonne 2.2.1.6. Formalisation 2.2.2. Réfutation 2.2.2.1. Liaison hors enchaînement 2.2.2.2. Inventaire des éléments précédés d'une consonne à l'inversion 2.2.2.3. Pas de [t] à l'initiale 2.2.3. Bilan 2.3. La consonne de liaison est épenthétique 669 669 670 672 673 673 674 674 677 679 680 681 682 683 684 684 684 685 686 686 686 686 687 687 687 688 689 690 Table des matières 2.4. Proposition : morphème piloté par la syntaxe et marqueur d'accord 2.4.1. Morphème d'inversion 2.4.2. Morphème de placement de clitique 2.4.3. Marqueur d'accord 2.4.3.1. Proposition 2.4.3.2. Retour sur la liaison 2.4.3.3. Typologie des consonnes "de liaison" 2.4.4. Représentation 2.4.4.1. Finale en consonne flottante 2.4.4.2. Donne-moi [z] en terrasse le [CV] d'inversion 2.4.4.3. Finale vocalique 2.4.4.4. Finale consonantique complexe fixe 2.4.4.4.1. "Attaque branchante" : [TR] 2.4.4.4.2. "Coda-attaque" et "bogus clusters" : [RT] vs. [TT] 2.4.4.4.3. Trois types de groupes consonantiques en CVCV 2.4.4.5. Finale consonantique simple fixe 2.4.4.6. Personnes du pluriel 2.4.5. Inversion du sujet et première personne 2.4.6. Liaison vs. inversion : l'aspiration consonantique en français canadien 2.4.7. Enclise et proclise 3. Bilan sur le [CV] syntaxique Chapitre 11. [CV] morphologique : les conséquences phonologiques de la dérivation 1. Interaction morphologie / phonologie 1.1. Rôle de la morphologie en phonologie 1.2. Traduction de la morphologie en phonologie 2. Formation des adverbes en -ment en français (Pagliano 1999a) 2.1. Données 2.2. Analyse comparative 2.2.1. Morphème suffixal 2.2.2. Adverbes en -(&)ment 2.2.2.1. Base à finale consonantique simple latente : bassement 2.2.2.2. Base à finale consonantique latente derrière consonne fixe : sourdement 2.2.2.3. Base à finale consonantique simple fixe : lucidement 2.2.2.4. Base à finale consonantique complexe fixe : âprement 2.2.3. Adverbes en -ément : commodément 2.2.4. Adverbes en -ment : joliment 2.2.5. [CV] et gémination 2.2.6. Adverbes en -[a]ment : méchamment 2.2.7. Bilan 2.3. Les géminées en français 2.3.1. "Vraies" géminées 2.3.2. "Fausses" géminées 2.3.3. Retour à l'emphase 2.3.4. Géminées virtuelles 691 691 692 694 695 697 697 700 701 702 705 705 705 708 715 717 718 718 721 723 725 728 729 730 730 731 732 733 733 734 734 735 736 737 738 739 740 741 742 744 744 746 748 752 Table des matières 2.3.4.1. Manifestations en colonais et en somali (Ségéral & Scheer 1999, 2001b) 2.3.4.1.1. Allemand colonais 2.3.4.1.2. Somali 2.3.4.2. En français 2.3.4.2.1. Collègue 2.3.4.2.2. Illisible 2.3.4.2.3. Méchamment 2.3.5. Gémination et position forte 2.4. Bilan 3. Classes de suffixes 3.1. Classes de suffixes et Phonologie Lexicale 3.2. Classes de suffixes et modèle représentationnel 3.3. Classes de suffixes en français 4. Dérivés suffixaux et épenthèses consonantiques 4.1. Avant voyelle 4.1.1. En hiatus 4.1.2. Après consonne 4.2. Avant consonne 4.2.1. Suffixes -ier, -ième, -ien, -ois 4.2.1.1. Glide en attaque vs. glide en noyau 4.2.1.2. Le suffixe -ier 4.2.1.3. Le suffixe -ien 4.2.1.4. Le suffixe -ième 4.2.1.5. Le suffixe -ois 4.2.1.6. Bilan 4.2.2. Suffixes -elet, -ement, -eraie, -erie, -eté 4.2.2.1. Suffixes à initiale consonantique ? 4.2.2.2. Frontière morphologique [CVCV] ? 4.2.2.3. Schwa en initiale de suffixe ? 4.2.2.4. Réalisation du schwa lexical 5. Bilan sur le [CV] morphologique 753 753 755 757 758 758 760 763 766 767 768 770 772 779 779 779 780 784 785 785 786 790 792 793 794 794 795 796 797 801 803 Chapitre 12. Prolongements de l'analyse : la position forte 1. Emphase, intensif et gémination 2. Nature de l'épenthèse en français 3. Position forte et épenthèse consonantique en français : réciprocité ? 3.1. Syntaxe et sémantique vs. morphologie 3.2. Initiale de mot et épenthèse consonantique 3.3. De l'initiale de mot en français Conclusion de la partie III 804 804 808 812 812 814 815 819 Conclusion générale 822 Index général 825 Références 827 Table des matières ANNEXES 859 Annexe 1 : Liste des termes après le premier filtre Annexe 1a - Mots retenus après le premier filtre - tri par origine puis base puis consonne épenthésée Annexe 1b - Mots retenus après le premier filtre - tri par base puis consonne épenthésée Annexe 1c - Mots retenus après le premier filtre - tri par finale base puis base Annexe 1d - Mots retenus après le premier filtre - tri par finale base puis consonne épenthésée puis suffixe Annexe 1e - Mots retenus après le premier filtre - tri par initiale suffixe, suffixe puis consonne épenthésée Annexe 1f - Mots retenus après le premier filtre - tri par initiale suffixe, suffixe puis consonne épenthésée Annexe 1g - Mots retenus après le premier filtre - tri par consonne épenthésée puis suffixe Annexe 1h - Mots retenus après le premier filtre - tri par catégorie de la base puis catégorie du dérivé Annexe 1i - Mots retenus après le premier filtre - tri par catégorie du dérivé puis catégorie de la base Annexe 1j - Mots retenus après le premier filtre - tri par gabarit radical puis base Annexe 1k - Mots retenus après le premier filtre - tri par gabarit radical puis consonne épenthésée Annexe 1l - Mots retenus après le premier filtre - tri par suffixe puis consonne épenthésée Annexe 1m - Mots retenus après le premier filtre - tri par suffixe puis consonne épenthésée Annexe 1n - Liste des préfixes du français du TLFi Annexe 1p - Liste des argots spécifiques (Colin, Mével & Leclère 2001) 860 861 Annexe 2 : Liste des termes après le deuxième filtre Annexe 2a - Récapitulatif du traitement des 435 dérivés traités au second filtre Annexe 2b - Tri des mots retenus après le 2ème filtre - ordre alphabétique Annexe 2c - Mots retenus après le deuxième filtre - tri par base puis consonne épenthésée Annexe 2d - Mots retenus après le deuxième filtre - tri par finale base, consonne épenthésée, suffixe, base Annexe 2e - Mots retenus après le deuxième filtre - tri par initiale suffixe, suffixe puis consonne épenthésée Annexe 2f - Mots retenus après le deuxième filtre - tri par consonne épenthésée puis base puis suffixe Annexe 2g - Mots retenus après le deuxième filtre - tri par consonne épenthésée puis suffixe Annexe 2h - Mots bleus après le deuxième filtre - tri par catégorie de la base puis catégorie du dérivé Annexe 2i - Mots bleus après le deuxième filtre - tri par taille du radical puis suffixe Annexe 2j - Mots retenus après le deuxième filtre - tri par suffixe puis consonne épenthésée Annexe 2k - Tri mots retenus après le deuxième filtre - par contexte syllabique 919 920 926 927 868 874 882 887 891 894 897 900 903 908 910 912 915 918 932 937 939 944 946 948 950 955 Table des matières Annexe 3 : Récapitulatif du traitement des 859 termes Annexe 3a - Classement des 859 termes selon leur origine d'extraction Annexe 3b - Classement des 859 termes selon leur terminaison Annexe 3c - Corpus détaillé Annexe 3d - Nature de la consonne épenthésée à la frontière suffixale 957 958 961 967 1101 Annexe 4 : Questionnaire Annexe 4Aa - Suffixes vitaux Annexe 4Ab - Ebauche de questionnaire visant à tester la vitalité des suffixes Annexe 4Ba - Type de finales du radical et gabarit du radical Annexe 4Bb - Nature de la base et nature du suffixe Annexe 4Bc - Questionnaire visant à tester la production d'épenthèses entre radical et suffixe Annexe 4C - F14 (Nice-Nice) Annexe 4C - F21 (Var-Nice) Annexe 4C - F23 (Guillaume 06 - Nice) Annexe 4C - F25 (Lyon - Nice - Paris) Annexe 4C - F31 (Seine-et-Marne - Var - Nice) Annexe 4C - F47 (Tunisie - Nice) Annexe 4C - F52 (Nice - Nice) Annexe 4C - F53 (Nice - Normandie) Annexe 4C - H18 (Nice - Nice) Annexe 4C - H24 (Nice - Nice) Annexe 4C - H50 (Bourgogne - Nice) Annexe 4C - H55 (Paris - Nice) Annexe 4Da - Résultats en fonction de la voyelle finale du radical Annexe 4Db - Résultats en fonction de la voyelle initiale du suffixe Annexe 4Dc - Résultats en fonction de la taille du radical Annexe 4Dd - Résultats en fonction de la catégorie lexicale de la base Annexe 4De - Résultats en fonction de la catégorie du suffixe Annexe 4Df - Résultats en fonction du suffixe 1108 1109 1111 1113 1118 1124 1134 1139 1144 1149 1154 1159 1164 1169 1174 1179 1184 1189 1194 1196 1198 1200 1202 1204 Introduction générale Introduction générale Le sous-titre de cette thèse se veut représentatif des trois contextes d'épenthèse consonantique en français : parles-en [parlz] illustre l'épenthèse avant un pronom clitique, à l'impératif et à l'inversion du sujet. Numérotation [nymerotasjç] représente les épenthèses entre radical et suffixe. Enfin, l'occlusive glottale à l'initiale de l'adjectif impossible [posibl] marque le troisième cas d'épenthèse, à l'emphase. Cette thèse poursuit deux objectifs, l'un d'ordre empirique et l'autre théorique. Elle offre un corpus original de données présentant une épenthèse consonantique à la frontière dérivationnelle suffixale en français. Elle propose également une analyse portant sur une modélisation de l'intervention des niveaux supérieurs de la grammaire en phonologie, par la création d'une position forte. Ces deux pôles trouvent leur origine dans une source commune : l'étude de l'épenthèse consonantique en français. La contribution empirique de cette thèse est assurée par la constitution de données dont le recensement systématique n'avait jusqu'à présent pas été entrepris. Le corpus fini rassemble 272 dérivés français, correspondant à 206 bases différentes, qui comportent une consonne entre le radical et le suffixe. C'est un processus de filtrage méthodique et rigoureux qui a permis de déterminer le caractère épenthétique de la consonne. Ont ainsi été rejetés près de 70 % des 859 termes de la base de données préalablement constituée à partir de sources aussi diverses que les recueils de néologismes ou les dictionnaires électroniques, au moyen de méthodes d'extraction manuelles ou semi-automatisées. Les consonnes dont une analyse étymologique a établi l'existence diachronique ont été éliminées du corpus, ainsi que celles qui peuvent être créditées d'une existence lexicale et celles pour lesquelles l'étude suffixale a établi un doute quant à leur nature ex nihilo. Je prends en effet le parti de considérer dans l'établissement de ce corpus, comme dans l'étude en elle-même, les seules consonnes non-étymologiques, non sous-jacentes et qui ne sont pas prédictibles par le contexte : les consonnes ex nihilo. 1 Introduction générale L'hypothèse soutenue est que l'épenthèse consonantique ne dépend aucunement du niveau mélodique en français, mais du niveau syllabique. Je démontrerai ainsi que l'hiatus ne constitue pas en lui-même le contexte déclencheur de l'épenthèse consonantique, mais que celle-ci est conditionnée par l'existence dans la séquence d'une position consonantique forte, à laquelle n'est associé aucun segment lexical. Je soutiens que c'est la présence d'une unité [CV] correspondant à la frontière dérivationnelle suffixale qui est responsable de cette position forte. Cette unité [CV] est la traduction, en phonologie, de la frontière morphologique, c'est-à-dire de cet objet jusqu'alors opaque et le plus souvent transcrit par #, + et d'autres diacritiques. Proposer une implémentation phonologique d'un objet morphologique s'inscrit dans un projet plus large, initié par Lowenstamm (1999) en ce qui concerne le début de mot, et qui consiste à identifier la nature des objets non proprement phonologiques mais qui jouent pourtant un rôle en phonologie. Il incombe en effet au phonologue d'exprimer la réalité de ces objets autrement que par une représentation diacritique. Leur modélisation en termes phonologiques permet d'expliquer leurs effets dans la structure au lieu de simplement en faire état. Je propose pour ma part l'interprétation d'un second type de frontière morphologique, autre que le début de mot : celle de la frontière dérivationnelle, ou plus exactement d'une frontière dérivationnelle suffixale du français, dont on observe la manifestation à travers l'épenthèse consonantique. Ainsi un dérivé comme numéroter, formé à partir de la base numéro et du suffixe -er, présente-t-il une épenthèse consonantique de l'occlusive coronale [t] qui est selon la théorie que je présente la résultante de cette frontière morphologique particulière. Comme en anglais, il existe donc deux classes de suffixes en français : les suffixes qui ont cette frontière morphologique, et ceux qui ne l'ont pas. J'étends de plus la démarche à la syntaxe et à la sémantique. La frontière dérivationnelle suffixale ne constitue en effet qu'un des trois contextes d'épenthèse consonantique du français sur lesquels se penche cette thèse. Seront également considérées les épenthèses consonantiques liées à l'emphase, que l'on observe par exemple dans la réalisation [s(t)posibl] de la séquence c'est impossible, dans laquelle l'emphase porte sur la première syllabe, à initiale vocalique, de l'adjectif. Il s'agit là d'un facteur sémantique, voire stylistique, puisque c'est l'emphase qui est le déclencheur de l'épenthèse : la réalisation de la séquence hors emphase ne comporte pas l'occlusive glottale ([s(t)posibl]). Le troisième cas étudié concerne les épenthèses en relation avec le placement du pronom clitique dans la phrase, c'est-à-dire causées par la syntaxe : dans parles-en, le [z] est épenthétique. 2 Introduction générale Toutes ces épenthèses sont obligatoires : on ne peut réaliser numéroter sans [t] (*[nymeroe]), non plus que c'est impossible, lorsque l'emphase porte sur la première syllabe, sans [] ou parles-en sans [z] (*[parlz]). En outre, la consonne épenthétique, dans ces cas, est toujours la même dans un contexte donné. Ceci établit une différence marquée avec le phénomène de liaison qui met en jeu une consonne flottante variable. Je référerai à ces trois cas d'épenthèse en fonction du niveau qui les conditionne ; je parlerai ainsi d'épenthèse morphologique pour numéroter, syntaxique pour parles-en et sémantique pour c'est impossible. Je montrerai que pour chacune de ces situations, l'existence d'une unité [CV], en provenance des trois niveaux supérieurs, explique l'apparition de l'épenthèse consonantique. Cette unité [CV] est également la cause, dans certains cas, de la gémination d'une consonne lexicalement présente : c'est épouvantable [s(t)eppuvtabl]. Je parlerai ainsi des [CV] morphologique, syntaxique et sémantique, respectivement. Cette extension de la démarche qui consiste à déterminer l'identité phonologique d'objets issus d'autres composants de la grammaire n'est novatrice qu'en ce qui concerne les langues indo-européennes. C'est chose acquise dans la tradition sémitique : ce qui est connu comme gabarit n'est rien d'autre, en réalité, que la représentation graphique d'effets phonologiques induits par des ordres morphologiques et sémantiques. La première partie de la thèse sera consacrée à une présentation générale du phénomène de l'épenthèse consonantique tel qu'il apparaît dans la littérature. Y est également inclus un chapitre concernant les consonnes coronales, qui sont celles que l'on observe à l'épenthèse entre radical et suffixe en français, et à leur statut particulier reconnu à la fois empiriquement et au sein des théories phonologiques. Un troisième volet examinera la représentation de l'épenthèse consonantique dans les théories selon deux axes : ses rapports avec le phénomène des alternances consonne ~ zéro en français, et les analyses portant sur l'épenthèse à proprement parler. La deuxième partie s'articule autour de l'élaboration du corpus qui constitue la contribution empirique de cette thèse : l'épenthèse consonantique à la frontière dérivationnelle suffixale. Outre l'élaboration du corpus lui-même, du recueil brut d'unités lexicales dérivées à la sélection finale des termes présentant effectivement une épenthèse consonantique ex nihilo, elle propose un questionnaire qui enquête sur les conditions d'apparition de l'épenthèse dans des néologismes. 3 Introduction générale C'est dans la troisième partie que sera présentée l'analyse qui met en exergue l'implémentation en phonologie d'une séquence [CV] envoyée par les niveaux supérieurs de la grammaire, [CV] dont la présence crée une position forte responsable de l'apparition des consonnes épenthétiques du français. J'aborderai également dans cette partie la représentation des mots à h aspiré et les liaisons post-verbales, qui se révèleront être de pures "fictions orthographiques". La proposition centrale de cette thèse est la suivante : il n'y a pas d'épenthèse en dehors de la position forte en français. Autrement dit, toutes les épenthèses consonantiques en français sont le résultat d'une position forte. La réciproque est vraisemblablement juste : une position forte non pourvue de mélodie constitue une condition nécessaire et suffisante à l'apparition d'une épenthèse consonantique ; j'aborderai le cas du début de mot dans la thèse. La position forte est symbolisée par le schéma ci-dessous. J'expliquerai la représentation dans la thèse, mais il est essentiel de retenir dès à présent que la position forte est la consonne C0 parce qu'elle s'inscrit dans la structure en fonction des relations suivantes : origine syntaxique, morphologique, sémantique position forte Gouv [C V] V C0 | V Lic épenthèse 4 Partie I. L’épenthèse consonantique dans les langues en général 5 Partie I – L'épenthèse consonantique dans les langues en général Introduction Cette première partie a pour ambition de brosser le portrait général de l'épenthèse consonantique, tant du point de vue de son étendue empirique que de la façon dont les théories ont pu la traiter. Le premier chapitre sera consacré à la revue des divers cas d'épenthèse dans les langues du monde en général et en français en particulier, en mettant l'accent sur le type de segment inséré et sur les motivations possibles à cet apport mélodique. A l'issue de ce chapitre, un premier bilan quant à la qualité de la consonne épenthétique conduira à s'intéresser plus précisément aux coronales, du point de vue de leur statut particulier comme de leur représentation phonologique, ce qui constituera l'objet du second chapitre de cette première partie. Le dernier chapitre proposera un examen des analyses linguistiques proposées pour rendre compte du phénomène de l'épenthèse consonantique, depuis les cadres linéaires jusqu'à la Théorie de l'Optimalité, tant en lui-même qu'au sein du cadre plus large des alternances consonne ~ zéro. 6 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Chapitre 1. Distribution géographique, variation qualitative, contextes d'apparition et causalités Qu’entend-on précisément par "épenthèse" ? S'agit-il de l'épenthèse d'un élément, ou nécessairement d'un phonème complet ? Comment les épenthèses sont-elles analysées dans les théories actuelles ? Occupent-elles une position particulière à l'intérieur du mot ? Peut-on parler de voyelles et de consonnes typiquement épenthétiques ? Trouve-t-on fréquemment des épenthèses dans les langues du monde ? Ce premier chapitre a pour vocation de répondre à ces questions afin d'établir un tableau général de l'épenthèse consonantique - occurrences dans les langues du monde, types de consonnes concernés, traitement par les théories. Dans une première partie, j'exposerai différents points de vue quant à l'objet "épenthèse" et établirai précisément le type d'épenthèses constituant l'objet d'étude de cette thèse. Une deuxième partie sera consacrée à l'exposé des épenthèses consonantiques dans les langues du monde, en orientant celui-ci sur la nature de la consonne épenthésée ainsi que sur une intervention possible de la morphologie, et à une recherche des contextes d'apparition généraux. Dans une troisième partie je passerai en revue les différentes représentations que reçoivent les coronales dans diverses théories linguistiques génératives de la fin des années soixante jusqu'aux théories actuelles. 1. Définition Les articles ou ouvrages mentionnant l'épenthèse tiennent généralement pour acquise la définition même de ce qu'est une épenthèse. Trouver un éclaircissement sur ce qu'on entend précisément par ce terme nécessite une plongée dans les dictionnaires, sinon spécialisés, du moins suffisamment étendus. 7 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 1.1. Epenthèse, étymologie et sous-jacence L'épenthèse est définie par Dubois et al. (1994) comme un "phénomène qui consiste à intercaler dans un mot ou un groupe de mots un phonème non étymologique pour des raisons d'euphonie, de commodité articulatoire, par analogie, etc." Pour le TLF, c'est un "phénomène consistant dans l'apparition, à l'intérieur d'un mot ou groupe de mots, d'un phonème adventice d'origine ou de nature non étymologique qui contribue à en faciliter l'articulation." Mounin (1974 [2000]) la qualifie de "métaplasme qui consiste en l'apparition, à l'intérieur d'un mot, d'un phonème non étymologique. On l'explique généralement comme un adoucissement d'articulations inhabituelles." Dans le glossaire de son ouvrage sur La construction des mots en français, Apothéloz (2002 : 154) la définit comme l'"ajout d'un ou de plusieurs phonèmes non étymologiques dans un mot", prenant pour exemple une prononciation de lorsque en [ls´k´]. Toutes ces définitions mettent en exergue le caractère non étymologique de l'épenthèse : est épenthétique un élément dont on ne trouve pas trace en diachronie. J'ajouterai à cette définition le caractère non sous-jacent de l'épenthèse : un élément qui apparaît à la liaison ou au féminin en français ne peut pas être considéré comme épenthétique (cf. section II [6] 1). Il n'est cependant pas toujours simple de décider du caractère sous-jacent ou épenthétique d'un segment ; l'alternance consonne ~ zéro a été abordée par de nombreux linguistes, parmi lesquels Tranel (1981 : 160-162), Schane (1968), Selkirk (1972), Dell (1973), Hyman (1985), Prunet (1986, 1987), pour qui elle résulte de la présence d'une consonne latente sous-jacente en fin de radical ou d'une consonne qui se réalise uniquement dans certains contextes morphologiques1. Ceci me permet d'obtenir cette première définition de l'épenthèse : (1) Première définition de l'épenthèse Un segment épenthétique est un élément non étymologique et non sous-jacent. L'étape suivante dans cette mise au point de ce qui est entendu par épenthèse va consister à cerner ce que le terme "élément" recouvre dans cette définition. 1 Cf. section I [3] 1 pour un exposé des analyses de l'alternance consonne ~ zéro. 8 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 1.2. Eléments épenthésables Il s'agit maintenant de préciser ce qu'on entend par "élément". S'agit-il nécessairement d'un phonème, ou le terme englobe-t-il également des unités plus petites ? Les définitions répertoriées plus haut semblent indiquer que l'épenthèse concerne nécessairement un phonème entier et n'est pas envisageable pour un élément seul. Cependant, aucun argument ne vient appuyer cette restriction, ni dans ces ouvrages généraux ni dans les articles plus pointus sur le sujet. Rien n'empêche apparemment de considérer que peuvent être épenthésés un accent (cf. Popescu 2000), un ton, un segment qui ne soit pas un phonème, ou un élément plus petit tel qu'un trait distinctif, une position dans le squelette, une ligne d'association. 1.3. Epenthèses et environnement phonologique En ce qui concerne les épenthèses, il convient de distinguer deux groupes : - les épenthèses dont la mélodie est un avatar de leur environnement. - les épenthèses ex nihilo, c'est-à-dire dont la mélodie est sans rapport avec leur environnement. 1.3.1. Les épenthèses "avatar" Dans notre première approche de la notion d'épenthèse, nous avons exclu les éléments sous-jacents d'une représentation de la classe des épenthèses. Certains sons cependant, sans être présents dans le matériel lexical, émanent de ce matériel en ce sens qu'ils sont des copies de tout ou partie des traits d'un phonème appartenant au même morphème ou à un morphème voisin. Les glides issus de voyelles entrent dans cette catégorie d'épenthèses puisque la qualité de leur mélodie est intimement liée aux segments les environnant. Si l'on prend par exemple le verbe français formé à partir du substantif pli et du suffixe verbal -er, la forme attendue *[plie] est écartée au profit de [plije], comprenant un glide directement issu de la voyelle antérieure haute précédente. De même, /tru/ + /e/ est réalisé [tuwe] et /my/ + /e/ [mye] (voire [me] selon les variétés de français, les locuteurs ou les moments ; selon Klein (p.74), l'observation attentive de la prononcation de mots de cette espèce par des informateurs francophones ne laisse aucun doute sur la présence d'une semi-voyelle de transition entre les deux voyelles", même si elle est moins perceptible sur le plan acoustique. Cette catégorisation 9 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités indique plutôt que s'il y a "épenthèse" de glide, elle sera conditionnée par une voyelle fermée ou mi-fermée dans son contexte immédiat. Pour reprendre de Lacy (2002a : 188) : "Epenthetic segments can be divided into two types for PoA [place of articulation]. One is where the PoA is copied from a nearby segment. This is the case in glide epenthesis, for example, where the glide is palatal [j] if an adjacent vowel is front, but labial [w] if the vowel is back." Kitto & De Lacy (1999) relèvent en ce qui concerne les voyelles les cas suivants, parmi lesquels les copies de voyelles peuvent aussi bien être de vraies voyelles que les glides correspondants : (2) le southern tati, langue indo-européenne de la branche indo-iranienne parlée en Azerbaïdjan et en Iran (Yar-Shalter 1969) le farœse, langue indo-européenne de la branche germanique du nord parlée au Danemark (Anderson 1972) copies de voyelles le malais adjacentes le bardi ou baadi, langue australienne nyulnyuliane le winnebago, langue amérindienne siouan de la vallée du Mississipi (Miner 1992) l'awtuw, langue papoue de Nouvelle-Guinée (Feldman 1986) le dakota, langue amérindienne siouan de la vallée du Mississipi copies partielles de (Shaw 1980) voyelles adjacentes le pomo du sud-est, langue amérindienne hokane parlée en Californie, sur les côtes est du lac Clear Lake (Moshinsky 1974) Le cas relevé par Rubin (2000 : 114) en français du Midi s'apparente également à ce type d'épenthèse. Il s'agit de l'épenthèse de [] après une voyelle nasale, de /boN/2 réalisé [bç] par exemple : le mode d'articulation est copié du segment précédent. Dans le paragraphe précédent (section 1.2), il a été établi que n'importe quel type d'élément, quelle que soit sa taille, pouvait être considéré comme épenthétique à partir du moment où il n'était ni étymologique ni sous-jacent. Dans le cadre d'épenthèses du type traité ici, la frontière entre assimilation et épenthèse devient floue : un trait distinctif qui n'est ni 2 Je n'entrerai pas ici dans le débat de la lexicalité de la voyelle nasale, qui n'a aucune incidence sur le phénomène traité dans cette étude. La représentation proposée correspond à la thèse défendue par Sauzet (1998) qui considère que "les voyelles nasales du français sont systématiquement dérivées de séquences où une voyelle est suivie de consonne nasale". Cf. également Prunet (1986), Tranel (1986). Une représentation où la voyelle nasale serait lexicale accréditerait la thèse d'une épenthèse, mais celle-ci serait de toute façon étroitement dépendante du contexte phonologique immédiat. 10 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités étymologiquement attesté dans une position donnée, ni sous-jacent, mais qui est donné à la position par le contexte, participe-t-il d'un phénomène d'assimilation ou d'épenthèse ? Je reviendrai sur ce point dans le paragraphe suivant. La deuxième catégorie d'épenthèses distinguée ici, après celle des épenthèses liées à leur environnement phonologique, est constituée par les épenthèses que je qualifierai d'ex nihilo. 1.3.2. Les épenthèses ex nihilo Il s'agit des épenthèses dont la mélodie ne peut pas être prédite à partir de l'environnement, "where the PoA is not influenced by surrounding segments - 'default' epenthesis" (De Lacy 2002a : 188-189). Dans ce cas, c'est généralement la consonne par défaut dans la langue considérée qui va être épenthésée dans le cas des épenthèses consonantiques (cf. section 2). Le problème de la confusion entre épenthèse et assimilation, quelle que soit la taille du segment incriminé, ne se pose plus ici : un trait distinctif non étymologique et non sous-jacent qui apparaît dans une position donnée sans que l'on puisse l'imputer au contexte phonologique ne pourra en aucune manière être considéré comme relevant d'un phénomène d'assimilation. Cette bipartition des épenthèses n'est pas toujours aussi compartimentée dans les langues du monde : au sein d'une même langue, dans un contexte similaire, sera choisi tantôt le premier type d'épenthèses, tantôt le second. "Epenthetic quality is not simply a parametric choice between copying and default segmentism. In a number of languages, epenthetic vowels copy only some features while markedness constraints dictate the quality of others." (Rehg & Sohl 1981 : 55). De Lacy (2002a : 191) partage cet avis : "there are also some languages that assign epenthetic consonants their PoA through assimilation in some environments, and a default PoA in others. For example, a number of languages epenthesize glides next to high vowels, but [] elsewhere: Dutch (Booij 1995:191), Tamil (Wiltshire 1988), Kalinya (Rosenthall 1994:180), Malay (Cohn 1989, Cohn & McCarthy 1994)." 11 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Je m'intéresserai dans cette étude uniquement aux épenthèses ex nihilo entre radical et suffixe. La définition finale de l'épenthèse retenue ici sera donc la suivante : (3) Définition de l'épenthèse Un segment épenthétique est un élément (phonème, trait, ton, accent, ligne d'association, etc.) non étymologique, non sous-jacent et non prédictible par le contexte. Ayant établi ce qui sera entendu par épenthèse dans cette thèse, je vais établir dans la section suivante un tableau de l'ensemble des épenthèses consonantiques relevées dans les langues du monde correspondant à l'acception retenue ici. 2. Substance des épenthèses consonantiques dans les langues du monde Cette section va s'organiser en deux parties : dans un premier temps j'orienterai mon exposé en fonction de la nature de la consonne épenthésée, puis j'aborderai le sujet sous l'angle des motivations à l'apparition d'une épenthèse. 2.1. Nature de la consonne épenthésée Un premier point à éclaircir en ce qui concerne les épenthèses consonantiques dans les langues du monde est la nature phonétique des sons épenthésés. Toutes les consonnes sontelles susceptibles d'être épenthésées ? Toutes les consonnes épenthésables le sont-elles dans les mêmes proportions ? La littérature fournit une réponse quasiment consensuelle à ces deux questions : toutes les consonnes ne sont pas égales face à l'épenthèse, le tiercé gagnant étant constitué des glottales, suivies des coronales et des vélaires. "In contrast, no language inserts an epenthetic labial [p f m] or dorsal [k x ]" (de Lacy 2002a : 191)3. La section suivante va établir la réalité des épenthèses de vélaires. 3 Cette dernière affirmation est cependant à nuancer ; Vaux (2003 : 14-15) répertorie quelques langues dont il affirme qu'elles comportent des épenthèses de labiales mais sans illustrer son propos. 12 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.1. Vélaires Les vélaires sont épenthésables, mais ne sont pas les consonnes les plus fréquemment épenthésées dans les langues du monde. Outre le fait que ce ne sont pas les consonnes les plus fréquentes, c'est surtout la nasale vélaire qui est concernée, plus que les occlusives (cf. Rubin 2000 : 113-114). Le kaingang (Yip 1992, Lombardi 1997 : 14 et de Lacy 2002a : 190), langue macroge parlée à São Paulo au Brésil, présente une épenthèse de consonne vélaire pour laquelle malheureusement on ne dispose pas de beaucoup de détails. En revanche, Lombardi (1997) mentionne un type particulier d'épenthèse en coda finale, l'épenthèse de consonnes nasales vélaires, connu sous le nom d'épenthèse anusvara/angma dans la tradition sanscrite. Ceci concerne la plupart des épenthèses de consonnes vélaires, ce qui semble indiquer que les vélaires sont réservées à la fois à un lieu d'articulation précis en ce qui concerne l'épenthèse, et que celle-ci n'est pas due à la présence d'un hiatus (cf. section 2.2). Dans beaucoup de cas // semble être la nasale non-marquée en coda finale (cf. Trigo 1988). Ceci se manifeste notamment quand il y a neutralisation ou épenthèse en coda. Ainsi les seules consonnes possibles en coda en buginese (langue austronésienne d'Indonésie, cf. Mills 1975) sont // et //, ce qui placerait pour cette langue la vélaire avant les coronales, en terme de marque (cf. chapitre 2 section 2). En buginese, la structure minimale du mot requiert une consonne en coda d'un monosyllabe. Lors de l'emprunt d'un monosyllabe sans coda, la langue y adjoint un [] : tea "thé" sera emprunté sous la forme [te] (cf. section 2.2.2.2.) Rice (1996 : 496 ; 533) cite également parmi les langues connaissant l'épenthèse de la nasale vélaire le murut, langue austronésienne de la famille malayo-polynésienne de l'ouest parlée en Malaisie4 (Prentice 1971), pour laquelle elle ne donne malheureusement pas plus de détails. Un troisième cas d'épenthèse de vélaire est observé en uradhi, langue australienne pratiquement éteinte parlée dans la région de Queensland (Crowley 1983, Hale 1973, 1976, 4 Les informations relatives à la classification et à la localisation des langues présentées ici sont issues, sauf mention contraire, de SIL (2002). 13 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Paradis & Prunet 1993, Trigo 1988 : 57ss, Rice 1996 : 531-533, de Lacy 2002a : 190), qui se rattache également au type anusvara/angma décrit plus haut, en ce sens qu'il s'agit d'une épenthèse de nasale vélaire en coda. En uradhi, le dernier mot d'une expression ne peut se terminer phonétiquement par une voyelle ; si le matériel lexical ne fournit pas de consonne à la finale, il y a insertion d'une nasale selon les modalités définies ci-dessous. On distinguera avec Paradis & Prunet (1993) suivant Crowley (1983) trois dialectes uradhi : l'atampaya, le yadhaykenu et l'angkamuthi. En atampaya (a), un [] est inséré après une finale de mot (d'expression) en [a] ou [u], et une vélaire nasale avant [ ] après une finale de mot en [i]. En yadhaykenu (b), quelle que soit la voyelle finale elle peut se manifester sans épenthèse, ou avec une épenthèse de []. En angkamuthi (c), trois possibilités sont offertes au locuteur : soit la voyelle se manifeste seule, soit elle est suivie d'un [] épenthétique, soit la voyelle est nasalisée. (4) forme sous-jacente (a) atampaya /ama/ /yuku/ à l'intérieur d'une expression à la finale d'une expression glose [ama] [yuku] [ama] [yuku] "personne" "arbre" /iwi/ (b) yadhaykenu /ama/ [iwi] [iwi ] "oiseau du matin" [ama] [ama], [ama] "personne" /yuku/ /ipi/ (c) angkamuthi /ama/ /yuku/ /ipi/ [yuku] [ipi] [yuku], [yuku] [ipi], [ipi] "arbre" "eau" [ama] [yuku] [ipi] "personne" [ama], [ama], [ama] [yuku], [yuku], [yuku] "arbre" "eau" [ipi], [ipi], [ipi] Dans le premier dialecte, l'épenthèse est obligatoire, alors qu'elle n'est qu'optionnelle dans les deux autres, concurrencée par la version sans épenthèse ou la version nasalisée. Par ailleurs, Vaux (2003 : 10) cite le mongol (Rialland & Djamouri 1984, Beffa & Hamayon 1975 : 43) parmi les langues épenthésant l'occlusive vélaire orale [g], mais les données qu'il fournit ne permettent pas de conclure en faveur de l'épenthèse plutôt que d'une 14 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités allomorphie ou de la présence d'une consonne sous-jacente. La consonne incriminée apparaît entre deux voyelles longues ou entre une diphtongue et une voyelle longue5, à la frontière entre base et morphème flexionnel (Vaux ne donne pas "désinence" mais "suffixe" ; cependant, les exemples fournis ne relèvent pas de la dérivation) : (5) morphème flexionnel ablatif /-AAs/ génitif /-IIn/ instrumental /-AAr/ base dalai odoo dülii xii da debee guu glose "mer" "maintenant" "sourd" "air" "chef" "marécage" "fermoir" dérivé dalai[g]aas odoo[g]oos dülü[g]ees xii[g]ii da[g]iin debee[g]iin guu[g]aar On remarquera parmi les exemples fournis par Vaux (2003) un qui ne relève pas du contexte défini par lui : la base da ne se termine pas par une voyelle longue, cependant [g] est inséré dans le dérivé. Cette section a mis en évidence le lien qu'entretiennent les épenthèses consonantiques vélaires, d'une part avec le mode articulatoire nasal, d'autre part avec la position en coda finale. Il s'agira dans la suite de l'exposé de déterminer s'il s'agit dans les deux cas d'un lien exclusif : les nasales épenthésées sont-elles uniquement vélaires ou peut-on en trouver d'autres lieux d'articulation (cf. section 2.1) ? Ne peut-on trouver que des vélaires en coda (cf. section 2.2) ? Les vélaires ne sont pas les consonnes les plus fréquemment trouvées en épenthèse. Pour Ortmann (1998 : 71), elles ne font même pas partie des consonnes observées dans les cas d'épenthèses productives, celles-ci se limitant à l'occlusive glottale et aux coronales. Je vais donc maintenant me tourner vers les épenthèses de glottales, avant d'achever cette présentation par les coronales. 5 Vaux précise que la consonne épenthésée est "[g] in [+atr] contexts, [G] in [-atr] words." 15 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.2. Glottales Les consonnes glottales sont les grandes favorites en ce qui concerne l'épenthèse, avec une préférence nette pour le coup de glotte. Peut-on mettre en évidence une position particulière liée à cette catégorie d'épenthèse, comme on l'a fait pour les vélaires en coda ? 2.1.2.1. Fricative h La littérature fait état essentiellement de deux groupes faisant appel à l'épenthèse de la fricative glottale : les langues gabaritiques d'une part, les langues amérindiennes d'autre part. Bien que ces deux groupes ne se situent pas sur le même plan, je vais garder cette partition en tant que représentative de la littérature consacrée à ce type d'épenthèses. Je terminerai cette présentation par l'épenthèse facultative en hanunoo, langue austronésienne parlée aux Philippines. 2.1.2.1.1. Langues gabaritiques Les langues gabaritiques forment un premier groupe exploitant la fricative glottale : Rose (1996 : 108) mentionne le [h] comme épenthèse en hébreu moderne, en tigré, langue éthio-sémitique du nord, et en nisgha (écrit également nisga'a), langue tsimhianique de la famille penutienne parlée en Colombie Britannique, reprenant pour cette dernière les données de Shaw (1987, 1991) : "marcher" sera prononcé [hi-y:]6 à partir du morphème /y:/. Cette dernière, en tant que langue amérindienne gabaritique, est une transition toute trouvée vers le deuxième groupe mentionné plus haut comme ayant recours au [h], celui des langues amérindiennes. 2.1.2.1.2. Langues amérindiennes Certaines langues amérindiennes utilisent en effet l'épenthèse consonantique en [h]. C'est le cas tout d'abord du yucatec, langue maya parlée par les Amérindiens de Yucatán au Mexique : les mots de cette langue se terminent obligatoirement par une consonne ; aussi les emprunts ne satisfaisant pas cette condition se parent-ils d'un [h] à la finale (cf. Orie & Bricker 1997, repris dans Lombardi 1997, également Straight 1976 : 71, de Lacy 2002a : 189). 6 Rose ne donne pas d'explication concernant le son [i] qui apparaît également lors de l'épenthèse de [h]. 16 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Le huariapano, langue morte du Pérou, pratique également l'épenthèse en [h] pour se conformer à l'exigence de poids des syllabes accentuées, qui doivent être lourdes (cf. Parker 1994 : 100-101, 1998 ; cf. également de Lacy 2002a : 189). De Lacy (2002a : 189) reprenant Rice (1989 : 133) relève un [h] épenthétique dans deux dialectes de slave ou slavey (langue amérindienne de la famille na-dene athapaskane) du nord, le hare et le bearlake, parlés au Canada, dans la région de Mackenzie. Dans ces deux langues le [h] est épénthésé de façon à ce que toutes les syllabes aient une attaque, y compris celles ne comportant pas de consonne sous-jacente à l'initiale : (6) consonne initiale sous-jacente [tice] "nous commençons à chanter" /t-ice/ /ice/ /le-i-wee/ voyelle initiale sous-jacente "nous chantons" [hice] [lehiwee] "nous coupons en deux" De Lacy (2002a : 189) cite également le chipewyan (Li 1946), langue amérindienne na-dene parlée au Canada de la même famille que le slavey, parmi les langues exploitant l'épenthèse de [h]. L'ayutla mixtec ou coastal guerrero mixteco (de Lacy 2002a : 189, Pankratz & Pike 1967), langue oto-manguéenne parlée au Mexique, a recours à l'épenthèse de la fricative glottale du fait d'une exigence relative à la structure du mot. La première syllabe d'un mot prosodique doit en effet être de la forme CVC, ce qui se manifeste généralement par la gémination de la consonne suivante (cf. (7)a) ; cependant, du fait que dans cette langue les occlusives ne peuvent pas se trouver en coda, lorsque la consonne suivante est une occlusive un /h/ est inséré de façon à remplir la coda (cf. (7)b). (7) consonne syllabe occlusive consonne syllabe occlusive forme sousjacente /toso/ 2ème /tima/ non/cele/ /naja/ ème /tuta/ 2 /aku/ /kati/ gémination de la 1ère C de la 2ème syllabe [tos.so] [tim.ma] [cel.le] [naj.ja] *[tut.ta] glose épenthèse de [h] [tuh.ta] "arche florale" "bougie" "ciseaux" "chien" "atol" [ah.ku] "quelques" [kah.ti] "coton" 17 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Le guajiro (Mansen & Mansen 1984, Alvarez 1995 ; cf. également Vaux 2003 : 16), langue amérindienne arawak parlée en Colombie et au Vénézuela, épenthèse la fricative glottale en fin de mot, derrière une voyelle brève accentuée : (8) [ka’ih] [ny’ah] [m’ah] [m’aa] kashi nüsha ma maa derrière voyelle brève derrière voyelle longue "lune" "sang" "terre, monde" "avec toi" Parmi les langues amérindiennes pratiquant l'épenthèse de [h] citons encore, à la suite de de Lacy (2002a : 189), les langues tucanoan (Welch & Welch 1967 : 18), famille parlée principalement en Colombie et au Brésil, le yagua (Payne & Payne 1986 : 438), langue amérindienne peba-yaguan parlée au Pérou, et le fox (Bloomfield 1924 : 220), langue amérindienne parlée en Oklahoma, Kansas et Nebraska, avec l'exemple suivant : /mana icawiwa/ [mana hichawiwa]. 2.1.2.1.3. Langue austronésienne Vaux (2003) répertorie le hanunoo (Schane 1973b : 54), langue austronésienne de la famille malayo-polynésienne parlée dans les Philippines, parmi les langues pratiquant l'épenthèse de la fricative glottale. Le contexte fourni par lui est l'hiatus vocalique seul, cependant les exemples fournis se situent à la frontière morphologique et concernent un type particulier de bases, les adjectifs numéraux. Signalons enfin que dans cet exemple rien ne permet d'écarter l'hypothèse de la lénition : (9) base unum usa glose "six" "un" suffixe -i -i dérivé unumi usahi glose "mets-le en six" "fais-en un" Les données disponibles sur l'épenthèse de [h] précisent l'hypothèse émise à la fin de la section 2.1.1. : les vélaires sont certes réservées à la position en coda, mais la position en coda n'est pas propre aux vélaires. Toutefois, on notera que sur les trois cas attestés ici d'épenthèse de [h] en coda, deux sont soumis également à d'autres paramètres : en yucatec, ce n'est pas la position de coda en tant que telle qui est importante, mais la position finale de mot ; toutes les codas ne sont donc pas concernées, et celles qui le sont ne le sont qu'au nom d'un autre paramètre. En ayutla mixtec, la structure du mot requiert une coda qui ne soit pas 18 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités une occlusive, ce qui provoque l'apparition du [h] quand la réduplication de la consonne suivante, qui constitue le mode de réponse par défaut à cette contrainte, fournirait précisément une occlusive ; [h] n'est épenthésé en coda que par égard à son statut de non occlusive. [h] n'est donc le plus souvent lié à la position de coda que du fait de causes extérieures à cette position, ce qui concourrait à privilégier malgré tout la relation entre la coda et les vélaires, faisant de celles-ci les consonnes non marquées de la position. Cette hypothèse sera à vérifier en observant le comportement des autres consonnes possibles en épenthèse à l'égard de la position en coda : laissent-elles le champ libre à la nasale vélaire où sont-elles également attestées, sans condition supplémentaire ? Par ailleurs, on ne peut identifier aucune position propre à l'épenthèse de [h], qui est possible aussi bien en coda, comme on vient de le voir, qu'en attaque (en slave ou en fox par exemple). Le [h] n'est pas la seule glottale à apparaître en épenthèse ex nihilo dans les langues du monde. L'occlusive glottale connaît en effet un succès encore plus important en tant que consonne "parasite". 2.1.2.2. Occlusive "Phonetically, the glottal stop, unreleased, is the negation of all sound whether vocalic or consonantal. Is it the perfect minimum or terminus of the syllable, the beginning and the end, the master or maximum consonant?" F.R. Palmer (1948)7 Le coup de glotte est pour Lombardi (1997 : 14) "the optimal epenthetic consonant, all things being equal". Suivant notamment Ladefoged (1971), Hyman (1975), Schane (1973b), Lass (1976), elle considère le coup de glotte comme une obstruante à part entière et non comme un glide. En effet, [] et [h] ont été classés avec les glides depuis Jakobson et al. (1952 : 19) et Chomsky & Halle (cf. Durand 1986b : 80 ou Bessel 1992 : 56 pour un récapitulatif). Cette position est due en partie au fait que, tout comme les glides, les laryngales sont des "briseurs d'hiatus" (Kenstowicz & Kisseberth 1979 : 243-244) : les glides lorsque l'hiatus contient l'une des voyelles hautes [i] et [u], les laryngales lorsqu'il inclus un [a]. 7 Cité par Lombardi (1997 : 1), mais sans indiquer les références précises. 19 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Cependant, les données du malais (Durand 1986a) notamment mettent à mal cette unification des laryngales avec les glides. Sans entrer dans le débat du statut du coup de glotte, je le considérerai néanmoins comme une consonne étant donné que la plupart des théories phonologiques actuelles le considèrent comme tel, de façon à rendre compte dans la partie suivante de leur manière de le considérer en regard des coronales. Je retiendrai également de ce débat le rôle attribué au coup de glotte dans la résolution des hiatus, et évaluerai cette proposition : l'épenthèse de coup de glotte est-elle exclusivement liée à l'hiatus ? [] est une consonne épenthétique exploitée sur tous les continents : aussi bien les langues austronésiennes que les langues amérindiennes ou africaines y font appel, on la trouve également en Asie et en Europe ainsi que dans les langues gabaritiques. 2.1.2.2.1. Langues austronésiennes Un certain nombre de langues austronésiennes sont concernées par l'épenthèse du coup de glotte, et ont été traitées dans la littérature. Les langues austronésiennes ou malayopolynésiennes forment une famille de 300 à 500 langues comprises par environ 300 millions d'individus dans la péninsule de Malaisie, à Madagascar, à Taïwan, en Indonésie, en Nouvelle-Guinée, dans les îles polynésiennes, dans les Philippines et en Nouvelle-Zélande. En indonésien (Carr & Kassin 1999, Pater 2001 : 171-174, Cohn 1989, Cohn & McCarthy 1994), l'épenthèse du coup de glotte dépend de la frontière morphologique. A contexte phonologique égal, c'est-à-dire à l'intérieur d'un même hiatus (i_a), la langue insèrera soit un glide homorganique de la première voyelle, soit un coup de glotte. C'est la position morphologique de l'hiatus qui déterminera le type de son inséré : glide à l'intérieur de mot ou entre radical et suffixe, [] entre préfixe et radical. 20 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (10) forme sous-jacente /diam/ /siap/ /hari + an/ /udi + an/ /di + ambil/ /di + adari/ intérieur de mot entre radical et suffixe entre préfixe et radical épenthèse de glide [dijam] [sijap] [harijan] [udijan] épenthèse de [] [diambil] [diadari] glose "tranquille" "prêt" "quotidien" "examen" "pris" "enseigné" En malais (Carr & Kassin 1999, cf. également Durand 1986a, Zaharani 1998, Teoh 1994), l'insertion de l'occlusive glottale se fait, qu'il y ait frontière morphologique ou pas (cependant, tous les exemples fournis par Carr & Kassin 1999 se situent à une frontière morphologique) : (11) radical + suffixe préfixe + radical composés réduplication morphèmes /mula + i/ /m´ + buta + i/ insertion de [mulai] [m´mbutai] "aveugle" /di + ambel/ /s´ + ora/ [diambel] [sora] "pris" "une personne" /k´rt´/ + /api/ [k´rtapi] "locomotive à vapeur" /di + ambel/ + /aleh/ /uda/ /anai/ /isi/ [diambelaleh] [udauda] [anaianai] [isiisi] "emporter" "lois" "insectes" "peaux" glose Le makassarese ou makassar (Aronoff et al. 1987, Broselow 2000, McCarthy 1998, 2002, McCarthy & Prince 1994), langue austronésienne malayo-polynésienne parlée en Indonésie, présente un cas d'épenthèse de l'occlusive glottale accompagnant une épenthèse vocalique, copie de la dernière voyelle radicale, après r, l, s. Il est à noter que si le radical se termine en voyelle, il n'y a pas d'épenthèse consonantique. (12) forme sous-jacente épenthèse /rantas/ [rantasa] finale radicale consonantique finale radicale vocalique pas d'épenthèse glose "sale" /teter/ [tetere] "rapide" /jamal/ [jamala] "vilain" /lompo/ [lompo] "gros" En selayarese, langue austronésienne de l'ouest parlée en Sulawesi du Sud en Indonésie (Lombardi 2003 : 12-14, Mithun & Basri 1986, Broselow 1984) le coup de glotte est épenthésé dans les séquences de deux voyelles identiques en hiatus. 21 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Cependant, tous les coups de glotte entre deux voyelles identiques ne relèvent pas d'une épenthèse ; on distinguera donc les cas où le coup de glotte est sous-jacent et se retrouve quel que soit le groupe de voyelles (cf. (13)a), des cas où le coup de glotte n'apparaît qu'entre deux voyelles identiques, auquel cas on a affaire à une épenthèse (cf. (13)b). (13) kuurai (b) coup de glotte épenthétique "je l'accompagne" "tu l'accompagnes" riurai riinui "tu le bois" mais (a) coup de glotte sous-jacent "être excessif" taata taente "être érigé" "être saoul" tainu kuinui "je le bois" De plus, le coup de glotte est aussi inséré à l'initiale de l'unité d'intonation, ce qui signifie que les mots en isolation dont le matériel lexical fournit une voyelle en premier élément se voient affublés d'un [] épenthétique. (14) inni (a) à l'initiale d'une unité intonationnelle "ceci" aapa inni (b) ailleurs "qu'est ce" Lombardi (2003 : 13-14) mentionne parmi les langues connaissant l'épenthèse glottale l'ilokano (cf. Hayes & Abad 1989 : 351, Rose 1996 : 108 ; également Ortmann 1998 : 71, Rosenthall 1997 : 144) ou iloko, langue d'Indonésie également. Outre les cas où l'épenthèse, comme en tamil, intervient avant un [a] au même titre que les glides [w] et [j] interviennent respectivement avant les voyelles arrondies et les voyelles hautes, l'ilokano connaît un cas où les glides et le [] surgissent dans les groupes vocaliques quels qu'ils soient, et en variation libre : dans les emprunts et dans "certain forms to which -an and -en are not normally attached". (15) (a) épenthèse de coup de glotte pajojoen pajojowen "cause to play with yoyo" trabahoen trabah(o)wen "work-goal focus" pabasien pabasijen "lieu où le vin de canne à sucre est fait / consommé" (b) épenthèse de glide glose Le kisar, de la branche sud-ouest de la famille malayo-polynésienne centrale (Lombardi 2003 : 14-15, Christensen & Christensen 1992), ne semble pas en surface présenter d'opposition à l'initiale entre voyelle et coup de glotte : aucun mot ne commence phonétiquement par une voyelle. Cependant, lorsqu'il y a réduplication, on constate que certains mots rédupliquent le coup de glotte initial et d'autres non. Dans le premier cas (cf. 22 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (16)a) le coup de glotte est donc bien sous-jacent, puisqu'il est rédupliqué, alors que dans le second (cf. (16)b) il doit être épenthétique puisqu'il n'apparaît plus dès lors que le morphème n'est plus à l'initiale. (16) umu (a) coup de glotte sous-jacent "dense" "très dense" umuumu alam "nuit" alalam eni (b) coup de glotte épenthésé "ceci" "celui-ci" enieni "de bonne heure" Si l'on suppose une structure sous-jacente */eni/ en (b), la réalisation rédupliquée devrait être *[enieni]. On posera donc des structures sous-jacentes de type /umu/ et /alam/ dans le premier cas, mais /eni/ dans le second, qui se réalisera phonétiquement avec un coup de glotte à l'initiale, du fait de la structure syllabique qui impose une consonne en début de mot dans cette langue. De plus, selon que les mots contiennent dans le lexique une consonne à l'initiale ou non, ils s'attachent à différents allomorphes du morphème pronominal de première personne du singulier et du morphème de négation. Dans le cas où une consonne est à l'initiale, donc où un coup de glotte est présent dans le lexique, on trouve la variante [jau] du morphème de première personne (a) ; dans le cas où le mot commence dans le lexique par une consonne, c'est un allomorphe de la forme [j] suivi d'une copie de la voyelle suivante, et ce bien qu'un coup de glotte soit quand même inséré en surface. (17) (a) consonne, // sous-jacent Æ [jau] "j'enterre" jau karu "je fais" jau hii "je lave" jau omhe "je ferme" jau elek (b) voyelle à l'initiale Æ [j] + voyelle "je dors" ja amkuru "je tue" je esne "je bois" jo omun Lambert (1999 : 83-84 ; cf. 1.3.3.) mentionne les épenthèses de coup de glotte en atayal, langue austronésienne de la branche formosane parlée à Taïwan. La structure des mots atayaliens exige la présence d'une consonne à la finale ; si cette consonne n'est pas fournie par le matériel lexical, c'est une occlusive glottale qui vient en épenthèse afin de satisfaire la structure, comme l'illustrent les données suivantes : 23 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (18) input /an- aka/ /am- satu/ /am- si/ /am- kai/ /sini/ /am- ktri/ /m- paa/ /am- su/ output anak samatu sami mkai sini kamtari mapaa samau glose "casser" "envoyer" "mettre" "chercher" "croire" "s'agenouiller" "porter" "donner un coup de pied" Lombardi (1997) cite encore parmi les langues austronésiennes utilisant le [] le sundanese, langue parlée en Java de l'ouest de la branche malayo-polynésienne de l'ouest (Robins 1953). De Lacy (2002a : 189) indique également le larike (Laidig 1992, Laidig & Laidig 1995) langue austronésienne malayo-polynésienne centrale parlée en Indonésie. Le schéma ci-dessous reprend schématiquement les langues austronésiennes concernées par l'épenthèse (adapté de SIL 2002) : austronésien malayo-polynésien (indonésien) de l'ouest sulawesi sulawesi du sud makassar selayarese Philippines du nord Luzon du nord ilokano sundic sundanese malayic malayan malais local makassarese du centre-est malayo-polynésien central timor maluku du sud-ouest kisar-roma kisar maluku central de l'est ouest puis est larike formosan atayalique atayal 24 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.2.2.2. Langues gabaritiques Outre les langues austronésiennes, d'autres langues utilisent le coup de glotte en épenthèse. En ce qui concerne les langues gabaritiques, Rose (1996 : 100 ; 108) cite l'arabe8 et l'hébreu moderne. Lombardi (2003 : 11-12) reprend des données fournies verbalement par McCarthy sur 9 l'arabe et distingue les cas où le coup de glotte initial résulte d'une épenthèse des cas où il est phonologique : lorsqu'il est sous-jacent, le coup de glotte apparaît aussi bien à l'initiale qu'en position intervocalique (cf. (19)a). Lorsqu'il est épenthétique en revanche (cf. (19)b), l'hiatus éventuel est résolu par la chute de la seconde voyelle. (19) (a) coup de glotte sous-jacent "une épingle" ibra "il a dit 'une épingle'" qaalaibra "elle a dit 'une épingle'" qaalatibra (b) coup de glotte épenthétique "écoute" ismaq "il a dit 'écoute'" qaalasma "elle a dit 'écoute'" qaalatisma Le tigrigna (également écrit tigrinya ou tigray), langue du groupe éthio-sémitique parlée en Erythrée et dans la province éthiopienne du Tigray, utilise l'épenthèse d'occlusive glottale à la frontière entre une racine nominale et certaines désinences, telles que le morphème /u/ "possessif 3ème personne", devant voyelle (Denais 1994 : 52-54) : (20) racine à finale consonantique racine à finale vocalique /faras - u/ /aza - u/ [farasu] [azu], [azu], [azau] "son cheval" "sa maison" /abbo - u/ [abbou], [abbuu] "son père" /adde - u/ [addiu] "sa mère" /dmmu - u/ [dmmuu] "son chat" /sahafi - u/ [sahafu] "son écrivain" D'autres phénomènes peuvent apparaître : élision de la voyelle précédente, modification de son timbre, etc., mais on trouvera tout de même l'épenthèse de coup de glotte. Après les langues amérindiennes et gabaritiques, tournons-nous vers un troisième ensemble de langues concerné par l'épenthèse du coup de glotte, les langues amérindiennes. 8 9 Rose ne précise pas de quelle variété d'arabe il s'agit dans son article. Lombardi ne précise pas s'il s'agit de l'arabe moderne ou classique dans son article. 25 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.2.1.3. Langues amérindiennes La littérature fait état de quatre langues amérindiennes ayant recours à l'épenthèse en [] : le cupeño, le tunica, le mohawk et le tsishaath nootka. Le cupeño ou takic du sud, langue amérindienne de la famille uto-aztèque parlée en Californie du Sud, présente un cas d'épenthèse d'occlusive glottale dans les cas où le gabarit minimal d'un mot n'est pas atteint par le matériel lexical seul (données de Crowhurst 1994, réanalysées par Lombardi 1997, 2003 : 17 ; également de Lacy 2002a : 189, 2002c) : (21) /hu/ /kwa/ [hu] [kwa] [ti] /ti/ "péter" "manger" "rassembler" Dans certains cas bien définis, le tunica présente aussi une épenthèse glottale (cf. section 2.1.3.2), mais celle-ci s'accompagne nécessairement d'une syllabe entière, aussi ne peut-on pas la mettre sur le même plan que les autres. De Lacy (2002a : 189) mentionne encore deux autres langues amérindiennes à utiliser le [] en épenthèse, à savoir le mohawk (Hale & White Eagle 1980), langue amérindienne iroquoise parlée au sud de l'Ontario au Canada et aux Etats-Unis, et le tsishaath nootka (Stonham 1999), langue amérindienne de la famille wakashan parlée en Colombie Britannique. Après le continent américain représenté par les langues amérindiennes, c'est au tour du continent asiatique de nous dévoiler ses secrets en ce qui concerne l'épenthèse de []. 2.1.2.2.4. Continent asiatique Le continent asiatique est quant à lui représenté par trois langues : le tamil pour l'Inde, le koryak pour l'océan Pacifique et le persan pour le Moyen-Orient. Le tamil, langue de la famille dravidienne du Sud, présente un cas d'épenthèse de coup de glotte (Christdas 1988, Lombardi 1997, 2003 : 10) devant [a] à l'initiale, alors que devant les voyelles arrondies [o] et [u] on trouvera le glide [w], et [j] devant les voyelles antérieures [i] et [e]. 26 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (22) /peer-aacaj/ intérieur de mot "avidité" [peeraas] /aacaj/ initiale de mot [aas] "espoir" Le koryak, langue paléo-sibérienne (Kenstowicz 1976, Lombardi 2003 : 16) parlée principalement dans la péninsule de Kamchatka dans l'océan Pacifique nord, utilise le coup de glotte à l'initiale de mot devant voyelle, satisfaisant ainsi la requête d'une consonne à l'initiale de cette langue. Comme pour le tamil, c'est la comparaison avec la même base adjointe à un préfixe se terminant par une consonne qui permet de mettre en évidence le caractère épenthétique du coup de glotte. (23) intérieur de mot initiale de mot "s'évanouir" [mal-ajat-k] "tomber" [ajat-k] Le persan présente un cas d'épenthèse de coup de glotte en variation libre avec l'apparition d'un glide10 homorganique de l'une des deux voyelles de l'hiatus qui constitue le contexte déterminant (cf. Vaux 2003 : 15) : (24) forme sous-jacente /baazari + i/ épenthèse de [] [baazarii] [baazariji] glose "un homme d'affaires" /baalaa + i/ [baalaai] [baalaaji] "celui d'en haut" /maa + o + somaa/ [maaosomaa] [maawosomaa] "nous et vous" /zaa + u/ [zaau] [zaawu] "enceinte" /naame + at/ [naameat] *[naamejat] "votre lettre" réalisation avec glide Ce tableau met en évidence l'apparition du coup de glotte en hiatus, sans qu'il soit possible toutefois de décider si la frontière morphologique joue un rôle déterminant dans cette épenthèse ou pas. Intéressons-nous maintenant, après ce tour d'horizon des langues austronésiennes, gabaritiques, amérindiennes et asiatiques, aux langues africaines, avant de terminer cette présentation des épenthèses de coup de glotte par les langues européennes. 10 On remarque par ailleurs que la réalisation avec glide n'est pas toujours autorisée (*[naamejat]) sans que l'on puisse pour antant attribuer cette interdiction, au vu de ces seules données, au fait qu'aucune des voyelles de l'hiatus n'est fermée ; en effet, [maawosomaa] atteste d'un glide dans le même contexte [voyelle moyenne _ voyelle ouverte]. Signalons enfin que chacune des deux voyelles de l'hiatus peut propager un glide, comme en témoigne la variation constatée dans /doru + i/ "l'hypocrisie", qui peut se réaliser avec propagation de la première voyelle ([doruwi]) comme de la seconde ([doruji]). 27 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.2.2.5. Continent africain L'Afrique n'est pas en reste avec trois langues, à savoir le kçnni, le gokana et le tigré, et une famille de langues, les langues chadiques, en lice. En kçnni, langue niger-congolaise parlée dans le nord du Ghana, la consonne épenthétique insérée à la fin des propositions ou entre deux voyelles à travers une frontière de mot est le coup de glotte (Cahill 1999, Lombardi 2003 : 32), soit toujours aux extrémités d'un mot et non à l'intérieur. De même, le gokana, langue niger-congolienne, (cf. Hyman 1985 ; également Lombardi 1997, 2003) insère une occlusive glottale à l'initiale de mot pour répondre à la structure syllabique exigée par la langue. De Lacy (2002a : 189) relève en outre des cas d'épenthèses d'occlusive glottale dans les langues chadiques (Frajzynger & Koops 1989), sous-groupe de la famille afro-asiatique rassemblant près de 200 langues parlées principalement au Nigeria, au Chad et au Cameroun ; en tigré (Raz 1983), langue afro-asiatique de la branche éthiopienne parlée en Erythrée ainsi qu'au Soudan. Le dernier continent à explorer est l'Europe. Trouve-t-on des épenthèses de coup de glotte sur le vieux continent ? 2.1.2.2.6. Continent européen Pour l'Europe, ce sont les langues slaves et les langues germaniques qui manifestent leur intérêt pour le coup de glotte. En allemand (Wiese 1996, Alber 2001 et références inclues ; cf. section 2.2. pour une présentation plus détaillée), un coup de glotte est inséré à l'initiale devant voyelle et à l'intervocalique devant voyelle accentuée, l'épenthèse étant optionnelle dans ce dernier cas : (25) a. à l'initiale devant voyelle b. à l'intervocalique devant voyelle accentuée awtoo ka()'oot Auto chaotisch "voiture" "chaotique" 28 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités En anglais (Lombardi 2003 : 17), après une pause on ne constate "no real vowel-initial words". Dans le cas où le mot commence par une voyelle dans le lexique, l'exigence consonantique est remplie par le coup de glotte, qui n'est pas présent à l'intérieur dès lors que le mot n'est plus en initiale de proposition, sauf en cas de réalisation "particulièrement emphatique". (26) position dans la proposition initiale graphie eel intérieure intérieure, emphatique big eel the EEL épenthèse [ijl] pas d'épenthèse [bijl] glose "anguille" "grosse anguille" "l'anguille" [ijl] Le bulgare (Rubach 2000 : 287-290) présente un cas d'insertion de coup de glotte, obligatoire, à l'initiale de mot devant voyelle, mais non à l'intervocalique. (27) intérieur de mot initiale _i _u _a _i _u _a graphie egoist kontinuum teatar Iraq urnata Amerika hiatus épenthèse de [oi] [uu] [ea] [i] [u] [a] glose "dialecte" "continuum" "théâtre" "Irak" "l'urne" "Amérique" On observe un comportement similaire du tchèque, au moins en ce qui concerne la norme prescriptive, à l'égard de l'épenthèse d'occlusive glottale : pas d'insertion ailleurs qu'à l'initiale devant voyelle (Kucera 1961, Rubach 2000 : 297-302). En revanche, le tchèque permet également l'insertion du glide [j] à l'intérieur d'un hiatus dont l'un des membres est /i/. (28) intérieur de mot initiale _i i_ _u _e _i _u _a _o graphie kokain dialekt muzeum poeta idiot ulice Amerika okna hiatus épenthèse de j [aji] [ija] épenthèse de [eu] [oe] [i] [u] [a] [o] glose "cocaïne" "dialecte" "musée" "poète" "idiot" "rue" "Amérique" 11 L'oclusive glottale dévoise la consonne occlusive précédente : v Americe [ramertse] "en Amérique", od Aleny [otalen] "d'Alène", z okna [sokna] (Janda & Townsend 2000 : 10, Palková 1997 : 326). "Even speakers who do not use the glottal stop devoice these obstruents". 29 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités On notera cependant qu'une frontière morphologique intérieure de mot en hiatus, généralement entre préfixe et radical, peut également se voir adjoindre un coup de glotte, facultatif. Celui-ci permet notamment de distinguer deux mots homophones en surface mais distincts dans le lexique (Janda & Townsend 2000 : 9-10, Palková 1997 : 325-326) : (29) proudi pas d'épenthèse car intérieur de morphème radical proud + "jaillit" [proui] (présent) terminaison i épenthèse de [] car frontière morphématique préfixe pro + radical "fumera à [proi] travers" ud + terminaison i 2.1.2.2.7. Bilan sur le coup de glotte Ce survol des langues utilisant l'occlusive glottale en cas d'épenthèse consonantique montre bien l'importance de ce lieu d'articulation, puisque nulle région du monde n'est épargnée. Il a également mis en évidence le manque de relation particulière entre le coup de glotte et une position particulière. On trouve certes quantité d'épenthèses de [] en hiatus (indonésien, selayarese, ilokano, knni, allemand, tchèque)12, mais le [] intervient également dans d'autres contextes qui n'exigent qu'une seule voyelle dans leur contexte immédiat, à leur droite : à une frontière morphologique (tigrigna, malais), en attaque ou début de mot (kisar, arabe, tamil, allemand, anglais, bulgare, tchèque), en initiale de proposition (anglais). On trouve enfin [] en finale de mot (makassar, atayal, cupenõ) ou de proposition (knni). Au contraire de l'épenthèse de vélaire qui se situe essentiellement en coda, l'apparition du coup de glotte n'est liée à aucune position particulière ni même à l'hiatus, contrairement à ce que le laissait entendre son classement avec les glides précisément pour ce motif. En outre, l'hypothèse formulée en fin de section 2.1.2.1. s'avère infondée. Certes les vélaires sont épenthésées en coda sans qu'il soit besoin d'autre motif que la nécessité d'avoir une consonne dans cette position précise, au contraire des fricatives nasales, qui peuvent se trouver en coda mais le plus souvent du fait de raisons morphologiques supplémentaires. Mais la position de coda n'est pas pour autant propre à la nasale vélaire, non plus que l'on peut la considérer comme la consonne non marquée de cette position, puisque l'on constate le même "manque de motivation" extérieur à la position pour les occlusives glottales : les quatre langues connaissent l'épenthèse de [] – le knni, l'atayal, le makassar et le cupeño - ne 12 Pour une étude des autres critères déterminants, cf. section 2.2. 30 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités l'appellent que pour des raisons strictement structurales et non en vertu d'autres contraintes morphologiques. En-dehors des glottales, les plus fréquemment attestées en épenthèse, une autre catégorie de consonnes est assez fréquente dans les langues du monde : les coronales. 2.1.3. Coronales Les coronales paraissent en effet être, avec les glottales // et /h/, les consonnes épenthétiques les plus fréquentes (Béland & Favreau 1991 : 218). Je distinguerai dans cette présentation les différentes coronales épenthésées par leur mode articulatoire : les sonantes tout d'abord, en commençant par les liquides pour arriver aux nasales, puis les obstruantes, avec tout d'abord les fricatives puis les occlusives. Là encore, je tenterai de découvrir s'il existe un contexte de prédilection relatif à l'apparition des coronales en épenthèse. 2.1.3.1. Liquides Les liquides sont des épenthèses très prisées dans les langues du monde. On en trouve en Afrique, en Australie, en Asie et en Europe. 2.1.3.1.1. Continent africain [l] est très peu cité en tant qu'épenthèse dans la littérature. On le trouve notamment en baka, langue niger-congolaise du Cameroun (Kleinhenz 1992 ; également Ortmann 1998 : 72). Le contexte déclencheur est constitué (a) par un hiatus de deux voyelles identiques, auquel cas l'épenthèse est optionnelle, et (b) par n'importe quel hiatus pourvu qu'il corresponde à une frontière dérivationnelle. (30) /m/ (a) /soo/ /moo/ /si + / (b) /m + / [ml] [solo] [molo] [sil] [ml] "faire" "sécher" "tuer" "regarder – perfectif" "faire – perfectif" 31 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités L'épenthèse de [r] est bien plus documentée que celle de [l]. A l'intervocalique, le gokana, langue niger-congolaise parlée au Nigéria, présente une épenthèse de [r] entre deux orales (et de [n] entre deux nasales, cf. paragraphe suivant). Hyman (1985, repris par Lombardi 1997, 2003) considère ces réalisations comme correspondant à un phonème /l/ sous-jacent. Il n'y a cependant épenthèse que lorsque les voyelles en hiatus sont toutes les deux longues (après une voyelle brève, les voyelles longues s'abrègent), et à l'intérieur d'un pied, considéré comme un constituant morphologique. Enfin, seuls deux suffixes sont concernés par cette épenthèse : le suffixe correspondant à la deuxième personne du pluriel sujet et le logophorique. (31) réalisation oo zov-ii oo sii-rii glose réalisation Deuxième personne du pluriel "vous prenez" oo -i "vous dansiez" oo ban-ii "vous attrapiez" oo naa-nii oo tu-e "il prenait" oo zov-ee oo sii-rii "il dansait" "il attrapait" oo tu-i Logophorique oo - glose "vous cachez" "vous mendiez" "vous faisiez" "il cachait" oo ban- oo naa-n "il mendiait" "il faisait" En kçnni, langue niger-congolaise parlée dans le nord du Ghana, on constate une épenthèse de [r] entre une voyelle radicale longue [aa], [] ou [çç] et le suffixe du pluriel en ce qui concerne les noms de classe 1 (Cahill 1998, 1999, Lombardi 2003 : 32). Cette épenthèse s'accompagne d'un abrègement de la voyelle longue précédente. (32) singulier base en voyelle brève à la finale base à voyelle longue à la finale pluriel s- ta- bnt- s-a tan-a bnt-ra glose "poisson" "pierre" "crapaud" daa- da-ra "jour" Le knni conclut cet aperçu des épenthèses de liquides coronales en Afrique. Le second continent exploré ici est l'Australie. 32 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.3.1.2. Continent australien Une seule langue austronésienne est citée comme comportant des épenthèses consonantiques en [r], il s'agit de l'anejom ou aneityum (de Lacy 2002a : 190, Lynch 2000 : 29), langue austronésienne de la famille malayo-polynésienne de l'est parlée à Vanuatu à l'est de l'Australie. Après l'Afrique et l'Australie, tournons-nous vers l'Asie. 2.1.3.1.3. Continent asiatique Une seule langue exploite le type d'épenthèses coronales envisagé ici. En japonais une alternance apparaît dans le paradigme verbal (Lombardi 1997, Mester & Itô 1989, de Chene 1985, Poser 1986, McCawley 1968) : plusieurs terminaisons comportent un [r] lorsque leur initiale syllabique est une voyelle, mais non quand elles commencent par une consonne : (33) pres. prov. pass. bases à finale consonantique das-u das-eba das-areru "sortir" bases à finale vocalique tabe-ru tabe-reba tabe-rareru "manger" Le problème ici est de savoir s'il s'agit de l'élision du /r/ (Poser 1986, McCawley 1968) ou de son épenthèse (Mester & Itô 1989, de Chene 1985). De Chene, repris par Lombardi (1997), base son analyse notamment sur les résultats d'une expérience exploitant des verbes dénués de sens, mettant ainsi en évidence le caractère restrictif du contexte de l'épenthèse : uniquement à la frontière d'un radical verbal. Nous avons visité successivement l'Afrique, l'Australie et l'Asie sous le prétexte de l'épenthèse de liquide coronale. Il est temps de rentrer dans nos contrées pour chercher si l'on n'y trouve pas également ce que nous sommes allés chercher si loin. 2.1.3.1.4. Continent européen En anglais (Szigetvári 1994 : 192, Ortmann 1995 : 1) un [] est inséré entre deux voyelles adjacentes si la première ne peut pas propager de glide afin de résoudre l'hiatus. Si la première voyelle est [], [u], [i:] ou [u:], un glide est propagé ; si en revanche il s'agit d'un [], 33 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités d'un [a:] ou d'un [ø:], c'est l'épenthèse qui est choisie pour résoudre l'hiatus, comme on peut le voir dans le tableau ci-dessous. Cependant, "the prescriptivist stands against filling hiatus with [] and other reasons as well make some speakers of English fill it with [], i.e. (Jones 1966 : 113)." (Szigetvári 1994 : 220 note 6). (34) propagation d'un glide s[i:j]ing n[aw]and seeing now and grandma is India and glose épenthèse d'un [] "voyant" "maintenant et" "mamie est" "l'Inde et" grandm[a:] is Indi[] and Il est intéressant de relever à cet endroit que l'épenthèse de [r] n'est pas toujours considérée comme une épenthèse de coronale (Akinlabi 1993 ; également Ortmann 1998 : 72), mais il s'agit dans ce cas d'analyse portant sur une langue donnée, en l'occurrence le yoruba, n'ayant donc pas de valeur générale. L'anglais de Bristol présente constitue le deuxième cas d'épenthèse en [l] documenté par la littérature : un [l] est inséré en finale de mot après un schwa (Lombardi 1997, 2003, Hughes & Trudgill 1979, Wells 1982, Gick 1999) de telle sorte que des mots comme Eva et evil se retrouvent homophones. Enfin, Vaux (2003 : 22) signale qu'en espagnol sévillan, les emprunts manifestent un [r] épenthétique. Toutefois, il ne fournit qu'un seul exemple ne permettant pas de déterminer avec certitude le contexte en hiatus – l'épenthèse concerne-t-elle uniquement une certaine catégorie de voyelles ? – et ce [r] est ici en variation libre avec [s]. (35) mot emprunté chalet épenthèse de [r] chaleres épenthèse de [s] chaleses Les liquides coronales sont donc bien attestées dans le phénomène de l'épenthèse, le plus souvent en hiatus (seul l'anglais de Bristol fait exception à cette règle) mais le plus souvent sans que ce hiatus soit une condition suffisante (cf. section 2.2). Les coronales sont également largement employées dans les cas d'épenthétisation sous la forme de la nasale [n], ce qui invalide la relation d'exclusivité constatée en section 2.1.1. entre le mode d'articulation nasal et le lieu vélaire. 34 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.3.2. Nasale On trouve la nasale coronale épenthésée dans des langues d'origines diverses, permettant à cette consonne d'être représentée en Amérique avec le tunica, en Afrique avec le fula et le gokana, en Asie avec le coréen, en Australie avec le murut et en Europe avec le suisse allemand. Le tunica, langue amérindienne éteinte anciennement parlée en Louisiane centrale, (Haas 1940, Lombardi 1997, 2003) présente un cas d'épenthèse de la nasale coronale /n/. En fin de proposition, les séquences en tunica doivent obligatoirement comporter une consonne. Si le lexique ne fournit pas cette consonne, /n/ est inséré13 : (36) Forme régulière hatika sahku Phrase-final form (ton omis) hatikan sahkun glose "encore" "un" Certaines catégories de mots, portant l'accent à la finale, ne peuvent pas prendre directement l'épenthèse de la nasale et insèrent une syllabe entière, formée d'un coup de glotte et d'une copie de la voyelle précédente, avec le /n/ en coda. (37) Forme régulière ri ke ru arupo Phrase-final form riin keen ruun arupoon glose "maison" "guêpe" "hickory" "rêve" Le fula (Bagemihl 1989, Lombardi 1997), langue de la famille niger-congolaise parlée notamment en Gambie, au Mali et au Sénégal, connaît un jeu de langage consistant à inverser les deux premières consonnes d'un mot : (38) fula saare war umara 13 fula transformé raase raw muaru glose "concession" "vient" nom propre Quelques mots préfèrent à l'épenthèse de la nasale la chute de la dernière voyelle, mais ils restent minoritaires. 35 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Cependant, lorsque ces deux consonnes sont identiques, la deuxième dans le mot transformé est remplacée par un /n/ épenthétique, et ce, quel que soit le lieu d'articulation de la consonne qui est élidée : (39) fula fula transformé glose baaba baana "père" daada daana "mère" jaaje jaane nom propre C'est le seul endroit où un /n/ apparaît en épenthèse en fula14. Le gokana (Hyman 1982, 1985, Lombardi 1998), langue niger-congolienne parlée au Nigéria dont nous avons déjà observé la propension à l'épenthèse en [r], manifeste parallèlement une épenthèse en [n] lorsque le site est entre deux nasales (cf. (31)). De Lacy (2002a : 190) ajoute à cette liste le coréen (Hong 1997) et le murut (Prentice 1971 : 113) langue austronésienne de la famille malayo-polynésienne de l'ouest parlée en Malaisie. En ce qui concerne le continent européen, c'est le haut alémanique, "basically Swiss German", qui comporte des épenthèses de nasale coronale, selon Ortmann (1995 : 1-3) reprenant des données de Heusler (1888 : 110) et Weinhold (1863 : 171). Il définit ces épenthèses comme en relation avec la cliticisation, lorsque le clitique est complément : (40) suisse allemand wo [n] er ko isch däs Stuck, wo [n] erer id gfalle hätt gröBer wie [n] i gang zu [n] ere traduction des mots quand il arrivé est la pièce, que elle pas plu a plus grand que moi va à elle glose "quand il est arrivé" "la pièce qu'elle n'a pas aimée" "plus grand que moi" "va à elle" La nasale coronale, comme les liquides, n'est donc pas exclusivement liée à l'hiatus (et dans ce cas l'hiatus n'est pas non plus un critère suffisant, cf. section 2.2) puisqu'on la trouve également épenthésée en fin de proposition (tunica). 14 Lombardi 1997 note :" It is unclear whether we should expect to see markedness constraints reflected in the same way in language games as in natural languages; for example, do they actually tend to use unmarked consonants in epenthesis? Perhaps not; Stuart Davis (p.c.) points out that some language games use labials, for instance, and we probably don’t want to use this to argue that the Place markedness hierarchy should be revised. There are surely functional reasons that language games might want to use more marked consonants deliberately, to mark the language game situation (and of course, because labials are just funnier than other consonants.)" 36 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Les épenthèses de coronales semblent assez fréquentes dans les langues du monde, du moins tant qu'il s'agit de sonantes. En est-il de même pour les obstruantes ? 2.1.3.3. s, z /s/ et /z/ sont des épenthèses, sinon fréquentes, du moins courantes en français, "standard" comme régional (cf. section 3). Pourtant, il semblerait que les langues du monde ne partagent pas cette affection du français pour les coronales antérieures fricatives, puisqu'un seul article à ma connaissance fait état de ce type d'épenthèse dans d'autres langues. Outre l'emprunt mentionné en espagnol sévillan (chalet > chaleses, cf. 2.1.3.1.4.), Vaux (2003 : 24) signale une épenthèse "randomly in coda" en espagnol dominicain (Nuñez-Cedeño 1988) : (41) teatro "théâtre" abocado "avocat" réalisations possibles [teastro] [teatros] [asboado] [abosado] [aboasdo] [aboados] réalisations interdites *[tesatro] *[teatsro] *[saboado] Cette désaffection de l'épenthèse ne s'étend pas aux occlusives coronales, tant s'en faut. Rose (1993 : 173) le dit bien, "the coronal /t/ is often an epenthetic segment". Ce sentiment est partagé notamment par Broselow (1984), Hume (1994) et Spring (1990), et nombre de langues viennent confirmer cette impression. 2.1.3.4. t, d Les langues qui ont recours à l'épenthèse des occlusives coronales font en fait presque uniquement appel à [t], que ce soit les langues amérindiennes, africaines, asiatiques, australiennes ou européennes, les quatre dernières n'étant en fait représentées que par une langue chacune. 37 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.3.4.1. Langues amérindiennes Les langues amérindiennes utilisant l'épenthèse en [t] sont au nombre de deux : l'asheninca campa et l'odawa. Les langues de la famille arawak étaient anciennement parlées de la Floride au Chili, elles ne sont plus actuellement pratiquées qu'en Amérique du Sud. En axininca campa15 (cf. Payne 1981 ; cf. également Itô 1989 : 237, Kitto & De Lacy 1999, Lombardi 1997, McCarthy & Prince 1993), langue parlée au Pérou, l'attaque est obligatoire (sauf en début de mot prosodique, qui ne sera donc pas concerné par l'épenthèse). Si une attaque n'est pas remplie par le matériel lexical entre une base et un suffixe, donc en hiatus vocalique à la frontière dérivationnelle suffixale, un /t/ est épenthésé pour remplir mélodiquement la position : (42) forme sous-jacente /noN-kim-i/ /noN-pok-i/ /noN-pisi-i/ réalisation sans épenthèse [nokimi] [nompoki] réalisation avec épenthèse [nompisiti] glose "je balaierai" "j'entendrai" "je balaierai" /noN-piyo-i/ [nompiyoti] "j'entasserai" /i-N-koma-i/ [ikomati] "il pagaiera" /i-N-koma-aa-i/ [ikomataati] "il repagaiera" /i-N-koma-ako-i/ [ikomatakoti] "il pagaiera pour" /i-N-koma-ako-aa-i-ro/ [ikomatakotaatiro] "il repagaiera pour ça" Cette épenthèse se trouve uniquement avec la suffixation. Dans le cas de la préfixation, un éventuel hiatus est résolu par la chute de la voyelle. C'est ce qui fait dire à Lombardi (1997, 2003) que les coronales ne sont épenthétiques que dans des cas morphologiquement restreints. Je reprendrai cette hypothèse en section 2.2. Piggott (1990), repris par Lombardi (1997, 2003), mentionne une épenthèse de /t/ à la frontière entre un préfixe de personne et un radical en odawa (ojibwa : langue amérindienne du groupe algonquin du Canada et des États-Unis), comme l'illustre le tableau ci-dessous (où les règles d'effacement de voyelles sont omises puisque non pertinentes pour le sujet traité) : (43) Forme sous-jacente /ki-akat-i/ kitakati "tu es timide" /ki-osamikwam-m/ kitosamkwamim "vous faîtes la grasse matinée" /ni-ompass/ nitompass "mon bus" 15 Réalisation glose On trouve également écrit Asheninca Campa 38 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités L'hiatus avec le même préfixe attaché aux noms d'une autre classe, celle des possessions inaliénables, est en revanche résolu non par l'épenthèse mais pas l'élision : (44) (a) (b) (c) Forme sous-jacente /ni-oss/ /okima-ak/ /okkkwe-ak/ /ki-pi-ia-w/ Réalisation noss okimak okkwek kipia / kipiia glose "mon père" "chefs" "asticots" "il est venu ici" Après l'Amérique, intéressons-nous aux autres continents, représentés chacun par une langue. 2.1.3.4.2. Autres continents L'amharique est une langue gabaritique parlée en Ethiopie16, de la famille chamitosémitique. Selon Broselow (1984) (cf. également Lombardi 1997), /t/ est la consonne par défaut en amharique ; c'est notamment elle qui est épenthésée lorsque la structure gabaritique requiert une consonne. Dans la colonne (a) est exposé un verbe dont la structure sous-jacente est bilitère. Une épenthèse apparaît au gérondif et à l'infinitif pour atteindre le gabarit trilitère souhaité (Broselow précise que "the reason why the j of this root does not spread to fill the final consonant slot is because there is no language-specific rule which would cause it to spread: automatic spreading is not a universal principle.") ; la colonne (b) illustre le cas des verbes possédant bien trois consonnes dès le lexique, les deux dernières étant identiques, la colonne (c) le cas "normal", avec trois consonnes différentes dès le lexique. (45) (a) /fj/ "consumer" fäjjä fäjto mäfjät (b) /wdd/ "aimer" wäddädä wäddo mäwdäd (c) /lbs/ "ouvrir" läbbäsä läbso mälbäs glose perfectif gérondif infinitif Sont également référencés le coréen (Kim-Renaud 1986 : 19, De Lacy 2002a : 189) et le maori (de Lacy 2002a : 189, 2002d), langue austronésienne malayo-polynésienne du groupe centre-est parlée au nord et à l'est de la Nouvelle-Zélande. 16 Pour une description du système phonologique de l'amharique, cf. Leslau (1997). 39 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités En maltais (Ortmann 1995 : 3-4), un [t] est inséré si les deux conditions suivantes surviennent simultanément : après un numéral et avant une épenthèse de [i]. L'épenthèse vocalique se trouve dans d'autres contextes, aussi est-on en droit de supposer qu'il ne s'agit pas d'épenthèse d'un CV entier mais bien de deux épenthèses distinctes. L'exemple ci-dessous illustre d'une part l'épenthèse en elle-même à partir de deux unités lexicales sans [t], d'autre part que cette épenthèse ne survient pas si le [i] suivant n'est pas épenthétique mais lexical. (46) épenthèse zewg hbieb zewg + hbieb sewg + Indjani pas d'épenthèse zewgt ihbieb zewg (*t) Indjani glose "deux" "amis" "deux amis" "deux Indiens" En allemand enfin (Scheer 2002 : 11), on observe en diachronie une épenthèse d'occlusive coronale, [t] ou [d], en fin de mot ou de morphème, après [n], [r], [s], [], [] et [f]. (47) après [n] après [r] après [s] après [] après [] (rare) après [f] moyen haut allemand iergen ieman vollen sinvluot allenhalben wësenlîch anderhalp ackes obez sus bâbes habech dornach bredige werf saf nouveau haut allemand iergend jemand vollends Sintflut allenthalben wesentlich anderthalp Axt Obst sonst Papst Habicht Dornacht Predigt Werft Saft glose "n'importe quel" "quelqu'un" "complètement" "flotte" "partout" "important" "un et demi" "axe" "fruit" "sinon" "pape" "aigle" nom de la ville "sermon" "chantier naval" "jus" Il est temps d'établir un bilan concernant cette classe de consonnes : est-elle liée à un contexte particulier comme les vélaires, ou est-il impossible d'établir une distribution particulière, comme pour les glottales ? 40 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.3.5. Bilan sur les coronales D'une manière générale, on peut dire que non seulement l'épenthèse de coronale n'est pas imposée par la présence d'un hiatus, mais que celui-ci est loin d'être même une condition nécessaire. Le seul cas où elle est conditionnée uniquement par l'hiatus est en réalité un cas où un glide ne peut pas propager de la première voyelle (anglais). L'hiatus est une condition requise mais non suffisante dans plusieurs langues (baka, gokana, knni, japonais, fula, haut allémanique, odawa), et il n'intervient pas dans nombre d'autres. En effet, l'épenthèse de coronale peut être requise par la langue en fin de morphème (allemand), de mot (anglais de Bristol, allemand) ou de proposition (tunica) ; par le gabarit (amharique) ; par une frontière morphologique seule (maltais) ou associée à la position d'attaque (asheninca campa). La section suivante propose un récapitulatif des consonnes épenthésées dans les langues du monde, en fonction du son épenthésé puis de la région géographique d'une part, des contextes d'apparition de l'épenthèse liés aux différents sons d'autre part. 2.1.4. Récapitulatif des langues et des consonnes concernées 2.1.4.1. Classement par son épenthésé Le tableau ci-dessous permet de récapituler les langues citées ici en fonction du son épenthésé qu'elles manifestent : (48) vélaires [] [] glottales [h] buginese (Mills 1975, Lombardi 1997) uradhi (Trigo 1988, Crowley 1980, 1983, Rice 1996, De Lacy 2002a) murut (Prentice 1971, Rice 1996) kaingang (Yip 1992, Lombardi 1997, De Lacy 2002a) mongol (Rialland & Djamouri 1984, Beffa & Hamayon 1975, Vaux 2003) yucatec (Orie & Bricker 1997, Lombardi 1997, Straight 1976, De Lacy 2002a) huariapano (Parker 1994, 1996, 1998, de Lacy 2002a) hare et bearlake (Rice 1989, De Lacy 2002a) chipewyan (Li 1946, De Lacy 2002a) ayutla mixtec (Pankratz & Pike 1967, De Lacy 2002a) langues tucanoan (Welch & Welch 1967, De Lacy 2002a) yagua (Payne & Payne 1986, De Lacy 2002a) fox (Bloomfield 1924, De Lacy 2002a) hébreu moderne (Rose 1996) tigré (Rose 1996) nisgha (Shaw 1987, Rose 1996) hanunoo (Schane 1973, Vaux 2003) guajiro (Mansen & Mansen 1984, Alvarez 1995, Vaux 2003) 41 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités [] [l] [r] coronales [n] [s] [d] [t] indonésien (Cohn 1989, Cohn & McCarthy 1994, Karr & Kassin 1999, Pater 2001) malais (Durand 1986a, McCarthy 1998, Carr & Kassin 1999, Zaharani 1998,) makassar (Aronoff et al 1987, Broselow 1999, McCarthy 1998, McCarthy & Prince 1994) selayarese (Mithun & Basri 1986, Lombardi 2003) ilokano (Hayes & Abad 1989, Rose 1996, Lombardi 2003, Ortmann 1998, Rosenthall 1997) kisar (Christensen & Christensen 1992, Lombardi 2003) atayal (Lambert 1999) buginese (Mills 1975, Lombardi 1997) sundanese (Robins 1953, Lombardi 1997) larike (Laidig 1992, Laidig & Laidig 1995, De Lacy 2002a) hébreu moderne (Rose 1996) arabe (McCarthy, Lombardi 2003) tigrigna (Denais 1994) cupeño (Crowhurst 1994, Lombardi 1997, 2003, de Lacy 2002a) mohawk (Hale & White Eagle 1980, de Lacy 2002a) tsishaath nootka (Stonham 1999, de Lacy 2002a) tunica (Haas 1940, Lombardi 1997, 2003) gokana (Hyman 1985, Lombardi 1997, 2003) kçnni (Cahill 1999, Lombardi 2003) langues tchadiques (de Lacy 2002a, Frayzingier & Kopo 1989) tigré (de Lacy 2002a, Raz 1983) tamil (Christdas 1988, Lombardi 1997, 2003) koryak (Kenstowicz 1976, Lombardi 2003) persan (Picard 2002, Vaux 2003) allemand (Wiese 1996, Alber 2001) anglais (Lombardi 2003) bulgare (Rubach 2000) tchèque (Kucera 1961, Rubach 2000) anglais de Bristol (Lombardi 1997, 2003, Hugues & Trudgill 1979, Wells 1982, Gick 1999) baka (Kleinhenz 1992, Ortmann 1998) français québécois (Morin 1982) gokana (Hyman 1985, Lombardi 1997, 2003) kçnni (Cahill 1998, 1999, Lombardi 2003) anejom (de Lacy 2002a, Lynch 2000) japonais (Lombardi 1997, Mester & Itô 1989, de Chene 1985, Poser 1986, McCawley 1968) anglais (Szigetvári 1994, Ortmann 1995) espagnol sévillan (Vaux 2003) tunica (Haas 1940, Lombardi 1997, 2003) fula (Bagemihl 1989, Lombardi 1997) gokana (Hyman 1985, Lombardi 1997, 2003, de Lacy 2002a) coréen (Hong 1997, de Lacy 2002a) murut (Prentice 1971, de Lacy 2002a) suisse allemand (Orrtmann 1995) espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003) allemand (Scheer 2002) asheninca campa (Payne 1981, Kitto & De Lacy 1999, Lombardi 1997, McCarthy & Prince 1993) amharique (Broselow 1984, Lombardi 1997) odawa (Piggott 1990, Lombardi 1997, 2003) maltais (Ortmann 1995) allemand (Scheer 2002) 42 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Les épenthèses consonantiques dans les langues du monde se limitent donc à trois points d'articulation : - la vélaire [] - les glottales [h] et surtout [] - les coronales, sonantes et occlusives. 2.1.4.2. Classement par région géographique La carte suivante17 offre une vision globale du type de consonne épenthésée par continent ou région géographique18. Elle ne se veut aucunement limitative et vise simplement à représenter les données rassemblées plus haut. (49) , r, s, t, d, n, l h, , n, t h, , t , r, t , h, , r , r, n, l , h, t Cette représentation permet d'aboutir à la conclusion somme toute attendue que les sons épenthésés ne sont pas propres à une région du globe plutôt qu'à une autre ; les éventuels "trous" dans la distribution - pas de vélaire épenthétique en Europe ou en Afrique, pas de coup de glotte en Amérique du Sud - doivent donc être imputés à un manque de données plutôt qu'à un éventuel paramètre linguistique. 17 Fond de carte issu de http://www.graphicmaps.com/atlas/world.htm Les [l] enregistrés en français québécois ne figurent pas avec le continent américain, dans le sens où ont été reportées sur ce continent "uniquement" les langues amérindiennes, natives, et non celles issues de langues européennes comme le français ou l'anglais. 18 43 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités En ce qui concerne le français, on ne rencontrera que deux types d'épenthèses, toutes deux coronales : l'épenthèse en fricative le plus souvent sonore et en occlusive le plus souvent sourde (cf. section I [1] 3). C'est pourquoi il semble pertinent de s'intéresser de plus près à cette catégorie de consonnes que sont les coronales. 2.1.5. Contextes syllabiques d'épenthèse en fonction du son épenthésé Lors du passage en revue des consonnes observables en épenthèse, j'ai précisé leurs contextes d'apparition. Dans ce bilan sont distinguées les deux positions possibles pour une consonne : la "coda" et l'"attaque"19. Il ne s'agira pas ici de distinguer de contextes déclencheurs, ce qui sera réservé à la section 2.2, mais uniquement de repérer et d'évaluer quantitativement les positions syllabiques où l'on observe des épenthèses. Précisons ici que n'ont pas été abordées les langues pour lesquelles l'épenthèse n'est pas aisément classable en termes de coda et d'attaque (cf. section 2.2.1). Pour de Lacy (2002a : 190), "of the epenthetic consonants, [n l] seem to be acceptable epenthetic codas. Epenthetic onsets are typically [ t h] or a homorganic glide [j w] and perhaps []." A la lumière des langues et des épenthèses répertoriées au long de la section 2.1, peut-on confirmer cette impression ? 2.1.5.1. Sons épenthésables en coda On observe en coda toutes les catégories de sons répertoriées : des vélaires comme des glottales et des coronales. Je distinguerai ici trois cas de figure : les épenthèses que l'on ne trouve qu'en fin de proposition pour une langue donnée, celles que l'on trouvera en fin de mot, et celles qui seront dans n'importe quelle coda de la langue où qu'elle se situe dans une unité supérieure (fins de proposition et de mot comprises). 2.1.5.1.1. Fin de proposition Trois langues parmi l'inventaire dressé ici utilisent l'épenthèse pour satisfaire une structure de proposition en coda : l'uradhi (cf. section 2.1.1.), qui épenthèse la nasale vélaire ; 19 J'emploie ici les termes de "coda" et d'"attaque" dans leur acception courante, sans leur associer de quelconque statut à l'intérieur d'une théorie donnée. La "coda" est donc entendue comme la position post-nucléaire d'une syllabe, tandis que l'"attaque" renvoie au(x) segment(s) pré-nucléaire(s) de la syllabe. 44 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités le knni (cf. section 2.1.2.2.) qui préfère le coup de glotte ; le tunica (cf. section 2.1.3.2.) qui choisit la dentale nasale. Le tableau ci-dessous récapitule ces trois langues avec leurs références et un exemple lorsqu'il en était de disponible : (50) langue uradhi knni tunica références Trigo 1988, Crowley 1980, 1983, Rice 1996, de Lacy 2002a Cahill 1999, Lombardi 2003 Haas 1940, Lombardi 1997, 2003 son épenthésé [] forme sousjacente /ama/ illustration réalisation en fin de réalisation proposition ailleurs glose [ama] [ama] "personne" [hatikan] [hatika] "encore" [] [n] Plus nombreuses sont les langues ici répertoriées qui font appel à l'épenthèse consonantique en fin de mot. 2.1.5.1.2. Fin de mot Il s'agit ici des langues qui comportent une épenthèse en coda lorsque celle-ci est en fin de mot, mais non lorsqu'elle se situe à l'intérieur du mot. Les glottales sont toutes deux concernées par cette position : [h] en yucatec et en guajiro (cf. section 2.1.2.2.), [] en atayal, makassar et cupeño (cf. section 2.1.2.2.). Deux coronales s'y intéressent également, chacune représentée par une langue : [l] est épenthésé en fin de mot en anglais de Bristol (cf. section 2.1.3.1.), [t] (et [d]) en allemand (cf. section 2.1.3.4.). Dans ce dernier cas, précisons que l'épenthèse s'observe en diachronie, et qu'elle concerne également le début de morphème (cf. section 2.2). Le tableau suivant rappelle par un exemple (lorsque la littérature afférente en fournit) la situation de ces langues : 45 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (51) langue yucatec guajiro atayal son illustration épenthésé forme sous-jacente réalisation en fin de mot glose Orie & Bricker 1997, [h] Lombardi 1997, Straight 1976, de Lacy 2002a Mansen & Mansen 1984, "lune" [h] [kaih] Alvarez 1995, Vaux 2003 Lambert 1999 "mettre" [] /am + si/ [sami] références makassar Aronoff et al. 1987, Broselow 1999, McCarthy 1998, 2002, McCarthy & Prince 1994 Crowhurst 1994, Lombardi cupeño 1997, 2003, de Lacy 2002a Lombardi 1997, 2003, anglais de Bristol Hugues & Trudgill 1979, Wells 1982, Gick 1999 allemand Scheer 2002 buginese Mills 1975, Lombardi 1997 [] /jamal/ [jamala] "vilain" [] /kwa/ [kwa] "manger" mha : ieman nha : jemand "quelqu'un" "thé" [l] [t] [] [te] Le dernier cas d'épenthèse en "coda", après l'épenthèse en fin de proposition et celle en fin de mot, concerne tout simplement la finale de syllabe, quelle que soit la position de celleci dans une unité supérieure - mot, proposition, unité intonationnelle. 2.1.5.1.3. Fin de syllabe Trois langues de l'inventaire établi ici sont concernées, dont deux avec la même consonne épenthétique : [h] (cf. section 2.1.2.1). Il s'agit de deux langues amérindiennes, l'ayutla mixtec (Pankratz & Payne 1986, de Lacy 2002a ) et l'huariapano (Parker 1994, 1996, 1998, de Lacy 2002a). L'espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003) épenthèse quant à elle un [s] (cf. section 2.1.3.3.) dans cette position. Nous venons de rappeler quelles langues ont recours à l'épenthèse consonantique en coda. Cependant, la plupart des langues qui ont été répertoriées ici épenthèsent une consonne en attaque, comme on va le voir dans la section suivante. 2.1.5.2. Sons épenthésables en attaque Seules les glottales et les coronales sont épenthésables en attaque, aucune vélaire n'étant attestée dans l'inventaire établi en début de section 2.1. Comme dans le cas de la coda, 46 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités on peut ici distinguer les trois catégories suivantes : les épenthèses en début d'unité supérieure (proposition ou intonation), celles en début de mot, et celles en début de syllabe. 2.1.5.2.1. Début d'unité supérieure Le coup de glotte est le seul son auquel il soit fait appel en début d'une unité plus grande que le mot (cf. section 2.1.2.2.), et ce dans deux langues : l'anglais pour l'initiale de proposition, et le selayarese pour celle d'intonation. (52) langue anglais selayarese illustration son épenthésé réalisation en initiale réalisation ailleurs glose Lombardi 2003 "anguille" [] [ijl] [ijl] Lombardi 2003, Mithun "ceci" [] [inni] [inni] & Basri 1986, Broselow 1982 références Intéressons-nous maintenant aux langues qui épenthèsent une consonne en début de mot. 2.1.5.2.2. Début de mot Il s'agit ici des langues qui ne font appel à l'épenthèse que pour une attaque en début de mot lorsque le matériel lexical ne fournit pas de consonne. Là encore, les huit langues inventoriées ont recours uniquement au coup de glotte (cf. section 2.1.2.2.). On en trouve le rappel dans le tableau suivant : (53) langue kisar arabe tamil koryak gokana allemand bulgare tchèque références Lombardi 2003, Christensen & Christensen 1992 Lombardi 2003 Christdas 1988, Lombardi 2003 Kenstowicz 1976, Lombardi 2003 Hyman 1985, Lombardi 1997, 2003 Scheer 2000a, Alber 2001, Hall 1992, Wiese 1996 Rubach 2000 Kucera 1961, Rubach 2000 son illustration épenthésé forme sous-jacente réalisation à l'initiale glose /eni + eni/ "celui-ci" [] [enieni] [] [] [ismaq] [aas] "écoute" "espoir" [ajatk] "tomber" [] [awtoo] "voiture" [] [] [u]rnata [i]diot "urne" "idiot" [] /ismaq/ /aacaj/ [] 47 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Vient enfin l'endroit où l'on relève le plus d'épenthèse à travers les langues : le début de syllabe, où que soit cette syllabe. 2.1.5.2.3. Début de syllabe La plupart des langues qui épenthèsent une consonne en début de syllabe le font en hiatus vocalique. Ce n'est cependant pas une règle absolue, en témoignent des langues comme le malais, le tigrigna ou le maltais, qui attestent des insertions après coda. La position d'initiale de syllabe n'est en effet pas, moins encore que pour les autres contextes proposés ici, déterminante dans l'apparition d'une épenthèse ; elle n'en est bien souvent qu'une condition nécessaire (cf. section 2.2). On peut citer ici le mongol pour les épenthèses de vélaires, avec les réserves émises en section 2.1.1 quant à la réalité de l'épenthèse. Ce serait alors le seul cas relevé dans deux catégories : la seule épenthèse de vélaire orale, et la seule épenthèse de vélaire en attaque. Parmi les glottales, seuls les dialectes hare et bearlake de la langue slavey et le hanunoo attestent d'une épenthèse de [h] en initiale de syllabe (cf. section 2.1.2.1), toutes les autres attestations concernant le coup de glotte (cf. section 2.1.2.2). Les quatre coronales répertoriées fournissent des cas d'épenthèse dans cette position : les liquides en baka, gokana, knni, japonais, espagnol sévillan et anglais (cf. section 2.1.3.1), la nasale en fula, gokana et haut alémanique (cf. section 2.1.3.2), et l'occlusive en asheninca campa, odawa et maltais (cf. section 2.1.3.4). Le tableau suivant offre une vue synthétique de l'ensemble des données concernées, avec une illustration lorsque celle-ci est disponible : 48 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (54) langue références Rialland & Djamouri 1984, Beffa & Hamayon 1975, Vaux 2003 et Rice 1989, de Lacy 2002a mongol ? hare bearlake hanunoo Schane 1973, Vaux 2003 son épenthésé [] [h] forme sousjacente /le + i + wee/ [] [] Cahill 1998, 1999, Lombardi 2003 Lombardi 1997, Mester & Itô 1989, de Chene 1985, Poser 1986, McCawley 1968 Vaux 2003 [lehiwee] glose [usahi] "nous coupons en deux" "mets-le en un" /di + ambil/ [diambil] "pris" /mula + i/ [mulai] "aveugle" [kuurai] [h] indonésien Carr & Kassin 1999, Pater 2001, Cohn 1989, Cohn & McCarthy 1994 Carr & Kassin 1999, Zaharani malais 1998, Durand 1986a, McCarthy 1998 selayarese Lombardi 2003, Mithun & Basri 1986 Hayes & Abad 1989, Rose 1996, ilokano Lombardi 2003, Ortmann 1998, Rosenthall 1997 Picard 2002, Vaux 2003 persan Cahill 1998, 1999, Lombardi knni 2003 allemand Wiese 1996, Alber 2001, Hall 1992, Scheer 2001 Janda & Townsend 2000, tchèque Palková 1997 Denais 1994 tigrigna Kleinhenz 1992, Ortmann 1998 baka Hyman 1985, Lombardi 2003 gokana illustration réalisation à l'initiale [dalaiaas] [] [] /lailo/ [lailo] "je l'accompagne" "affectionate" [] [] /zaa + u/ [zaau] "enceinte" [ka'oot] "chaotique" [] [] /pro + ud + i/ [proi] [] /sahafi + u/ [sahafiu] "fumera à travers" "son écrivain" [l] [r] /soo/ [solo] [oo sii rii] "sécher" "vous attrapiez" [r] [dara] "jour [r] tabe-ru "manger, présent" [r] chaleres "chalet" Szigetvári 1994, Ortmann 1995 [r] Indi[r] and "l'Inde et" fula (jeu) gokana Bagemihl 1989, Lombardi 1997 Hyman 1985, Lombardi 2003 [n] [n] "mère" "il faisait" haut alémaniqu e asheninca campa Ortmann 1995, Heusler 1888, Weinhold 1863 [n] daana [oo naa-n] wo [n] er [t] /i + + koma + [ikomati] i/ "il pagaiera" odawa Kitto & De Lacy 1999, Payne 1981, Lombardi 1997, McCarthy & Prince 1993 Piggott 1990, Lombardi 2003 [t] "mon bus" maltais Ortmann 1995 [t] /ni + ompass/ /zewg + hbieb/ knni japonais espagnol sévillan anglais [nitompass] [zewgt ihbieb] "quand il" "deux amis" On remarquera ici la double présence du knni, due au fait que d'autres facteurs que la position interviennent dans la distribution de l'épenthèse, et du gokawa puisque le contexte 49 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités influence la qualité de la consonne épenthésée. Cependant, dans cette partie il ne s'agit que de situer l'épenthèse et non d'expliquer son apparition, objet de la section 2.2. 2.1.5.3. Tableau récapitulatif Le tableau suivant permet de récapituler les endroits où l'on trouve des épenthèses dans les langues du monde présentées ici, en fonction de la nature du son épenthésé comme de la classe à laquelle ce son appartient : (55) [] [] [h] fin de proposition uradhi / / "coda" fin de mot buginese / yucatec atayal makassar cupeño fin de syllabe / / ayutla mixtec huariapano / anglais selayarese (unité d'intonation) "attaque" début de mot / / / / / / anglais de Bristol / kisar arabe tamil koryak gokana allemand bulgare tchèque / / / / tunica / / / / / allemand / / / knni [] [l] début de proposition / / / / [r] [n] [t] début de syllabe / (mongol) hare et bearlake indonésien malais tigrigna selayarese ilokano knni allemand tchèque baka gokana knni japonais anglais fula (jeu) gokana haut alémantique asheninca campa odawa maltais vélaires glottales coronales Est mise en évidence ici la prépondérance, au moins quantitative, de l'attaque sur la coda en regard de l'épenthèse consonantique, et particulièrement du début de syllabe : en dehors de la nasale vélaire, tous les sons relevés sont épenthésables dans cette position. A l'intérieur de la position "coda", c'est la fin de mot qui est la plus diversement attestée. On constate par ailleurs une relative distribution complémentaire entre les deux consonnes glottales : en-dehors précisément de ces deux contextes de début de syllabe et de fin de mot que l'on vient d'identifier comme plus ou moins généraux, c'est tantôt l'une, tantôt 50 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités l'autre qui apparaît en épenthèse : le coup de glotte privilégie les extrémités des propositions et le début de mot, mais ne se manifeste pas en fin de syllabe ; la fricative glottale au contraire n'intervient qu'en fin de syllabe et non dans les autres contextes. Faut-il voir là un universal concernant ces deux consonnes, ou une manifestation de l'opposition occlusive / fricative en ce qui concerne les épenthèses ? Cette dernière hypothèse se vérifie ici : tous les autres sons épenthésables sont occlusifs, et aucun en-dehors de [h] n'est possible en fin de syllabe. Il semble donc que ce contexte sélectionne les fricatives, donc [h], la seule disponible dans cet inventaire. La fin de proposition se distingue également, dans le sens où elle privilégie les nasales dans chaque classe de sons, quand il y en a ; à défaut, elle choisit l'occlusive correspondante. Ainsi a-t-on [] pour les vélaires et [n] pour les coronales, mais [] pour les glottales puisque aucune nasale n'est disponible. On remarquera enfin que pour les attaques qui ne sont pas de la catégorie générale, seul le coup de glotte est habilité à être épenthésé, et ce sur l'ensemble des trois catégories de consonnes. A ce niveau, il est possible d'amender la proposition de de Lacy (2002a) citée en début de section et rappelée ici : "of the epenthetic consonants, [n l] seem to be acceptable epenthetic codas. Epenthetic onsets are typically [ t h] or a homorganic glide [j w] and perhaps [].". Outre [n], [] et [l], [h] s'avère également possible en coda, dans davantage de langues que les trois sons cités par de Lacy ; [] et [t] sont également acceptables dans cette position. De même, en attaque la quasi-totalité des sept sons épenthésables sont possibles et non seulement les glottales et [t], seule [] étant exclue dans cette position. En ce qui concerne les glides homorganiques, on a vu que leur distribution en tant qu'"épenthèse" était complémentaire dans certaines langues de celle du coup de glotte. Afin de mieux mettre en évidence les particularités de chacun des trois grands groupes de consonnes - vélaire, glottal, coronal - qui sont concernées par le phénomène de l'épenthèse, on trouvera dans le tableau suivant les trois classes de consonnes mises en relation avec les endroits où elles sont présentes en tant qu'épenthèses dans les langues du monde. 51 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités "coda" (56) vélaire glottales coronales fin de proposition 9 9 9 "attaque" fin de mot fin de syllabe début de proposition 9 9 9 9 9 début de mot 9 début de syllabe 9 9 Ce tableau met en évidence de façon très nette la primauté des glottales sur les autres lieux d'articulation intéressés par l'épenthèse. Un classement simple en "coda" et "attaque" aurait pu laisser croire la même latitude pour les coronales, mais on voit ici que bien qu'elles soient deux fois plus nombreuses à intervenir (quatre coronales vs. deux glottales), leurs contextes d'apparition sont deux fois plus restreints que les glottales. La catégorie des vélaires avec son seul représentant ne figure que dans deux des contextes sur les six distingués ici. Il est vrai que ne figurent dans ces tableaux récapitulatifs que les langues pour lesquelles la littérature a fourni suffisamment de détails pour permettre de statuer, aussi est-il nécessaire que les généralisations ici observées soient tempérées à la lumière de davantage de données. Cependant, ces tendances sont suffisamment fortes pour valider l'hypothèse présentée en introduction du caractère plus général des épenthèses de glottales et plus anecdotiques des épenthèses des autres lieux d'articulation. 2.1.6. Bilan de la section L'ensemble de cette section 2.1. a permis de prendre contact avec le phénomène de l'épenthèse à travers les langues du monde, et d'en apprécier l'étendue. Par ailleurs, certaines observations concernant la nature de la consonne épenthésée en regard de son emplacement dans les unités phonologiques ont pu être formulées. Ont été ainsi mises en évidence l'absence de certaines consonnes dans le phénomène, particulièrement des labiales mais également de certaines coronales, palatales et vélaires, qui brillent par leur absence. Parmi les consonnes qui apparaissent en épenthèse, des contextes ont été dégagés : les glottales sont disponibles quelle que soit la position dans la syllabe, le mot ou une unité supérieure, les coronales se manifestent en coda comme en attaque, mais pas dans des soussections de ces catégories, et les vélaires ne se manifestent qu'en fin de proposition. A l'intérieur de la catégorie des glottales a été mise en évidence une complémentarité quant aux 52 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités positions que [h] et [] sont susceptibles d'occuper, et certains contextes semblent privilégier un mode articulatoire particulier : la fin de proposition donne la priorité aux nasales, les débuts de proposition et de mot aux occlusives. A l'issue de cette première section, le choix d'une consonne épenthésée plutôt que d'une autre dans les langues du monde est maintenant plus explicite. Mais on ne sait encore que peu de choses sur les motivations de l'apparition même d'une épenthèse. C'est ce qui va faire l'objet de la section suivante. 2.2. Pourquoi Pourquoi les langues choisissent-elles d'avoir recours à l'épenthèse ? Quelles sont les raisons phonétiques, structurales ou morphologiques invoquées ? Pour reprendre Lambert (1999 : 50) en effet, "epenthesis is often seen as triggered by something – epenthesize only when necessary." Dans cette partie seront abordées les causes proposées dans la littérature concernant l'épenthèse. Les motivations spécifiques au cas plus particulier de l'épenthèse entre radical et suffixe en français seront traitées dans la section 3 de ce même chapitre. Je distinguerai trois grandes motivations. La première concerne les épenthèses consonantiques au sein d'un groupe de consonnes, les deux dernières sont de portée plus générale. La première explication avancée est la résolution de groupes de consonnes interdits par la langue, à laquelle l'ajout d'une consonne occlusive permet de se conformer. Sont ensuite évoquées les contraintes structurales, du niveau de la proposition jusqu'à celui de la syllabe. Je terminerai cet inventaire en mentionnant les motivations extralinguistiques pouvant entrer en jeu dans la présence d'une consonne non étymologique, non sous-jacente et non conditionnée par le contexte. 53 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.2.1. Coarticulation et résolution de groupes de consonnes interdits Les cas d'épenthèses présentés ici ne correspondent pas exactement à la définition qui est retenue de l'épenthèse dans le cadre de cette étude (cf. section 1). La nature de la consonne "parasite" dépend en majeure partie du contexte : dans un phénomène ns > nts par exemple, si [dental] relève du contexte, l'occlusion n'est héritée ni de [n], ni de [s]. Or, j'ai admis que n'importe quel élément, aussi petit soit-il, peut être envisagé comme épenthésé. Dans le cas d'épenthèses au sein d'un groupe de consonnes, deux explications sont avancées : un phénomène de coarticulation tout d'abord, qui serait exclusivement phonétique et qui donc exclurait totalement ces cas de mon étude. Un phénomène de résolution de groupes de consonnes, qui peut, selon l'interprétation que l'on lui en donne, impliquer une épenthèse au sens où je l'entends ici : le contexte pose un problème et fournit une partie des éléments de réponse, mais l'aspect occlusif de la consonne épenthésée n'est pas issu de l'environnement de la consonne et peut donc être considéré comme une épenthèse de trait ou même simplement de position. Je commencerai par présenter les épenthèses après consonnes sonantes avant de m'intéresser à celles devant liquides. Dans un troisième paragraphe je mentionnerai un cas d'épenthèse après consonne à la finale, qui ne semble correspondre à aucun des cas décrits ici. 2.2.1.1. Epenthèses après sonantes Une explication traditionnellement avancée à l'apparition d'une consonne épenthétique dans un contexte consonantique, alors qu'il s'agit là d'une augmentation de la complexité de l'ensemble, est le phénomène de coarticulation : le son épenthésé assurerait la transition articulatoire entre les deux consonnes qu'il joint. On peut citer par exemple Wetzels (1985 : 285) : "intrusive stops are traditionally understood as sounds emerging at the phonetic surface as the result of specific coarticulation effects, generally involving the manner of articulation features 'nasal', 'continuant', and 'lateral'". Cette hypothèse est cependant largement concurrencée par une analyse en termes de résolution de groupes de consonnes interdits dans une langue donnée. Dans une première sous-section, je vais m'intéresser aux épenthèses devant obstruantes, puis à celles pour lesquelles le deuxième élément du groupe est indifférent. 54 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.2.1.1.1. Devant obstruantes En anglais (Wetzels 1985 : 288, Clements 1987 : 32 ; également Piggott & Singh 1985 : 419-420), une occlusive peut être facultativement insérée dans des groupes de consonnes dont le premier élément est une nasale, pourvu que l'obstruante suivante n'appartienne pas à l'attaque d'une syllabe accentuée. Le tableau suivant illustre chacun des cas possibles : (57) _s nts (sense) lts (false) mps (hamster) ks (youngster) n_ l_ m_ _ _ nt (ninth) lt (health) mp (warmth) k (length) _ nt (censure) lt (Welsh) mp (assumption) k (anxious) _f / _t / / / mpf (triumph) / mpt (dreamt) / La consonne épenthésée est une occlusive non-voisée, homorganique de la première consonne du groupe. Si l'on considère par exemple le terme dreamt, sont en contact au niveau sous jacent la nasale [m] et l'occlusive [t]. La consonne épenthésée [p] a récupéré le lieu d'articulation de la première consonne, en l'occurrence ici le lieu labial, et non de la deuxième, sans quoi elle serait coronale. Ce type d'épenthèse s'observe également en variation libre en gallois (Wetzels 1985 : 288) comme les exemples suivants l'illustrent : (58) hemt variante sans épenthèse variante avec épenthèse hempt "chemise" glose hemden hembden "chemises" komt kompt (il) "vient" hat hakt (il) "pend" La variation dans le voisement de la consonne épenthésée paraît dépendre de celui de la consonne suivante : lorsque celle-ci est voisée, la consonne intruse l'est également. En allemand, (cf. Wiese 1996 : 233), le groupe de consonnes déclencheur d'une épenthèse facultative est composé d'une consonne sonante suivie d'une consonne fricative. On 55 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités peut concevoir que cette consonne est épenthétique puisqu'elle n'est pas présente dans le pluriel des formes l'attestant au singulier, comme le tableau suivant le montre : (59) Singulier sans épenthèse ans Singulier avec épenthèse ants Pluriel sans épenthèse nz Pluriel avec épenthèse *ntz Gans, Gänse vams vamps vmz *vmpz Wams, Wämser hals halts hlz *hltz Hals, Hälse Graphie Glose "oie" Là encore, la consonne épenthésée est homorganique de la première consonne du groupe dans lequel elle s'inscrit. On pourrait penser que ce type d'épenthèses est propre au groupe germanique. Pourtant, Wetzels (1985 : 288) signale une consonne épenthétique qui apparaît, entre le latin et l'ancien français, entre une nasale et un [s] final. Laborderie (1994 : 77-78 ; 84) ajoute le contexte [_s], si bien que l'épenthèse concerne le cas plus général des sonantes suivies de [s] en finale. Bourciez (1967 : 165) mentionne les deux types de contextes ; pour lui, il s'agirait plutôt d'une question de prononciation ("ce z prononcé ts"). Le groupe final est par la suite repassé à s puis s'est amuï. Le tableau suivant photographie la situation au moment où l'épenthèse est attestée : (60) latin vieux français glose annos ants "années" ponos points "poing" enoclos enults "genou" consilius conseutz "conseil" Dans les deux premiers termes, la chute du [o] entraîne la mise en contact de la nasale avec [s] à la finale, le conflit étant résolu par l'épenthèse de la consonne occlusive homorganique de la consonne précédente. Dans les deux derniers, le [l] s'est palatalisé du fait de sa présence à la suite de l'occlusive vélaire ou devant un yod (genoclos et consilius respectivement) ; en contact avec [s] suite à la chute du [o] pour genoclos et du [u] pour consilius, il a favorisé l'apparition d'une consonne homorganique. Dans ce cas encore, le voisement ne vient pas de la première consonne mais de la seconde, ce qui explique que l'épenthèse soit non voisée. 56 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Ce qui est facultatif pour les langues germaniques doit recevoir une explication en termes de coarticulation, l'aspect facultatif de l'épenthèse démontrant que le groupe de consonnes dans laquelle elle s'inscrit n'est pas interdit par la langue. Cette explication tombe au rang de simple candidate en ce qui concerne l'ancien français, puisque cette fois l'épenthèse est obligatoire à partir du moment où la nasale est entrée en contact avec la fricative, lors de la chute de la voyelle. Il semblerait donc qu'il faille dans ce cas privilégier l'hypothèse du groupe interdit. Bourciez (1967 : 193) signale d'ailleurs que "le groupe ns n'existait déjà en latin que graphiquement, s'étant de très bonne heure réduit à s simple dans la prononciation". Face au groupe [ns], le latin a opté pour la troncation de la nasale, l'ancien français pour l'épenthèse d'une consonne intermédiaire. Après l'épenthèse au sein d'un groupe [nasale + obstruante] considérons le cas où la deuxième consonne peut être une sonante. 2.2.1.1.2. Devant sonante ou obstruante Jones (1976 : 124-125 ; cf. également Piggott & Singh 1985 : 418, Wetzels 1985 : 287) relève un cas d'épenthèse derrière sonante entre le vieil et le moyen anglais. Le deuxième élément du groupe dans lequel la consonne s'inscrit peut être une obstruante comme une sonante, comme l'illustre le tableau ci-dessous : (61) contexte devant obstruante a. derrière nasale devant nasale bilabiale vieil anglais æmti moyen anglais empti glose nemnan nempne "nommer" scea(m)ol schambel "tabouret" ym(e)l imble "dé à coudre" "vide" b. derrière nasale devant liquide coronale on(o)r under "tonnerre" spin(e)l spindel "fuseau" c. derrière liquide alre (acc) alder "eux tous" La consonne épenthésée est homorganique de la première consonne du groupe, comme dans tous les cas d'épenthèse interconsonantique relevés jusqu'à présent. La variation de voisement est quant à elle due à la deuxième consonne : dans le cas des sonantes, la consonne épenthétique est voisée, mais non-voisée devant une occlusive sourde. 57 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Etant donné le caractère obligatoire de cette épenthèse, l'hypothèse du groupe de consonnes interdit est privilégiée sur la coarticulation. Il semblerait donc que la langue rejette des groupes composés de deux nasales ([mn]) ou de deux sonantes ([nl], [nr], [ml]), ainsi que la séquence [mt], ce dernier cas étant plus surprenant puisque les deux consonnes appartiennent à deux classes différentes. Dans ce cas, et bien que la nature de la consonne épenthésée soit partiellement déterminée par le contexte, il reste que la position, voire le trait occlusif, sont des apports de matériel ex nihilo. Le deuxième cas distingué, après l'épenthèse derrière sonante, est l'épenthèse devant liquide. Les deux ne s'excluent pas l'un l'autre : nombre d'exemples attestent l'apparition d'une consonne entre sonante et liquide. 2.2.1.2. Epenthèse devant liquide En ancien français (Bourciez 1967 : 195 ; 188 ; 162 ; cf. également Piggott & Singh 1985 : 419, Walker 1978 : 66, Wetzels 1985 : 286-287, Morin 1980) on observe des épenthèses consonantiques devant les liquides, précédées de nasales ou liquides, mais également derrière les fricatives [s] et [z] comme l'illustre le tableau suivant : (62) contexte m_r m_l (a) derrière nasale n_r (b) après liquide l_r z_r (c) après [s] ou [z] s_r latin cam(e)ra *remem(o)rare sim(u)lare cum(u)lu cin(e)re pon(e)re ven(i)re-habeo *ven(e)risdie mol(e)re *col(u)ru *vol(e)re-habeo fall(e)re-habet co(n)s(ue)re *las(a)ru *cis(e)ra *ess(e)re antecess(o)r ancien français chambre remembrer sembler combre cendre pondre vendrai vendredi moldre coldre voldrai faldra cosdre lasdre cisdre estre ancestre français moderne viendrai moudre coudre voudrai faudra coudre ladre cidre être ancêtre 58 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Les changements notés dans ce tableau ne concernent pas le point abordé ici : [l] s'est vocalisé en [u] (Bourciez 1967 : 187), [z] et [s] devant consonnes se sont effacés (Bourciez 1967 : 162). Les épenthèses derrière consonne nasale (a) et liquide (b) correspondent également au cas traité dans le paragraphe précédent (2.2.1.1.2.), puisqu'il s'agit d'épenthèse derrière sonantes. Cependant, les obstruantes sont exclues du deuxième élément du groupe consonantique, aussi les classera-t-on préférentiellement ici. Il faut conclure de ce tableau que les séquences de nasales suivies de liquides ([mr], [ml], [nl], de liquides ([lr]) et de fricatives suivies de liquides ([zr], [sr]) sont interdites. Mises en contact par la chute de la voyelle atone, les consonnes ont réagi en produisant une consonne homorganique de la première consonne. On ne peut cependant pas ici attribuer son voisement à la seconde puisque dans le contexte s_r, c'est [t] qui est épenthésé et non [d]. Le voisement est ici dépendant de la première consonne. Ce phénomène d'épenthétisation s'observe dans d'autres langues romanes (Wetzels 1985 : 287) : (63) contexte espagnol italien m_ n_ l_ m_ s_ l_ latin hom(i)nem ven(i)ra sal(i)ra mem(o)rare pess(u)lus slavo langue moderne hombre vendra saldra membrare peskjo skjavo glose "homme" "il viendra" "il partira" "mémoriser" "pierre" "esclave" S'ajoute en ce qui concerne les groupes [skl] une glidicisation du [l]. En anglais (Wetzels 1985 : 288, Clements 1987 : 32, également Piggott & Singh 1985 : 419-420), une épenthèse d'occlusive se rencontre dans un groupe donc le deuxième élément est une liquide et le premier une sonante ou une fricative. Le tableau suivant illustre les combinaisons attestées dans le deuxième cas, c'est-à-dire devant consonne liquide, par les auteurs cités. Aucun exemple n'est malheureusement fourni. 59 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (64) _r deuxième élément liquide _l s_ str skl z_ zdr / m_ mbr mbl n_ ndr l l_ ldr / Là encore, le voisement comme le lieu d'articulation de la consonne épenthésée proviennent de la première consonne. Il en va de même en grec ancien et en gallois (Wetzels 1985 : 287) ainsi qu'entre l'indo-européen, le germanique et le slave (Bloomfield 1933 : 384), comme l'attestent les exemples suivants : (65) contexte grec gallois vieil anglais vieux bulgare m_ n_ s_ l_ s_ s_ langue ancienne *gam-ros *anr-os s(i)roop polre *srow *srow langue moderne gambros andros stroop polder strem struja glose "marié" "homme" (génitif) "sirop" "terre" Les cas d'épenthèses devant liquide sont tous obligatoires, ainsi que tous diachroniques, comme l'était celui de l'épenthèse en ancien français dans le contexte [n_s]. Tous sont considérés être provoqués par la mise en contact "malheureuse" de deux consonnes, dont l'une au moins est une sonante, dont le groupe est interdit par la langue. Si l'on peut déduire le lieu d'articulation ainsi que le voisement du contexte, le mode articulatoire comme la position même de la consonne "intruse" sont quant à eux épenthétiques. Tournons-nous vers un cas nettement plus obscur, le cas de l'épenthèse en finale après consonne. 2.2.1.3. Epenthèses en finale après consonne : diachronie de l'allemand Nous avons eu l'occasion d'observer en section 2.1. des épenthèses consonantiques en finale de mot : en yucatec ([h]), en atayal, makassar et cupeño ([]), en anglais de Bristol ([l]). L'allemand, qui épenthèse [t] ou [d] en fin de mot en diachronie, faisait également partie de l'inventaire. Cette dernière langue doit pourtant faire l'objet d'une attention particulière. En 60 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités effet, on ne peut imputer à une exigence structurale l'épenthèse qu'elle manifeste, puisque celle-ci a lieu derrière une autre consonne et non derrière une voyelle comme dans le cas des autres langues citées ici. De plus, la mélodie de la consonne épenthésée dépend en partie de son environnement puisque le voisement est dicté par la consonne précédente, alors que dans les autres langues qui épenthèsent une consonne à la finale c'est toujours la même qui s'y trouve, la consonne "par défaut". Le tableau suivant (cf. Paul et al. 1881 : 161, voir aussi Scheer 1996 : 189-190 ; 2002 : 11) propose un récapitulatif du phénomène, qui ne se produit qu'après [n, r, s, , f, (g)] finaux (fin de mots ou de morphèmes), entre le moyen-haut allemand et l'allemand actuel : (66) nrsgf- moyen haut allemand iergen ieman sinvluot wësenlîch anderhalp ackes bâbes habech dornach bredige saf werf nouvel haut allemand irgend jemand sintflut wesentlich anderthalp Axt Papst Habicht Dornacht Predigt Saft Werft glose "quelque" "quelqu'un" "un et demi" "hache" "pape" "autour (subst)" ville "prêche" "jus" "chantier naval" Cette fois l'épenthèse ne se limite pas au contexte post-sonant puisque l'on constate des épenthèses après fricatives ([s], [], [f]) et même après occlusive ([g]). On ne peut arguer du même raisonnement coarticulatoire que lorsque l'épenthèse se situe à l'intérieur de mot, entre deux morphèmes dont la consonne finale du premier donnerait son caractère occlusif et son lieu d'articulation, voire son voisement, et la seconde au mieux le voisement. En revanche, en ce qui concerne la finale de mot, le raisonnement ne tient plus : d'une part, il ne s'agit plus d'épenthèse au sein d'un groupe de consonnes mais uniquement après une consonne ; d'autre part, seule les occlusives coronales sont épenthésées, et ce même après des consonnes d'autres lieux d'articulation : vélaire dans le cas de bredige, labio-dental dans celui de saf ou werf. Les épenthèses de consonnes interconsonantiques, quand elles sont obligatoires et non facultatives, relèvent d'une adjacence interdite par la langue de deux consonnes dont l'une au moins est sonante. Cette adjacence résulte d'un processus diachronique de chute de voyelle, ou de la concaténation de deux morphèmes (grec ancien). La langue réagit par l'insertion 61 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités d'une consonne "tampon", qui vient briser le groupe interdit. Cette explication ne règle cependant pas tous les cas d'insertion de consonne dans un contexte consonantique, puisque l'épenthèse finale en allemand après consonne n'entre pas dans ce cas de figure. La justification par la coarticulation ou la réaction à des groupes de consonnes interdits ne concerne qu'une partie des épenthèses consonantiques, celles précisément présentes entre deux consonnes. Pour la majorité des épenthèses attestées, qui ne se situent pas dans un groupe consonantique, l'explication la plus communément offerte relève de contraintes structurales. 2.2.2. Contraintes structurales Pour Paradis (1988 : 71-91), une stratégie de réparation est une "operation that applies to a phonological unit or structure in order to repair the violation of a structural or segmental phonological constraint of universal or language-particular type. It is context-free, the context being determined by the very constraint which justifies its application." Pour elle, les stratégies de réparation sont ce qui permet d'expliquer bon nombre de phénomènes phonologiques, parmi lesquels l'emprunt. Je vais présenter les différentes contraintes structurales par ordre de taille de la structure impliquée, de la plus grande à la plus petite. Je commencerai donc par la proposition, avant de présenter les contraintes liées au mot, puis terminerai par les contraintes imposées par la structure syllabique, ce dernier volet incluant une présentation de la résolution d'hiatus. 2.2.2.1. Structure de la proposition La proposition est la plus grande unité pour laquelle la littérature mentionne l'insertion d'une épenthèse consonantique. En tunica en effet (Haas 1940, Lombardi 1997, 2003), un [n] est inséré en fin de proposition : la forme régulière du morphème ayant pour signifié "encore" est [hatika], mais en fin de proposition on entendra [hatikan] (cf. section 2.1.3.2). L'anglais (Lombardi 2003) illustre un autre cas d'épenthèse liée à la proposition, cette fois en début ; [] est inséré en début de proposition (ou en réalisation emphatique) : eel se 62 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités prononce [ijl] à l'initiale d'une proposition (ou en réalisation emphatique) mais [ijl] à l'intérieur. Outre la proposition, l'unité intonationnelle peut également être source d'épenthèse. Le selayarese (Lombardi 2003, Mithun & Basri 1986) présente en effet une épenthèse en début d'unité intonationnelle en l'absence de consonne lexicale (cf. section 2.1.2). Ainsi le morphème de démonstratif dans l'exemple ci-dessous comporte-t-il un coup de glotte en début d'unité intonationnelle, mais non à l'intérieur : inni "ceci" aapa inni "qu'est-ce" La proposition et l'unité intonationnelle peuvent déclencher l'apparition d'épenthèses consonantiques si le matériel lexical ne propose pas de consonne, à la frontière gauche ou à la frontière droite selon les langues concernées. Les contraintes liées à la taille d'une unité ne se limitent cependant pas à ce type d'éléments et se retrouvent aux niveaux inférieurs que sont les mots et les syllabes. 2.2.2.2. Structure de l'unité lexicale Certaines études mettent en effet en relation l'épenthèse consonantique et la taille minimale du mot. Dans d'autres cas, cette contrainte structurale, bien que non explicitement donnée, s'avère probable dans l'apparition d'une épenthèse, ou au moins en partie sa cause. 2.2.2.2.1. Finale de mot Broselow (1984) fait état de l'épenthèse consonantique en amharique, langue gabaritique éthiopienne. Comme dans toutes les langues sémitiques, un verbe a besoin de trois consonnes en amharique. L'épenthèse de [t] survient lorsque la mélodie fournie par le lexique est insuffisante pour remplir les positions consonantiques requises par le gabarit, quel que soit l'environnement morphologique : /fj/ "consumer" sera réalisé [fäjjä] au perfectif, avec redoublement de la deuxième consonne, mais avec épenthèse au gérondif et à l'infinitif, respectivement [fäjto] et [mä-fjät] ([mä] est ici un préfixe, il n'entre pas en jeu dans le décompte des consonnes du verbe). Cette langue n'est pas à mettre sur le même plan que les 63 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités autres, dans le sens où ce n'est pas la position finale de mot, mais la position finale de gabarit, qui constitue le contexte déclencheur. En cupeño (Crowhurst 1994, Lombardi 1997), langue amérindienne uro-aztèque parlée aux Etats-Unis, l'épenthèse de coup de glotte est requise en coda pour satisfaire une taille de mot minimale, à savoir une syllabe fermée par une coda, si le matériel lexical n'est pas suffisant : /hu/ est réalisé [hu] "péter" , /kwa/ s'observe en tant que [kwa] "manger". En atayal (Lambert 1999) également, un coup de glotte est épenthésé en fin de mot, en cas de défaillance lexicale. Par exemple, la forme sous-jacente /m- paa/ "porter" est réalisée [mapaa]. Dans ce chapitre consacré aux contraintes structurales liées au mot figurent également les emprunts. Un mot importé d'une langue source n'est pas toujours adapté aux exigences de la langue cible. Aussi doit-il, en vue de son assimilation, se plier à la structure requise par la langue qui l'accueille. Pour reprendre les propos de Broselow (2000 : 1) : "Loanwords normally undergo changes that bring them into conformity with native language phonological patterns." Toutefois, Paradis (1996) met en avant le fait que cette adaptation des segments non conformes ne se fait pas de manière systématique ; elle ne s'observe en effet que dans 85.2% des 12635 séquences mal formées qu'elle a relevées dans des emprunts anglais en québécois français ou des emprunts français en arabe marocain, kinyarwanda et fula ; les séquences sont laissées telles quelles, bien qu'inadaptées, dans 10.7% des cas. Lombardi (1997 : 14) mentionne les emprunts en buginese, qui font appel à l'épenthèse de nasale vélaire "to meet the minimal word requirement" : le mot anglais tea ne sera pas repris par la forme *[te] en buginese mais par [te], ce qui signifie que la langue choisit de faire appel à l'épenthèse de nasale vélaire pour adapter le mot à sa structure (cf. également Mills 1975 : 53). En yucatec (cf. Orie & Bricker 1997, également Straight 1976 : 71, de Lacy 2002a : 189, Lombardi 1997) les mots doivent se terminer par une consonne. Un emprunt se terminant en voyelle se verra adjoindre [h] en finale de mot. Par ailleurs, il est à noter que certaines consonnes sont épenthésées en finale de mot, sans que ce soit pour autant la syllabe ou la proposition qui requière un tel ajout (cf. section 64 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.1.5.1). De telles épenthèses semblent donc également dues à la taille du mot et non de la syllabe. En makassar (Aronoff et al. 1987, Broselow 2000, McCarthy 1998, 2002, McCarthy & Prince 1994) est épenthésé un coup de glotte en finale de mot si le radical se termine par une consonne, ce coup de glotte s'accompagnant d'une épenthèse de voyelle correspondant à la copie de la dernière voyelle radicale. De cette manière, le morphème /jamal/ "vilain" est réalisé [jamala]. Le dialecte anglais parlé à Bristol (Lombardi 1997, 2003, Hugues & Trudgill 1979, Wells 1982, Gick 1999) utilise quant à lui l'épenthèse de [l] en fin de mot à condition que la voyelle précédente soit un []. Le prénom Eva, par exemple, est prononcé de la même manière dans ce dialecte que le substantif evil (cf. section 2.1.3.1). En guajiro (Mansen & Mansen 1984, Alvarez 1995, Vaux 2003), la fricative glottale est insérée à la fin d'un mot quelle que soit sa taille, pourvu que la dernière voyelle soit brève et accentuée : /m'a/ "terre, monde" est réalisé [mah]. Intéressons-nous maintenant à la frontière gauche du mot. 2.2.2.2.2. Début de mot Nous avons vu en section 2.1.5.2.2. huit langues insérant une consonne épenthétique en début de mot lorsque la forme sous-jacente commence par une voyelle : le kisar, l'arabe, le tamil, le koryak, le gokana, l'allemand, le bulgare et le tchèque. Dans chacun de ces cas, la consonne insérée est un coup de glotte (cf. 2.1.2.2). Pour cinq de ces langues, l'insertion de [] est automatique dès lors qu'une initiale de mot est vocalique, de façon à ce que la structure de mot de la langue soit respectée : le kisar (Lombardi 2003, Christensen & Christensen 1992), le koryak (Kenstowicz 1976, Lombardi 2003), le bulgare (Rubach 2000), l'arabe (Lombardi 2003) et le gokana (Hyman 1985, Lombardi 1997, 2003). Le tamil (Christdas 1988, Lombardi 2003) pour sa part a le "choix" entre l'épenthèse du coup de glotte ou la propagation d'un yod, selon la qualité de la voyelle à la droite de la position : s'il s'agit de [i] ou [e], [j] va se propager et occuper l'attaque ; si la voyelle est [o] ou [u], c'est [w] que l'on trouvera à l'initiale ; le coup de glotte est réservé aux cas où la voyelle initiale est [a]. Il n'y a donc épenthèse que par défaut, lorsque la voyelle suivante ne peut pas propager de glide. 65 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Le tchèque (Kucera 1961, Rubach 2000) et l'allemand (Scheer 2000a, Alber 2001, Hall 1992, Wiese 1996) se distinguent des autres langues en ce que le contexte initial n'est pas le seul déclencheur de l'apparition d'une consonne épenthétique. En tchèque en effet, un coup de glotte peut également être inséré, facultativement, à une frontière morphologique en hiatus. Le deuxième contexte d'épenthèse que connaît l'allemand est également en hiatus, mais cette fois c'est le fait que la deuxième voyelle de l'hiatus est accentuée qui est déterminant. Ces deux langues seront examinées plus précisément en section 2.2.3.3. Les deux frontières du mot sont donc susceptibles de constituer un motif suffisant à l'apparition d'une consonne épenthétique, selon que la structure d'une langue donnée requiert de façon obligatoire l'une ou l'autre. Après l'influence des structures de la proposition et du mot sur l'apparition de consonnes épenthétiques, abordons une troisième catégorie d'items propre à favoriser la présence d'une épenthèse : la syllabe. 2.2.2.3. Structure syllabique Comme pour les deux constituants abordés dans les sections précédentes, la syllabe est une structure pouvant exiger la présence d'une consonne à sa frontière droite comme à sa frontière gauche : dans certaines langues, une syllabe doit obligatoirement comporter une attaque, dans d'autres c'est la coda qui n'est pas optionnelle. 2.2.2.3.1. Coda requise En ce qui concerne la coda, j'ai eu l'occasion de souligner en section 2.1.5. que seule la fricative glottale, parmi toutes les consonnes attestées en épenthèse, pouvait occuper cette position en tant qu'épenthèse. Deux langues requièrent une coda pour satisfaire leur structure syllabique : l'ayutla mixtec (Pankratz & Payne 1986 ; cf. également de Lacy 2002a) et le huariapano (Parker 1994, 1998 ; cf. également de Lacy 2002a). Dans la première de ces langues, l'exigence syllabique se double d'un conditionnement lié à la consonne suivante : il faut absolument en ayutla mixtec que la première syllabe d'un mot comporte une coda, mais les codas ne peuvent jamais être occlusives. Si le matériel lexical ne fournit pas de coda, une première solution consiste à dupliquer la consonne initiale 66 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités de la seconde syllabe. Si celle-ci est une occlusive, cette solution est exclue, aussi la langue at-elle recourt à une épenthèse de [h]. En huariapano, il faut distinguer les syllabes accentuées des syllabes non accentuées. Sur la première catégorie pèse une exigence de poids : toutes les syllabes accentuées doivent être lourdes. En conséquence, si une syllabe portant l'accent n'a pas de coda fournie par le matériel lexical, elle insère un [h]. Ces deux langues sont les seuls cas ici recensés d'épenthèse consonantique due à la structure de la syllabe, et dans le deuxième cas cette condition s'assortit d'une contrainte liée à l'accent. Mentionnons le cas de l'espagnol dominicain (Nuñez-Cedeño 1988, Vaux 2003) qui insère un [s] dans l'une des codas du mot, en variation libre : teatro "théâtre" est réalisé [teastro] ou [teatros]. Il est difficile dans ce cas de déterminer si c'est la syllabe qui exige une coda, puisque seule une des syllabes du mot est concernée, ou si la contrainte est liée au mot lui-même. Les épenthèses consonantiques attestées en attaque sont bien plus nombreuses que celles recensées en coda. 2.2.2.3.2. Attaque requise = résolution d'hiatus On a vu en section 2.1. que les épenthèses consonantiques se situent principalement en attaque de syllabe. Il s'agissait cependant d'une constatation empirique et non d'une explication. Dans cette section, ces cas vont être étudiés du point du vue explicatif. Il serait tentant de distinguer ici deux cas : celui où l'exigence d'attaque serait liée à un hiatus et celui où il n'y aurait pas d'hiatus à la source de l'épenthèse. Dans ce dernier cas, deux contextes sont théoriquement possibles : à l'initiale de mot, et derrière une coda. L'initiale de mot a déjà été traitée plus haut. Quant au contexte CVC._V, il n'est pas documenté dans la littérature comme déclencheur d'épenthèses à lui seul : si une consonne est épenthésée après une coda, c'est toujours pour une raison autre que la structure syllabique. J'ai signalé en section 2.1.5. trois cas où une consonne pouvait être épenthésée entre une coda et une consonne : le malais, le 67 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités tigrigna et le maltais. Dans ces trois cas, le contexte déclencheur est d'ordre morphologique et non structural, cf. section 2.2.3. L'obligation d'attaque imposée par la syllabe (et non par le mot ou la proposition) se confond donc avec la résolution d'hiatus. Celle-ci constitue l'explication sans doute la plus courante pour l'apparition d'une consonne ni étymologique ni sous-jacente dans la réalisation d'une séquence. En effet, "vowel clusters (hiatus) are universally dispreferred" (Ortmann 1995 : 7). L'hiatus peut justifier à lui-seul l'apparition d'une épenthèse consonantique, mais il arrive également qu'il soit une condition nécessaire, certes, mais non suffisante pour l'apparition d'une consonne. Je commencerai par rappeler les langues où l'hiatus semble seul servir de déclencheur à l'épenthèse, avant d'aborder les cas où l'hiatus se double de motivations morphologiques ou mélodiques. 2.2.2.3.2.1. Hiatus seul On rencontre des hiatus déclencheurs dans un certain nombre de langues. Pourtant, seuls deux dialectes de la langue amérindienne slave considèrent l'hiatus comme une condition suffisante à l'apparition d'une épenthèse : le hare et le bearlake (Rice 1989, de Lacy 2002a) épenthèsent un [h] dans toute attaque de syllabe non remplie par du matériel mélodique. Dans tous les autres cas d'épenthèse en hiatus, celui-ci constitue une condition nécessaire mais non suffisante. Soit l'hiatus s'assortit d'une condition d'ordre mélodique, soit c'est la morphologie qui intervient. 68 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.2.2.3.2.2. Hiatus condition nécessaire mais pas suffisante 2.2.2.3.2.2.1. Hiatus accompagné d'un conditionnement mélodique En selayarese (Mithun & Basri 1986, Lombardi 2003), l'hiatus s'accompagne d'une condition mélodique. On ne trouve une épenthèse de coup de glotte que si les deux voyelles de l'hiatus sont identiques : [kuurai] "je l'accompagne" mais [riurai] "tu l'accompagnes" (cf. section 2.1.2.2.1). En baka (Kleinhenz 1992, Ortmann 1998 : 72), deux cas d'épenthèses en hiatus sont relevés : l'un correspond à une frontière dérivationnelle et sera donc abordé dans la section suivante. L'autre intéresse cette partie : l'hiatus s'assortit de la condition mélodique d'être constitué de deux voyelles identiques, auquel cas une [l] s'insère en son sein. Ainsi les formes sous-jacentes /m/ "faire" ou /soo/ "sécher" seront-elles réalisées respectivement [ml] et [solo]. L'épenthèse est optionnelle et le contexte déclencheur est constitué par un hiatus de deux voyelles identiques. En anglais enfin (Szigetvári 1994), un [r] est facultativement inséré en hiatus à condition que la première voyelle ne soit pas haute, auquel cas c'est un glide qui apparaît : (67) seeing grandma is propagation d'un glide s[i:j]ing épenthèse d'un [] grandm[a:] is glose "voyant" "mamie est" Dans le premier cas la présence d'une voyelle haute provoque l'apparition d'un glide, dans le deuxième c'est un [r] qui est épenthésé. 2.2.2.3.2.2.2. Hiatus et dissimilation Dans les autres langues répertoriées, l'hiatus est une condition nécessaire à l'apparition d'une épenthèse, mais non suffisante. Dans certains cas, il se doublera d'un contexte dissimilatoire propice à l'insertion d'une coronale. C'est le cas du français sous l'analyse de Plénat et al. (2002), que je développerai dans la section 3 de ce chapitre. Le jeu de langage du fula mentionné en 1.2.1.3.2. fait appel à l'épenthèse de [n] dans le cas où les deux consonnes inversées sont identiques. 69 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (68) fula consonnes différentes consonnes identiques saare daada fula transformé raase daana glose "concession" "mère" Il s'agit donc là encore d'une épenthèse provoquée par deux consonnes identiques, l'une s'effaçant au profit d'une consonne "neutre". Il est dommage que les données ne permettent pas d'établir avec certitude que le [n] est bien totalement indépendant du [d] qu'il remplace. 2.2.2.3.2.2.3. Hiatus et accent En allemand (Alber 2001, Scheer 2000a : 152), outre le coup de glotte obligatoire à l'initiale de mot que j'ai indiqué en section 2.2.2, un coup de glotte est optionnellement inséré en hiatus pourvu que la seconde syllabe soit accentuée : ['kaçs] "chaos" n'est pas en variante libre avec *['kaçs], mais [ka'ooti] "chaotique" l'est avec [ka'ooti]. L'accent seul n'est pas un élément suffisant pour déclencher l'apparition du coup de glotte : si c'était le cas, tous les mots allemands en contiendraient au moins un. 2.2.2.3.2.2.4. Hiatus et conditionnement morphologique Outre ces phénomènes dissimilatoires ou mélodiques peuvent se joindre à l'hiatus des contraintes morphologiques, beaucoup plus fréquentes, qui conditionnent l'apparition d'une épenthèse consonantique. Je ne citerai ici que les cas où le conditionnement morphologique a été formellement identifié comme s'ajoutant à l'hiatus en tant que déclencheur. Les langues concernées par la nécessité de la présence d'un hiatus associé à un conditionnement morphologique seront exposées en détail dans la section suivante (2.2.3), aussi n'en donnerai-je ici que la liste pour mémoire : le knni, l'indonésien, le tchèque, l'odawa, l'ilokano, le gokana, le tigrigna et le japonais. En kçnni, l'hiatus doit se situer à la frontière de mot pour déclencher l'apparition d'une épenthèse de coup de glotte, et pour une épenthèse de [r] il faut un hiatus de deux voyelles longues, l'épenthèse ne concerne qu'un seul suffixe et ne fonctionne qu'avec une classe de noms particulière. Le gokana épenthèse un [r] ou un [n] selon que l'hiatus est constitué de voyelles orales ou nasales, mais dans tous les cas il faut que lesdites voyelles soient longues et 70 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités situées à l'intérieur d'un pied, et l'épenthèse ne fonctionne qu'avec deux suffixes donnés. En odawa, un [t] est épenthésé en hiatus si celui-ci est à la frontière entre un préfixe de personne et un radical nominal, et uniquement avec une classe de nom définie. En japonais, l'hiatus doit se doubler d'une frontière devant désinence verbale. En ilokano, l'épenthèse n'est que facultative et s'observe en hiatus certes, mais pourvu qu'il se situe à une frontière morphologique et devant deux suffixes particuliers. En indonésien, seule une catégorie de frontière morphologique est propre à déclencher l'apparition d'une épenthèse à condition qu'elle se tienne en hiatus. Cette double condition se retrouve en tchèque, pour lequel l'épenthèse n'est d'ailleurs que facultative. S'ajoute enfin le tigrigna dans lequel "[] est défini comme le segment consonantique minimal apte à briser un hiatus vocalique" (Denais 1994 : 55), pourvu qu'il soit associé à une frontière morphologique particulière. L'hiatus est donc conçu comme un déclencheur d'épenthèse largement répandu, même s'il suffit rarement à lui seul à déclencher l'apparition d'une épenthèse consonantique. L'épenthèse est d'ailleurs très souvent décrite comme une stratégie de réparation visant à résoudre des hiatus : pour Lombardi (1997), l'épenthèse est la "optimal resolution of hiatus". 2.2.2.3.2.3. Résolution d'hiatus L'épenthèse n'est pourtant pas la seule entorse possible à la concaténation pure et simple de deux morphèmes. Lors de la concaténation de deux morphèmes en hiatus peuvent en effet se produire au moins cinq cas de figure, certains pouvant se d'ailleurs se combiner, et ce, rien que pour le français. Il se peut tout d'abord qu'il n'y ait simplement aucune modification, comme c'est le cas lors de la concaténation des adjectifs épicènes type aisé ou joli avec le morphème adverbial ment : aisément, joliment. Dans le cas où le dernier son de la base est un i ou un u, il arrive que ces voyelles produisent un glide à la frontière morphologique20 : cri + er > crier [kije], bien que l'on puisse également attribuer ce glide à la base verbale (cf. Boyé 2003). Si l'on considère qu'il 20 Cf. par exemple Piggott & Singh (1985 : 416), pour qui les segments épenthésés sont, dans un contexte intervocalique, "usually" des glides, ou Lombardi (2003 : 9-10), selon laquelle "in languages that resolve hiatus via epenthesis, another common approach is to epenthesize a glide that agrees in features with an adjacent vowel, often a high vowel." 71 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités s'agit bien d'une épenthèse, seule la première voyelle de l'hiatus influence la nature de l'épenthèse ; autrement dit, seule une voyelle haute peut produire un glide. Une autre modification possible est la chute d'un phonème, comme on le trouve en asheninca campa lorsque deux voyelles se trouvent en contact à la préfixation (cf. 1.2.1.3.2.) ; en français, on trouve la chute de la voyelle par exemple dans le cas de la concaténation de Victoria avec le suffixe -ien, le résultat étant la perte du -a final de la base : victorien. La concaténation peut permettre à une consonne sous-jacente d'apparaître en surface, comme dans le cas de la concaténation du morphème -esse [s] à l'adjectif petit [pti] : petitesse [ptits]. Le résultat fait alors ressortir le -t sous-jacent de l'adjectif, qu'on trouve à la liaison (petit ami [ptitami]) comme au féminin (petite [ptit]). Le dernier cas envisagé ici est l'épenthèse, sujet de cette étude : bijou + ier = bijoutier. Les causes phonologiques de l'épenthèse étant ainsi mieux cernées, se profile la question suivante : pourquoi lorsqu'une de ces motivations est rencontrée dans une langue, l'épenthèse consonantique n'est-elle pas pour autant systématique ? Un premier élément de réponse a déjà été apporté en ce qui concerne le traitement des hiatus : les langues disposent d'autres outils que l'épenthèse pour s'adapter à une situation inconfortable. Un deuxième élément de réponse tient à la langue même : un hiatus peut être parfaitement toléré dans une langue mais totalement interdit dans une autre, établissant la motivation de l'épenthèse liée à l'hiatus en termes de paramètre et non de principe. Se greffent également souvent à une cause structurale des raisons morphologiques, que je traiterai plus précisément dans la section suivante. Enfin, des paramètres sociaux tels que la mode ou la popularité d'une variante peuvent justifier du choix de l'épenthèse à un moment donné dans la langue. Ils seront détaillés en section 2.2.5. 2.2.3. Conditionnement morphologique 2.2.3.1. A l'intérieur d'un morphème ? En allemand, le coup de glotte peut être épenthésé à une frontière morphologique comme à l'intérieur d'un morphème pourvu que l'on soit en situation d'hiatus (Alber 2001). 72 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Dans ce cas, est prioritaire la contrainte structurale exigée par la syllabe et non le conditionnement morphologique. Toutefois, il faut que la voyelle suivante soit accentuée. Pour autant, ce n'est pas la position intérieure du morphème qui sert de déclencheur. Dans aucune langue, donc, la position intérieure de morphème ne déclenche d'épenthèse. Aussi, lorsqu'on parle de conditionnement morphologique, entend-on exclusivement la frontière morphologique. 2.2.3.2. Frontière morphologique Les frontières morphologiques semblent déclencher nombre d'épenthèses consonantiques. Si l'on en croit Ortmann (1995 : 7), "C-epenthesis is largely restricted by morphological conditions." Alber (2001 : 1-2) renchérit sur la particularité des frontières : "At the edges of prosodic and morphological categories often phonological processes take place that do not happen elsewhere, or conversely, phonology that happens elsewhere fails to take place (…) but it is not always clear how such edge-effects are brought about." Le caractère particulier des frontières morphologiques est largement reconnu. Ainsi pour une des deux catégories d'épenthèses de [l] attestées en baka (Kleinhenz 1992, également Ortmann 1998 : 72), en-dehors de l'hiatus composé de deux voyelles identiques mentionné dans le paragraphe précédent, l'épenthèse est déclenchée par une frontière dérivationnelle en hiatus, quel que soit le type de frontière. Cependant, les seuls exemples disponibles n'attestent cette assertion qu'en ce qui concerne la frontière entre base et désinence : /si + / "regarder – perfectif" est réalisé [sil]. En persan (Picard 2002, Vaux 2003) on observe une épenthèse de coup de glotte ou de glide homorganique en hiatus, apparemment systématiquement à la frontière morphologique mais quelle que soit cette frontière (cf. section 2.1.2.2.4). En effet, il serait intéressant d'établir maintenant si les différents types de frontières provoquent les mêmes effets, autrement dit de répertorier les épenthèses éventuellement attestées entre deux mots mais également à l'intérieur des mots composés, entre préfixe et radical et entre radical et suffixe. 73 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.2.3.2.1. Entre deux mots Trois langues parmi celles répertoriées ici réservent l'épenthèse à la frontière entre deux mots : le knni, le haut alémanique et le maltais. En kçnni (Cahill 1999, Lombardi 2003 : 32), langue niger-congolaise parlée dans le nord du Ghana, la consonne épenthétique entre deux voyelles à travers une frontière de mot est le coup de glotte, soit toujours aux extrémités d'un mot et non à l'intérieur. La frontière morphologique se double donc d'une exigence d'hiatus, comme on l'a vu dans la section précédente. Le haut alémanique (Heusler 1888, Weinhold 1863 ; cf. également Ortmann 1995) quant à lui insère un [n] entre deux mots pourvu que l'un des deux soit un clitique complément. A la nature de la frontière morphologique s'ajoute une exigence relative à la nature du morphème même : wo [n] er ko isch "quand il est arrivé", größer wie [n] i "plus grand que moi". Ce double conditionnement morphologique s'observe également en maltais (Ortmann 1995 : 3-4), langue dans laquelle un [t] est inséré entre deux mots si les deux conditions suivantes surviennent simultanément : après un numéral et avant une épenthèse de [i]. L'exemple ci-dessous permet de démontrer le lien nécessaire entre l'épenthèse de [i] et celle de [t] : (69) zewg + hbieb sewg + Indjani épenthèse zewgt ihbieb pas d'épenthèse zewg (*t) Indjani glose "deux amis" "deux Indiens" Sur trois langues concernées par l'épenthèse d'un élément entre deux mots on constate d'une part que les consonnes épenthésées dans chaque langue sont différentes, ce qui signifie qu'on ne peut attribuer un son particulier au conditionnement morphologique ; d'autre part que la frontière de mot participe du conditionnement de l'épenthèse mais n'est jamais suffisante : soit il faut la présence impérative d'un hiatus, soit d'une certaine catégorie de morphème. 74 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Tournons-nous maintenant vers les frontières intérieures de mot, à commencer par celle située dans une unité lexicale composée. 2.2.3.2.2. Dans les composés ? Peu de travaux abordent l'épenthèse consonantique dans les composés. Morin (1982 : 36-39) traite du [l] "des composés du type lampe à [l] huile" en français québécois, pour l'exclure en tant qu'épenthèse : "le [l] dans les composés du type lampe à [l] huile est vraisemblablement un article agglutiné qui a été réinterprété comme une consonne de liaison" (Morin 1982 : 41). Wetzels (1987 : 316 note 15) s'intéresse pour sa part aux consonnes de liaison en français, pour lesquelles il établit que "no epenthetic consonants appear at the juncture of elements of compounds". Seul le malais (Carr & Kassin 1999, cf. également Durand 1986a, Zaharani 1998, Teoh 1994), dans l'inventaire des langues établi ici, manifeste une épenthèse à la frontière morphologique d'un composé. On ne peut cependant maintenir l'idée que c'est la frontière du composé qui sert de déclencheur ; en réalité toutes les frontières morphologiques en hiatus se voient affectées d'un coup de glotte épenthétique, comme le rappelle le tableau suivant : (70) /mula + i/ /di + ambel/ /k´rt´/ + /api/ insertion de [mulai] [diambel] [k´rtapi] glose "aveugle" "pris" "locomotive à vapeur" /uda/ [udauda] "lois" morphèmes radical + suffixe préfixe + radical composés réduplication Carr & Kassin (1999 : 9) affirment même que l'insertion de l'occlusive glottale s'applique "regardless of the presence of boundary", tout en reconnaissant que le malais "should, but does not, exhibit GSI [glottal stop epenthesis] stem-internally". Il semblerait donc que la frontière morphologique à l'intérieur d'un terme composé ne constitue pas un critère déclenchant l'apparition d'une épenthèse. 75 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Si la composition se révèle décevante, tournons-nous vers les frontières liées à la dérivation pour déterminer leur importance quant à l'épenthèse consonantique. La première catégorie de frontière liée à la dérivation examinée ici est la frontière entre préfixe et radical. 2.2.3.2.3. Entre préfixe et radical La frontière entre préfixe et radical provoque des comportements particuliers. Par exemple en malais (Cohn 1988, Carr & Kassin 1999), on relève un processus d'assimilation valable entre préfixe et radical, mais pas entre radical et suffixe (ni à l'intérieur d'un composé), comme le tableau suivant le montre : (71) radical suffixe morphèmes + /tanam + kan/ /m´ + baun + kan/ préfixe radical + /m´ + bua/ /m´ + daki/ composé assimilation non assimilation [tanamkan] [mmbaunkan] glose "planter" "développer" [mmbua] "jeter" [mndaki] "escalader" /taman/ + /bua/ [tamanbu] "jardin de fleurs" Cette particularité de la frontière morphologique préfixe + radical (par opposition à la frontière radical + suffixe) se retrouve au niveau du phénomène de l'épenthèse. Dans les données recueillies ici en effet, trois langues sont concernées par l'insertion d'une consonne dans ce contexte. L'indonésien (Carr & Kassin 1999, Pater 2001 : 171-177 et Carr & Kassin 1999 référant à Cohn 1989, Cohn & McCarthy 1994) tout d'abord manifeste un comportement particulier entre un préfixe et un radical en ce qui concerne l'hiatus i_a, en y insérant un coup de glotte, alors qu'elle propagera un glide à partir de la première voyelle dans les autres positions, à savoir intérieur de mot et frontière radical + suffixe. (72) forme sous-jacente épenthèse de glide intérieur de mot entre radical et suffixe entre préfixe et radical /diam/ /hari + an/ /di + ambil/ [dijam] [harijan] épenthèse de [] [diambil] glose "tranquille" "quotidien" "pris" La position est donc déterminante quant à la nature du son qui apparaît, mais c'est l'hiatus qui détermine le fait même qu'il y ait épenthèse. 76 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités L'hiatus joue le même rôle nécessaire en tchèque (Janda & Townsend 2000 : 9-10, Palková 1997 : 325-326). Cette langue procède à une épenthèse facultative de coup de glotte entre préfixe et radical dans le but de distinguer deux homophones de surface, comme l'illustre l'exemple suivant : (73) proudi pas d'épenthèse car intérieur de morphème radical proud + terminaison i [proui] "jaillit" (présent) épenthèse de [] car frontière morphématique préfixe pro + radical ud + terminaison i [proi] "fumera à travers" Dans ce cas cependant, la frontière ne détermine pas la nature du son qui apparaît, elle constitue simplement un motif supplémentaire d'épenthèse. La langue amérindienne odawa (Piggott 1990) manifeste une épenthèse de l'occlusive coronale [t] à la frontière entre préfixe et radical, à la condition que le préfixe soit personnel et que la frontière soit en hiatus. (74) Forme sous-jacente /ki-akat-i/ kitakati Réalisation "tu es timide" Glose /ki-osamikwam-m/ kitosamkwamim "vous faîtes la grasse matinée" /ni-ompass/ nitompass "mon bus La frontière morphologique, là encore, se double d'un autre critère nécessaire pour se voir adjoindre une épenthèse : une certaine catégorie de morphèmes préfixaux. Les autres langues connaissant l'épenthèse consonantique conditionnée par une frontière morphologique n'introduisent de consonne qu'entre radical et suffixe et non entre préfixe et radical. C'est ce qui permet à Carr & Kassin (1999) d'établir le "mot phonologique" comme un radical accompagné de son ou ses éventuel(s) suffixe(s) : ainsi le cas non-marqué pour un processus phonologique est-il selon eux celui qui s'applique à l'intérieur du mot phonologique. 2.2.3.2.4. Entre radical et suffixe ou désinence La position radical + suffixe est, dans certaines langues, particulière elle aussi. 77 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Le tigrigna (Denais 1994 : 52-54), exploite l'épenthèse du coup de glotte à la frontière entre un radical nominal et certaines désinences, tel que le morphème /u/ "possessif 3ème personne", après voyelle : (75) racine à finale consonantique racine à finale vocalique /faras - u/ /aza - u/ [farasu] [azu], [azu], [azau] "son cheval" "sa maison" A nouveau, le contexte créé par la frontière morphologique est nécessaire, mais non suffisant. L'hiatus participe en effet tout autant de l'apparition d'une épenthèse, puisque celleci ne se manifeste pas après une consonne, à frontière morphologique identique. En kçnni (Cahill 1998, 1999, Lombardi 2003 : 32), [r] est inséré entre une voyelle radicale longue [aa], [] ou [çç], et le suffixe du pluriel en ce qui concerne les noms de classe 1. Cette épenthèse s'accompagne d'un abrègement de la voyelle longue précédente. (76) singulier base en voyelle brève à la s- finale ta- base à voyelle longue à la bnt- finale daa- pluriel glose s-a tan-a bnt-ra "poisson" "pierre" "crapaud" da-ra "jour" Le conditionnement est donc quadruple : il faut un hiatus, la frontière morphologique, le suffixe du pluriel et un radical appartenant aux noms de classe 1. L'ilokano (Hayes & Abad 1989 : 351, Rose 1996 : 108 ; également Ortmann 1998 : 71, Rosenthall 1997 : 144, Lombardi 2003 : 13-14) connaît un cas où les glides et le [] surgissent en hiatus et en variation libre : dans les emprunts et dans "certain forms to which an and -en are not normally attached". (77) épenthèse de coup de glotte pajojoen épenthèse de glide pajojowen glose "cause to play with yoyo" La frontière morphologique ne constitue donc ici qu'un des motifs d'apparition de l'épenthèse, avec l'hiatus et la restriction à certains suffixes. 78 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités En gokana (Hyman 1985, Lombardi 1997, 2003), on constate l'apparition d'un [n] entre deux voyelles nasales ou d'un [r] entre deux voyelles orales, pourvu dans les deux cas que les voyelles soient longues, à la frontière morphologique entre un radical verbal et l'une des deux désinences suivantes : logophorique ou deuxième personne du pluriel sujet (cf. sections 2.1.3.1 et 2.1.3.2). Dans ce cas l'épenthèse de sonante n'apparaît que dans un hiatus situé à une frontière suffixale particulière, et sa mélodie est partiellement prédictible par le contexte. Le japonais (McCawley 1968, de Chene 1985 ; également Lombardi 1997, Mester & Itô 1989, Poser 1986) enfin témoigne de l'apparition d'une consonne épenthétique en hiatus, mais uniquement à la frontière entre un radical verbal et une désinence (cf. section 2.1.3.1). 2.2.3.3. Bilan sur les frontières morphologiques La position à la frontière de morphème intérieure de mot est donc marquée, qu'il s'agisse de la frontière après un préfixe ou avant un suffixe. On remarquera cependant qu'aucun des cas relevés ici ne se satisfait de la frontière morphologique comme seul motif à l'apparition d'une épenthèse. 2.2.4. Bilan général du conditionnement interne Le tableau synoptique (78) permet d'embrasser visuellement l'ensemble des conditionnements attestés, qu'ils soient phonologiques ou morphologiques. Il aurait fallu un tableau à plusieurs dimensions pour rendre parfaitement compte du phénomène de l'épenthèse. A défaut, les indications qui relèvent de la phonologie mais non de la structure d'un élément, ou de la morphologie mais non de la frontière, sont indiquées pour chaque langue entre parenthèses. 79 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (78) Tableau récapitulatif des conditionnements internes à l'apparition d'une épenthèse phonologie conditionnement morphologique morphologie int. morph. frontière entre mots frontière de composé [CC] interdits structure de la proposition initiale finale conditionnement phonologique structure du mot initiale finale frontière préfixe + radical frontière radical + suffixe tamil (_V) allemand anglais (moderne, dia) gallois + mélodie (moderne, dia) espagnol (dia) italien( dia) grec (dia) anglais tunica kisar koryak bulgare arabe gokana tchèque allemand anglais (emphase) baka tchèque indonésien (+mél) odawa (+morph) baka ilokano japonais tigrigna axininca campa (+morph) knni (+mél +morph) gokana (+mél +morph) allemand anglais de Bristol selayarese (V1=V2) baka (V1=V2) (_) anglais (V1 non hte) guajiro ('V_) fula (dissimilation première consonne du mot) amharique (gab) cupeño atayal buginese (emp) yucatec (emp) makassar (dout) sans motif phonologique maltais (+morph + _i ép) knni ht alémanique (+morph) + accent sans conditionnement morphologique structure de la syllabe initiale finale huariapano ayutla mixtec (_.Cocc) hare & bearlake malais ? 80 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Dans ce tableau figurent les langues recensées ici en fonction des motivations relatives à l'apparition d'une épenthèse. Certaines, comme l'allemand ou le gokana, interviennent plus d'une fois, du fait qu'elles ont recours à l'épenthèse dans différents cas de figure. Sont indiquées entre parenthèses les motivations liées à la mélodie (identifiée par "mél" ou directement par l'indication du conditionnement mélodique) et à une catégorie morphologique particulière (codée par "morph"), puisqu'elles se combinent avec les frontières morphologiques et les contraintes structurales - elles correspondraient aux troisième et quatrième dimensions nécessaires à ce tableau. La mélodie a cependant pu être distinguée au sein de la catégorie "sans conditionnement morphologique", de même que l'accent, sans pour autant rendre le tableau illisible. L'indication "dia" présente en regard de certaines langues correspondant à des groupes de consonnes interdits indique la dimension diachronique de l'épenthèse dans ces langues par rapport au conditionnement fourni. Rappelons enfin que sont classés en "début de syllabe" + "frontière de mot" et non "début de mot" + "frontière de mot" le knni et le haut alémanique du fait que la frontière de mot se couple d'une exigence d'hiatus et non d'initiale du deuxième mot. Ce tableau met en exergue plusieurs régularités, que je regrouperai sous les deux titres suivants : conditionnement morphologique et conditionnement phonologique. Je présenterai ensuite un résumé des tendances dégagées. 2.2.4.1. Conditionnement morphologique Les cas où le seul conditionnement morphologique favorise l'apparition d'une épenthèse ne sont pas légion : seul le maltais semble concerné dans ce tableau, et il ne s'agit que d'un "effet d'optique" dû à la représentation en deux dimensions. En effet, et comme il l'est indiqué entre parenthèses dans le tableau, les motifs morphologiques constitués par la frontière de mots et la nature du morphème précédent s'assortissent de la présence nécessaire d'un [i] épenthétique en début de deuxième mot, donc d'une contrainte d'ordre mélodique. Parmi les langues répertoriées ici, aucune donc ne se contente du conditionnement morphologique comme déclencheur de l'apparition d'une épenthèse. En ce qui concerne les conditionnements morphologiques, l'intérieur de morphème comme la frontière à l'intérieur d'un composé ne semblent jamais déclencher l'épenthèse, même liés à d'autres facteurs. Dans le meilleur des cas et uniquement pour ce qui concerne 81 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités l'intérieur d'un composé, c'est le fait qu'il y ait une frontière qui joue un rôle (en malais), mais pas ce type de frontière particulièrement. La frontière de mot n'intervient pour sa part que dans deux cas : en knni et en haut alémanique. Pour la première langue, le manque d'illustration ne permet pas de déterminer si un contexte supplémentaire, d'ordre phonologique, intervient dans l'apparition de l'épenthèse, ou si l'hiatus combiné à cette frontière particulière est suffisant à la déclencher. En ce qui concerne le haut alémanique en revanche, la nature de l'un des deux morphèmes en contact est décisive : il faut qu'il y ait un clitique dans le contexte immédiat de la frontière morphologique pour qu'apparaisse une épenthèse. Le conditionnement morphologique apparaît donc ne s'exercer que dans les cas d'hiatus, et il s'avère que ce sont principalement les frontières intérieures de mot liées à la dérivation qui joue un rôle dans l'apparition de l'épenthèse. Peut-être faut-il relativiser cette observation du fait que les études à partir desquelles l'inventaire des langues ici considéré ont précisément davantage porté sur l'intérieur du mot que sur ses frontières extérieures ou sur des unités plus grandes ; cependant, il semble que ce ne soit pas le cas puisque nombre de langues attestent d'une épenthèse conditionnée précisément par des structures plus grandes que la syllabe, mais sans conditionnement morphologique associé. On observe par ailleurs que les groupes de consonnes interdits, type [nr] en ancien français, ne sont jamais combinés à une frontière morphologique qui participerait elle aussi au déclenchement de l'apparition d'une épenthèse. Ils peuvent être mis en contact par la concaténation, mais ce n'est en aucun cas obligatoire puisque, comme nous l'avons vu en section 2.2.1, c'est le plus souvent la chute d'une voyelle qui crée ces groupes. La morphologie n'entretient donc pas de lien nécessaire avec l'épenthèse dans ce cadre. En outre, le conditionnement morphologique constitué par les types de frontières s'assortit souvent d'une contrainte supplémentaire - en-dehors de l'hiatus obligatoire dans presque toutes, liée à la nature d'un des morphèmes mis en contact (haut alémanique, odawa, knni, japonais, tigrigna, maltais) ou à la mélodie de l'un ou des deux éléments de l'hiatus (indonésien, knni, gokana, maltais). 82 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 2.2.4.2. Conditionnement phonologique La structure d'une proposition, d'un mot ou d'une syllabe peuvent constituer à elle seule le motif de l'apparition d'une épenthèse. C'est même, dans le cas de la proposition, exclusivement le cas. L'épenthèse consonantique joue donc le rôle de marqueur de cette unité, en tunica comme en anglais. Les frontières de mots sont parfois assorties de contraintes liées à la mélodie (tamil, anglais de Bristol), ou à la prosodie (réalisation emphatique de l'anglais), mais jamais à la morphologie. En fait, elles suffisent à déclencher l'apparition d'une épenthèse dans la plupart des cas recensés ici. Les exigences liées à la structure de la syllabe ne montrent pas la même indépendance face aux contraintes morphologiques. Comme on l'a constaté dans la section précédente (2.2.5.1), c'est même le seul élément structural apte à se combiner avec ces contraintes morphologiques, pourvu qu'il s'agisse de l'initiale de syllabe et non de la finale. La finale de syllabe ne participe au contexte favorisant l'apparition de l'épenthèse que dans deux des langues répertoriées ici, et ne constitue jamais le contexte suffisant : en huariapano, seule la syllabe lourde réclame une coda, aussi l'accent joue-t-il un rôle dans l'apparition de l'épenthèse ; en ayutla mixtec, c'est l'absence de coda devant une consonne occlusive qui déclenche l'épenthèse de [h]. L'initiale de syllabe constitue le contexte principal de l'apparition d'une épenthèse. Etant donné que l'on a distingué l'initiale de mot et l'initiale de proposition d'une part, l'initiale de syllabe se confond avec l'hiatus vocalique dans tous les cas où la morphologie n'intervient pas. L'hiatus constitue une condition nécessaire et suffisante dans deux cas : dans les dialectes voisins hare et bearlake, et en malais, avec une réserve concernant cette dernière langue du fait que l'on n'a pas d'attestation d'épenthèse en intérieur de morphème. Dans quatre langues, l'hiatus doit s'assortir d'une mélodie particulière : les deux voyelles doivent impérativement être identiques (selayarese, baka), ou la première voyelle non haute (anglais) ; dans le cas du fula, c'est la mélodie de la première consonne du mot qui entre en jeu. En allemand, une épenthèse de coup de glotte ne se déclenche que lorsque l'hiatus est associé à l'accent. Une remarque concernant l'allemand doit être formulée ici. L'allemand manifeste une épenthèse de coup de glotte à l'initiale de mot d'une part, en hiatus dont la 83 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités deuxième syllabe est accentuée d'autre part. Ces deux contextes ont été réunis par Scheer (2000a : 140-155) en tant que constituant un contexte disjonctif puisque produisant "les mêmes effets phonologiques sur des objets qui sont initiaux de mot et placés sous (à proximité de) l'accent", ce qui permet de proposer une explication unifiée de l'apparition d'une épenthèse en allemand (en-dehors des cas d'épenthèse en finale après consonne). Etant donné que c'est la seule langue de cet inventaire à être en mesure de bénéficier de cette explication mais que ce n'est pas la langue pour laquelle je cherche une explication, je ne développerai pas le détail de son analyse ici. Dans les autres langues considérées dans l'inventaire, l'hiatus se combine avec une contrainte relative à une frontière morphologique (knni, baka, tchèque, ilokano, japonais, tigrigna, axininca campa), voire, en plus, à une mélodie particulière (knni, gokana), ou "seulement" à la frontière et à la mélodie (indonésien). 2.2.4.3. Résumé De cette étude des éléments internes déclencheurs de l'épenthèse ressortent deux informations principales : 1. l'hiatus est une condition nécessaire dans 20 cas sur 29 répertoriés ici, mais n'est une condition suffisante que pour un ou deux d'entre eux. 2. les frontières morphologiques ne sont jamais suffisantes pour faire apparaître une épenthèse, et se combinent dans 10 cas sur 11 à l'hiatus. Il s'agira d'observer les épenthèses en français à la lumière de ces tendances qui semblent se dégager de l'examen des langues présentant une épenthèse dans le monde (cf. section 3 et partie III). Pour l'heure, intéressons-nous aux facteurs extra-linguistiques de l'apparition d'une épenthèse consonantique. 2.2.5. Facteurs non linguistiques Parmi les facteurs pouvant favoriser l'apparition d'une épenthèse figurent un certain nombre de raisons extérieures à la structure de la langue, phonologique, syntaxique, sémantique ou morphologique. Il s'agit tout d'abord de l'influence de l'orthographe : dans quelle mesure une consonne sans réalité linguistique mais figurant dans la graphie d'un mot va-t-elle être prononcée ? L'analogie est un second facteur couramment invoqué à l'apparition 84 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités d'une épenthèse, parfois associé à troisième facteur, partiellement lexicologique, qui consiste en la remotivation d'un signifiant, sa réinterprétation pouvant aboutir à l'insertion d'une consonne issue d'un autre paradigme. Enfin, des raisons sociales ou contextuelles peuvent également être envisagées. Commençons par évaluer l'influence possible de l'orthographe sur l'apparition d'une épenthèse. 2.2.5.1. Influence de l'orthographe La question de l'influence de l'orthographe sur les réalisations épenthétiques n'est pas si triviale qu'il y paraît au premier abord. Pour Apothéloz (2002 : 142 note 3), "l'influence de l'écrit sur l'oral est (...) telle que certaines de ces marques peuvent se manifester dans des prononciations recherchées ou hypercorrigées, notamment par le biais de la liaison : [tyazydlas] (tu as eu de la chance), [ilztditbi] (ils entendirent un bruit)." Il met d'ailleurs en parallèle deux systèmes morphologiques distincts pour une langue donnée : "à côté du système morphologique naturel et "premier" de la réalité orale, existe un système morphologique "second", sorte d'artefact engendré par les conventions régissant l'orthographe. En français ce système second a une prégnance particulière dans le domaine de l'orthographe dite grammaticale […]. Dans le domaine de la flexion verbale et nominale, l'orthographe française a un ensemble de marques purement graphiques, qui n'ont pas de correspondant oral. L'omniprésence de l'écrit, de même que la tendance, très forte en francophonie, à naturaliser les conventions orthographiques pour en faire la réalité linguistique première, ne font que renforcer la prégnance de cette morphologie seconde, ce qui contribue au retour à masquer la réalité orale." (Apothéloz 2002 : 141-142) S'il est vrai en effet qu'une langue est d'abord orale avant que d'être écrite d'une part, et que si tous les locuteurs d'une langue la parlent, tous ne l'écrivent pas d'autre part, il n'est donc cependant pas irraisonné de supposer une influence de l'écrit sur la réalisation d'épenthèses consonantiques. La connaissance - ou la supposition - de l'orthographe d'un mot peut inciter un locuteur à réaliser un son qui ne serait au départ qu'écrit pour des raisons indépendantes de la phonétique (rappel de l'étymologie, distinction d'avec un terme homophone, etc.). Pupier & Grou (1974) envisagent d'ailleurs cette hypothèse explicative dans le cas des [t] finaux que l'on entend facultativement en français canadien et qui ne sont pas sous-jacents : [but] / [bu] 85 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités "bout", [patut] / [patu] "partout", [pt] / [po] "pot", etc. Dans ce cas l'hypothèse est rejetée du fait que ces [t] se trouvent également à la finale de termes ne comportant pas de -t dans leur graphie : [ft] "frais", [puit] "pourrie", [isit] "ici", [lt] "laid", etc. Cependant, dans une langue comme le français où d'une part, le statut de l'écrit est très important, et où d'autre part, ledit écrit comporte tant de consonnes non prononcées, la tentation est grande pour le locuteur, face à une incompatibilité structurale ou à un hiatus "dérangeant", de faire appel à ces consonnes, qui de purement graphiques peuvent accéder au statut de son réellement réalisé. Bien entendu, l'influence de l'écrit sur l'oral ne se justifie que dans la mesure où d'autres motivations, phonologiques cette fois, se greffent sur l'écrit : toutes les consonnes graphiques ne sont pas prononcées en français ! L'écrit peut donc, dans une certaine mesure, expliquer l'apparition d'une consonne. Je reviendrai sur le cas particulier du français en section III [10] 2.4.3.3. Une seconde explication non phonologique est aussi fréquemment avancée pour rendre compte de ces épenthèses : l'analogie. 2.2.5.2. Analogie et remotivation L'analogie est prise pour justification de l'épenthèse dans la diachronie du français comme en français actuel ou encore en français québécois. Picard (1989 : 227) s'intéresse à l'évolution du latin SPINULA. Pour résoudre le problème posé par la juxtaposition des consonnes [n] et [l] après la chute du [u], pourquoi ne pas avoir inséré un [t] ? La coronale était la consonne attendue, tant du fait que les deux consonnes du contextes étaient elles-mêmes coronales que parce qu'il s'agit d'une consonne plus fréquente en épenthèse que les vélaires. Pourtant, c'est précisément une vélaire qui a été préférée : épingle et non épintle. La raison en est analogique et non phonologique21 : "on the basis of the likes of angle, sangle, cingle, ongle, etc., especially in light of the apparently general tendency to do away with all such dental + l clusters by various means like metathesis, substitution, dissimilation and reduction". Je reviendrai sur cet exemple précis en section 3.1. pour présenter l'explication classique avancée pour ce terme. Morin (1982 : 28-29 ; 31-36) cite le cas des épenthèses syntaxiques en français québécois (cf. section 3.2.1) de type "ça [l] a pour effet" ou "on [l] allait à l'hôpital" : "si l'on 21 Picard mentionne tout de même que "Bloch & Wartburg have a simpler solution, namely, that "le groupe -nglfait postuler une forme lat. *spingula due probablement à un croisement avec spicula 'piquant'" (1986 : 229)" 86 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités admet que le [l] après ça est une innovation récente, alors il ne peut qu'avoir été construit analogiquement à partir de la liaison après les autres pronoms clitiques sujets." Il en est de même pour les épenthèses après on. Analogie également, toujours selon Morin, dans le cas d'un [z] après ça dans de nombreux parlers de l'est de la France, "où elle a été vraisemblablement construite par analogie sur le modèle du clitique sujet vous, voir Bloch (1917), Aub-Büscher (1962)". Pupier (1971 : 129) fait quant à lui appel à l'analogie pour expliquer les dérivés faisander et caviarder en français, formés respectivement sur faisan et caviar qui ne comportent pas de consonne sous-jacente finale (faisane et non *faisante ou *faisande pour le féminin, caviar avarié et non caviar - t - avarié pour la liaison). Outre l'influence de l'orthographe et l'analogie, des motivations d'ordre social ou contextuel jouent également souvent un rôle dans l'apparition d'une épenthèse. 2.2.5.3. Motivations sociales et contextuelles Toutes les épenthèses consonantiques d'une langue donnée ne sont pas nécessairement réalisées par tous les locuteurs. Entrent en compte, comme dans la plupart des phénomènes phonologiques synchroniques (liaison, élision, etc.), des variables d'ordre social comme la profession, le niveau d'études, l'origine, l'âge, le sexe des locuteurs, ainsi que le contexte de l'énonciation. Morin (1982 : 10) y fait explicitement référence en ce qui concerne l'épenthèse de [l] en français québécois (cf. section 3.2.1), tout en reconnaissant la difficulté de quantifier précisément leur influence : "Nous ne serons pas en mesure […] d'examiner précisément le statut sociolinguistique et la distribution géographique de ces [l]. Il nous apparaît seulement que leur fréquence d'utilisation dépend de la classe sociale (elle est plus grande dans les milieux défavorisés) et peut-être de l'âge et de l'origine géographique des locuteurs (nos données […] proviennent principalement de Montréal). Elle dépend aussi de certains contextes que nous préciserons : si nous avons noté ces [l] après ça comme dans l'exemple (la) ou dans les noms composés comme lampe à [l]huile assez fréquemment chez nos étudiants et nos collègues à l'Université, les formes du type (1b) et (1c) sont régulièrement absentes dans ce milieu ; d'ailleurs certains linguistes professionnels, "locuteurs autochtones avertis" (sic), affirment n'avoir jamais entendu rien de semblable." 87 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Nous étudierons plus en détails ce qu'il en est de l'influence de ces facteurs sociaux quant à l'épenthèse synchronique entre radical et suffixe lors de l'étude des données que j'ai rassemblées au moyen d'un questionnaire (cf. II [7]). 2.2.6. Bilan sur les conditionnements Les facteurs internes à la langue se rassemblent en deux grandes catégories : les motifs d'ordre phonologique, parmi lesquels figure en priorité l'hiatus, et les motifs d'ordre morphologique, notamment les frontières de morphèmes. Nous avons vu que c'est en hiatus qu'apparaissent le plus souvent les épenthèses consonantiques, sans que l'hiatus soit pour autant une condition suffisante ; c'est en effet au niveau de la frontière initiale de syllabe qu'interviennent les conditionnements morphologiques. Outre ces facteurs propres à chaque langue, des motivations indépendantes peuvent contribuer à l'apparition d'une épenthèse, tels que l'influence de l'orthographe, la prégnance de l'analogie et l'impact des environnements sociaux et contextuels. Il est plus difficile d'évaluer précisément leur part dans l'apparition d'une épenthèse, mais on ne peut pas les exclure de l'ensemble des facteurs favorisant l'insertion d'une consonne non sous-jacente, non étymologique et non prédictible par le contexte. L'ensemble de cette section 2 a permis de prendre contact avec les différentes épenthèses possibles dans les langues du monde, tant du point de vue de la nature du son épenthésé que de leur position dans la syllabe ou des raisons invoquées à leur présence. Dans la section suivante, je vais m'intéresser plus particulièrement à l'épenthèse consonantique en français : quelles consonnes sont insérées ? Dans quelles positions ? Pour répondre à quelles raisons ? 3. Les épenthèses en français Le corpus élaboré dans la partie II de cette thèse porte sur les épenthèses en français dans un contexte très particulier : à la frontière dérivationnelle entre radical et suffixe. Ce n'est cependant pas le seul cas d'épenthèse recensé en français. Dans cette section seront répertoriées les données concernant le français d'une façon plus large, ce qui inclut les 88 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités épenthèses observées en diachronie comme celles attestées dans certaines variétés régionales de français. Je distinguerai ici trois sections : les consonnes épenthésées au sein de groupes consonantiques, les épenthèses "syntaxiques" et celles qui apparaissent à une frontière interne de mot. 3.1. Au sein d'un groupe consonantique L'épenthèse présentée ici intervient entre le latin et l'ancien français (Bourciez 1967 : 195 ; 188 ; 162, Fouché 1961 : 822-823), lorsque sont mises en contact certaines consonnes du fait de la chute de la voyelle intermédiaire. J'ai déjà présenté ce cas en section 2.2.1.2 lors du passage en revue des épenthèses de consonnes à l'intérieur de groupes consonantiques, aussi ne donnerai-je ici que quelques illustrations : (79) (a) derrière nasale (b) après liquide (c) après [s] ou [z] contexte déclencheur m_r m_l n_r l_r z_r s_r latin cam(e)ra sim(u)lare cin(e)re mol(e)re co(n)s(ue)re *ess(e)re ancien français chambre sembler cendre moldre cosdre estre La chute de la voyelle post-tonique dans les proparoxytons a mis en contact, entre autres groupes consonantiques, des séquences de deux sonantes dont la deuxième est une liquide, ou de fricatives suivie de la sonante [r]. Selon l'analyse classique, la langue ne tolérant pas de telles combinaisons, elle insère une consonne occlusive dont le lieu d'articulation et le voisement sont dictés par la première consonne du groupe dans lequel elle s'insère. Un premier groupe consonantique brille par son absence de ce phénomène d'épenthèse, alors qu'il s'agit bien de deux consonnes sonantes : [r_l]. Le groupe consonantique s'est maintenu tel quel en français (Fouché 1961 : 800 cite par exemple urler), ou "changer" le [l] en [n] (Bourciez 1971 : 186 ; poster(u)la > poterne) plutôt que d'épenthéser l'occlusive dont le lieu d'articulation et le voisement correspondrait à ceux de la première consonne du groupe : [d]. Ceci semble indiquer que la séquence *[dl] est "davantage encore" prohibée que la séquence [rl], que l'on trouve par exemple dans merle du latin mer(u)lu ou *ur(u)lare > urler. Bourciez (1971 : 153) note que "quand ils sont de constitution 89 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités tardive, le groupes tl et dl, qui n'étaient pas originaires en latin, ont éprouvé en français un effacement de la dentale par assimilation". On ne trouve pas non plus trace du contexte [n_l], partenaire manquant de la combinaison des nasales avec les liquides, les trois autres [m_r], [m_l] et [n_r] étant attestés. Cette absence est encore une fois imputable à l'interdiction du groupe *dl dans la langue. Reprenons le cas du latin spinula présenté dans le cadre de l'analogie (section 2.2.5.2). Après la chute de la voyelle post-tonique [u], les deux consonnes sous intérêt ici se sont retrouvées en contact. Il y a alors bien eu épenthèse, de façon à casser ce groupe interdit ; mais l'épenthèse a été de vélaire et non de dentale : *[tl] est interdit par la langue. Fouché (1961 : 823) établit une étape intermédiaire -ndl-, "le groupe insolite ayant été remplacé par -gl-".On obtient donc épingle et non *épintle. Un troisième cas de figure est absent du phénomène de l'épenthèse : les fricatives suivies de [l] ([z_l], [s_l]). Le cas n'est pas résolu par l'épenthèse mais par la chute en français moderne de la fricative (Fouché 1961 : 744 ; 811) : ins(u)la > île. Bourciez (1971 : 186) indique que le [l] s'est parfois changé en [n] : pess(u)lu > pesle > pêne. Le tableau suivant récapitule ces différents cas de figure : (80) _r _l sonante non cor __ coronale non son __ coronale sonante __ épenthèse de consonne occlusive, épenthèse de consonne occlusive, épenthèse de consonne occlusive, lieu et voisement de la sonante lieu et voisement de la sonante lieu et voisement de la sonante cam(e)ra > chambre *ess(e)re > être cin(e)re > cendre résultat avec épenthèse : *tl ou *dl épenthèse de consonne occlusive, r_l : maintien du groupe lieu et voisement de la sonante chute de la première consonne mer(u)lu > merle sim(u)lare > sembler ins(u)la > île n_l : épenthèse de consonne vélaire spin(u)la > épingle Dans chacun des cas où l'épenthèse consonantique n'est pas observée, on constate que la réalisation attendue aurait été *tl ou *dl, groupes consonantiques interdits par la langue. Pour éviter ces séquences *tl et *dl, le français recourt à d'autres stratégies : la chute du [s] dans les groupes [sl], l'épenthèse d'une vélaire dans [nl], le maintien du groupe [rl]. Ce n'est pas le caractère "sonant" de la première consonne (qui serait à justifier pour [s] et [z]), ni sa coronalité, qui jouent un rôle dans l'interdiction de l'épenthèse, mais c'est le groupe consonantique que l'on obtiendrait – *tl ou *dl – qui justifie un traitement différent par la langue. 90 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Ce cas d'épenthèse interconsonantique en français concerne la diachronie. En revanche, les épenthèses syntaxiques et celles à la frontière morphologique sont actuellement observables en français. Il est à noter que l'on ne rencontre pas d'épenthèse intérieure de morphème en hiatus. 3.2. Epenthèses syntaxiques J'entends ici par épenthèse syntaxique une épenthèse de consonne qui apparaît à la frontière entre deux mots. Je distinguerai les épenthèses en français "régional" des épenthèses en français "standard", les deux appellations étant utilisées davantage en tant qu'étiquettes distinguant deux variétés de français qu'en tant que qualificatifs à comprendre dans leur sens littéral (cf. section II [4] 1 pour une discussion sur le français "standard" et ses variations). 3.2.1. En français "régional" Sont présentés ici les deux cas rassemblés par Morin (1982) en ce qui concerne l'épenthèse de [l] : le français québécois et certains parlers de l'est de la France. En français québécois, un [l] est épenthésé après on et ça, comme on peut en trouver l'illustration dans le tableau suivant : (81) on ça a b c d on [l] avait un téléphone, on [l] avait encore des frères dans ce temps-là, on [l] allait pas à l'hôpital si vous [l] êtes satisfait ça [l] a pour effet, ça [l] arrive souvent Selon son analyse, ce [l] est au moins dans certains cas une consonne de liaison due à l'analogie, dans d'autres "une manifestation d'un [l] agglutiné au verbe suivant" (1982 : 41), donc d'une consonne sous-jacente. Précisons que cette épenthèse se produit toujours en hiatus, et qu'elle est également attestée à l'intérieur de mots composés : une lampe à [l] huile (cf. section 2.2.4.2.2). Cependant, une analyse concurrente concernant ces [l] peut être envisagée. Morin luimême indique en effet qu'il est possible d'attribuer les épenthèses de [l] à des pronoms clitiques dans l'ensemble des cas présentés ci-dessus, ou à un déterminant dans le cas des mots composés. Il envisage également de considérer ce [l] comme "une consonne de liaison ou un segment agglutiné au mot qui suit" (Morin 1982 : 10). 91 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités La validité de ce [l] en tant qu'épenthèse consonantique n'est donc pas certifiée. De plus, j'ai démontré que [l] est la consonne la moins fréquente parmi les consonnes épenthésées dans les langues du monde (cf. section 2.1). Outre le français québécois, Morin (1982 : 29) présente un autre cas de liaison syntaxique après le pronom ça, en [z] ou [l]. Il indique en effet qu'"on note une consonne de liaison z après ça dans de nombreux parlers de l'est de la France […]. Claude Poirier nous signale un l de liaison après ça dans le centre de la France au XIXème siècle (Jaubert, 1864)". Cependant, le manque de données ne permet pas d'évaluer la réalité de cette épenthèse ni d'attribuer la nature de la consonne épenthésée au contexte environnant. En dehors de ces cas, somme toute restreints puisque se produisant uniquement derrière les pronoms sujets ça et on, le français présente de nombreuses attestations d'épenthèses consonantiques à la frontière entre deux mots. 3.2.2. En français "standard" Je présenterai ici les différents cas syntaxiques recensés en y adjoignant les hypothèses de justification d'ordre extralinguistique. J'aborderai l'aspect linguistique de cette épenthèse dans la partie III, au chapitre 10. Deux consonnes sont relevées en épenthèse syntaxique en français, toutes deux des coronales : l'occlusive non-voisée [t] et la fricative voisée [z]. L'épenthèse syntaxique en français est courante, et souvent stigmatisée. On la rencontre ainsi de façon récurrente (a) dans les cas d'inversion du sujet devant clitique à initiale vocalique, l'épenthèse étant d'ailleurs indiquée dans l'orthographe (cf. partie III chapitre [10]). Si les autres contextes syntaxiques d'épenthèse en français ne sont pas normativement autorisés, ils sont néanmoins bien réels : (b) entre verbe et préposition ; (c) entre participe passé et verbe ; (d) entre deux pronoms ; (e) entre pronom et adverbe ; (f) et (g) entre verbe et préposition. 92 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités (82) a b c d e f g y a-t-il partira-t-il les brouillards qui se sont formés-t-au lever du jour (Wetzels 1987 : 285) si tu ne vas pas à Lagardère, Lagardère ira-t-à toi comme le président de la république l'avait laissé-t-entendre (Wetzels 1987 : 285) donne-moi-z-en (au lieu de donne-m'en) elle n'est pas là-z-aujourd'hui Malbrough s'en va-t-en guerre Luc Ferry met [z] en garde (21/05/2003, journal radio) Trois types de motivation peuvent être invoquées pour justifier de ces épenthèses syntaxiques : l'hypercorrection, l'analogie et la métathèse. On distinguera, suivant notamment (McMahon 2002), deux types d'analogie : l'analogie proportionnelle ou "four-part analogy", et l'analogie paradigmatique ou nivellement ("paradigmatic levelling")22. Pour elle, "four-part analogy typically takes a regular pattern and extends it to forms which were previously irregular, paradigmatic levelling regularises the forms of a single morpheme" (2002 : 2) et elle précise en outre que l'"hypercorrection can be seen as a variant of four-part analogy" (2002 : 1). Ainsi en ce qui concerne les cas d'inversion du sujet (a), une analyse possible serait d'identifier un phénomène d'analogie proportionnelle avec les verbes comportant une consonne sous-jacente à la finale : partira-t-il prendrait un [t] en hiatus parce que prend-il se prononce avec un [t], alors que dans leur forme affirmative aucun d'entre eux ne manifeste de consonne à la finale : il partira, il prend [p]. Dans le cas de donne-moi-z-en, l'épenthèse se ferait par analogie, proportionnelle également, avec le modèle de prends-en et la réfection du pronom moi complet. L'analogie serait dans cette optique à l'œuvre également dans le cas de Lagardère (b) : après le verbe un [t] est épenthésé parce que le verbe est à la troisième personne ; il y a toutefois fort à parier que l'analogie se double d'hypercorrection à cet endroit, attendu que ce type de frontière lexicale bloque, en français normatif, la liaison : il rit à mes plaisanteries se réalise avec l'hiatus et non il rit [t] à mes plaisanteries. Ceci semble donc étayer l'association entre hypercorrection et analogie proportionnelle avancée par McMahon (2002 : 1). Les épenthèses du type de celle de (g) font également intervenir à la fois l'analogie par rapport à la forme passée, reprise d'ailleurs plus loin dans le journal radiophonique cité et l'hypercorrection, mais cette fois on se situe dans un cas de nivellement puisqu'il s'agit 22 Cette bipartition se retrouve chez Kiparsky (1982 : 41-43) sous les étiquettes de leveling, "with the result that allomorphs of some morphemes become more similar to each other or merge completely", et de polarisation, "in which existing alternations spread to new instances". 93 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités d'harmoniser les réalisations en ce qui concerne un même morphème, celui du verbe mettre à la troisième personne : Luc Ferry a mis [z] en garde présente une liaison en [z], la même est donc réalisée au présent. Pour les trois cas restants - les brouillards qui se sont formés-t-au lever du jour, le président de la république l'avait laissé-t-entendre, elle n'est pas là-z-aujourd'hui - on remarque que le mot précédent celui suivi de la prétendue épenthèse se termine précisément par la consonne épenthésée, flottante. Il est donc possible que cette "épenthèse" soit en réalité une métathèse, probablement due à de l'hypercorrection. Les épenthèses syntaxiques sont donc possiblement justifiables par des facteurs extralinguistiques, et le fait même qu'il s'agisse toujours de consonnes coronales serait dû sous cette hypothèse soit au contexte de troisième personne du verbe, soit aux consonnes sousjacentes, verbales là encore ou marques de pluriel. Ces épenthèses ne sembleraient donc pas avoir de rapport avec le caractère particulier des coronales. Je proposerai cependant une analyse concurrente en ce qui concerne les cas (82)(a) et (d) dans la troisième partie de la thèse, chapitre 10. Un autre type de frontières déclenche également des épenthèses en français ; il s'agit des frontières morphologiques intérieures de mot. 3.3. Epenthèses à la frontière morphologique interne On peut distinguer quatre types de frontières à l'intérieur du mot : - la frontière entre deux éléments d'un composé, de type hygia#phone ou chemin#de#fer. - la frontière entre préfixe et radical : in#actif, dé#faire. - la frontière entre radical et suffixe23 : joli#ment, journal#isme. - la frontière entre radical et désinence : jou#ait, crie#ra. De ces quatre frontières, seules deux vont faire l'objet d'une section ici. En effet, je n'ai pas trouvé d'attestation d'épenthèse à la frontière entre les deux éléments d'un composé endehors de celle relevée par Morin (1982) en français québécois (cf. section 3.2.1), et pour celle-ci le statut de la consonne en tant qu'épenthèse est loin d'être assuré. Aussi cette frontière peut-elle être considérée comme neutre en regard de l'épenthèse. 23 J'emploie le terme de suffixe pour ce qui est du domaine de la dérivation, et celui de désinence pour ce qui concerne la flexion (cf. section II [4] 3.3 pour une présentation précise de la dérivation par rapport à la flexion). 94 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités D'autre part, la frontière entre radical et désinence n'est pas toujours nettement délimitée, et les éventuelles épenthèses qu'on y trouve (numérotais, blablatera, etc) sont également présentes dans la forme verbale infinitive correspondante (numéroter, blablater). Le statut de cette dernière n'est pas claire (cf. sections II [4] 3 et [3] 2) : s'agit-il d'une forme dérivée ou d'une forme à laquelle est attachée une désinence flexionnelle ? En ce qui concerne la flexion nominale, c'est essentiellement le féminin de l'adjectif (grande, longue) et de certains substantifs (marchande, savante) qui fait apparaître des consonnes ; l'analyse générale du phénomène consiste cependant à considérer que ces consonnes sont présentes dans la forme lexicale de la base mais ne sont pas réalisées au masculin, alors que le morphème du féminin leur apporte une position phonologique leur permettant de se réaliser. Il ne s'agit pas d'épenthèse (cf. par exemple Apothéloz 2002 : 36-38). Les deux sous-sections s'intéresseront donc ici à la frontière entre préfixe et radical et à celle entre radical et suffixe. La revue des épenthèses dans les langues du monde (section 2) a permis de mettre en évidence la prépondérance des épenthèses aux deux frontières dérivationnelles. Le conditionnement créé par la frontière se double d'un impératif de positionnement en hiatus. Retrouve-t-on ce même doublet en français ? 3.3.1. Entre préfixe et radical Un rapide survol des dérivés préfixaux du français pourrait laisser penser que le français connaît des épenthèses consonantiques de consonnes à la frontière entre préfixe et radicaux. Mettons en effet en regard des paires de dérivés comme défaire / déshabituer et tricyclique / trisaïeul. Dans le premier cas, il y a bien apparition d'un [z] dans le deuxième mot, le préfixe étant pourtant le même (même type de base, même signifié), lorsque la frontière se situe en hiatus. Il serait pourtant hâtif de conclure à une épenthèse : si tel était le cas, tout hiatus correspondant à une frontière entre préfixe et radical devrait se voir adjoindre cette consonne épenthétique. Or de nombreux dérivés français comme préavis ou rééditer viennent invalider cette hypothèse. De plus, [z] n'étant ni une consonne épenthétique dans les langues du monde, ni la seule consonne possible en français, il faudrait encore expliquer pourquoi c'est cette consonne qui apparaît dans ce contexte et non [t], nettement plus répandu dans les langues en 95 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités général, et aussi en français, comme on va le voir dans la section 3.3.2. Le [z] appartient donc au préfixe en tant que consonne sous-jacente (cf. Apothéloz 2002 : 36), qui ne se manifeste en surface que devant voyelle initiale de base. Il s'agit d'une propriété lexicale de chaque préfixe : /dez/ comporte la consonne flottante, mais non /re/ ou /pre/. Le cas est identique en ce qui concerne la deuxième paire de mots proposée ici (tricyclique / trisaïeul), bien que l'on puisse trouver en français des dérivés formés à partir de bases à initiale vocalique et de ce même préfixe tri, sans que ce soit l'allomorphe avec [z] qui surgisse en surface : trialcool, triacide, triathlon, triatomique ; trièdre, triennal, triester ; triode, trionyx en forment la liste exhaustive (Nouveau Petit Robert 1993). Deux remarques sont à faire à ce propos : certains de ces mots sont posés par le Robert comme facultativement réalisables avec un [j] à la frontière (trionyx, trièdre, triathlon), d'autres avec [j] "obligatoire" (triode, triennal), d'autres enfin avec [j] "interdit" (triester, triacide, trialcool, triatomique), ce qui indique que la frontière ne "réclame" pas nécessairement le remplissage par une consonne épenthétique d'une part, ni que celle-ci soit systématiquement la même le cas échéant. On ne peut pas non plus conclure, à partir du corpus de termes en tri- sans épenthèse, à une distribution régulière de l'apparition de jod. D'autre part, il s'agit dans tous les cas de mots savants, ce qui signifie que la formation a été possiblement réfléchie et non spontanée, entraînant un choix délibéré de la forme sans [z]. Aussi semble-t-il qu'il faille reconnaître à la lacune distributionnelle de l'allomorphie entre triet tri[z]- des raisons purement extérieures à la langue et non le fait d'une épenthèse pour laquelle il faudrait supposer un conditionnement idiosyncratique, un marquage au cas par cas dans le lexique. Cette absence d'épenthèse entre préfixe et radical disqualifie ce type de frontière comme élément déclencheur en français. Il reste à examiner maintenant l'épenthèse à la frontière entre radical et suffixe ; la section suivante en propose une présentation générale. 3.3.2. Entre radical et suffixe L'insertion d'une consonne dans la réalisation d'un dérivé entre le radical et le suffixe, tout comme pour les consonnes apparaissant à la frontière entre préfixe et radical, est susceptible de recevoir une explication en termes d'allomorphie suffixale, de suffixes distincts ou de réalisation de la consonne sous-jacente de la base. 96 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Plénat (1999) pose ce problème de la distinction entre une consonne, devant un suffixe, qui relèverait d'une épenthèse, de celle appartenant à un suffixe à initiale consonantique. C'est le cas par exemple des suffixes -ingue (sourdingue sur sourd, follingue sur fol, rapidingue sur rapide, etc.), -if (largif sur large, furaxif sur furax, orthodoxif sur orthodoxe, etc.) ou -oche (valoche sur valise, Césaroche sur César, baloche sur ballotine, etc.), que l'on peut mettre en relation respectivement avec -dingue (loufdingue pour louf, buffedingue pour buffet, foldingue pour fol, etc.), -tingue (louftingue pour louf, mouftingue pour mouflet, mochetingue pour moche, etc.), -zingue (chiottesingues sur chiottes, papezingue pour papier, cabzingues pour cabinets, etc.), -lingue (burlingue) ; -sif (booksif sur book, paxif sur paquet, pecsif sur pécore, etc.), -pif (beaujolpif sur beaujolais), -sif (pognzif sur pognon, trognezif sur trognon, beignzif sur baigneur, etc.), -gif (dargif sur darrière, vergif sur verni) ; toche (fastoche, vachetoche, mastoche, etc.), -boche (Alboche pour Allemand, dégueulboche pour dégueulasse, Italboche pour Italien, etc.), -doche (valdoche), -loche (amerloche pour américain, burloche pour bureau, dirloche pour directeur, etc.). Comment être sûr qu'il s'agit bien de variantes d'un même suffixe et non d'autant de suffixes ? Pour Plénat (1999 : 102), "si ce sont vraiment des variantes, la question se pose aussi de déterminer le conditionnement de leurs formes et de leur répartition. Ces questions sont malaisées, dans la mesure surtout où les données font en général cruellement défaut". Deux contextes sont envisagés ici, selon que le radical se termine par une consonne ou par une voyelle. Trouve-t-on des épenthèses consonantiques dans les deux cas ? 3.3.2.1. Après consonne : Plénat (1997, 1999) La logique veut que l'on envisage les deux options théoriquement possibles après consonne : devant consonne et devant voyelle. La littérature ne répertorie pas d'épenthèse consonantique à la frontière suffixale au sein d'un groupe de consonnes, aussi doit-on se tourner dès à présent vers le deuxième contexte : C_V. 3.3.2.1.1. Présentation des données Plénat (1997) s'est intéressé aux dérivés en -Vche (où V indique un ensemble de voyelles possibles : -oche, -uche, etc), tandis que Plénat (1999) a mis en évidence la 97 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités distribution des allomorphes de suffixes -ingue et -if. Ces suffixes se voient précédés d'une consonne potentiellement épenthétique, après la dernière consonne du radical (maintenue). Les trois suffixes étudiés appartiennent à la catégorie des suffixes évaluatifs et se concatènent à des bases nominales, adjectivales ou verbales, voire adverbiale, soit par simple concaténation, soit par troncation de la rime finale, mais sans changer la catégorie ni la capacité référentielle de la base. (83) -(C)ingue -(C)if -(C)Vche concaténation simple troncation de la rime de la base concaténation simple troncation de la rime de la base concaténation simple troncation de la rime de la base base verbale base nominale base adjectivale base adverbiale roul(er) > automobile > sourd > sourdingue roulingu(er) automobilingue pardessus > dégourdi > rapidement > pardingue dégourdingue rapidingue fort > fortif cartable > cartif bav(er) bavoch(er) > César > césaroche valise > valoche chiatoire > chiatif fort > fortiche métallique métalloche > dorénavant > dorénavuche Les cases restées vides ne le seraient que par manque d'illustration et non par impossibilité logique. Par ailleurs, les dérivés à l'aide de suffixes évaluatifs sur des bases verbales ou adverbiales sont tout de même minoritaires : ce sont essentiellement les noms et les adjectifs qui se voient concaténer ce type de suffixes. Enfin, le mode de concaténation favori est la substitution à la rime de la base plutôt que la concaténation simple. Ces suffixes sont attestés également avec différentes consonnes à l'initiale : - en ce qui concerne le suffixe -ingue sont attestées les finales complexes -dingue, -tingue, lingue et -zingue ; - le suffixe -if apparaît avec les finales complexes -zif, -sif, -gif, -chif, -bif et -pif. - pour le suffixe -(V)che, on trouve notamment les finales complexes en -t(V)che, -d(V)che, l(V)che, -m(V)che24. Ces finales complexes, comme les finales simples, apparaissent dans le cas de la concaténation simple comme dans celui de la troncation de la base ; on peut en voir l'illustration dans le tableau suivant : 24 Etant donné que le suffixe -Vche comporte de plus une alternance vocalique pouvant compliquer la présentation, j'exposerai plus particulièrement ici le cas des suffixes -ingue et -if ; les données concernant le suffixe -Vche ne sont pas exhaustives mais revêtent simplement une valeur illustrative. 98 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités suffixe suffixe -[t] _ -[d]_ rif > louf > concaténariftingue loufding tion simple ue mouflet buffet > troncation > mouf- buffedin rime base tingue gue concaténa/ / tion simple / / troncation rime base -(C)Vche -(C)if -(C)ingue (84) vache > concaténavachetion simple toche facile > valise > troncation fastoche valdoche rime base suffixe -[s] _ / / suffixe -[z] _ chiottes > chiottezingues tacot > taczingue suffixe -[] _ / suffixe -[] _ / suffixe -[b] _ / suffixe -[p]_ / suffixe -[l] _ / / / / bureau > burlingue noir > noircif paquet > pognon > plumard darrière paxif pognzif > plume > dargif chif / / / / / / / / / beaujolais > beaujolpif dégueulasse > dégueul pif / / Allemand > Alboche / américain > amerluche Les barres obliques indiquent que la consonne posée en en-tête de colonne n'est pas attestée avec le suffixe considéré. L'absence d'exemple ou de barre oblique renvoie à un simple manque d'illustration mais non à une impossibilité de fait ; en effet, la concaténation sans substitution de suffixe étant la variante marquée de ces dérivations, certaines cases ne sont pas remplies en regard de la concaténation simple. La présence d'une finale simple (-ingue, -if, -Vche) ou d'une finale complexe (-Cingue, -Cif, CVche, dans lesquelles C renvoie à une consonne de l'inventaire possible pour chaque suffixe), ainsi que dans une certaine mesure le choix de la troncation (fastoche) plutôt que de la concaténation simple (vachetoche), sont prédictibles à partir de la nature des consonnes finales ou internes de base. Ainsi le morphème -ingue apparaît sous la forme simple si la dernière consonne ou la consonne interne de la base est une coronale voisée orale (sourdingue sur sourd, lazingue sur lasagne, follingue sur fol), mais sous une forme à initiale consonantique si aucune consonne interne ou finale de la base n'appartient à cette classe25 (buffedingue sur buffet, burlingue sur bureau). Le morphème -if est présent sans consonne 25 Cette règle semble néanmoins associée à une contrainte selon laquelle "la coronale qui précède -ingue doit en fait être la tête de l'attaque de la syllabe finale du dérivé" (Plénat 1999 : 111). Aussi dans une base comme mornifle, bien qu'il y ait présence d'une coronale orale voisée ([l]), le dérivé n'est pas morniflingue mais morningue, et ce bien que [n] ne fasse pas partie de cet ensemble des coronales orales voisées. De même, la base mouflet ne donnera que facultativement mouflingue ; on trouvera également mouftingue. Une autre explication (Plénat 1999 : 112) tient au fait que le suffixe soit attaché à un groupe consonantique (syllabé en "coda-attaque" ou en "attaque branchante"), et ce même si la consonne finale ne fait pas partie de l'inventaire des consonnes attestées devant -ingue (alpague > alpingue, poitrinaire > poitringue). 99 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités ajoutée à son initiale si l'une des consonnes de la base autre que l'initiale appartient à l'ensemble {/t/, /s/, /z/, //, //} (cartif sur cartable, torchif sur torchon). Le tableau ci-dessous exemplifie les finales de bases attestées devant les terminaisons simples (hors finales en groupes consonantiques, nécessairement suivies de la variante simple) : (85) base en -[t] -ingue smart > smartif -if base en -[d] base en -[s] sourd > / sourdingue / pensionnaire > pensif base en -[z] base en -[] base en -[] suffixe -[l] lasagne > / / fol > lazingue follingue rasoir > torchon > dragée > / rasif torchif dragif Le tableau suivant propose une schématisation de la distribution entre les deux grandes catégories d'allomorphes : avec et sans consonne initiale. (86) -(C)ingue -(C)if allomorphe à initiale vocalique allomorphe à initiale consonantique finale ou consonne interne de la base = finale ou consonne interne de la base = autres coronale voisée orale hors /r/ consonnes ou groupe de deux consonnes finale ou consonne interne de la base = finale ou consonne interne de la base = autres coronale orale hors {/d/, /l/} consonnes Il s'agit là d'une répartition schématique, qui masque les irrégularités observées. Ainsi en ce qui concerne le suffixe -ingue par exemple, si la situation est relativement claire pour les occlusives et les fricatives, elle l'est moins pour les sonantes. Commençons par les obstruantes : coronales voisées orales, elles sont suivies de l'allomorphe simple, mais de l'allomorphe à initiale consonantique après toute autre consonne. Or Plénat (1999 : 112 note 12) cite les exceptions suivantes : laubingue sur laubé "beau" et popingue sur Popincourt d'une part, prouvant que d'autres consonnes occlusives peuvent être suivies de l'allomorphe simple ; batingues sur Batignolles et crassingue sur crasseux d'autre part, indiquant que les coronales non voisées sont également attestées avec la variante simple. Les sonantes, quant à elles, sont largement irrégulières. En effet, des trois sonantes coronales du français (/n/, /l/ et /r/), seule /r/ est obligatoirement suivie de l'allomorphe à initiale consonantique26 (bureau > burlingue, tiroir > tirlingue). /l/ est parfois suivi de l'allomorphe simple (follingue sur folle, seulingue sur seul), mais il est également attesté avec la finale à initiale consonantique (foldingue sur fol, valdingue sur valise) et les deux 26 Sur les six dérivés de l'inventaire proposé par Plénat (1999 : 114), trois (burelingue, carelingue, politburlingue) sont formés à partir de bases en -[o]. Peut-on y voir 1. une trace de l'étymologie des bases (bureau < burel, carreau < quarrel) ou 2. une émanation du [o] ? 100 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités attestations comportant /n/ à la finale (hors groupe consonantique) de la base se répartissent équitablement entre l'allomorphe simple (ciningue sur cinéma) et l'allomorphe à initiale consonantique (fouinzingue sur fouinard). Admettons néanmoins cette répartition schématique, indicatrice des grandes tendances, de façon à suivre l'argument. Outre la présence même d'une consonne en initiale de suffixe, la nature de cette consonne est prédictible en fonction du contexte, plus précisément en fonction de la dernière consonne du radical (base entière ou tronquée) à laquelle elle s'adjoint : "la consonne initiale d'une finale complexe est une occlusive quand la consonne qui la précède est une fricative, et vice versa, /r/ sélectionne /l/ avec -ingue et une fricative avec -if, /l/ paraît sélectionner /d/ avec -ingue et /b/ ou /p/ avec -if." (Plénat 1999 : 122-123 ; 104-107 pour le détail concernant le suffixe -Vche, 113-114 pour -ingue, 119-120 pour -if). Tournons-nous maintenant vers le commentaire de ces données : la finale simple et celle à initiale consonantique sont-elles allomorphiques ou faut-il supposer l'insertion d'une consonne épenthétique dans le cas de la finale complexe ? 3.3.2.1.2. Analyse des données Bien que la distribution des deux formes du suffixe soit prédictible à partir de la base, ou plus précisément de la nature de la consonne de la base à laquelle le suffixe se concatène, Plénat (1999 : 123) rejette l'hypothèse de la distribution complémentaire de deux allomorphes, l'un à initiale vocalique, l'autre à initiale consonantique, pour la raison suivante : c'est toujours la même consonne qui apparaît devant le suffixe, qu'elle soit directement une de celle de la base ou qu'elle provienne du suffixe27 ; de ce fait, "le principe qui préside aux choix de la consonne qui sera amenée à précéder les finales -ingue et -if est le même dans les finales simples et dans les finales complexes. (…) Si, en effet, le répertoire des suffixes comportait les variantes complexes à côté des variantes simples, il faudrait que la constitution des premières obéisse à une règle de structure morphématique, tandis que la répartition des variantes simples obéirait à une règle régissant la sélection du radical dans la lexie de base. 27 Il ne convainc pas complètement Apothéloz (2002 : 94) puisque celui-ci, bien que citant Plénat (1999), considère qu'"on peut voir dans ces ajouts soit des épenthèses soit un fait de variation allomorphique sur le suffixe". Toutefois, Apothéloz ne propose aucun argument en faveur de l'une ou de l'autre explication. 101 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Les deux mécanismes seraient différents, et ce serait un hasard qu'ils sélectionnent les mêmes consonnes". Cependant, et comme Plénat le note lui-même, on constate des exceptions à cette règle qui veut que l'on trouve les mêmes consonnes devant la voyelle initiale de suffixe, qu'elles soient finales de base ou initiales de suffixe. A commencer par les bases à finale complexe, qui préfèreront concaténer le suffixe à une autre consonne du radical n'appartenant pas à l'ensemble autorisé plutôt que derrière le groupe consonantique (cf. note 19 ; Plénat 1999 : 112) : le dérivé de mornifle n'est pas morniflingue mais morningue, alors que le [n] ne fait pas partie de l'inventaire des consonnes autorisées ; alpague donnera alpingue, bien que [p] ne soit même pas coronale. La distribution est encore moins nette en ce qui concerne le suffixe -if : "l'ensemble des consonnes licites devant la finale simple -if ne coïncide pas exactement avec celui des consonnes initiales des finales complexes en -C+if" (1999 : 122). Il faut cette fois envisager la régularité par la négative : les coronales orales qui sont interdites devant la finale simple -if sont les mêmes que les coronales orales qui ne peuvent être initiales de la finale complexe C+if (cf. Plénat 1999 : 122). Si l'identité n'est pas complète entre les consonnes possibles devant la finale simple des suffixes et celles présentes à l'initiale de la finale complexe, alors l'argument contre la distribution complémentaire d'allomorphes perd de sa vigueur, sans pour autant être rejeté. Un deuxième problème est soulevé par l'analyse de la première consonne de finale complexe en tant que consonne épenthétique. En effet, supposer la consonne épenthétique, dans les cas exposés ci-dessus, devant le suffixe, revient à supposer soit l'insertion d'une position consonantique vide (puisque le contenu mélodique est prédictible par le contexte) après consonne, soit la présence d'une position consonantique vide à l'initiale du suffixe. L'insertion d'une position consonantique après une consonne pouvant être syllabée en attaque de la syllabe suivante semble difficile à soutenir : universellement, les syllabes sont préférentiellement de la forme CV, l'attaque étant remplie en priorité sur la coda de la syllabe précédente (sauf en cas de liaison sans enchaînement, cf. Encrevé 1988a). La mélodie seule peut-elle être considérée comme suffisante pour déclencher une épenthèse de position ? Il semble qu'il s'agisse alors d'un cas unique dans les langues du monde, dans lesquelles la mélodie n'est jamais un motif suffisant à l'épenthèse ; elle s'adjoint à un hiatus, associé éventuellement à une frontière morphologique. Il y a effectivement ici frontière 102 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités morphologique, mais elle ne peut jouer de rôle dans l'apparition de la position puisque la même frontière dans certains cas est suivie de l'allomorphe à initiale vocalique. Par ailleurs, il n'y a pas d'hiatus disponible, donc pas de contrainte liée à la structure de la syllabe (cf. section 2.2). Aussi semble-t-il qu'il faille rejeter l'hypothèse d'une insertion de position consonantique avant le suffixe. Si la position est présente à l'initiale du suffixe, mais non reliée à du matériel mélodique, cela explique que l'épenthèse puisse se produire après consonne : la mélodie générée par le contexte vient s'adjoindre à une position déjà existante mais vide (cf. section 3.3.2.1.1), comme l'illustre la représentation de burlingue ci-dessous : A N C As Ns Cs | | | | | | b y r l × Par ailleurs se pose la question de la chute de la voyelle [o] de bureau. Pourquoi la voyelle devrait-elle impérativement chuter alors que le suffixe fournit une position consonantique pouvant "résoudre l'hiatus" à la frontière morphologique ? A quoi serait due la nécessité du contact des deux consonnes ? Elle ne peut venir d'une contrainte portant sur la structure de la syllabe, attendu qu'une syllabe avec coda correspond à une situation marquée par rapport à une syllabe sans coda. Intéressons-nous enfin à la mélodie. Qu'est-ce qui est exactement épenthésé si la position consonantique est présente à l'initiale du suffixe ? Pour le suffixe -ingue, toutes les consonnes possibles à l'initiale du suffixe sont des coronales orales, ce qui correspond à une des catégories de consonnes épenthétiques observées dans les langues du monde (cf. section 2.1). Le voisement n'est pas propre à toutes les épenthèses possibles, aussi sera-t-il difficile de prédire sa provenance : s'il arrivait par l'épenthèse ou était présent dans le lexique, attaché à la position consonantique "vide", on ne trouverait pas d'allomorphe à initiale sourde ; or -tingue est une des terminaisons possibles. On ne peut pas davantage considérer qu'il est donné par la consonne finale de la base, ni qu'il est produit par dissimilation, puisque l'on trouve des consonnes sourdes aussi bien que sonores devant les terminaisons à initiale consonantique. En 103 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités ce qui concerne le suffixe -if, les consonnes présentes à son initiale ne sont pas nécessairement des coronales puisque l'on trouve également les labiales [p] et [b] ; faut-il alors considérer qu'une labiale peut être épenthésée ex nihilo, alors qu'il semble qu'aucun cas n'est relevé dans les langues du monde ? Considérons un instant l'hypothèse de la troncation. Le suffixe serait présent dans le lexique sous sa forme longue, par exemple -Cingue dans laquelle C serait spécifiée coronale voisée orale (mettons de côté le cas de -tingue pour suivre l'argument). Dans ce cas, il y aurait troncation de la consonne initiale de suffixe (ou assimilation au mode d'articulation de la consonne finale de base puis troncation de celle-ci) lorsqu'elle est en contact avec la même consonne finale de base : pard(essus) + -C[coronale voisée orale]ingue met en contact deux consonnes coronales voisées, l'une des deux disparaît28. Cependant, cela indiquerait un certain "masochisme" de la part du suffixe, qui tantôt sélectionne les bases qui vont lui permettre de ne pas réaliser sa consonne initiale, tantôt se concatène à des bases consonantiques qui lui permettent de la réaliser et définit son mode articulatoire par dissimilation avec celui de ces bases. Pourquoi deux mécanismes différents ? Pourquoi ne pas procéder par dissimilation après une consonne coronale voisée orale ? Tâchons à présent d'établir le bilan de l'analyse. 3.3.2.1.3. Bilan Il semble que l'hypothèse d'une épenthèse ne soit pas pleinement satisfaisante. En effet, l'apparition d'une épenthèse consonantique est mise à mal par le manque de prédictibilité fiable de ses occurrences d'une part, étant donné qu'après une même consonne finale de base peut ou non avoir lieu une épenthèse, et la difficulté d'attribuer l'insertion de la position consonantique à la mélodie d'autre part. Si la position squelettale est donnée par le suffixe, alors se pose la question de la troncation de la base après consonne : pourquoi celle-ci doit-elle impérativement se terminer par une consonne ? 28 On peut également supposer qu'il n'y a pas troncation mais consonne géminée (Ségéral & Scheer 1999b) en forme sous-jacente, qui se réalise simple en surface. La discussion à ce sujet n'est pas pertinente pour la démonstration ici. 104 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités Si l'on rejette l'hypothèse d'une épenthèse, étudions alors l'éventualité d'une distribution complémentaire entre un allomorphe à initiale vocalique et un allomorphe dont l'initiale comporte une position consonantique (syllabée en attaque) vide, ou contenant la spécification du lieu d'articulation coronal, ainsi que les indications de voisement et d'oralité. La répartition entre les deux s'établit en fonction de la consonne du radical à laquelle ils se concatènent. Autant l'épenthèse ne peut pas être dictée par la seule mélodie, autant ce seul paramètre peut déterminer le choix de l'un ou l'autre des allomorphes. Ainsi pour le suffixe -ingue, c'est la variante à initiale consonantique qui est choisie après une consonne coronale voisée orale, et la variante à initiale consonantique après toute autre consonne. La détermination de la nature mélodique de la consonne qui apparaît en surface dépend crucialement de la consonne à laquelle elle est directement concaténée, et s'établit par dissimilation : fricative après une occlusive, occlusive après une fricative, /l/ après l'autre liquide du français /r/. Dans le cas de ce suffixe, l'inventaire des consonnes attestées devant l'allomorphe à initiale vocalique est le même que celui des consonnes observées dans la variante complexe, à une exception près : [t] est possible dans l'allomorphe à initiale consonantique, mais [t] ne se manifeste jamais en fin de radical devant l'allomorphe à initiale vocalique. Puisque d'une part il s'agit d'allomorphes ; puisque d'autre part le contexte permet de prédire à la fois le fait qu'ils comportent une consonne initiale et la nature de cette consonne, alors il ne s'agit pas d'épenthèses ex nihilo. Certes la consonne n'est pas étymologique, certes il est difficile de concevoir qu'elle est sous-jacente étant donné la multiplicité des consonnes possibles. Elle constitue cependant une émanation directe du contexte en ce qui concerne sa nature (par dissimilation), et la présence même de l'allomorphe à position initiale consonantique dépend de la mélodie. Les données et l'analyse proposées par Plénat ont permis d'évaluer la possibilité d'épenthèse consonantique derrière une consonne à la frontière morphologique qui nous intéresse. On peut douter qu'il s'agisse d'une épenthèse, étant donné que l'on ne peut exclure la possibilité qu'il s'agisse en réalité d'allomorphes distincts, l'un à initiale vocalique, l'autre présentant une position consonantique à l'initiale, dont le remplissage mélodique serait assuré par le contexte. Il y a donc bien épenthèse, mais non ex nihilo. Parce que les épenthèses 105 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités présentées ici ne sont pas ex nihilo, ces données ne rentrent pas dans le cadre empirique que je me suis donné. L'analyse du corpus établi dans la partie II aux chapitres 5 et 6 permettra de conclure quant à la présence d'une épenthèse dans un environnement partiellement consonantique : peut-on considérer par exemple qu'un terme comme médiumnique (médium + ique) constitue un cas d'épenthèse consonantique ? Je viens d'exposer les cas possibles d'épenthèse après consonne en français. Cependant, la section 2 a montré que dans les langues considérées, c'est après une voyelle, et plus précisément en hiatus, que l'on atteste la plupart des épenthèses consonantiques. Je vais montrer dans la partie suivante que le français comporte également des épenthèses dans ce contexte précis, bien qu'il ne s'agisse aucunement d'une condition nécessaire. Dans la troisième partie de cette thèse en effet, je démontrerai que l'hiatus n'est pas la condition déterminante de l'épenthèse consonantique. 3.3.2.2. Après voyelle L'épenthèse à la frontière suffixale après voyelle concerne potentiellement deux cas de figure : l'hiatus vocalique, ou la position devant consonne (V_C). Cependant, ces cas ne sont bien souvent pas distingués, pour les raisons invoquées dans le paragraphe 3.3.2.2.2. Dans les deux sections suivantes, je précise simplement quels cas sont concernés, puisque les données seront évaluées et analysées dans la troisième partie de la thèse. 106 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 3.3.2.2.1. En hiatus Il s'agit de cas de type absolutiste (absolu + iste) ou noyautage (noyau + age), c'est-àdire dans lesquels une base à finale vocalique est concaténée à un suffixe à initiale vocalique. Les ouvrages sur la dérivation suffixale en français (Gruaz 1988, Corbin 1987, Dubois & Dubois-Charlier 1999, Apothéloz 2002 par exemple) en font état, sans dégager de généralité à leur sujet29. Je montrerai en partie III qu'il ne s'agit que d'un des contextes possibles d'une épenthèses consonantiques, et non du contexte déclencheur. 3.3.2.2.2. Devant consonne Etant donné que ce contexte correspond souvent, graphiquement parlant, à la frontière gauche d'un -e (-erie, -ement), l'épenthèse n'est pas distinguée des cas en hiatus dans les manuels de lexicologie. Entrent également dans cette catégorie les dérivés formés à partir de suffixes à initiale en glide, type cacaotier (cacao + ier). L'analyse proposée dans la partie III montrera qu'il s'agit effectivement d'un phénomène unique, mais non pour de simples raisons graphiques. 3.4. Bilan sur le français En français, les deux endroits où l'épenthèse consonantique est susceptible de se produire sont la frontière entre deux mots et la frontière suffixale. Entre deux mots, la présence d'un hiatus est une condition déterminante, alors qu'il ne semble pas que ce soit le cas à la frontière suffixale : une consonne peut être présente en début de suffixe comme en fin de base. Cette dernière affirmation sera réévaluée à la lumière du corpus et du questionnaire élaborés en partie II et analysés en partie III [11]. 29 Apothéloz (2002 : 92) ne parle d'épenthèse qu'à l'occasion de l'étude des suffixes diastratiques, c'est-à-dire dans le cas où ces suffixes introduisent une variation "liée à la différence des 'registres' de la parole". Pour autant, il ne dit pas formellement que les épenthèses ne se rencontrent qu'avec ce type de suffixe, mais plutôt que ce type de suffixes s'accompagne parfois d'épenthèses. 107 Chapitre 1 – Distribution géographique, variation qualitative, contextes d'apparition et causalités 3.5. Bilan du chapitre 1 Au terme de ce premier chapitre, nous avons dans notre escarcelle : - une définition rigoureuse à la fois de l'épenthèse telle qu'elle est conçue dans cette thèse, et des variétés de français auxquelles celle-ci va s'intéresser. - une liste des consonnes attestées en épenthèse dans les langues du monde, en fonction de leur fréquence et des contextes où elles sont attestées, ainsi qu'un inventaire des causes invoquées pour l'apparition d'une épenthèse. A cette occasion, la motivation "résolution d'hiatus" a été réévaluée à la baisse. - une idée plus précise des endroits où peut se produire une épenthèse consonantique en français, et de ceux où elle n'est jamais attestée : les épenthèses en français ne sont pas circonscrites aux hiatus, on les rencontre également après consonne. Il s'agit maintenant de compléter ce bagage par l'étude de l'implémentation dans les analyses phonologiques du phénomène de l'épenthèse (chapitre 3), et par celle de la représentation des consonnes coronales (chapitre 2). En effet, nous avons vu à l'occasion de l'inventaire des consonnes dans les langues du monde leur fréquence dans les cas d'épenthèse : après les glottales, elles constituent la deuxième catégorie de consonnes épenthésées en termes quantitatifs, et la première en termes qualitatifs. En ce qui concerne le français, nous avons pu observer que les épenthèses syntaxiques étaient soit en [t], soit en [z], c'est-à-dire une consonne coronale à chaque fois ; et si l'on n'a pas encore établi de corpus fiable en ce qui concerne la frontière suffixale, on peut tout de même risquer une première observation avec Plénat (1999 : 128) : "la consonne insérée est la plupart du temps une coronale". 108 Chapitre 2 – Le caractère particulier des consonnes coronales Chapitre 2. Le caractère particulier des consonnes coronales : phonétique, phonologie, théories Dans ce chapitre je présenterai en premier lieu la structure phonétique des coronales, puis m'intéresserai à la particularité de leur statut, avant d'observer la façon dont différentes théories phonologiques ont choisi de représenter - ou non - ce statut particulier des coronales. 1. Les coronales : quelques faits phonétiques Une mise au point préalable de ce qui est exactement recouvert sous le nom de "coronale" s'impose. Il s'agira de distinguer dans un premier temps son acception purement phonétique du sens que les phonologues lui confèrent. Je commencerai par présenter les coronales du point de vue acoustique avant de les envisager sous leur aspect articulatoire. 1.1. Les coronales en phonétique acoustique. Jakobson, Fant & Halle (1952) observent que les voyelles d'avant et les consonnes coronales se caractérisent par "a concentration of energy in the upper (vs. lower) frequencies of the spectrum" (Hume 1994 : 52). "The number of studies investigating the acoustic correlates of coronal consonants is more limited than that of vowels. Nonetheless, the studies that have been done support the general claim that a coronal consonant is distinguished from its noncoronal counterpart by a greater concentration of energy in the upper frequencies." (Hume 1994 : 53). Ceci se vérifie pour les fricatives (Strevens 1987), mais pour les occlusives le spectre seul ne suffit pas à distinguer les différents lieux d'articulation, il faut s'intéresser plus particulièrement au "burst release to the onset of voicing " pour distinguer les coronales des autres lieux d'articulation (Lahiri et al. 1984). D'autres ouvrages ne distinguent pas particulièrement les coronales des autres lieux d'articulation, cf. par exemple Leoni & Maturi (1995 : chapitre 3). 109 Chapitre 2 – Le caractère particulier des consonnes coronales Acoustiquement parlant donc, les coronales se distinguent par une concentration d'énergie dans les hautes fréquences du spectre plus grande que pour les non coronales, sans que la distinction soit cependant flagrante pour les consonnes. En effet, ce seul critère n'est pas suffisant, au moins pour les occlusives. Après cette incursion du côté de la phonétique acoustique, abordons maintenant l'étude des coronales sous l'angle de la phonétique articulatoire. 1.2. Phonétique articulatoire : lame de la langue. Deux critères articulatoires déterminent un son : le lieu d'articulation, et l'articulateur mobile qui vient s'y placer. La coronalité d'une consonne se définit prioritairement en fonction de l'articulateur concerné : une consonne est coronale si son articulation met en jeu la pointe et la lame de la langue (Keating 1991 : 30, Ladefoged 1982, 1989, Ladefoged & Maddieson 1995 : 11 ; 20, Paradis & Prunet 1991 : 12)30. Pour être plus précise, est coronale pour eux toute articulation pour laquelle la lame de la langue est élevée par rapport à sa position neutre et non-coronale toute articulation pour laquelle la lame reste en position neutre (cf. Chomsky & Halle 1968). Cependant, tous les linguistes ne s'accordent pas sur ce qu'est exactement la lame de la langue. Le problème est essentiellement dû au fait qu'il n'y a pas de marque physique permettant de décider avec certitude de la frontière entre la lame et le dos de la langue. Keating (1991 : 30) reprend Catford (1977 : 143) et constate avec lui que deux traditions s'affrontent : - pour la phonétique anglaise, la lame ("blade") est "the part that lies opposite the teeth and alveolar ridge when the tongue is at rest", ce qui correspond à la pointe ("tip") augmenté de 10 à 15 mm environ. C'est à cette école que se rattachent Keating et Catford. - pour la science de la parole américaine (Daniloff 1973 : 173), c'est cette partie entière qui constitue la pointe, la lame se situant plus en arrière. Ladefoged définit la pointe (ou apex) et la lame comme les parties les plus mobiles de la langue (1982 : 4), ce qui reste là encore sujet à interprétation, puis la lame de façon plus précise comme la partie qui n'est pas attachée au "plancher" de la bouche (1989), ce qui 30 Hume (1994 : 25-30) ajoute à cette définition l'avant de la langue, optionnellement : "[coronal] can be implemented by the tip, blade and/or front of the tongue", de façon à inclure l'articulation des voyelles d'avant, qui ne font pas l'objet de la présente étude. Ce plus, cette distinction rejoint celle concernant les palatales, cf. plus bas. 110 Chapitre 2 – Le caractère particulier des consonnes coronales correspondrait selon lui à un espace d'un centimètre au maximum. Ladefoged & Maddieson (1995 : 10-11) reprennent ces notions : pointe et lame sont les parties les plus mobiles de la langue et sont situées en avant du frenulum, c'est-à-dire de la partie attachée au bas de la bouche. Ces deux parties de la langue ont des attributions dans l'articulation bien spécifiques, mais du fait de leur proximité ne peuvent pas jouer toutes deux de rôle majeur dans l'articulation d'un même son. L'apex est la partie de la langue qui au repos est verticale, c'està-dire parallèle aux incisives, augmentée d'environ deux millimètres. Derrière cette pointe, la partie de la langue située sous le centre de l'arcade alvéolaire lorsque la langue est au repos est la lame ; le centre de l'arcade alvéolaire se définit comme le point d'inclinaison maximale de la courbure de cette partie du milieu de la section sagittale du conduit vocal situé derrière les dents du haut. Le schéma ci-dessous, repris de Ladefoged & Maddieson (1995 : 12), récapitule les cinq groupes de structures mobiles formant les articulateurs actifs du conduit vocal, au-dessus de la glotte. 111 Chapitre 2 – Le caractère particulier des consonnes coronales 1.3. Lieux d'articulation des coronales Le lieu d'articulation intervient également dans la définition de la coronalité ; là encore, les choses ne sont pas aussi simples qu'il y paraît au premier abord, les avis divergent quant aux lieux d'articulation à retenir. En effet, si tous les linguistes s'accordent à dire que les coronales sont articulées au niveau des dents et des alvéoles (Ladefoged & Maddieson 1995 : 19), les avis divergent en revanche quant au fait d'introduire le palais parmi les lieux d'articulation concernés. Pour Ladefoged & Maddieson (1995 : 31) "When places of articulations are grouped according to the active articulator used, palatal articulations, which use the body of the tongue rather than the blade, fall outside the Coronal class of articulations. Rather, they are connected to the velar and uvular places." Ils suivent en cela Chomsky & Halle (1968 : 304 : "the socalled dental, alveolar, and palato-alveolar consonants are coronal, as are the liquids articulated with the blade of the tongue"), Chomsky & Halle eux-mêmes reprenant en grande partie sous le trait [coronal] le trait acoustique [-grave] de Jakobson, Fant & Halle (1952). Halle & Stevens (1979 : 346) ou Keating (1991 : 30) englobent pourtant davantage de lieux d'articulation : "among the generally recognized coronal places of articulation are dental, alveolar, palato-alveolar, retroflex, and palatal. (...) The IPA also includes another place using the tongue blade, alveolo-palatal. Ladefoged & Maddieson (1986) add two less common coronal places, linguolabial and interdental." (Keating 1991 : 30). Cette dernière ajoute que les affriquées et les liquides sont presque invariablement coronales, et que les voyelles fermées le sont probablement aussi. Les articulations non coronales sont alors les suivantes : bilabiales, labiodentales, vélaires, uvulaires, pharyngales. Elle reconnaît cependant que les alvéo-palatales et les palatales sont souvent considérées comme non coronales, par Maddieson (1984) ou Chomsky & Halle (1968), mais "both of these are now standardly considered coronal by phonologists" (note 2 p.47). Ceci semble confirmé par Rubin (2000 : 103), pour qui le terme de "coronal" remonte certes à Chomsky & Halle (1968) pour son utilisation en phonologie générative mais s'est modifié depuis pour inclure également les palatales à cet ensemble comprenant déjà les alvéolaires et les dentales. Ladefoged & Maddieson (1995 : 31) résument ainsi la situation : "The problem is further complicated by the fact that there are large individual anatomical differences in the coronal region, making it hard to make precise remarks about articulation. Keating & Lahiri 112 Chapitre 2 – Le caractère particulier des consonnes coronales (1993), who have summarized articulatory descriptions based on x-rays of speech sounds in the palatal and velar regions, note that different sources provide quite different articulatory pictures of what are claimed to be the same sound." C'est le lieu d'articulation palatal qui pose problème : les consonnes palatales sontelles ou non des coronales ? Il s'agit du point d'achoppement principal des linguistes en ce qui concerne les coronales ; d'ailleurs, Hall (1997) commence son ouvrage sur les coronales par un chapitre sur "the status of palatals". En ce qui concerne la présente thèse cependant, le débat n'a pas lieu d'être puisque les palatales ne se manifestent jamais en épenthèse dans aucune langue répertoriée (cf. partie précédente). En français, la seule consonne palatale éventuellement concernée par la discussion serait le //, et celle-ci n'apparaît jamais en épenthèse. Aussi me contenterai-je de mentionner les deux approches sans prendre parti. Pour une comparaison plus détaillée, cf. Hume (1994 : 30-39) et Hall (1997 : 6-22). Le tableau suivant récapitule les articulations consonantiques selon qu'elles participent de la prononciation des consonnes coronales ou non : (87) consensuelles coronales dentale alvéolaire post-alvéolaire (=palato-alvéolaire) sub-apical palatal (=rétroflexe) (linguo-labial) (interdental) sujettes à caution non coronales bilabiale labio-dentale vélaire uvulaire pharyngale épiglottal glottal alvéo-palatales palatales Le schéma suivant, emprunté à Ladefoged & Maddieson (1995 : 13), rappelle les neuf régions du conduit vocal qui peuvent être considérées comme des cibles pour les articulateurs mobiles (la glotte ne le pouvant pas). Les lignes numérotées indiquent quelques-uns des dixsept composants articulatoires distingués dans la description articulatoire des sons du langage, y compris celui correspondant à la glotte. 113 Chapitre 2 – Le caractère particulier des consonnes coronales Le schéma ci-dessous (Ladefoged & Maddieson 1995 : 14) permet de mieux apprécier les articulations impliquant la pointe et la lame de la langue, donc impliquées dans la détermination des coronales. 114 Chapitre 2 – Le caractère particulier des consonnes coronales Observons plus en détail les différentes classes de coronales ; pour ce faire, je conserverai la méthode de classement de Keating (1991), tout en gardant à l'esprit que seules les trois premières catégories mentionnées sont consensuelles parmi les linguistes. 1.3.1. Coronales antérieures Cette première classe rassemble les consonnes pour lesquelles l'articulation, qu'elle soit occlusion ou constriction, se situe sur les dents du haut, la partie avant des alvéoles ou sur la lèvre supérieure. Pour illustrer cette première catégorie de coronales, les schémas ci-dessous représentent (a) une occlusive dentale (apico-laminale), (b) une nasale apico-alvéolaire (Keating 1991 : 33, d'après Simon 1967). Le deuxième groupe de coronales distingué est l'ensemble des coronales palatoalvéolaires. 1.3.2. Coronales palato-alvéolaires Dans cette seconde classe sont regroupées les consonnes articulées sur ou près du coin de l'arcade alvéolaire (Keating 1991 : 34 : "are at or near the corner of the alveolar ridge"). Sur le schéma suivant (Keating 1991 : 34, d'après Ladefoged & Maddieson 1986) est ainsi représentée l'articulation d'une fricative palato-alvéolaire en anglais,). 115 Chapitre 2 – Le caractère particulier des consonnes coronales Après les coronales antérieures et les coronales palato-alvéolaires, un troisième sousensemble de coronales est constitué par les rétroflexes. 1.3.3. Coronales rétroflexes Les rétroflexes sont articulées en roulant la lame de la langue de façon à ce que la pointe ou le dessous de la langue forme une constriction avec le palais, au niveau de l'arcade alvéolaire ou, plus communément, derrière le coin, comme on peut en voir deux illustrations sur les schémas suivants (Keating 1991 : 35) correspondant à (a) l'articulation d'une occlusive sublaminale en tamil (langue sud-dravidienne parlée en Inde ; d'après Ladefoged & Maddieson 1986) et (b) à celle d'une fricative apicale en serbe (d'après Miletic 1960). Les deux catégories restantes sont celles mentionnées plus haut qui sont sujettes à discussion : les consonnes alvéo-palatales et les consonnes palatales sont-elles réellement des coronales ? 116 Chapitre 2 – Le caractère particulier des consonnes coronales 1.3.4. Coronales alvéopalatales Selon Keating 1991, ce sont fréquemment des nasales et des latérales, également des fricatives et des affriquées. Le plus souvent, elles impliquent la lame de la langue approchant le coin de l'arcade alvéolaire. Sur les schémas suivants (Keating 1991 : 36) on peut apprécier l'articulation alvéopalatale de quelques consonnes fricatives polonaises (a et b ; d'après Wierzchowska 1967, 1980), et mandarine (d'après Ohnesorg & Svarny 1955). Terminons l'inventaire des catégories de consonnes potentiellement considérées comme coronales par les palatales. 117 Chapitre 2 – Le caractère particulier des consonnes coronales 1.3.5. Coronales palatales Keating (1988), repris dans Keating (1991), définit le lieu d'articulation des palatales comme "near a large part of the hard palate, between the alveolar ridge and the roof of the mouth". Elle précise que la constriction est très longue, et que ni la pointe ni la partie de la lame qui y est accolée ne sont impliquées dans l'articulation. Par exemple, le schéma ci-contre (Keating 1991 : 38, d'après Hala 1962) présente l'articulation d'une occlusive nasale palatale en tchèque. Le tableau suivant récapitule les différentes articulations des consonnes coronales en fonction du classement établi par Keating (1991), en les illustrant des symboles consonantiques les plus courants31. (88) coronales dentale sons concernés classement t, d, n, , t, d, n, l, r, , t, d, n, t, d, n, s, z coronales antérieures t, d, n t, d, n t, d, n, , coronales palatoalvéolaires alvéolaire (linguo-labial) (interdental) consensuelles post-alvéolaire (=palatoalvéolaire) sub-apical palatal , , , , , , , (=rétroflexe) alvéo-palatales , sujettes à caution palatales c, , , , (j) rétroflexes coronales alvéopalatales coronales palatales 31 Les diacritiques sont les symboles de l'API (1993) correspondant aux spécifications suivantes : linguo-labiale dentale rétractée apicale laminale 118 Chapitre 2 – Le caractère particulier des consonnes coronales Après ce bref rappel de ce que recouvre la catégorie des coronales sous son aspect phonétique, acoustique comme articulatoire, la section suivante propose d'étudier le statut particulier des consonnes coronales par rapport aux consonnes des autres lieux d'articulation. 2. Le statut particulier des coronales : phonologie Les coronales ne forment pas une classe à part des autres consonnes du point de vue phonétique strict, en ce sens que si quantitativement elles s'imposent en effet, elles n'ont rien d'extraordinaire du point de vue qualitatif (formants). En revanche, la phonologie leur reconnaît un statut particulier, et ce pour plusieurs raisons relatives à leur fréquence dans les langues du monde, à leur transparence, à leur propension à subir l'assimilation ou la neutralisation, et à leur comportement dans les chutes, les cooccurrences et les phénomènes d'aphasie. 2.1. Fréquence Le caractère singulier des coronales s'observe tout d'abord en fonction de la fréquence à laquelle elles s'observent dans les langues, à l'intérieur de chaque langue comme au sein de l'inventaire universel des sons, mais également dans le discours et dans leur liberté distributionnelle. 2.1.1. Dans les langues du monde Une première remarque à leur propos est que pratiquement toutes les langues (endehors du hawaïen, cf. notamment Paradis & Prunet 1991, Kean 1975 et Maddieson 1984) ont des consonnes coronales, mais toutes n'ont pas des labiales ou des dorsales32 (Paradis & Prunet 1991 : 11). Cette première observation fait des coronales les consonnes les plus fréquentes dans les langues du monde. Selon Paradis & Prunet (1991 : 1), la coronale nasale la plus fréquente est le /n/ présent dans 316 langues sur les 317 répertoriées par Maddieson (1984), la coronale fricative la plus représentée est le /s/ que l'on trouve dans 266 langues sur 317 (Maddieson 1984 : 41) ; quant aux liquides, ce sont des coronales "in the overwhelming majority of the languages". De plus, ce sont selon Paradis & Prunet (également Stemberger & Stoel-Gammon 32 Keating (1991) se montre plus réservée : "It should be noted that labial and velar categories are also almost universal" 119 Chapitre 2 – Le caractère particulier des consonnes coronales 1991 : 186, Stoel-Gammon 1985 : 509, Vihman et al. 1986 : 26) les premières consonnes acquises par les enfants avec les labiales, sans qu'il soit cependant possible de les départager. De la même manière van de Weijer (1994 : 26), reprenant les données de Nartey (1979) et de Maddieson (1984), établit la fragile prépondérance des coronales sur les labiales si l'on considère l'inventaire occlusif suivant : (89) segment nombre de langues où le segment en question existe sur 317 lieu d'articulation 292 284 276 41 52 30 coronal vélaire labial uvulaire palatal rétroflexe 190 180 200 5 28 24 coronal vélaire labial uvulaire palatal rétroflexe non-voisé t k p q c voisé d b j Les coronales dans leur ensemble, c'est-à-dire en incluant les rétroflexes (et éventuellement les palatales) sont majoritaires, mais au sein des occlusives voisées, /b/ est plus fréquente que /d/. 2.1.2. Au sein d'une langue Cette grande quantité de coronales au sein des langues du monde se double d'une fréquence intralinguistique marquée. Paradis & Prunet (1991 : 10-11) précisent en effet que le nombre de consonnes coronales dans l'inventaire consonantique d'un système donné est plus élevé que le nombre de consonnes d'autres lieux d'articulation. Ainsi en anglais compte-t-on treize consonnes coronales (dont sept alvéolaires) pour cinq labiales et deux vélaires. Le français compte quant à lui neuf coronales (dont sept dentales) pour cinq labiales et deux vélaires. Il est regrettable que les auteurs n'aient pas fourni l'inventaire des consonnes qu'ils classent parmi les coronales, dans le sens où ceci permettrait d'une part de savoir où ils classent les palatales, donc //, d'autre part d'identifier la septième dentale : s'agit-il du /r/ cité par Paradis & El 120 Chapitre 2 – Le caractère particulier des consonnes coronales Fenne & El Fenne (1992) ? Prince & Smolensky (1993 : 109) présentent l'inventaire phonologique du lardil, langue pama-nyungienne d'Australie parlée sur l'île Mornington (cf. notamment Hale 1973), qui sur 17 consonnes (dont 3 approximantes) compte 12 coronales (dont 2 approximantes) se répartissant en lamino-dentales (t, d), apico-alvéolaires (t, n, l, r), lamino-alvéolaires (tj, nj, j) et rétroflexes (, ) contre trois labiales (en comptant le glide w) et deux vélaires. Un troisième type de fréquence particularise les coronales dans les langues du monde. 2.1.3. Dans l'inventaire des sons Une troisième distinction des coronales par rapport aux consonnes d'autres lieux d'articulation concerne leur fréquence dans l'inventaire universel des sons : selon Paradis & Prunet (1991 : 11), l'Alphabet Phonétique International recense trois fois plus de coronales que de labiales ou de vélaires. Keating (1991 : 29) illustre ceci par l'analyse de l'inventaire consonantique de Maddieson (1984) : sur 20 consonnes, 10 sont coronales. 2.1.4. Dans le discours De plus, les coronales sont les consonnes qui se manifestent le plus souvent dans le discours. Fry (1947), repris par Paradis & Prunet (1991), a ainsi montré que les cinq consonnes les plus fréquentes dans un corpus conversationnel d'anglais britannique (variété du sud) étaient toutes des coronales (dans l'ordre décroissant n, t, d, s et l). Ferreres (1990) a relevé dans un corpus d'espagnol argentin, parmi les consonnes, 69,62% de coronales (/s/ le plus fréquent, // le moins), 18,45% de labiales, 11,21% de vélaires. 2.1.5. Dans leur distribution Enfin, selon Szigetvári (1994 : 193-194) "the general tendency seems to be that coronal consonants are freer in their distribution than others". En effet, il relève pour l'anglais une forte majorité de terminaisons consonantiques en coronales par rapport aux autres types 121 Chapitre 2 – Le caractère particulier des consonnes coronales de consonnes possibles, comme on peut le voir dans le tableau suivant33, réalisé à partir d'un ensemble de 24000 mots : (90) labiales p _# dont r_# l_# [+nasal]_# s_# f_# p_# k_# 406 12 8 43 11 0 0 coronales b 106 18 3 0 - t 3521 141 62 658 305 43 50 129 vélaires d 1259 237 123 285 - k 1416 88 13 70 33 0 0 - g 159 42 0 0 - Ce tableau met en lumière la forte représentation des coronales à la finale de mots, notamment par rapport aux labiales mais également par rapport aux vélaires, et ce y compris après une autre consonne, quel que soit son lieu d'articulation. Par ailleurs, on notera que les consonnes non voisées sont plus représentées à la finale, tous lieux d'articulation confondus, que leurs partenaires voisés. Ce dernier argument conclut cette première approche de la spécificité des coronales par le biais de leur fréquence. 2.1.6. Bilan sur la fréquence Les coronales sont toujours mises en valeur par rapport aux autres catégories de consonnes, et ce, quel que soit le type de fréquence observé. De plus, dans tous ces types de fréquences, ce sont toujours les dentales et les alvéolaires qui se distinguent au sein de cette classe des consonnes coronales. Bien entendu, toutes ces fréquences sont en partie corrélées : c'est parce que les coronales sont les phonèmes consonantiques les plus nombreux à disposition que la probabilité de les trouver dans la presque totalité des langues est plus élevée que pour d'autres consonnes, et c'est parce que, dans une langue donnée, on trouve davantage de phonèmes coronaux que de phonèmes consonantiques d'autres lieux d'articulation, que les coronales 33 Les - indiquent les articulations "which are excluded by 'strong' principles: a difference in voicing, or a prohibition of geminates; while '0' appears in those boxes where nothing seems to exclude the group, yet it does not occur." (Szigetvári 1994 : 193). 122 Chapitre 2 – Le caractère particulier des consonnes coronales seront réalisées plus souvent à l'oral. Aussi ne pouvons-nous nous limiter à cette prépondérance quantitative pour fonder un raisonnement sur le statut particulier des coronales. Tournons-nous donc vers une deuxième particularité des coronales, relative à leur transparence. 2.2. Transparence Les coronales34 sont transparentes à certaines règles (Paradis & Prunet 1989b), c'est-àdire qu'elles autorisent un trait à se propager à travers elles comme si elles n'étaient pas là. Pour reprendre les termes de McCarthy & Taub (1992 : 368), "sometimes coronal consonants are special by virtue of phonological inactivity or invisibility". Paradis & Prunet (1989b : 317, 1990, 1991 : 10) illustrent cette affirmation par une propagation vocalique dans plusieurs langues d'Afrique de l'ouest, propagation possible uniquement à travers des coronales et bloquée lorsque ce sont des non-coronales qui interviennent. Observons pour illustrer notre propos le comportement des coronales dans le paradigme verbal du fula. En fula (Paradis & Prunet 1989b : 324-325), le système verbal comprend vingt-et-une marques suffixales exprimant l'aspect (perfectif et imperfectif) et la voix (active, passive et intermédiaire). Les aspects perfectif et imperfectif couvrent en réalité sept sous-aspects, indicés numériquement (perfectifs 1, 2 et 3 ; imperfectifs 1, 2, 3 et 4). Le tableau ci-dessous récapitule les vingt-et-une marques suffixales résultant de la combinaison des sept sous-aspects avec les trois voix du fula : (91) perfectif P1 P2 P3 imperfectif I1 I2 I3 / i ii i ii iima a aa aama / a at o oo oto e ee ete I4 ata otoo etee 34 actif (A) intermédiaire (M) passif (P) Les glottales sont également réputées pour leur transparence. 123 Chapitre 2 – Le caractère particulier des consonnes coronales Observons tout d'abord les suffixes perfectifs. On remarque que le /m/ dans les formes P3M et P3P ne présente pas le même cas de propagation de voyelle. La forme P3M ne demande pas d'explication, dans le sens où ce n'est pas la même voyelle qui est réalisée, attestant bien de la réalité d'un suffixe -ma ; la forme P3P est quant à elle analysée comme deux suffixes en contact "which happen to have the same vowel" (Paradis & Prunet 1989 : 324), en l'occurrence le suffixe -a de P2P avec -ma identifié en P3M. Tournons-nous vers l'imperfectif. Quelle serait la forme du suffixe I3, puisque la dernière voyelle est différente pour chaque voix ? En fait, les voyelles de part et d'autre de la coronale sont identiques, il y a propagation de la mélodie de la première voyelle sur les autres positions vocaliques du suffixe, et ce à travers la consonne coronale. Celle-ci est donc transparente à l'harmonie vocalique. Pour le paradigme nominal, ce sont les marqueurs nominaux qui offrent un cas de transparence. En futankoore, dialecte fula parlé en Mauritanie et au Sénégal, ces marqueurs sont obligatoirement suffixés aux noms et aux adjectifs et peuvent chacun se présenter sous quatre formes en fonction de contraintes phonologiques et morphologiques. Paradis & Prunet (1989a : 329-334) présentent le cas des marqueurs -ru, -re et -ri qui alternent respectivement avec les formes -uru, -ere et -iri, dans lesquelles les voyelles sont identiques de chaque côté du /r/ : (92) (a) (b) -rV -VrV am-re sof-ru caak-ri woj-ere woot-uru kes-iri *woj-re *woot-ru *kes-ri "tortue" "poussin" "couscous" "lièvre" "unique" "nouveau" Les séquences en (a) sont formées à partir de radicaux se terminant par une consonne non coronale, au contraire des séquences sous (b). Le principe de contour obligatoire interdit des séquences de deux consonnes de même lieu d'articulation ne partageant pas leur nœud de place, c'est pourquoi on peut penser que lorsque la consonne finale de radical est une coronale, elle ne peut pas se trouver en relation immédiate avec le -r- du suffixe. L'analyse proposée par Paradis & Prunet (1989a) est la suivante : le -r- du suffixe est géminé dans le lexique ; lorsqu'il est en contact avec une consonne finale de radical coronale, il "libère" la première position de façon à permettre à une 124 Chapitre 2 – Le caractère particulier des consonnes coronales voyelle de se réaliser. C'est la voyelle finale de radical qui se propage à travers /r/ pour apporter de la mélodie à cette position. /r/ se comporte donc exactement comme s'il n'était pas présent en regard de cette propagation. Il reste à démontrer que cette propagation ne fonctionne pas à travers une consonne non-coronale. Si l'on ajoute le marqueur -e, à initiale non-coronale, à un radical comportant deux consonnes finales, le nouveau noyau créé entre le radical et le suffixe n'est pas rempli par une propagation de la voyelle suffixale mais une épenthèse de /u/ : (93) singulier jolf-o (o) awl-o (o) /jolf/ /awl/ pluriel jolf-u-e awl-u-e glose "Wolof" "griotte" Un dernier cas de transparence des coronales en fula est présenté par Paradis & Prunet (1989a : 334-338). Deux voyelles peuvent être épenthésées pour éviter des attaques ou des codas branchantes, interdites en fula : [i] avant un suffixe verbal suivant deux consonnes, [u] après un domaine verbal (radical verbal plus suffixes dérivatifs) se terminant par deux consonnes, avec une préférence pour le [u] si les deux sont possibles (cf. c) : (94) (a) radical seul (b) dérivé (c) insertion de [u] dojj-u ekk-u *ojj-u-n, *ojj-n-u *ojj-u-t, *ojj-t-u wor--u as-t-u aam-t-u insertion de [i] *dojj-i *ekk-i ojj-i-n ojj-i-t *wor-i-, *wor--i *as-i-t, *as-t-i *aam-i-t, *aam-t-i glose "tousse !" "enseigne !" "faire tousser" "tousser à nouveau" "devenir infecté" "refaire" "manger à nouveau" Paradis & Prunet (1989a : 338-341) proposent également un argument pour la transparence des coronales, non plus basé sur la propagation de voyelle à travers des coronales mais sur la fusion de voyelles dans le même contexte. En guere zibiao, langue niger-congolaise krou parlée en Côte d'Ivoire, les mots bisyllabiques qui ne sont ni composés, ni empruntés ne peuvent comporter deux voyelles non hautes (Contrainte de Hauteur). De plus, si une consonne est présente entre les noyaux de chacune des syllabes, c'est toujours une coronale. Le tableau ci-dessous récapitule les quatre cas de figure observés, en fonction des voyelles des deux syllabes et de la présence d'une attaque dans la deuxième syllabe : 125 Chapitre 2 – Le caractère particulier des consonnes coronales (95) voyelles différentes radical CVV voyelles identiques au moins une voyelle haute radical CVCV aucune voyelle haute me lua w baa dçç "langue" "sol" "brûle !" "manioc" "semaine" y ne nin nimi wçç "sécher" "porcelaine" "lait" "animal" "laver" bee "pendre" Les séquences de voyelles identiques dans un radical CVV ne correspondent pas à la contrainte de hauteur qui veut qu'un mot ne puisse comporter deux voyelles non hautes. Il faut donc supposer que ces voyelles partagent leurs traits concernant le lieu d'articulation35. En ce qui concerne les radicaux de type CVCV, cette contrainte de hauteur n'est pas nécessairement respectée lorsque l'attaque de la deuxième syllabe est une coronale ; ou plus précisément, à chaque fois qu'elle n'est pas respectée, l'attaque de la deuxième syllabe s'avère être une coronale. Il semble donc que le traitement puisse être le même que pour les radicaux de type CVV : les voyelles partagent leurs traits concernant le lieu d'articulation "par-dessus" la consonne coronale les séparant. En guere donc, les voyelles peuvent partager des traits de lieu d'articulation pourvu que la consonne qui les sépare soit une coronale, ce qui là encore milite pour la transparence des consonnes coronales. En mau (ou mawukakan), langue niger-congolaise du groupe mandé également parlée en Côte d'Ivoire, les seules consonnes transparentes aux voyelles sont les coronales [l] et [r] (Paradis & Prunet 1989 b : 341-344). Les tons dans cette langue sont prévisibles : un ton bas est toujours associé à la première syllabe, un ton haut toujours aux autres syllabes (a), ou un ton modulé sur les monosyllabes (b). Cependant, quand un mot commence par deux voyelles identiques adjacentes (une voyelle longue en surface), celle-ci prend le ton bas (c) ; de même, quand les deux premières voyelles d'un mot sont identiques et séparées par une coronale, toutes deux prennent le ton bas (d). 35 L'analyse est proposée en Géométrie des Traits (cf. section 3), dans laquelle ce partage des traits se traduit pas la fusion sous-jacente du nœud de place des voyelles. En revanche, il n'est pas fait mention de la représentation précise du suffixe, ni n'est précisé laquelle des deux voyelles propage ses traits à l'autre. Ce n'est pas important dans la démonstration ici, puisque c'est la transparence des coronales qui est à démontrer. 126 Chapitre 2 – Le caractère particulier des consonnes coronales (96) a. disyllabe "normal" b. monosyllabe "normal" c. deux premières V identiques d. V coronale V lona safina ye wo iiwii heejabu bçlçti, bçrçti "coq" "savon" "gourde" "trou" "soufre" "protection" "fil" salaba, saraba "faible" Tout se passe donc exactement comme si les liquides coronales n'étaient pas là. Lorsque les deux premières voyelles d'un mot sont identiques, il n'y a qu'une mélodie vocalique dans le lexique, comme l'indique le fait que le ton est le même sur les deux voyelles. Cette mélodie vocalique se propage sur la position vocalique inoccupée36, et ce qu'il y ait une consonne coronale entre les deux ou aucune consonne. Tous ces exemples illustrent le caractère transparent des consonnes coronales. Il est cependant à noter que les vélaires se comportent parfois également comme si elles étaient transparentes à certaines règles, ce qui en fait sur ce point des concurrentes des coronales (cf. notamment van der Hulst & Smith 1990, Trigo 1988). Les consonnes laryngales sont également transparentes dans nombre de langues, comme l'illustrent notamment Gafos & Lombardi (1999 : 82) en kashaya (Buckley 1994) mais également en mazahua otomi, langue oto-mandéenne parlée au Mexique (Steriade 1995, Spotts 1953) ; en finnois et en yurok, langue quasiment éteinte du nord ouest californien (Collinder 1965) ; en arbore, langue afro-asiatique parlée en Ethiopie ; en nez perce, langue amérindienne parlée dans le nord de l'idaho ; en mohawk, langue iroquoise parlée notamment dans la région de l'Ontario au Canada ; en tojolabal, langue maya parlée au Mexique, etc (Steriade 1987). "If only one Place is transparent in a language, it is Pharyngeal (this includes /h, / (…)); and if Coronal is transparent, then Pharyngeal is also transparent." (Gafos & Lombardi 1999 : 83) Le caractère particulier des coronales du fait de leur transparence est donc à relativiser : les coronales sont plus transparentes que les labiales, sans doute plus que les vélaires, mais moins que les pharyngales. Ceci est sans doute à relier au fait que parmi les 36 Il n'importe pas ici de connaître le sens de propagation, mais Paradis & Prunet (1989b : 343) penchent pour la deuxième voyelle sur la première, soit de droite à gauche. 127 Chapitre 2 – Le caractère particulier des consonnes coronales consonnes épenthétiques, les pharyngales sont également en concurrence avec les coronales, cf. plus haut. Parallèlement à la transparence des coronales aux voyelles, il est intéressant d'observer l'analyse de Broselow (à paraître) à propos des épenthèses en selayarese : "only r, l, s trigger epenthesis (of a vowel) in selayarese loans because epenthesis can take place only after 'transparent' consonants". Les coronales sont selon elle plus susceptibles d'accepter des traits vocaliques que les consonnes labiales ou dorsales. 2.3. Assimilation Les coronales subissent plus souvent des assimilations que les autres lieux d'articulation. Kiparsky (1985 : 97-98) observe en effet que les coronales sont les consonnes les plus susceptibles de s'assimiler en ce qui concerne le lieu d'articulation ; cette propension à l'assimilation se manifeste par la propagation des traits de lieu de la consonne suivante sur la consonne coronale précédente. Ainsi en catalan, pour reprendre l'exemple de Kiparsky (cf. également Herrick 1999 : 28-29), les consonnes nasales s'assimilent-elles au lieu d'articulation de la consonne immédiatement à leur droite dans les proportions suivantes : /n/ est toujours assimilée par la consonne suivante (Herrick 1999 : 28 précise "except when the following consonant is palatal (…) full assimilation to lamino-palatals, but assimilation is only partial to palatals"), /m/ seulement si ladite consonne est une labiodentale, // et // jamais. (97) /n/ /m/ // // alvéolaire "témoin" labiale so[n] amics so[m] pocs "ils sont amis" "ils sont peu" labio-dentale so[] felios "ils sont heureux" dentale so[n] dos "ils sont deux" alvéolaire postalvélaire so[n] sincers so[n] rics "ils sont sincères" "ils sont riches" laminopalatale so[n,] [d]ermans "ils sont frères" palatale so[n,] []iures "ils sont libres" vélaire so[] rans "ils sont grands" so[m] amics so[m] pocs so[] felios "nous sommes amis" "nous sommes peu" "nous sommes heureux" so[m] dos a[] feli ti[] pas "nous sommes deux" "bonne année" "j'ai du pain" 128 Chapitre 2 – Le caractère particulier des consonnes coronales L'assimilation dentale en coréen, présentée par Cho (1988 : 44, 1991 : 171) notamment, est également une parfaite illustration de l'assimilation des consonnes dentales par la consonne suivante en termes de lieu d'articulation : (98) /kotpalo/ [kopparo] "droit, direct" /pat/ + /ko/ [pakko] "recevoir et" /kt/ + /ci/ [kcci] "nous laisse découvrir" intramorphématique /hankan/ [hakan] "la rivière Han" intermorphématique /han/ + /bn/ [hambn] "une fois" intramorphématique coronale orale coronale nasale intermorphématique En revanche, les labiales et les dorsales ne s'assimilent pas aux coronales (Iverson & Kim 1987 : 186 ; cf. également Rice 1996 : 494-495) : (99) papto kato papto kado *patto *kando "le riz aussi" "voleur" Ce même constat est fait par Paradis & Prunet (1991 : 9) : les assimilations ayant pour cible les consonnes non coronales sont beaucoup moins fréquentes que celles concernant les coronales, et n'intéressent souvent que celles-ci. Citons encore l'assimilation des coronales dans certaines langues couchitiques de l'est parlées en Ethiopie : en qafar, dialecte du nord, pourvu que ce soient des obstruantes ; en oromo, dialecte wellegga, en ce qui concerne les occlusives alvéolaires et palatales ; en bayso ou baiso pour toutes les coronales autres que [] (Garrett & Blevins 2003 : 17). Les travaux en acquisition confirment ces résultats : les coronales, en tant que consonnes plus simples, sont assimilées aux labiales et aux vélaires dans le discours enfantin. Stemberger & Stœl-Gammon (1991 : 189-191) présentent une étude portant sur des substitutions consonantiques chez des enfants entre neuf mois et deux ans apprenant l'anglais. Sont distinguées les substitutions de lieu d'articulation contextuelles (donc les harmonies consonantiques : duck "canard" prononcé [ak]) de celles indépendantes du contexte (dans lesquelles un enfant remplace systématiquement un son par un autre : les vélaires par les alvéolaires, cow "vache" prononcé [da:] alors qu'aucune alvéolaire n'est disponible dans le contexte.). Le tableau suivant présente les résultats des substitutions consonantiques constatées : 129 Chapitre 2 – Le caractère particulier des consonnes coronales (100) substitution alvéolaire Æ vélaire vélaire Æ alvéolaire bidirectionnelle alvéolaire Æ labiale labiale Æ alvéolaire bidirectionnelle vélaires labiales total harmonie 19 1 3 18 2 4 47 non contextuelle 1 24 3 1 4 2 35 total 20 25 6 19 6 6 82 Comme on le constate ici, Stemberger & Stœl-Gammon (1991 : 189-191) ont relevé seulement 3 cas d'harmonie d'une vélaire ou d'une labiale vers une alvéolaire, contre 37 où c'est l'alvéolaire qui s'assimile. En revanche, dans le cas des substitutions non contextuelles, c'est l'articulation coronale qui est prioritairement choisie : 28 attestations en coronales contre 2 pour les labiales et les vélaires réunies. Il semble donc que les coronales là encore se comportent comme les éléments les plus simples puisqu'elles subissent l'assimilation consonantique d'une part, et sont utilisées comme consonnes par défaut d'autre part. Béland & Favreau (1991 : 210) offrent des analyses comparables, sur le français, mais émettent une réserve quant à la nature de la coronale impliquée : les occlusives et les sonantes coronales subissent davantage l'assimilation par une labiale que les fricatives. L'assimilation d'une labiale par une coronale (/swaf/ réalisé [swas]) est quant à elle plus souvent observée pour les fricatives que l'assimilation inverse. Le tableau ci-dessous présente les données numériques pertinentes : coronale Æ labiale (101) /t, d, n, l, r/ /s, z/ /, / total 10 3 0 13 labiale Æ coronale 2 5 5 12 total 12 8 5 25 Considérons une troisième étude relative aux assimilations consonantiques. Gaskell et al. (1995), reprenant une étude sur l'anglais de Marslen-Wilson & Nix (1992) et Nix et al. (1993), mettent en évidence le caractère marqué des coronales en regard de l'assimilation à travers la comparaison de la perception de deux phrases, l'une (a) comportant un segment vélaire en surface, l'autre (b) un segment coronal : (102) (a) (b) They thought the lake cruise was rather boring They thought the late train was rather boring 130 Chapitre 2 – Le caractère particulier des consonnes coronales La première séquence est ambiguë : s'agit-il d'un /k/ ou d'un /t/ dans le lexique, de lake ou de late ? Les sujets à qui ces phrases ont été présentées ont donné à 80% une réponse avec une coronale pour (b), mais seulement 55% ont identifié un /k/ dans (a)."There is no such ambiguity in (b), since assimilation from non-coronal to coronal place does not occur. For example, the /k/ in lake cannot assimilate to the /t/ in train to give late train. The only phonologically viable reading of the critical word is therefore late. (...) for English speakers coronal surface segments are reliable indicators of an underlying coronal segment and are treated as such during speech perception. Labial and velar surface forms, since they can occur as the product of the assimilation of an underlying coronal segment, must be treated as more ambiguous, at least until their following context is known." D'autres simulations conduites par Gaskell, Hare & Marslen-Wilson (1995 simulations 1 et 3) ont également mis en valeur le comportement particulier des coronales par rapport aux consonnes des deux autres grands lieux d'articulation, à savoir les labiales et les coronales. D'une manière générale, les harmonies consonantiques consistent "almost exclusively of coronal harmony" (Paradis & Prunet 1991 : 2), si l'on excepte celles impliquant les consonnes laryngales. La particularité des coronales a été jusqu'à présent mise en évidence à travers leur fréquence dans les langues du monde, leur transparence face à certains phénomènes d'harmonies consonantiques ou au travers des processus d'assimilation. Elle peut également être mise en évidence dans des cas de neutralisation. 2.4. Neutralisation En coda, on observe généralement que les segments complexes se simplifient, que ce soit du point de vue du mode comme du lieu d'articulation (cf. par exemple Trubetzkoy 1939). Ainsi le carrier, langue amérindienne athapaskan, illustre le propos en ce qui concerne le mode articulatoire : dans cette langue comportant trois séries d'occlusives (aspirées, glottalisées et simples), seule la série simple existe en coda (cf. Cook 1976 : 6). Pour Paradis & Prunet (1991 : 9), les cas de neutralisation peuvent également contribuer à mettre en évidence la particularité des coronales par rapport aux consonnes des autres lieux d'articulation. Ainsi de Lacy (2002a : 192, 268-283) est même plus affirmatif : 131 Chapitre 2 – Le caractère particulier des consonnes coronales "the output of neutralization is shown to always be glottals or coronals, never labials or dorsals", comme le récapitule le tableau suivant (cf. de Lacy 2002a : 268) : (103) Input /vélaire/ /labiale/ /coronale/ /glottale/ neutralisation en [glottale] ou [coronale] [glottale] ou [coronale] [glottale] [coronale]37 Une illustration de la neutralisation des vélaires en coronale se trouve en yecuatla, langue amérindienne totonac parlée au Mexique dans laquelle un phonème // se neutralise en [n] (cf. de Lacy 2002a : 272, MacKay 1994 : 33). Dans un langage secret taiwanais, les occlusives labiales et dorsales se neutralisent en [t] dans les codas des mots rédupliqués, "despite the fact that [] is available" (de Lacy 2002a : 272-273, cf. également Li 1985). Ce langage fonctionne de la manière suivante : Chaque mot est rédupliqué de telle sorte que : - la première consonne de la base est remplacée par un [l] si la voyelle suivante est orale, [n] si la voyelle suivante est nasale : /be/ sera rédupliqué [le-bi] ; - la voyelle rédupliquée est neutralisée en [i] (cf. exemple précédent) ; - la coda rédupliquée est neutralisée en [t] : /tsap/ sera réalisé [lap tsit] avec [t] dans la coda de la forme rédupliquée et non [p] comme dans la forme de base. Le tableau suivant fournit quelques illustrations : 37 La neutralisation des coronales en occlusive glottale est attestée dans les langues, par exemple en kashaya, langue amérindienne de la famille poroane parlée en Californie du Nord (Oswalt 1961, Buckley 1994, 2000) : /mahsan + th/ "il n'est pas en train de l'emmener" est réalisé [mahsath]. Lorsque la consonne finale de radical n'est pas coronale, le morphème est infixé et non suffixé, aucune consonne ne subissant alors de neutralisation : /sima:q + ta/ "aller dormir" est réalisé [simataq]. 132 Chapitre 2 – Le caractère particulier des consonnes coronales (104) (a) radicaux à finale vocalique /be ts’ai/ Æ [le-bi lai ts’i] Æ /e hiau/ [le i liau hi] (b) radicaux à finale consonantique : neutralisation en coronales Æ dentale /t’at/ [lat t’it] coda Æ labiale /tsap ap/ [lap tsit lap it] orale Æ vélaire /pak k’ak/ [lak pit lak k’it] coda nasale dentale labiale /tsin t’iam/ /kam tsia/ Æ Æ vélaire /p’ç hç/ Æ "acheter de la nourriture, aller au marché" "capable" "frapper" "dix boîtes" "peler, ouvrir" [lin tsin liam t’in] [lam kin lia tsi] "très fatigué" "canne à sucre" [lç p’in lç hin] "flatus ventritus" La section suivante aborde la particularité des coronales sous l'angle de l'inventaire phonologique d'une langue donnée. 2.5. Marque et implication Rice (1999a : 3) mentionne l'implication par rapport à la marque (cf. chapitre 2) : "a feature X is more marked than a feature Y if the presence of X implies the presence of Y". Il semble que dans les langues contenant des coronales et des non-coronales dans leur inventaire, la présence de celles-ci présuppose la présence de celles-là, sans que cette relation soit réciproque. "All Australian languages with final labials and/or dorsals have final coronals" (Rice 1999a : 3) . Cette hypothèse est cependant à relativiser en ce qui concerne les coronales, dans le sens où l'on a vu (section 2.1.1.) que les coronales étaient précisément présentes dans toutes les langues du monde étudiées sauf une. 2.6. Chute L'argument de la chute des consonnes d'un lieu d'articulation par rapport à un autre est plus nuancé dans les faits (tantôt les coronales sont les seules à chuter, tantôt elles sont les seules à se maintenir), mais il concourt à mettre en lumière le comportement singulier des consonnes coronales. Szigetvári (1994 : 195-196) s'intéresse à la chute des consonnes coronales devant le morphème suffixal du nominatif singulier (-s), en grec et en latin. Il ne s'agit pas d'assimilation puisque les segments entourant la coronale ne sont pas modifiés par sa 133 Chapitre 2 – Le caractère particulier des consonnes coronales disparition, ni de neutralisation puisqu'elle ne laisse aucune trace. Cette chute ne se produit qu'à la suffixation avec les coronales et non avec les labiales ni les vélaires, qui sont suffixées sans aucune modification autre que le voisement. (105) radicaux labiales radicaux vélaires radicaux coronales morphèmes gūp-s en phleb-s grec classique réalisation glose gūps "vautour" phleps "veine" onukh-s korak-s en aig-s pharu[]g-s sark-s ornīth-s kharit-s nukt-s en gigant-s lampād-s rhīn-s hal-s martur-s morphèmes onuks koraks aiks pharu[]ks sarks ornīs kharis nuks gigās lampās rhīs hals martus réalisation "ongle" "corbeau" "chèvre" "gorge" "peau" "oiseau" "merci" "nuit" "géant" "torche" "nez" "sel" "témoin" glose morphèmes op-s trab-s urb-s hiem-s duc-s arc-s rēg-s latin réalisation ops tra[p]s ur[p]s hiems du[ks] ar[ks] rē[ks] glose "pouvoir" "bois" "ville" "hiver" "chef" "fort" "roi" pariet-s pont-s art-s custōd-s frond-s sanguin-s flōr-s pariēs pons ars custōs frons sanguis flōs "mur" "pont" "art" "garde" "feuillage" "sang" "fleur" morphèmes réalisation glose Lorsqu'une base se terminant par une labiale ou une vélaire est concaténée avec le suffixe -s, la consonne finale radicale perd le cas échéant son voisement. En revanche, lorsque c'est une coronale qui se trouve en finale de la base, elle chute devant le morphème -s ; la seule exception à cette chute est le [l] en grec classique, qui se maintient sans modification. Les coronales montrent bien un comportement particulier par rapport aux consonnes des autres lieux d'articulation. De Lacy (2002a : 192) cite quant à lui des cas où seules les dorsales et les labiales chutent, et considère que "the lack of cases where coronals delete but labials and dorsals survive is argued to show that there are no constraints that ban coronals without also banning labials and dorsals." Les langues qu'il présente sont le lardil et le nunggubuyu, toutes deux des langues australiennes ; le tableau ci-dessous (Hale 1973 : 424-425, de Lacy 2002a : 244) illustre la chute des consonnes non coronales en lardil : 134 Chapitre 2 – Le caractère particulier des consonnes coronales (106) labiales laminodentale apicoalvéolaires [ipii] [mukuni] [kurumpu] [taawu] [ipiipi-n] [mukuni-n] [kurumpuw-an] [taawuta-n] nominatif non-futur Æ Æ Æ Æ /t/ /n/ Æ [t] Æ [n] Æ [l] /japuti/ /pien/ "serpent" "femme" [japut] [pien] [japuti-n] [pieni-n] /kentapali/ "dugong" [kentapal] [kentapali-n] Æ [] Æ [] /pe:/ "variété d'arbre" [pe:] [pe:-in] /kiua/ "booby" [kiu] [kiua-n] /mijai/ "variété de lance" [mija] [mija-in] /taputi/ "frère aîné" [tapu] [taputi-n] /aluki/ /pee/ "histoire" "vagin" [alu] [pee] [aluki-n] [peei-n] // rétroflexes "morue de roche" "nullah" "lance 'tata'" ? glose /p/ /m/ /w/ /t/ /l/ // // ø ø ø ø forme sousjacente /ipiipi/ /mukunima/ /kurumpuwa/ /taawuta/ laminoalvéolaire /t/ Æ [] Æ ø dorsales /k/ // Æ ø Æ ø Si la dernière consonne est suivie d'une voyelle, elle entraîne celle-ci dans sa chute à la finale de mot ; par exemple, /ipiipi/ "morue de roche" se réalise [ipii], donc sans la dernière syllabe, en finale de mot, mais [ipiipi-n] quand il est suivi d'un autre morphème. Seules les consonnes apico-alvéolaires et rétroflexes ne chutent pas à la finale38. Le maintien ne concerne donc que des coronales, mais non toutes les coronales puisque les lamino-dentales et les lamino-alvéolaires chutent. De ces deux exemples, l'un attestant la chute des coronales associée au maintien des labiales et des vélaires, l'autre attestant le contraire, à savoir la chute des labiales et des vélaires et le maintien (d'une partie) des coronales, on retire un nouvel argument en faveur de la spécificité des coronales, sans que l'on puisse pour autant déduire un comportement général – chute ou maintien – d'une catégorie de consonnes par rapport à une autre. Un septième argument vient soutenir la thèse de la spécificité des coronales. Il porte sur les occurrences possibles de consonnes de même lieu d'articulation à l'intérieur d'un mot dans les langues gabaritiques. 38 Précisons tout de même que la rétroflexe [] est réalisée [] comme on peut le voir dans le tableau. 135 Chapitre 2 – Le caractère particulier des consonnes coronales 2.7. Cooccurrence Dans les langues gabaritiques, il existe une restriction quant à la nature des consonnes dans un mot. Ainsi, si en français un terme comme latéral [lateral], comportant quatre consonnes coronales, est possible, ce ne sera pas le cas dans les langues sémitiques. Buckley (2001) a quantifié les restrictions de ce type en tigrigna, langue éthiopienne (cf. chapitre 1) gabaritique, ce qui lui a permis de mettre en exergue le caractère particulier des coronales par rapport aux autres consonnes en regard de leur distribution à l'intérieur d'une racine. A partir d'un corpus de 2744 racines verbales bilitères, trilitères et quadrilitères issues du dictionnaire de Bassano (1918), "the most complete dictionary of Tigrinya available at present" (Buckley 2001 : 110), il a étudié la cooccurrence de consonnes homorganiques adjacentes ou dans la même racine, par rapport au nombre théorique possible, c'est-à-dire au nombre de racines attendues si la distribution des consonnes était totalement libre. (107) gutturales vélaires labiales total noncoronales coronales obstruantes coronales sonantes total coronales cooccurrences de consonnes homorganiques adjacentes O (racines E (racines rapport effectives) attendues) O/E 0 78 0.00 1 125 0.01 2 132 0.02 cooccurrences de consonnes homorganiques non-adjacentes O (racines E (racines rapport effectives) attendues) O/E 6 49 0.12 10 73 0.14 18 68 0.26 3 335 0.009 34 190 0.18 65 242 0.27 112 162 0.69 27 261 0.10 106 140 0.76 92 503 0.18 128 202 0.63 Les cooccurrences de consonnes de même lieu d'articulation sont proscrites, particulièrement si elles sont adjacentes, et il est vrai que les gutturales, les vélaires et les labiales en attestent très peu de cas. Le total des attestations des trois lieux d'articulation cumulés est trente fois moindre que celui des seules coronales en ce qui concerne deux consonnes adjacentes, et encore quatre fois moindre lorsque les consonnes sont séparées par une consonne intermédiaire. Il est vrai que le nombre de racines à coarticulation attendu est plus élevé pour les coronales que pour les consonnes des autres lieux d'articulation, aussi estce le rapport entre les racines effectives et les racines attendues qui est réellement révélateur d'une tendance. Là encore, les coronales manifestent une cooccurrence vingt fois supérieure à 136 Chapitre 2 – Le caractère particulier des consonnes coronales celle des consonnes des autres lieux d'articulation confondus lorsqu'il s'agit de séquences comprenant deux consonnes adjacentes de même lieu d'articulation, et encore 3.5 fois supérieure lorsque les consonnes ne sont pas adjacentes. On notera par ailleurs que parmi les coronales, les obstruantes sont plus souvent observées au sein d'un même mot lorsqu'elles sont adjacentes, alors que ce sont les sonantes qui seront attestées de manière privilégiée si les consonnes sont séparées par une consonne intermédiaire. Outre le fait que l'adjacence des consonnes est un facteur "aggravant" quant au manque de cooccurrences de deux consonnes homorganiques, ce qui est intéressant de relever pour notre propos est que les coronales sont les consonnes les plus susceptibles de se trouver en plusieurs exemplaires dans une même racine, alors même qu'une telle intimité est interdite ou fortement déconseillée dans la langue. Ceci est conforté lorsque l'on regarde plus précisément les cooccurrences des consonnes non seulement homorganiques, mais identiques. "Adjacent identical consonants are absolutely prohibited (so this again excludes biliterals), but the following roots illustrate the fact that identical consonants do occur in nonadjacent positions" (Buckley 2001 : 126). Le tableau suivant décompose les résultats du tableau ci-dessus deuxième partie : (108) gutturales vélaires labiales total noncoronales coronales obstruantes coronales sonantes total coronales cooccurrences de consonnes identiques nonadjacentes O (racines E (racines rapport effectives) attendues) O/E 0 16 0.00 1 14 0.07 2 22 0.09 cooccurrences de C non-identiques de même classe non-adjacentes O (racines E (racines rapport effectives) attendues) O/E 6 33 0.18 3 59 0.05 16 46 0.35 3 52 0.06 25 138 0.18 7 30 0.23 105 132 0.80 2 43 0.05 104 97 1.07 9 73 0.12 209 229 0.91 Deux coronales obstruantes identiques ont vingt fois plus de chances de se trouver en contact dans la même racine que deux gutturales, deux vélaires ou deux labiales identiques. On remarquera cependant que les labiales sont davantage susceptibles de subir cette intimité que deux coronales sonantes (0.09 contre 0.05). Si l'on observe maintenant le comportement des consonnes non-identiques non-adjacentes, le caractère relativement libre des coronales, 137 Chapitre 2 – Le caractère particulier des consonnes coronales obstruantes comme sonantes, est encore une fois mis en lumière : "as usual, among the coronals the prohibition is weaker". L'étude de la cooccurrence de segments homorganiques, voire identiques, a une fois de plus mis en exergue un comportement particulier des coronales par rapport aux autres consonnes, fussent-elles glottales. La section suivante envisage un huitième argument en faveur de la spécificité des coronales : le choix d'un allomorphe en fonction de la dernière consonne radicale (qui n'est pas sans rappeler les données fournies par Plénat sur la dérivation à l'aide de suffixes évaluatifs détaillées dans le chapitre 1 section 3). 2.8. Dérivation ? Buckley (2000) mentionne une autre particularité des consonnes coronales, en rapport cette fois avec leur position dans le mot. En kashaya, langue amérindienne pomœnne parlée en Californie du nord, le morphème d'"acte pluriel" connaît plusieurs allomorphes, pour lesquels la détermination est partiellement définie dans le lexique, mais dont la position relative dans le mot dépend du dernier son du radical. En ce qui concerne l'allomorphe [ta] : a - si le radical se termine par une consonne coronale, l'allomorphe [ta] est suffixé ; b - si le radical se termine par une consonne non coronale, l'allomorphe [ta] est infixé. (109) nature de la consonne finale du radical l coronales n non m coronales q radical dahqotolditanbilaqhamsima:q- radical + allomorphe infixal bilaqha-ta-msima-ta-q radical + allomorphe suffixal dahqotol-taditan-ta glose "échouer" "contusionner" "nourrir" "aller dormir" Ces données ne suffisent cependant pas à prouver qu'il s'agit d'une particularité des consonnes coronales par rapport aux autres types de consonnes : la détermination contextuelle peut être dans le cas présent liée à l'identité de la consonne du morphème dérivationnel, qui requerrait une consonne de même lieu d'articulation à sa gauche pour être suffixé. Il serait donc nécessaire de contrôler que d'autres allomorphes ou d'autres morphèmes dérivationnels commençant par une consonne d'un autre lieu d'articulation sont soumis au même conditionnement. Si un morphème se réalisant [ba] ou [ka] se comporte de la même manière que [ta], à savoir suffixé derrière une consonne coronale et infixé si le radical se termine par 138 Chapitre 2 – Le caractère particulier des consonnes coronales une consonne autre que coronale, alors la particularité des coronales est une fois encore mise en exergue. Si au contraire un morphème de réalisation [ba] se comporte parallèlement à [ta] mais en fonction de la labialité de la dernière consonne radicale, c'est-à-dire qu'il sélectionne les finales labiales pour l'allomorphe suffixal et réserve l'allomorphe infixal aux bases dont les finales ne sont pas coronales, alors les coronales ne sont pas spécifiques par rapport aux consonnes des autres lieux d'articulation. Buckley (2000) ne donne pas dans son article d'information permettant de statuer de manière définitive sur le statut des coronales en kashaya. L'argument dérivationnel n'est ici pas complet, mais il est serait intéressant de l'évaluer au moyen des données manquantes de façon à déterminer s'il s'agit là d'un critère de plus permettant de distinguer les coronales des autres consonnes. Le dernier argument présenté ici concerne les coronales en regard de l'aphasie. 2.9. Aphasie L'aphasie est définie par Pellat (1995) comme un "trouble du langage (atteinte des règles linguistiques nécessaires à l'expression et à la compréhension) en rapport avec une lésion cérébrale (hémisphère gauche chez le droitier)". J'envisagerai ici l'apport de l'aphasie dans la discussion sous trois angles différents : la substitution, la syncope et l'épenthèse dans le discours aphasique. 2.9.1. Substitution Le statut particulier des coronales dans le discours aphasique a été mis en exergue par Puel et al. (1980 : 253) dans une étude portant sur les erreurs de substitution produites par un patient de langue française atteint d'anarthrie39. Les segments alvéodentaux /t/, /d/, /s/ et /z/ étaient significativement les plus fréquemment employés en substitution d'autres segments. 39 L'anarthrie se manifeste par la difficulté à synchroniser les mouvements nécessaires pour réaliser les sons, ceux réalisés étant parfois altérés. Exemples : [pø] pour [blø], [pati] pour [pati], etc. 139 Chapitre 2 – Le caractère particulier des consonnes coronales 2.9.2. Syncope Les coronales sont les consonnes les plus fréquemment syncopées dans le discours aphasique de locuteurs de langue française, selon Béland & Favreau (1991 : 214-216). Ceuxci présentent une comparaison des syncopes consonantiques à partir de deux corpus. Le corpus A (Béland, 1985) porte sur 58 locuteurs français, la moitié d'entre eux étant aphasiques ; les tâches proposées consistaient en la répétition et la lecture à voix haute de 321 mots. (110) résultats corpus A initiale de mot dans les mots de départ syncopées intervocalique dans les mots de départ syncopées finale de mot dans les mots de départ syncopées labiales coronales vélaires total 40.5% 17.8% 48.9% 78.5% 10.4% 3.6% 99.8 % 99.9 % 33.5% 0 58.3% 100% 8.02% 0 99.82 % 100 % 12.06% 5.6% 79.3% 79.2% 8.6% 15.1% 99.96 % 99.9 % Les sujets aphasiques réalisent systématiquement la syncope des coronales fournies dans les mots de départ à l'intervocalique, qu'on leur demande de lire ou de répéter. En revanche, ils ne syncopent aucune labiale ni aucune vélaire dans cette même position. Les résultats à l'initiale de mot et à la finale sont moins impressionnants mais tout aussi révélateurs : près de quatre consonnes sur cinq syncopées sont coronales dans chacun de ces deux contextes, mais moins d'une labiale ou d'une vélaire sur cinq. En outre, on notera que les vélaires sont davantage syncopées en finale que les labiales, mais que celles-ci sont moins maintenues à l'initiale que les vélaires. Le corpus B (Favreau, 1989) a été construit à l'aide de quatre sujets aphasiques, ayant pour tâche de répéter 144 mots dont 96 réels. (111) résultats corpus A initiale de mot dans les mots de départ syncopées intervocalique dans les mots de départ syncopées finale de mot dans les mots de départ syncopées labiales coronales vélaires total 52.4% 0 39% 100% 8.5% 0 99.9 % 100 % 28.7% 0 62% 0 9.2% 0 99.9 % 5.4% 0 86.4% 85.7% 8.1% 14.2% 99.9 % 99.9 % 140 Chapitre 2 – Le caractère particulier des consonnes coronales Cette fois-ci c'est l'initiale de mot qui distingue les coronales : toutes les syncopes réalisées dans cette position concernent les coronales. A l'intervocalique en revanche, les coronales ne déclenchent aucune syncope, au même titre que les deux autres catégories de consonnes. En finale, les coronales syncopées représentent plus de 85 % de l'ensemble des consonnes syncopées (on remarquera d'ailleurs que les 15 % restants concernent les vélaires mais aucune labiale). Dans les deux corpus, il ressort que les syncopes les plus fréquentes sont le fait des coronales, sans que l'on puisse distinguer plus précisément un contexte particulier puisque dans un cas c'est l'intervocalique qui semble favoriser la syncope, dans l'autre c'est l'initiale de mot. Outre par le biais de la substitution et de la syncope, l'aphasie témoigne du comportement particulier des coronales dans les phénomènes d'épenthèse. 2.9.3. Epenthèse Béland & Favreau (1991 : 212) ont mis en parallèle les fréquences des épenthèses labiales, coronales et vélaires40, attendues (selon le nombre de coronales par rapport à l'ensemble des consonnes du français, soit (9/17) x 100) et observées dans le discours aphasique : (112) labiales coronales vélaires attendues observées à l'initiale de mot 29.4% 52.9% 17.6% 22.4% 4.1% à l'intervocalique41 7% en finale de mot 7.3% total 12.8% 73.5% ex : hublot [tublo] 81.3% ex : union [ynit] 81.3% ex : aspect [aspn] 79.7% 11.6% 7.3% 7.5% On constate davantage de coronales qu'il n'était prévu, particulièrement à l'intervocalique et à la finale, et corollairement moins de labiales et de vélaires. Le tableau 40 Les épenthèses de // et /h/ ne sont pas prises en compte. Le fait que l'intervocalique corresponde à un hiatus intérieur de morphème n'est pas clairement indiqué mais ressort des exemples fournis par les auteurs. 41 141 Chapitre 2 – Le caractère particulier des consonnes coronales met également en relief le comportement particulier des labiales à l'intervocalique : elles sont fort peu présentes, alors que les vélaires sont comparativement plus représentées. De la même manière, il est possible de distinguer à l'intérieur de la classe des coronales la sous-classe la plus représentée : (113) attendues observées à l'initiale de mot à l'intervocalique en finale de mot total /t, d, n, l, r/42 55.55% 22.22% /s, z/ 22.22% /, / 88.88% 97.1% 51.4% 79.2% 5.55% 0 37.1% 14.2% 5.55% 2.9% 11.4% 6.6% Cette ramification des données permet de mettre en exergue la prépondérance, dans un discours aphasique, des épenthèses de coronales antérieures non fricatives par rapport aux fricatives antérieures et aux post-alvéolaires, à l'initiale et à l'intervocalique. En revanche, en finale de mot ces coronales sont moins représentées que prévu, au profit des fricatives antérieures /s/ et /z/. Quoi qu'il en soit, ce sont les fricatives antérieures qui ont la préférence quand il s'agit d'épenthèse. 42 On remarquera que /r/ fait partie de l'inventaire pris en compte ici, alors que je l'ai exclu de l'analyse. Cependant, les résultats étant massifs, je ne pense pas que sa prise en compte les remette en question. 142 Chapitre 2 – Le caractère particulier des consonnes coronales 2.10. Bilan sur la singularité des coronales Le tableau ci-dessous récapitule les motifs répertoriés pour l'établissement de la singularité de la classe des coronales en regard des consonnes des autres lieux d'articulation. (114) critère fréquence dans les langues du monde fréquence intralinguistique section 2.1.1. 2.1.2. fréquence dans l'inventaire détail les coronales sont présentes dans toutes les langues répertoriées, en dehors du hawaïen. dans une langue donnée, beaucoup plus de lieux d'articulation sont distinctifs au sein de la classe des coronales que dans les autres. trois fois plus de coronales que de labiales ou de vélaires sont dénombrées dans 2.1.3. l'API. 2.1.4. les consonnes les plus attestées dans le discours sont les coronales. universel des sons dans le discours dans leur distribution transparence assimilation neutralisation marque et implication chute 2.1.5. 2.2. 2.3. 2.4. 2.5. 2.6. co-occurrence les coronales sont bien plus susceptibles de se trouver en finale de mot que les autres catégories de consonnes. les coronales sont transparentes à la propagation, au contraire des labiales et des vélaires. les coronales sont les consonnes les plus souvent assimilées dans les langues, y compris lors de l'acquisition. les neutralisations s'observent en coronales ou glottales, jamais en labiales ou en vélaires. la présence de consonnes non coronales dans une langue suppose celles des coronales, mais la réciproque n'est pas vraie. les coronales sont soit les seules à chuter, soit les seules à se maintenir dans une langue et dans une position données. dans les langues gabaritiques, alors que les séquences de deux consonnes 2.7. homorganiques au sein d'un même mot sont prohibées, on en trouve tout de même s'il s'agit de coronales. dérivation substitution dans l'aphasie syncope et aphasie épenthèse et aphasie 2.8. 2.9.1. 2.9.2. 2.9.3. les coronales sélectionneraient des allomorphes particuliers. les coronales sont plus souvent employées en substitution à d'autres segments que les consonnes des autres lieux d'articulation. les coronales sont les consonnes les plus souvent syncopées, quelle que soit leur position dans le mot. les coronales sont les consonnes les plus souvent épenthésées, où que l'épenthèse se situe dans le mot. 143 Chapitre 2 – Le caractère particulier des consonnes coronales Chaque motif d'isolation des coronales par rapport aux autres types de consonnes (labiale et vélaire) est insuffisant, pris séparément, pour cataloguer les coronales comme les consonnes les moins marquées : ce sont les plus fréquentes mais pas dans tous les types de fréquences, ce sont les premières acquises mais à égalité avec les labiales, les coronales sont transparentes mais les vélaires peuvent l'être aussi… C'est le faisceau de particularités centré sur les consonnes coronales plus que la valeur de chaque motif pris séparément qui permet de placer, dans les langues du monde, les coronales en concurrence avec le coup de glotte pour le titre de "consonne la moins marquée". La particularité des coronales étant maintenant établie, examinons à présent la manière dont les théories phonologiques ont choisi de l'implémenter, ou au contraire de ne pas la représenter. 3. Le statut particulier des coronales : les théories génératives La phonologie générative a pour acte de naissance The Sound Pattern of English de Chomsky & Halle (dorénavant SPE) en 1968. Le générativisme s'appuie sur le distributionnalisme mais en rejette la notion de corpus fini pour lui substituer une approche dynamique, basée sur la capacité de création de toute langue. La phonologie générative prolonge la syntaxe générative transformationnelle (Chomsky 1965). Le SPE sera a son tour remis en question au sein même de la phonologie générative, non pour ce principe de dynamisme de la langue, mais pour les notions de linéarité des représentations et de règles cycliques d'une part, de manque de structuration interne des éléments d'autre part. Pour reprendre les termes de Durand & Katamba (1995 : XIII), "during the 1970s and the 1980s a fairly radical reconfiguration of the fields of phonology took place, largely against the backdrop of Chomsky & Halle The Sound Pattern of English (1968)". On date généralement le début "officiel" des théories phonologiques autosegmentales à Goldsmith (1976). La plupart des théories phonologiques post-SPE supposeront en effet plusieurs niveaux ou lignes autosegmentales (ligne tonale, niveau squelettal indiquant les positions, niveau mélodique, etc.) et tenteront de déduire directement les représentations phonétiques des structures phonologiques. Elles s'inscrivent à la fois dans le cadre des approches 144 Chapitre 2 – Le caractère particulier des consonnes coronales multilinéaires et dans celui des théories "Principes et Paramètres", selon lesquelles chaque langue possède un système phonologique propre mais qui s'inscrit en même temps à l'intérieur d'un schéma universel unique. A cette étape de l'exposé nous nous intéressons à la structure interne des segments, pour tâcher de définir si les théories phonologiques à notre disposition font état de cette particularité des coronales établie plus haut. C'est pourquoi je n'aborderai pas dans cette partie des théories comme la Phonologie Lexicale, qui n'est pas une théorie de la substance mélodique. Je commencerai par un rappel rapide des traits saillants de Chomsky & Halle (1968) pertinents pour la discussion, avant de discuter plus précisément plusieurs cadres théoriques postérieurs. 3.1. Chomsky & Halle (1968) L'entrée lexicale d'un terme ne doit comporter que les éléments informatifs, ce qui relève d'un phénomène régulier doit en être exclu. Cette idée sera plus tard reprise par la sousspécification, cf. section 3.2.2. D'autre part, il faut trouver un moyen de référer aux classes naturelles de sons de manière simple. De ce fait, la primitive postulée par Chomsky & Halle (1968) n'est pas le phonème, mais le trait distinctif ; le phonème en effet n'est plus vu comme une entité indivisible mais comme une matrice de traits. Les traits distinctifs se manifestent à trois niveaux de la grammaire de Chomsky & Halle (1968) : la structure de surface (assignée par la syntaxe), la composante phonologique (ensemble de règles assignant une interprétation phonétique contextuelle aux représentations générées par la structure de surface), l'interprétation phonétique. Ces traits, toujours présents dans la matrice correspondant à un phonème, sont binaires car classificatoires : un son appartient ou non à la classe naturelle correspondante. Chomsky & Halle reprennent en cela la théorie des traits distinctifs de Jakobson (1941) basée sur les principes de binarité des traits et de distinction entre les traits phonétiques - potentiellement redondants - et les traits phonologiques - distinctifs ; parmi l'ensemble des traits universels, donc appartenant à la grammaire universelle, seul un petit nombre permet de différencier les phonèmes d'une langue donnée. Jakobson avait dressé un inventaire de douze traits distinctifs, définis en termes acoustiques. Chomsky & Halle quant à eux définissent un peu plus d'une dizaine de traits sur la base de corrélaires articulatoires et non plus acoustiques, sans pour autant donner à cet aspect phonétique des traits sa pleine 145 Chapitre 2 – Le caractère particulier des consonnes coronales valeur : la phonologie s'occupant des représentations structurales, il est nécessaire de simplifier le répertoire des traits par rapport à la phonétique. Cette simplification passe par l'élimination des traits redondants (par exemple, les traits [oral] et [nasal] étant en distribution complémentaire, on peut en supprimer un). En ce qui concerne les traits relatifs au lieu d'articulation des consonnes, Chomsky & Halle (1968) retiennent les traits antérieur, coronal, haut et arrière, définis de la manière suivante : - antérieur : est [+antérieur] un son pour lequel le principal obstacle au passage de l'air n'est pas plus en arrière dans la bouche que les alvéoles. Les labiales, dentales et alvéolaires sont [+antérieur] ; à partir des post-alvéolaires ([t],[d]), les consonnes sont [-antérieures]. - coronal : le trait [+coronal] caractérise les phonèmes réalisés avec un relèvement de la langue dans la cavité buccale par rapport à la position neutre. Seront donc [+coronales] les consonnes dentales, alvéolaires et post-alvéolaires, et [-coronales] les labiales, palatales, vélaires, uvulaires et pharyngales. - haut : si un son est articulé la masse de la langue relevée au maximum dans la bouche, il sera [+haut]. Les consonnes post-alvéolaires, palatales et vélaires sont alors [+haut]. - arrière : lorsque la masse de la langue est ramenée en arrière de la bouche comme pour les vélaires, les sons sont [+arrière]. Pour les consonnes on obtient les définitions de classes naturelles en traits suivantes : +ant (pharyngales) (uvulaires) vélaires palatales postalvéolaires alvéolaires dentales bilabiales labio-dentales (115) -ant -cor +cor -haut -cor +haut -arr -haut +arr Dans ce modèle, les coronales ne se voient pas attribuer un statut particulier en ce qui concerne le nombre de traits présents dans la matrice, mais elles se distinguent tout de même par l'apparition d'un trait qui leur est propre. On remarquera à cet endroit d'une part que Chomsky & Halle (1968) excluent les palatales de l'ensemble des coronales, d'autre part qu'ils ne fournissent pas de moyen pour distinguer entre les dentales et les alvéolaires. 146 Chapitre 2 – Le caractère particulier des consonnes coronales Je vais considérer dans ce qui suit quatre théories, plus ou moins directement inspirées de Chomsky & Halle (1968), qui se sont développées dans les années 80. Au niveau infrasegmental, c'est-à-dire en ce qui concerne l'organisation interne des segments, ces théories ont pour point commun l'objectif de fédérer certains traits, contrastant en cela avec les traits "en vrac", non classés, de SPE. Comme le récapitulent Anderson & Ewen (1987 : 255) dans leur ouvrage de présentation de la Phonologie de Dépendance, "the framework of SPE is minimally componential in that there is no attempt to organise the phonological primitives into subgroupings within the segmental feature matrix, nor is there any variety in the type of relationships holding between the primitives in the model; i.e. all segments are characterised by an unordered set of features, each of which can have only the value '+' or '-' at least phonologically." Ces quatre théories ne sont pas sur un pied d'égalité en ce qui concerne leur héritage par rapport à Chomsky & Halle (1968). En effet on distinguera d'une part la Géométrie des Traits (Clements 1985), beaucoup plus directement enracinée dans Chomsky & Halle (1968) et qui a en gardé la notion de traits distinctifs, et d'autre part la Phonologie des Particules (Schane 1984), la Phonologie de Dépendance (Anderson & Ewen 1987) et la Phonologie de Gouvernement (Kaye et al. 1985, 1990), qui ont préféré des primitives monovalentes aux traits binaires exploités dans le modèle de 1968. (116) Primitives polyvalentes, en traits distinctifs Géométrie des Traits Clements (1985) Primitives monovalentes, plus grandes que de simples traits Phonologie des Particules Schane (1984) Phonologie de Dépendance Anderson & Ewen (1987) Phonologie de Gouvernement Kaye & al. (1985) Nous allons commencer avec la Géométrie des Traits, considérée comme le modèle standard, et passerons dans un deuxième temps aux cadres, minoritaires, privilégiant les primitives monovalentes. 3.2. Géométrie des Traits Cette présentation du cadre s'organisera de la manière suivante : dans un premier temps, j'expliciterai le fonctionnement du cadre au niveau suprasegmental, c'est-à-dire de la structure interne des éléments, en mettant en évidence les particularités de la Géométrie des Traits. Dans une deuxième partie, je présenterai la théorie de la sous-spécification qui, si elle 147 Chapitre 2 – Le caractère particulier des consonnes coronales n'est pas partie intégrante du modèle et se trouve d'ailleurs dans d'autres cadres, joue un rôle important dans la représentation des éléments en Géométrie des Traits. 3.2.1. Structure interne des éléments La Géométrie des traits (Clements 1985, 1993, Sagey 1986, Clements & Hume 1995) a été développée en réaction à deux imperfections de Chomsky & Halle (1968) : le caractère amorphe et non structuré des traits à l'intérieur des matrices, et la surgénération du système, capable de rendre compte des phénomènes possibles comme de ceux qui ne sont jamais attestés. "What has been lacking, in other words, is an adequate way of capturing the notion natural class of features - features that tend to function together as units, to the exclusion of others, in linguistic rules." (Clements 1987 : 30). Ce cadre phonologique a vu le jour dans les années 80, plus précisément avec Clements (1985). Les traits distinctifs constituent donc dans ce cadre un ensemble hiérarchiquement organisé : certains traits fonctionnent ensemble, c'est-à-dire que si un processus phonologique (assimilation par exemple) en modifie un, d'autres seront automatiquement touchés. Les traits se propageant ou s'effaçant en groupe doivent donc constituer un nœud à un niveau supérieur. "If we find that certain sets of features consistently behave as a unit with respect to certain types of rules of assimilation or resequencing, we have good reasons to suppose that they constitute a unit in phonological representation, independently of the actual operation of the rules themselves." (Clements 1985 : 226). C'est pourquoi les traits sont regroupés en "nœuds" en fonction de leur degré d'intimité dans les processus phonologiques, ce qui aboutit à une représentation en arbres dans lesquels "segments are represented in terms of hierarchicallyorganized node configurations whose terminal nodes are feature values, and whose intermediate nodes represent constituents" (Clements & Hume 1995 : 249). Les éléments terminaux, c'est-à-dire les traits, ne sont pas ordonnés et sont placés à des niveaux séparés (Clements & Hume 1995 : 249-251). Il existe une structure universelle qui regroupe les traits en nœuds de classe43 ("class nodes", Clements 1985), qui à leur tour se hiérarchisent pour former un segment. Clements & Hume (1995 : 270) justifient ainsi la création d'un nœud de place : "In rules of place assimilation, the oral tract place features [labial], [coronal] and [dorsal] and their dependents spread as a single unit, independently of stricture features such as [continuant], [vocoid], and 43 Egalement appelés nœuds organisants ("organising nodes", Avery & Rice 1989). 148 Chapitre 2 – Le caractère particulier des consonnes coronales [sonorant]. We may capture this fact by grouping them under a single place node". Si l'on reprend l'assimilation en catalan développée dans la partie précédente dans cette optique, le but de la Géométrie des Traits est donc de rendre compte du fait que la nasale coronale s'assimile du lieu d'articulation de la consonne suivante – labiale, labio-dentale, coronale, vélaire – mais pas son mode d'articulation : elle ne perd pas pour autant sa nasalité ni son voisement, comme on peut le constater dans le tableau illustratif suivant : (117) /n/ alvéolaire "témoin" labiale so[n] amics so[m] pocs "ils sont amis" "ils sont peu" labio-dentale so[] felios "ils sont heureux" alvéolaire vélaire so[n] sincers so[] rans "ils sont sincères" "ils sont grands" Cette représentation hiérarchique fait la prédiction que certains traits fonctionneront toujours ensemble et d'autres jamais, ce qui restreint l'inventaire des processus phonologiques possibles. Les nœuds de classe sont unaires ou monovalents : soit ils sont présents, soit ils sont absents, étant entendu que ne peut se propager que ce qui est présent. Les traits en revanche comportent deux valeurs : + et - (ce qui a été vivement critiqué du fait que cette prétendue binarité cache en réalité un système à trois possibilités : absence du trait, valeur + et valeur - ; cf. section 1.1.1). Enfin, cette organisation des traits se retrouve à tous les niveaux de la dérivation, ce qui signifie que les règles phonologiques ne peuvent pas créer de nouveaux types d'organisation de traits. La hiérarchie des traits opère comme un gabarit définissant la bonne formation des segments tout au long de la dérivation. La représentation d'un segment en Géométrie des Traits, une fois ces quelques idées de base établies, ne fait pas l'unanimité : tous les linguistes de ce cadre en effet ne reconnaissent pas les mêmes nœuds, ni ne sont d'accord quant aux traits à exploiter, notamment en ce qui concerne le lieu de place (cf. notamment Yip 1989 : 349). Je présenterai ici un cadre général, adapté de Sagey (1986 : 12), qui permettra de suivre la discussion : 149 Chapitre 2 – Le caractère particulier des consonnes coronales (118) X nœud racine [continu] [consonantique] nœud laryngal [spread] [constr] [slack] [stiff] nœud supralaryngal palais mou [nasal] nœud de place labial [arrondi] coronal dorsal [antérieur] [distribué] [haut] [bas] [arrière] X indique le point squelettal lié au constituant syllabique auquel se rattache la structure : la Géométrie des Traits utilise une représentation standard de la syllabe, à savoir une attaque suivie d'une rime, elle-même comprenant un noyau suivi d'une coda, facultative. Chaque nœud syllabique terminal domine une unité du niveau squelettal, qui à son tour domine le nœud racine44 (RN). 44 Celui-ci est considéré dans certaines versions du modèle (McCarthy 1988, Yip 1989) comme constitué des traits [sonant] et [consonantique]. Que cela soit le cas ou non n’est cependant pas pertinent pour cette présentation. 150 Chapitre 2 – Le caractère particulier des consonnes coronales (119) syllabe attaque rime noyau coda | | X X X | | | RN RN RN Toutes les branches majeures de l'arbre sont issues du nœud racine : les nœuds laryngal et suprasegmental, sur lesquels je vais revenir, et les traits [continu] et [consonantique], qui ne sont pas dominés par des constituants articulatoires puisqu'ils ne sont pas exécutés par un articulateur particulier. [-continu] indique s'il s'agit d'un élément occlusif, [+continu] renvoie à un élément fricatif, sonant ou vocalique. De la même manière, le trait [consonantique] prendra la valeur positive pour une consonne, négative pour une voyelle. Le nœud laryngal (LN) domine les traits correspondant aux modes articulatoires. Ainsi domine-t-il [spread glottis], qui caractérise les segments aspirés s'il prend la valeur positive, et [constricted glottis], positif pour les éjectives et les implosives. Le voisement est quant à lui exprimé par les deux traits [slack] et [stiff], correspondant respectivement à voisé et non voisé, également dominés par le nœud laryngal. Le nœud supra-laryngal fédère le nœud palais mou, dominant le trait [nasal], et le nœud de place. Ce dernier va déterminer le lieu d'articulation du segment considéré, les traits qu'il domine "changing the shape of the resonator" (Sagey 1986 : 15). Dans le modèle présenté ici sont distingués trois sous-nœuds : - le nœud labial, indiquant s'il est impliqué que l'articulateur effectif du segment considéré est constitué par les lèvres (cf. Clements & Hume 1995 : 252) ; ce nœud domine le trait [arrondi], qui prend la valeur positive dans le cas d'un segment arrondi. - le nœud dorsal, présent si c'est le corps de la langue l'articulateur effectif ; trois traits viennent préciser l'articulation d'un segment dorsal : [haut] pour les sons articulés avec le corpus de la langue relevé par rapport à la position neutre, [arrière] et [bas] prenant la valeur positive respectivement pour les sons articulés la langue en arrière ou en bas par rapport à sa position neutre. 151 Chapitre 2 – Le caractère particulier des consonnes coronales Il faut noter à cet endroit que nombre de géomètres (Paradis & Prunet 1989, Hall 2001 par exemple) choisissent de rassembler les nœuds labial et dorsal en un seul, le nœud périphérique, du fait que "labials and velars form a natural class" par contraste avec celui des coronales (Hall 1997 : 25-26). Je reviendrai sur ce nœud périphérique un peu plus loin dans l'exposé. - le nœud coronal (impliquant l'avant de la langue, soit l'apex et la lame, cf. partie phonétique) dominant les deux sous-distinctions que sont l'antériorité et la distributivité. Les règles phonologiques en Géométrie des traits sont essentiellement de trois types (parfois davantage selon les différentes versions de la théorie, mais cela ne change rien aux buts de cette présentation) : - propagation (cf. Avery & Rice 1989 : 181, Clements & Hume 1995 : 257-259) : un nœud peut se propager d'un segment A vers un segment B si et seulement si une cible structurale est présente dans le segment B, c'est-à-dire si une position vide peut l'accueillir. B aura alors tout (assimilation totale) ou partie (assimilation partielle) des traits de A, selon que le nœud qui s'est propagé est plus ou moins haut dans la représentation. Ainsi si le nœud supralaryngal (SLN) d'un segment A se propage sur un segment B, celui-ci héritera-t-il non seulement du lieu d'articulation mais également du caractère nasal (ou non) du segment A ; en revanche, si seul le nœud de place (PN) par exemple se propage sur le segment B, celui-ci gardera son mode articulatoire et ne se verra imposé que le lieu d'articulation du segment A. - fusion : peuvent fusionner deux nœuds identiques d'un segment A et d'un segment B à condition que les nœuds secondaires, "en-dessous", soient également identiques. ; "both nodes do not dominate different secondary nodes" (Avery & Rice 1989 : 181). - déliaison (cf. Clements & Hume 1995 : 261-263, Avery & Rice 1989 : 182) : dans des positions neutralisantes, par exemple en coda, certains nœuds peuvent se délier, étant par la suite "deleted through a general convention". La déliaison explique notamment les cas de dissimilation (cf. Clements & Hume 1995 : 262-263 pour une illustration). Elle peut s'accompagner de l'effacement du trait délié, puis d'une insertion par défaut dans les cas de neutralisation (Clements & Hume 1995 : 264). Par ailleurs, entre le lexique et la réalisation phonétique d'un segment sous-spécifié, trois types de règles peuvent rendre compte du remplissage d'un segment sous-spécifié (cf. Keating 1988). 152 Chapitre 2 – Le caractère particulier des consonnes coronales - Le premier comprend les règles de remplissage, s'appliquant indépendamment de tout contexte et se basant sur les valeurs des autres traits déjà présentes dans la matrice du segment. C'est ce type de règles qui s'occupe de la redondance phonétique : si un segment est sonant, alors il est nécessairement [+voisé] ; autre possibilité : si seuls les segments [+voisés] sont sous-jacents, ceux qui ne sont pas spécifiés seront [-voisés]. - Le second type de règles sera formé de l'ensemble des règles de position. Il s'agit des règles qui déterminent la valeur des traits en fonction de la place du segment considéré dans la chaîne ou dans la structure de la syllabe, mais sans faire référence au contexte mélodique. L'exemple de Keating (1988) est emprunté à Stevens et al. (1986) : [+spread glottis] déclenche [-voisé] en anglais en début de syllabe ou de mot, et [+nasal] provoque [+voisé] à l'intervocalique, quelles que soient les voyelles du contexte. - Les règles contextuelles remplissent quant à elles les valeurs des traits d'un segment précisément en fonction des valeurs des segments voisins pour ces mêmes traits. Ce sont les règles qui opèrent dans les cas d'assimilation et de dissimilation. C'est dans cette catégorie que l'on trouvera par exemple la règle qui assigne la valeur positive au trait [vélaire] d'une consonne en contact avec une voyelle d'arrière. Après cette mise en place du cadre de la Géométrie des Traits dans l'optique de rendre compte de la manière dont il représente les coronales et leur statut particulier, intéressonsnous un instant au concept de sous-spécification, qui va permettre précisément de distinguer les coronales des autres classes de consonnes. 3.2.2. La sous-spécification Le principe de sous-spécification d'un segment n'est pas obligatoirement lié à la Géométrie des Traits. Dès 1975 par exemple, Kean (1975 : 48) propose une théorie universelle de la marque dans laquelle /t/ est universellement la consonne la moins marquée, et coronal l'articulation non-marquée. Par ailleurs, tous les phonologues travaillant en Géométrie des Traits ne reconnaissent pas la sous-spécification : outre Hall (1997 : 30-32) par exemple qui récuse explicitement l'idée de la sous-spécification des coronales, Lightner (1963) et Stanley (1967) parmi d'autres rejettent le principe même de sous-spécification du fait que "to omit specifications entailed allowing binary features to create a ternary contrast among segments". Pour ces derniers, la 153 Chapitre 2 – Le caractère particulier des consonnes coronales sous-spécification cache en réalité une opposition à trois degrés : valeur positive liée à un trait, valeur négative, ou absence du trait. Bien que la notion de sous-spécification soit indépendante du cadre de la Géométrie des Traits, c'est ce cadre qui l'a majoritairement exploitée. En Géométrie des Traits, la sousspécification est intimement liée au contrôle des valeurs des traits. La sous-spécification, selon Archangeli (1988), part du principe qu'un des critères d'évaluation d'une bonne grammaire est le fait que seules les propriétés idiosyncratiques sont listées dans le lexique (cf. entre autres Chomsky & Halle 1968 "Underlying representations may not contain the specification of predictable information" ; également Mohanan 1991 : 285). Dans le lexique d'une "bonne grammaire" donc, il ne faudrait pas trouver d'élément prévisible ("There is […] general consensus among most proponents of underspecification that redundant feature values are absent underlyingly" Hume 1994 : 21). De ce fait, la sousspécification est à la fois théoriquement possible et empiriquement désirable (Archangeli 1988). Pour Hall (2001 : 17ss), les représentations sous-spécifiées cumulent au moins les deux atouts suivants : "(i) underspecification allows one to eliminate redundancies and (ii) underspecification explains transparency to spreading and the failure to initiate spreading". En ce qui concerne ce dernier point, un trait non spécifié dans le lexique ne pourra en effet pas se propager, précisément parce qu'il n'est pas présent dans le lexique : comment propager un élément absent ? De la même manière, comment un élément absent pourrait-il déclencher une propagation ? Selon Archangeli & Gagnon (1984 : 174), la consonne par défaut en français est /t/, "the universally unmarked segment." Béland & Favreau (1991 : 211) cependant, s'appuyant sur des données relatives au discours aphasique, considèrent que "there is no obvious epenthetic consonant segment" en français. On distinguera trois approches de la sous-spécification développées parallèlement à la Géométrie des Traits : - la sous-spécification radicale, selon laquelle seuls les traits marqués à l'intérieur d'une théorie universelle de la marque sont présents. - la spécification contrastive, basée sur la notion de redondance à l'intérieur d'un système phonologique donné. - la spécification contrastive modifiée, héritière des deux variantes précédentes. 154 Chapitre 2 – Le caractère particulier des consonnes coronales 3.2.2.1. Sous-spécification radicale et marque Sous cette approche (Kiparsky 1982, 1985, Archangeli 1984, 1988, Pulleyblank 1988, Grignon 1984, Archangeli & Pulleyblank 1986, Paradis & Prunet 1989, Mohanan 1991, Steriade 1995), la sous-spécification se rattache à la notion de marque, élaborée à l'intérieur d'une théorie de la marque universelle et non intralinguistique. 3.2.2.1.1. La notion de marque La notion de marque, bien que souvent exploitée en phonologie depuis sa définition par l'école de Prague (cf. Brandão De Carvalho 1997 pour une présentation de l'historique et de la problématique de la marque), n'est pas si aisée à définir que son utilisation très répandue le laisserait penser. Rice (1999a : 3) a recensé dans la littérature, de Jakobson et Troubetzkoy aux ouvrages actuels, les expressions suivantes liées à la notion de marque : (120) marked less natural more complex more specific less common unexpected not basic less stable appear in few grammars later in language acquisition subject to neutralization early loss in language deficit implies unmarked feature harder to articulate perceptually more salient unmarked more natural simpler more general more common expected basic stable appear in more grammars earlier in language acquisition result of neutralization late loss in language deficit implied by marked feature easier to articulate perceptually less salient La plupart de ces expressions mériteraient à leur tour une définition, tant leur degré de précision est faible ou sujet à interprétation : qu'est-ce qu'un trait "attendu" ? Comment définir ce qui est "naturel" ? Rice récapitule les principaux "diagnostics" phonologiques qui permettent de déterminer les relations de marque à l'intérieur d'une classe de traits : - la neutralisation, par exemple du voisement en coda : les éléments se neutralisent en l'élément le moins marqué (cf. section 2.4 pour l'illustration en regard du lieu d'articulation) ; - l'épenthèse et la réduplication : l'absence des éléments épenthésés des formes sous-jacentes "makes such segments excellent candidates for unmarked features as insertion might be expected to provide the least marked features" (Rice 1999a : 4). Cependant, la variation que l'on peut trouver dans certaines langues en ce qui concerne la réalisation de l'élément 155 Chapitre 2 – Le caractère particulier des consonnes coronales épenthésé fragilise partiellement l'épenthèse et la réduplication en tant qu'indicateurs d'éléments non-marqués : "briefly, epenthetic vowels can be front, central, or back in place and high, mid, or low in height; epenthetic consonants are drawn from laryngeal, coronal, and velar places of articulation; they can be obstruents or sonorants. Clearly, the emergence of the unmarked does not yield a single clear statement on any dimension" (Rice 1999a : 6) ; - les asymétries dans l'assimilation : "the marked features within a class are active - these features transmit; the unmarked features, on the other hand, are passive, or inert - these do not transmit to other segments but are overridden by other features" ; - la chute et la coalescence, processus dans lesquels "marked features within a class are maintained and unmarked features lost". - l'assimilation non locale : les traits non-marqués peuvent être transparents à l'assimilation, ce qui aboutit à une assimilation à distance, alors que les traits marqués bloquent cette assimilation. Cependant, la classification d'un trait en tant que marqué ou non-marqué n'est pas si simple qu'il peut sembler au premier abord, du fait que "the unmarked feature within a class is not constant". La valeur d'un trait dépend en effet : - de la position du phonème correspondant à ce trait dans la syllabe, dans le pied, dans le morphème ou dans le mot notamment ; - du système dans lequel il se trouve en relation ; - à l'intérieur de deux systèmes identiques en termes d'inventaire, ce n'est pas toujours le même trait qui sera non-marqué selon les diagnostics phonologiques établis plus haut ; - à l'intérieur d'un système, il se peut que tous les traits se comportent de manière équivalente et qu'on ne puisse pas identifier de contraste de marque. Les réserves émises ci-dessus pourraient donner l'impression que n'importe quel lieu ou mode articulatoire est potentiellement non-marqué. Ce n'est cependant pas le cas, les classes de traits pouvant être non-marquées étant dépendantes du nombre d'éléments en opposition à l'intérieur de chacune. Rice (1999a : 6) indique le ou les lieu(x) possiblement non-marqués en fonction du nombre de lieux d'articulation tolérés par la langue pour une classe donnée, en se basant sur des tests phonologiques "attempting to abstract away from positional effects"45 : 45 Rice ne donne pas de précision quant à la nature de ces tests phonologiques. 156 Chapitre 2 – Le caractère particulier des consonnes coronales (121) lieu consonantique 1 lieu consonantique 2 lieu consonantique 3 lieu consonantique 4 mode d'articulation unités possibles coronal, vélaire coronal, labial coronal, labial, dorsal (laryngal) coronal, labial, vélaire (laryngal) occlusif, continu unités possiblement non marquées coronal, vélaire coronal, labial coronal (laryngal) vélaire (laryngal) occlusif, continu En ce qui concerne les consonnes, Rice distingue quatre types de classes en regard du lieu d'articulation, numérotés respectivement 1, 2, 3 et 4, et un pour le mode articulatoire des obstruantes. Dans les cas où seules deux classes de traits sont possibles, comme c'est le cas pour les lieux consonantiques 1 et 2 et le mode articulatoire, chacun des éléments de l'opposition peut se positionner comme non-marqué. Ainsi dans le cas du lieu consonantique 1, le trait coronal comme le trait vélaire peuvent-ils compter comme l'élément non-marqué dans une langue donnée, sans qu'il soit possible de déterminer au moyen des tests phonologiques lequel est le plus susceptible de l'être. La situation est la même lorsque coronal s'oppose à labial ou occlusif à continu. "Given a binary opposition between features [X] and [Y] of class [Z], either [X] patterns as marked and [Y] as unmarked, or vice versa". Dans les cas où l'opposition se joue entre plusieurs classes en revanche, comme pour les lieux consonantiques 3 et 4, toutes ces classes ne sont pas sur un pied d'égalité au regard de la marque : les tests phonologiques mettent en effet en évidence la primauté d'un élément, en terme de manque de marque, sur les autres. En ce qui concerne le lieu d'articulation 3, l'élément non marqué sera le trait coronal, mais ce sera le trait vélaire pour le lieu d'articulation 4. On notera à cet endroit que la distinction entre dorsales et vélaires, sur laquelle repose la différenciation de ces deux situations, correspond à celle exposée dans Rice (1996) discutée plus bas. Une seconde remarque s'impose ici : les laryngales sont mises entre parenthèses par Rice, et sont absentes des relations de marque ("ignoring laryngeal"), sans qu'une explication soit donnée pour cette mise à l'écart. C'est pourtant un des points d'achoppement majeur des phonologues quant il s'agit de marque liée au lieu d'articulation : les consonnes laryngales sont moins marquées dans les langues du monde que les consonnes coronales, aussi peut-on se demander quelle est la motivation pour ne pas postuler le trait laryngal comme non-marqué dans un système le comprenant. La notion de marque peut se définir universellement comme à l'intérieur d'un système donné, au moyen d'un certain nombre de critères dont la mise en commun permet de distinguer les classes de consonnes, voire la consonne, les moins marquées. Pour autant, la 157 Chapitre 2 – Le caractère particulier des consonnes coronales détermination des consonnes non marquées comme l'implémentation de la marque au sein d'un modèle phonologique ne sont pas consensuelles. Intéressons-nous à cette approche de la sous-spécification qui se base sur la notion de marque, c'est-à-dire la sous-spécification radicale. 3.2.2.1.2. Sous-spécification radicale Si la valeur d'un trait est universellement prédictible, donc non-marquée, elle ne sera pas spécifiée dans les représentations sous-jacentes ; une valeur de trait marquée, en revanche, le sera (cf. Paradis & Prunet 1989a : 319 ; 1991 : 5 ; Hume 1994 : 21). Pour reprendre Archangeli (1988 : 190), "all and only unpredictable features are specified". Dans ce modèle donc, n'apparaissent que les nœuds et traits informatifs d'un point de vue universel. L'association d'un nœud N implique le rattachement de N à un nœud immédiatement supérieur dans la hiérarchie des traits. Si un tel nœud n'existe pas dans la représentation du segment considéré, il est généré de façon à ce que tous les nœuds d'une représentation soient reliés. En Géométrie des Traits version "sous-spécification radicale", les coronales sont les consonnes non-marquées, en vertu de leur transparence par rapport aux voyelles (cf. section 2.2). Elles ne comportent donc jamais de Nœud de Place, quelle que soit la langue considérée, ce qui permet à Paradis & Prunet (1989a : 319) de formuler le principe suivant : (122) Coronal Underspecification Principle (CUP) Unmarked coronals universally lack a Place node. On retiendra ici qu'il s'agit d'un principe et non d'un paramètre, celui-ci n'étant valable que pour un sous-ensemble de langues. C'est là une revendication clairement exprimée par Paradis & Prunet (1989a : 342). Ce caractère universel pose problème lorsqu'à l'intérieur d'une même langue on trouve différents types de coronales, et qu'il faut donc utiliser les traits inférieurs au nœud Coronal, à savoir [antérieur] et [distribué] dans le modèle présenté ci-dessus, voire également [strident] : comment les distinguer s'il n'y a pas de Nœud de Place ? Le principe CUP énoncé en (122) est 158 Chapitre 2 – Le caractère particulier des consonnes coronales alors modifié pour ne porter que sur les coronales antérieures, dans le cas où une langue comporte plusieurs types de coronales, ce qui rejoint en partie le modèle de Spécification Contrastive Modifiée (qui sera discuté en section 3.2.2.3) . Plus loin dans la dérivation, une règle de spécification coronale permettra d'aboutir à la réalisation phonétique correcte en interprétant le nœud de Place (PN) vide : (123) Coronal Specification Rule (CSR) [O Place] Æ Coronal A l'intérieur de cette classe déjà particulière des coronales, /t/ est la consonne non- marquée, soit "the least specified member of the least specified class of consonants" (Paradis & Prunet 1989a : 321-322), ce qui signifie que [+antérieur] est également sous-spécifié, donc absent de la représentation. Nous obtenons pour /t/ la représentation suivante, dans la version de la Géométrie des Traits exploitée par Paradis & Prunet qui se caractérise notamment par l'attribution du trait [consonantique] au nœud supralaryngal : (124) X | RN | SLN | [+cons] La représentation de /d/ sera un peu plus complexe puisqu'elle fait intervenir le nœud laryngal : (125) X | RN LN | [+voisé] SLN | [+cons] Les fricatives /s/ et /z/ auront les représentations suivantes : 159 Chapitre 2 – Le caractère particulier des consonnes coronales (126) /s/ X | RN [+cont] SLN | [+cons] /z/ X | RN LN | [+voisé] [+cont] SLN | [+cons] Quant aux sonantes : (127) /n/ X | RN | SLN /l/ X | RN | SLN [+nas] [+cons] [+son] [+cons] Ce qui distinguera les glottales des coronales sera le nœud supralaryngal, absent chez celles-là mais présent chez celles-ci (Paradis & Prunet 1991 : 21 ; Bessel 1992 : 56). Nous aurons donc les représentations suivantes pour [] et [h] : (128) // X | RN /h/ X | RN | LN | [+voisé] "Thus, the prediction is that glottal epenthesis will be more frequent than coronal epenthesis, and coronal epenthesis more frequent than labial or velar epenthesis" (Paradis & Prunet 1991 : 21). Cependant, cette prédiction ne peut se prétendre intrinsèque à la théorie, dans le sens où la théorie n'a fait qu'encoder l'observation empirique de la marque des glottales et des coronales par rapport aux consonnes des autres lieux d'articulation. Son statut de "prédiction" est donc à relativiser : il ne s'agit pas d'une prédiction à proprement parler mais plutôt d'une 160 Chapitre 2 – Le caractère particulier des consonnes coronales observation, modérée puisque Paradis & Prunet indiquent simplement une tendance ("more frequent") et non un donné falsifiable. Dans cette perspective, il ne semble donc plus surprenant que ce soient les coronales qui apparaissent lors d'épenthèses en français puisque le français ne comporte pas de glottales46 dans son inventaire phonologique, y compris lors d'épenthèses syntaxiques (y a-t-il, j'ai trop [z] envie, donne moi [z] en, etc., cf. chapitre 1 section 3). Après la sous-spécification radicale liée à la notion de marque, tournons-nous vers une deuxième approche de la sous-spécification, la spécification contrastive. 3.2.2.2. Spécification contrastive L'idée de sous-spécification dans cette optique (Steriade 1987, Clements 1987, 1988, Mester & Itô 1989) est liée à la redondance à l'intérieur d'un système. Il ne s'agit plus de déterminer la sous-spécificité d'une valeur pour un trait d'un segment donné par rapport au système universel mais par rapport au système phonologique d'une langue particulière. On retrouve ici la philosophie structuraliste selon laquelle un élément n'a de valeur que dans les relations qu'il entretient avec les autres éléments du système. La sous-spécification découle du fait que si l'on décrit le système phonologique d'une langue, certains traits vont être redondants à l'intérieur de ce système (Spencer 1996 : 123, également Hall 2001 : 20-21). Cette fois, "all and only contrastive features are specified" (Archangeli 1988 : 190). Paradis & Prunet (1991 : 7) illustrent cette définition en prenant l'exemple d'une langue L comportant dans son inventaire phonologique les consonnes /p/, /b/ et /g/, mais où manque /k/. Dans cette situation, /p/ serait spécifié [-voisé], /b/ [+voisé] mais /g/ resterait nonspécifié pour le voisement puisqu'il n'est pas confronté à sa contrepartie phonétique. Au contraire de la sous-spécification radicale, l'unité primitive phonologique dans ce modèle n'est pas le trait mais le segment, si bien qu'un trait peut fonctionner pour un segment (dans l'exemple ci-dessus, /p/ et /b/ sont spécifiés pour le trait de voisement) mais rester inerte pour un autre (ici /g/). 46 Bien que l'on puisse en relever phonétiquement, selon les locuteurs et les contextes. Cf. Encrevé (1988 : 32-41, également Plénat 1999 : 128, Tranel 1981 : 310, Dell 1973 : 256 note 72) : "c'est bien le coup de glotte qu'utilise le français au niveau post-lexical pour éviter certaines configurations fâcheuses [bien qu'il n'appartienne] pas à l'ensemble des phonèmes qui sert à bâtir les items lexicaux". 161 Chapitre 2 – Le caractère particulier des consonnes coronales Tout comme dans le modèle précédent en revanche, la valeur marquée d'un trait est spécifiée dès le lexique, la valeur non-marquée en est absente et sera fournie au cours de la dérivation par une règle. Si un segment comporte un trait non spécifié, le segment entier est considéré comme sous-spécifié. Autrement dit, un segment sous-spécifié est un segment dont tous les traits ne sont pas spécifiés. Dans cette version de la sous-spécification, les coronales n'ont pas de statut particulier, puisqu'on les envisage d'un point de vue non pas universel mais systémique : une coronale s'oppose à une labiale de la même façon qu'une labiale s'oppose à une vélaire par exemple. La troisième approche de la sous-spécification est connue sous le nom de "spécification contrastive modifiée". 3.2.2.3. Spécification contrastive modifiée Cette troisième approche (Avery & Rice 1988, 1989) combine la sous-spécification liée à une théorie de la marque universelle (donc la sous-spécification radicale) à une conception systémique proche de la spécification contrastive (cf. également Rose 1993 : 157). Avery & Rice (1989 : 183) en effet "hold the position that one of the major requirements of a theory of underspecification is a universal markedness theory which provides information as to which features are present and/or absent in underlying representations", à moins qu'un contraste phonologique n'existe dans une langue donnée ; dans ce cas, la valeur marquée est spécifiée et le nœud de classe immédiatement dominant est présent pour les deux segments concernés dans cette langue : le segment avec la valeur marquée comportera le nœud de classe, mais ce sera également le cas du segment qui a la valeur non-marquée pour le trait considéré. Ceci est implémenté par la Condition d'Activation du Nœud (Avery & Rice 1989 : 183) : (129) Node Activation Condition (NAC) If a secondary content node is the sole distinguishing feature between two segments, then the primary feature is activated for the segments distinguished. Active nodes must be present in underlying representation. 162 Chapitre 2 – Le caractère particulier des consonnes coronales D'autre part, les traits sont monovalents dans ce modèle, et non binaires, si bien qu'ils peuvent fusionner, se propager et se délier au même titre que les nœuds. Avery & Rice (1989) s'intéressent également à la sous-spécification des coronales, à l'intérieur de cette version de la Géométrie des Traits. Leur position en regard des consonnes coronales est claire : le nœud coronal est le nœud non-marqué, il est donc absent des représentations sous-jacentes, sauf si dans une langue donnée deux segments ne se distinguent que par un trait qui dépend du nœud coronal, auquel cas ledit nœud est présent dans la représentation sous-jacente des deux segments concernés, du fait de la NAC (Node Activation Condition). Ghini (2001 : 152) résume ainsi le mécanisme : "if a system contrasts units within the coronal space of articulation, then [Coronal] is activated". Afin d'illustrer le fonctionnement de ce modèle, considérons deux langues LA et LB ayant les inventaires phonologiques suivants : {p, t, k} pour LA, {p, t, , k} pour LB. Pour LA, il n’existe pas de contraste phonologique à l'intérieur de la classe des coronales puisque son inventaire ne contient qu'une seule consonne coronale ; de ce fait, /t/ ne comporte pas le trait [coronal]. Dans LB en revanche, le fait que l'on trouve deux consonnes coronales impose le trait [coronal], et ce dans la représentation des deux consonnes : ce n'est pas parce que /t/ est moins marqué qu'il ne comporte pas le trait en question. Le corollaire de cette position est le suivant : lorsque le nœud Coronal est absent, les coronales peuvent s'assimiler librement à d'autres lieux d'articulation, mais lorsqu'il est présent, elles ne peuvent s'assimiler qu'à l'intérieur de la classe des coronales. Donc dans une langue comportant différents lieux d'articulation à l'intérieur de la classe des coronales, la théorie prédit que les consonnes coronales ne peuvent pas s'assimiler ou, en tout cas, pas davantage que les consonnes des autres lieux d'articulation, quel que soit le type de coronales. Selon ce modèle, dans une langue ne nécessitant pas la présence du nœud Coronal, /t/ et // auront la même représentation en ce qui concerne le nœud de place, puisque le coup de glotte n'a pas non plus de spécification de lieu d'articulation. Une alternance /t/ ~ // comme le montrent certains dialectes de l'anglais (cf. Ladefoged 1982) dans certains contextes est dès lors "totally natural" (Avery & Rice 1989 : 191), ce qui ne serait pas le cas d’une alternance /k/ ~// ou /p/ ~ // par exemple, les vélaires comme les labiales comportant un nœud 163 Chapitre 2 – Le caractère particulier des consonnes coronales supplémentaire sous le nœud de place au contraire des coronales. "When the unmarked node Coronal is filled in in phonetic implementation, this segment is realised as [t]; when the default Coronal is not filled in, it is realised as glottal stop." (Avery & Rice 1989 : 191). S'il est vrai que la plupart des linguistes considèrent les coronales comme les segments les moins spécifiés pour les raisons évoquées plus haut, il est intéressant de noter que certains ne partagent pas cet engouement. La section suivante présente les arguments de deux d'entre eux. 3.2.3. Contre la sous-spécification des coronales ? Parmi les différentes interprétations données à la sous-spécification dans le cadre de la Géométrie des Traits, celle de Rice (1996) se distingue en ce sens qu'elle ne considère pas les coronales comme les consonnes les moins marquées, mais les vélaires. Elle propose de ce fait une classification originale des consonnes à l'intérieur du cadre considéré. Goad (1995) remet également en question la spécificité des coronales par rapport aux consonnes des autres lieux d'articulation, en s'appuyant sur des données acquisitionnelles. 3.2.3.1. Rice (1996) Dans cet article, Rice reprend la notion de sous-spécification à l'intérieur du cadre de la Géométrie des Traits en mettant en avant la valeur non-marquée des vélaires, trop souvent mise de côté au profit de celle, bien établie, des coronales. Sa démarche repose également sur une différenciation des vélaires et des dorsales ; les premières sont articulées la langue au repos ou levée vers l'arrière de la bouche, les secondes avec l'arrière de la langue levé vers le vélum. Rice propose pour les différentes classes de consonnes les représentations suivantes : (130) coup de glotte Racine coronales / vélaires Racine | Lieu labiales Racine | Lieu | Périphérique dorsales Racine | Lieu | Périphérique | Dorsal 164 Chapitre 2 – Le caractère particulier des consonnes coronales Le coup de glotte comporte, dans sa représentation, uniquement le nœud racine, à l'exclusion du nœud de place. Les coronales et les vélaires ont ce nœud de place, sans nœud inférieur. Les labiales ajoutent le nœud périphérique, qui par défaut renvoie donc aux labiales et non aux dorsales, pour lesquelles il faut ajouter le nœud dorsal sous le nœud périphérique. Coronales et vélaires sont donc sur un pied d'égalité en ce qui concerne la sousspécification dans cette représentation. Si l'on se place dans le cadre de la Spécification Contrastive Modifiée, à partir du moment où une langue distingue plusieurs catégories de coronales, toutes comportent le nœud Coronal ("when Coronal is contrastive, it is not a default feature for its class"), ce qui donne les représentations suivantes (Rice 1996 : 533) : (131) apico-alvéolaires Racine | Lieu | Coronal lamino-dentales Racine | Lieu | Coronal | Laminal | Dental lamino-palatales Racine | Lieu | Coronal | Laminal vélaires Racine | Lieu Dans cette optique, les vélaires sont donc sous-spécifiées par rapport aux coronales dans le cas où une langue distingue plusieurs types de coronales, puisqu'il faut que la langue ait les moyens de distinguer les différentes articulations coronales. A l'intérieur de la classe des coronales, le classement en termes de marque va des apico-alvéolaires, les moins marquées des coronales et ne comportant de ce fait que le nœud coronal, aux lamino-dentales, comportant outre le nœud coronal, le nœud laminal, qu'elles partagent avec les laminopalatales, et le nœud dental. Rice discute donc la sous-spécification des coronales au profit des vélaires en se basant sur une distinction des consonnes vélaires avec les consonnes dorsales. Goad (1995) met également en cause la sous-spécification des coronales, en se basant quant à elle sur des données acquisitionnelles relevant de l'harmonie consonantique. 165 Chapitre 2 – Le caractère particulier des consonnes coronales 3.2.3.2. Goad (1995) Elle remet également en question la sous-spécification des coronales, à partir d'une étude sur l'harmonie consonantique dans le langage d'un enfant de langue maternelle anglaise. Elle reprend pour ce faire les données de Smith (1973) concernant le parler de son fils Amahl à l'âge de deux ans en regard de l'harmonie consonantique. Chez Amahl, on ne constate pas d'harmonie consonantique entre labiales et vélaires, comme on peut le voir dans le tableau cidessous : (132) labiale + vélaire [bæk] *[bæp] *[æk] [mik] *[mip] *[ik] [wi] *[wim] vélaire + labiale "black" [eip] *[eik] *[beip] "milk" [ep] *[ek] *[bep] "swing" [m] *[] *[bm] pas d'assimilation entre labiales et vélaires "grape" "escape" "come" En revanche, Amahl réalise bien une harmonie consonantique lorsque la cible de l'harmonie est une consonne coronale, que celle-ci soit obstruante comme dans le tableau cidessous ou nasale comme dans le tableau d'après, sous certaines conditions. (133) (a) obstruantes coronales en tant que cibles potentielles velaire + coronale "cloth" [k] "kiss" [ik] coronale + vélaire "stalk" [k] "duck" [k] [wt] "wash" coronale + labiale "stop" [bp] "stop" [dp] [uk] "coach" [ak] "dark" [bt] "bolt" (N) [bebu] [ai] "glasses" [ii] "sticky" [bat] "bath" "drum" [dm] assimilation optionnelle assimilation obligatoire (b) [bit] labiale + coronale "bit" (N) pas d'assimilation "table" nasales coronales en tant que cibles potentielles velaire + cor nasale "clean" [in] "skin" [in] "corner" [n] pas d'assimilation cor nasale + vélaire "snake" [eik] [] /n/ "neck" [()k] assimilation obligatoire labiale + cor nasale "burn" [bn] "pen" [bn] "spoon" [bun] pas d'assimilation cor nasale + lab "knife" [maip] "nipple" [mibu] "knob" [mb] assimilation obligatoire En (a), on constate que l'assimilation entre obstruantes est obligatoire lorsque la consonne déclenchant l'harmonie est vélaire, que celle-ci soit située avant la coronale (tableau a1) ou après (tableau a2) : la coronale finale de "kiss" est réalisée en vélaire par Amahl ([ik]), tout comme la coronale initiale de "duck" ([k]). En revanche, l'assimilation entre 166 Chapitre 2 – Le caractère particulier des consonnes coronales obstruantes est uniquement facultative, dans le meilleur des cas, lorsqu'elle est labiale : s'il s'agit d'assimilation régressive, elle est optionnelle, comme la variation dans la réalisation de stop par Amahl l'illustre : il produit la variante avec assimilation [bp] aussi bien que la variante sans [dp]. Dans le tableau (b), on note que si la coronale est nasale elle ne s'assimile pas progressivement, que la consonne potentiellement déclenchante soit vélaire (tableau b1) ou labiale (tableau b3), mais uniquement régressivement, l'assimilation étant dans ce cas obligatoire (tableaux b2 et b4). Jusqu'à présent, les données semblent confirmer la sous-spécification des coronales : en tant que cibles de l'harmonie consonantique dans le système d'Amahl, et surtout en tant qu'uniques cibles, elles doivent être sous-spécifiées. Cette constatation amène Goad (1995 : 6) à proposer les représentations suivantes pour les consonnes des différents lieux d'articulation : (134) (a) Représentations des consonnes obstruantes dans le système d'Amahl |B| (/p, b/ adultes) |G| (/k, g/ adultes) |D| (/t, d, s, z, , / adultes) Racine Racine Racine | | | Lieu Lieu Lieu | | Labial Dorsal (b) Représentations des consonnes nasales dans le système d'Amahl |m| (/m/ adultes) |n| (/n/ adultes) || (// adultes) Racine Racine Racine Lieu | Labial Nasal Lieu Nasal Lieu | Dorsal Nasal Les représentations postulées ici traitent les éléments de place - labial, dorsal - comme des nœuds, en ce sens qu'ils ne disposent pas d'une valeur positive ou négative mais qu'ils sont tout simplement présents ou absents. Cette intrusion de la privativité jusque dans les éléments terminaux de l'arbre sera discutée section 3.3. Les coronales sont sous-spécifiées dans le système d'Amahl puisqu'elles sont les cibles de l'harmonie consonantique, c'est pourquoi elles ne comportent pas d'indication de lieu d'articulation sous le nœud de place. 167 Chapitre 2 – Le caractère particulier des consonnes coronales Toutes les données ne concourent cependant pas à attribuer la valeur non-marquée aux consonnes coronales. En effet, la réalisation par Amahl des coronales liquides /l/ et /r/ dans des contextes potentiellement soumis à l'harmonie vocalique montre une concrétisation de cette éventualité, alors que jusqu'à présent les coronales subissaient l'harmonie mais ne la déclenchaient pas : (135) /l, r/ devant une labiale "left" [wpt] "lamp" [wæp] "room" [wum] "Robbie" [wbi] [lli] [lli] [ll] /l, r/ devant une coronale "light" [dait] "lash" [dæt] "rain" [dein] "red" [dt] /l, r/ avec d'autres liquides "lorry" "trolly" "troddler" [lu] [uli] /l, r/ devant une vélaire "lock" [k] "leg" [k] "ring" [i] "rug" [k] /l/ en isolation "hello" "only" Les phonèmes /l/ et /r/ s'assimilent avec le lieu d'articulation, que celui-ci soit labial (tableau 1) ou vélaire (tableau 3), sans que l'on puisse aboutir à aucune conclusion en ce qui concerne le lieu coronal puisque les liquides sont déjà coronales (tableau 2) et partiellement au moins avec le mode : /l/ comme /r/ seront réalisés comme un glide labial, [w], devant une consonne labiale, comme une occlusive devant une consonne coronale ou vélaire. Par contre, ils ne s'assimilent pas de la nasalité : "room" sera réalisé [wum] et non *[mum], Amahl prononcera [dein] pour "rain" et non *[nein], ni *[i] pour "ring" mais [i]. Pour se convaincre du fait que les coronales déclenchent l'assimilation de /l/ et de /r/, il suffit d'observer leur comportement lorsque c'est une liquide qui suit (tableau 4) : /l/ comme /r/ restent coronales et surtout ne changent pas de mode articulatoire, tout comme lorsqu'ils sont en isolation (tableau 5), du moins pour /l/ car Goad ne fournit pas de données pour /r/. Ce qui est mis en relief avec ces nouvelles données est le fait que les coronales peuvent également déclencher l'harmonie consonantique, pourvu que la cible soit une liquide. Les données révèlent donc un paradoxe : les coronales sont à la fois les cibles de l'harmonie consonantique et les déclencheurs de l'harmonie dans les mots où les cibles sont des liquides. 168 Chapitre 2 – Le caractère particulier des consonnes coronales En tant que cibles, les coronales devraient être sous-spécifiées, mais si elles sont sousspécifiées elles ne peuvent pas déclencher d'harmonie puisque celle-ci consiste en la propagation d'un élément, qu'elles n'ont pas dans leur représentation et ne peuvent donc propager si elles sont sous-spécifiées. Malgré quelques remises en question marginales, la grande majorité des linguistes considère que la consonne non-marquée par excellence est la coronale. 3.2.4. Bilan sur la sous-spécification Reprenons les trois variantes de la sous-spécification évoquées ici, à savoir la SousSpécification Radicale liée à la marque, la Spécification Contrastive liée à un système donné et la Spécification Contrastive Modifiée, qui combine les deux approches précédentes. Le sanscrit, pris comme illustration par Avery & Rice (1989 : 192) du comportement du nœud coronal dans le cadre de la Spécification Contrastive Modifiée, permet d'illustrer clairement la position des trois variantes de la sous-spécification. Son inventaire consonantique, en ce qui concerne les coronales, est le suivant : (136) dental rétroflexe palato-alvéolaire t t th h th d d dh h dh n l r / s Les consonnes dentales sont les segments non marqués (Kean 1975, Avery & Rice 1989 : 192), les rétroflexes ont un trait [rétroflexe] dépendant du nœud coronal, les palatoalvéolaires un trait [postérieur] également dépendant de Coronal. Si l'on se place dans le cadre de la Sous-Spécification Radicale, les dentales n'ont pas de nœud de lieu d'articulation du tout, les rétroflexes et les palato-alvéolaires présentent en revanche le nœud Coronal puisqu'elles possèdent un trait qui en est dépendant. (137) dentales Lieu rétroflexes Lieu | Coronal | [rétroflexe] palato-alvéolaires Lieu | Coronal | [postérieur] 169 Chapitre 2 – Le caractère particulier des consonnes coronales Dans le cadre de la Spécification Contrastive, toutes les coronales sont spécifiées pour le nœud. De ce fait, il n'y a pas de différence dans cette version avec les labiales et les vélaires du point de vue de la sous-spécification. (138) dentales Lieu | Coronal | [dental] rétroflexes Lieu | Coronal | [rétroflexe] palato-alvéolaires Lieu | Coronal | [postérieur] Pour la Spécification Contrastive Modifiée, à partir du moment où un type de coronales a besoin du nœud Coronal, tous les types de coronales en héritent, aussi bien les dentales, les rétroflexes que les palato-alvéolaires. On obtient alors les représentations suivantes (Avery & Rice 1989 : 192) : (139) dentales Lieu | Coronal rétroflexes Lieu | Coronal | [rétroflexe] palato-alvéolaires Lieu | Coronal | [postérieur] Après avoir observé la manière dont la Géométrie des Traits rend compte du pcaractère particulier des consonnes coronales par le biais de l'utilisation de la sousspécification, tournons-nous vers les théories monovalentes que sont la Phonologie des Particules, la Phonologie de Dépendance et la Phonologie de Gouvernement. Ces théories proposent-elles une représentation des coronales différente de celle(s) de la Géométrie des Traits ? Sont-elles en mesure de traiter les coronales comme une classe à part ? Quelles motivations fourniraient-elles à un éventuel traitement particulier ? 3.3. Les théories monovalentes Les théories monovalentes se distinguent de la Géométrie des Traits en ce qu'elles utilisent des primitives et non des traits distinctifs dotés d'une valeur binaire : "the ultimate constituent [...] is not the phonological feature" (Kaye & al. 1985 : 306). 170 Chapitre 2 – Le caractère particulier des consonnes coronales Ces primitives sont monovalentes, c'est-à-dire privatives : soit elles sont présentes dans la représentation d'un élément, soit elles en sont absentes ; par contraste, dans un cadre comme la Géométrie des Traits standard, tous les traits sont présents, c'est leur valeur + ou au sein d'un élément qui déterminera la nature de cet élément. La Géométrie des Traits n’exclut pas la privativité : les nœuds qu’elle propose sont de fait privatifs (cf. par exemple Yip 1989 : 370, qui emploie explicitement le terme) ; mais les éléments terminaux des représentations sont des traits. La privativité des modèles monovalents leur permet de réduire dans une certaine mesure la surgénération, dans le sens où le nombre de primitives dans ces modèles est d'environ une dizaine, alors que l'on trouve généralement plus de traits dans les modèles nonmonovalents (cf. Ploch 1997 : 242-243). Le nombre de combinaisons théoriquement possible est donc plus limité, si tant est que l'on limite également le nombre de primitives possible dans une représentation. La privativité des primitives réduit également les propagations possibles : dans un cadre fonctionnant à l'aide de traits toujours présents, comportant la valeur positive ou négative, ces traits ont tous la possibilité théorique de se propager, quelle que soit leur valeur. Ainsi [-nasal] peut-il aussi bien se propager que [+nasal] par exemple, sans que la théorie puisse analyser le caractère plus ou moins naturel de la propagation d'un élément portant la valeur négative. Dans un système monovalent en revanche, ne peut se propager qu'une primitive effectivement présente ; dans ce cas, le système prédit que seul le voisement peut se propager et non le non-voisement, puisque seul le voisement sera présent dans la représentation d'un élément. La notion de monovalence est par ailleurs directement liée à la notion de marque (cf. section 3.2.2.1.1) : plus un élément comporte de primitives, plus il est marqué. Dans un cadre comportant des traits binaires, les deux valeurs possibles pour un trait sont marquées de la même manière, c'est éventuellement l’absence du trait en question qui est non marquée (cf. Yip 1989 : 370), mais il ne sera pas possible de faire référence à la marque autrement qu’arbitrairement. Dans les théories monovalentes, par sa seule présence une primitive est marquée, c’est son absence qui est non-marquée ; un élément non marqué comporte le minimum de primitives possible, c'est-à-dire aucune. Ces trois théories, si elles partagent le même ensemble de postulats communs, d'une part les expriment de manière différente, d'autre part divergent sur d'autres points. 171 Chapitre 2 – Le caractère particulier des consonnes coronales La Phonologie des Particules (Schane 1984) a travaillé essentiellement sur la structure interne des voyelles, aussi ne la cité-je que pour mémoire, mais je ne développerai pas son argumentation. La Phonologie de Gouvernement a quant à elle pour ambition de limiter à la fois le nombre de primitives et celui des opérations phonologiques, de façon à juguler la surgénération des représentations. Elle sera développée en section 3.3.2. La Phonologie de Dépendance se caractérise par le fait qu'elle détermine les primitives phonologiques en fonction de critères phonétiques, comme on va le voir dans la section suivante. 3.3.1. Phonologie de Dépendance La Phonologie de Dépendance (Anderson & Durand 1986, Anderson & Ewen 1987) a pour fondement les mêmes postulats que la Géométrie des Traits, à savoir la représentation des classes phonologiques naturelles et la nécessité de pouvoir référer unitairement à un ensemble d'éléments fonctionnant de la même manière. Il s'agit là d'une idée émise très rapidement après la parution de Chomsky & Halle (1968) puisqu'on la retrouve clairement revendiquée dès 1973 chez Anderson & Jones (1973 : 15) : "our 'model' has the power to capture generalizations within processes (containing apparently unreducible sub-parts) resistant to the 'standard' generative phonological theory (...) a claim for 'more structure' within the phonology will enable underlying similarities and relationships between phonological processes to be brought out, phenomena which the Chomsky-Halle model (as well as most others) can only treat as unique or unrelated." La Phonologie de Dépendance exprime ces postulats à travers la Componentiality Assumption (Anderson & Ewen 1987 : 8) : "The representation of the internal structure of segments optimises the expression of phonological relationships ('classes', 'regularities') that are (a) recurrent and (b) natural." Par ailleurs, elle repose sur le concept de dépendance "or modifier-head relation" (Anderson 1987 : 15), défini comme la relation asymétrique de deux éléments à l'intérieur d'un domaine particulier, dont l'un, obligatoire, est la tête (le gouverneur) et l'autre le modifieur (ou dépendant). Ce concept de dépendance est issu de la syntaxe (cf. Anderson 1987) et se retrouve dans d'autres théories phonologiques génératives comme la Phonologie de Gouvernement, cf. section suivante. 172 Chapitre 2 – Le caractère particulier des consonnes coronales Le modèle présente trois types de dépendance (cf. Lass 1984 : 274) : - dépendance stricte : aÖb ou a ; b se lit "a gouverne b" ou "b est dépendant de a". - dépendance mutuelle : aÙb ou a : b se lit " a et b sont mutuellement dépendants" ou encore "a gouverne b et réciproquement". - combinaison : a,b se lit "a est associé avec b" sans qu'il n'y ait aucune relation de dépendance entre les deux. La structure interne d'un segment se présente sous la forme d'un "geste" composée de deux sous-gestes : - le geste catégoriel, subdivisé en sous-geste phonatoire et sous-geste initiatoire. - le geste articulatoire, subdivisé en sous-geste locationnel et sous-geste oro-nasal (celui-ci indiquant si un segment est oral ou nasal). Le tableau suivant, issu de Anderson & Ewen (1987 : 150), indique les types de propriétés présentes à l'intérieur de chacun des composants dans le modèle standard de Phonologie de Dépendance dans lequel ils travaillent47 : (140) geste catégoriel geste articulatoire consonanticité voisement continuance sonance constriction glottale glottalité succion vélaire lieu d'articulation hauteur arrondissement postériorité nasalité sous-geste phonatoire sous-geste initiatoire sous-geste locationnel sous-geste oro-nasal Les primitives postulées dans ce cadre pour rendre compte des propriétés listées dans le tableau ci-dessus correspondent approximativement aux traits phonétiques, articulatoires ou acoustiques. La formulation des représentations en Phonologie de Dépendance s'opère selon des conventions précises, données dans le tableau ci-dessous : 47 Comme l'indiquent Anderson (1988 : 15,) "there is some debate within DP as to the exact number of gestures and subgestures". L'ambition de ce paragraphe n'étant pas de développer le cadre mais de montrer comment il traite des coronales et de leur aspect particuler, je ne rentrerai pas dans le débat. Le tableau reproduit dans le texte a simplement pour ambition de rappeler le fonctionnement général du cadre. 173 Chapitre 2 – Le caractère particulier des consonnes coronales (141) symbole Accolade {} X Double barre |X| signification permettent de délimiter un segment primitive "the verticals indicate that in this case it is the only component present in this gesture" (Anderson & Durand 1986 : 2) dépendance du deuxième élément par rapport au premier Flèche simple Ö Deux points : ou dépendance mutuelle double flèche Ù L'objectif poursuivi ici étant la représentation des consonnes coronales dans le cadre étudié, je ne détaillerai pas le geste catégoriel, dévolu au mode d'articulation (cf. Anderson & Ewen 1987 : 151-202 pour une présentation complète, Anderson 1987 : 34-38 ou Anderson & Durand 1988 : 15-16 pour le sous-geste phonatoire) et présenterai directement le geste articulatoire, plus particulièrement le sous-geste locationnel, qui traduit le lieu d'articulation des segments. Pour caractériser les voyelles, quatre primitives sont retenues dans le sous-geste locationnel : |i| "avant" |a| "bas" |u| "arrondi" || "central" Plus une voyelle contient de ces éléments, moins elle est distinctive au regard du système universel. D'ailleurs, les trois premiers éléments cités correspondent au triangle vocalique que toute langue possède : si elle ne doit contenir que trois voyelles, une langue aura /i/, /u/ et /a/ (cf. arabe classique). Ces quatre primitives ne sont pas égales face aux relations de dépendance : |i| et |u| ne présentent pas de relation de dépendance l'un avec l'autre ; |a| et || au contraire peuvent entrer en relation de dépendance, entre eux aussi bien qu'avec |i| et |u|. (cf. Anderson & Ewen 1987 : 226-228). Les consonnes dans le modèle présenté par Anderson & Ewen (1987) font appel à huit éléments pour caractériser leur lieu d'articulation. Deux au moins sont communs avec les voyelles : |a| et |u|. |a| réfère en effet également aux consonnes uvulaires, |u| caractérise les 174 Chapitre 2 – Le caractère particulier des consonnes coronales labiales et les vélaires en tant que "grave" : plus |u| est proéminent, plus grande est la part basse du spectre dans la représentation. Les six autres éléments sont les suivants : |l| lingualité (1987 : 237) |t| apicalité (1987 : 239) |d| dentalité (1987 : 240) |r| RTR (retracted tongue root) (1987 : 243) |α| ATR (1987 : 245) |λ| latéralité (1987 : 245) |l| caractérise les segments produits avec la lame ou le dos de la langue comme articulateur actif48. |d| permet d'indiquer l'articulateur passif en sus de l'actif, pour distinguer les labiales des labio-dentales, ainsi que les dentales des alvéolaires. |r| caractérise les pharyngales. On a également besoin de son pendant ATR, |α|, "for [+ATR] dominant systems" (1987 : 245) et d'un élément de latéralité |λ|. Les classes consonantiques dépendant du lieu d'articulation sont donc représentées dans cette version de la Phonologie de Dépendance de la manière suivante : (142) {|u|} labiales {|l,d|} dentales {|l|} alvéolaires {|l| Ù |t|} apicales {|l| Ö |t|} laminales (c'est |l| qui gouverne car la lame est plus importante que l'apex dans leur articulation) {|t| Ö |l|} rétroflexes (seuls l'apex et le dessous de la lame sont articulateurs actifs) {|l, i|} palatales (sans certitude absolue car cette représentation pose problème, cf. Anderson & Ewen 1987 : 238) {|l,u|} 48 vélaires En ce qui concerne les voyelles, il constitue un trait redondant mais non distinctif des voyelles hautes. 175 Chapitre 2 – Le caractère particulier des consonnes coronales [] et [h] se caractérisent par le fait qu'ils n'ont pas dans leur structure d'élément supralaryngal, ils sont "specified for their categorial gesture but unspecified for articulation" (Durand 1986 : 80). Si bien qu'ils sont sur la trajectoire de lénition des occlusives et fricatives non-voisées ; "[] is viewed as the 'minimal' stop and [h] as the 'minimal' fricative." (Anderson & Ewen 1987 : 38), ce qui se traduit en termes représentationnels par |C| pour // et [CÙV] pour /h/ (cf. Durand 1986a : 80-81). Les coronales sont identifiées par l'élément |l|, ses relations avec les autres éléments déterminant les différentes articulations à l'intérieur de la classe des coronales. On remarquera cependant le parallélisme, non souhaitable, entre la représentation des palatales (|l, i|) et celle des vélaires (|l, u|). La représentation des vélaires combine l'élément |u| correspondant à la classe des labiales à l'élément |l| propre aux coronales, de façon à rendre compte du fait qu'elles "can be shown to form natural recurrent classes with both labials and dentals" (Anderson & Ewen 1987 : 237). Cette représentation a un coût en termes de marque, comme on va le voir dans le paragraphe suivant. La Phonologie de Dépendance recourt elle aussi à la notion de marque et l'exprime en termes de complexité : "the inherent complexity ('markedness') of a segment can be directly measured in terms of the complexity of its representation: velars (u,l – gravity combined with linguality) are more complex than denti-alveolars (|l| - linguality alone); voiceless fricatives (|V:C|) than voiceless plosives (|C|)." (Anderson & Durand 1986 : 3). De cette manière, "underspecification […] is more naturally expressed". Dans ce cadre donc, les coronales alvéolaires sont moins complexes que les vélaires, mais tout autant que les labiales qui, elles aussi, comportent un seul élément dans le composant locationnel. De plus, les coronales non alvéolaires sont non seulement aussi marquées que les vélaires (deux éléments en jeu dans chaque cas), mais en outre davantage que les labiales. On ne peut donc pas considérer que les coronales jouissent d'un statut privilégié en Phonologie de Dépendance par rapport aux labiales ou aux vélaires. D'autant plus qu'est possible dans ce cadre un composant vide, ce qui prédit un élément ou une classe d'éléments encore moins marqué que les labiales ou les coronales. Pour Durand & Anderson (1988 : 31-32) en effet, "if features can be present or absent, the complete lack of features within a given bundle (or gesture) is predicted. (...) The DP notation 176 Chapitre 2 – Le caractère particulier des consonnes coronales (...) mirrors markedness directly." A partir de l'analyse du système vocalique du Yawelmani, ils mettent ainsi en évidence que le caractère non-marqué de /i/ se traduit en Phonologie de Dépendance par une matrice vide. "The notion of an unspecified vowel - that is a vowel specified as |V| categorially but with an empty articulatory gesture - is therefore not an extension of the DP framework but falls squarely within it, both in principle and in practice. But it should also be obvious that the fully specified categorial matrices (...) are overspecified when taken within the context of individual languages" (Durand & Anderson 1988 : 16). Ce qui est démontré pour les voyelles fonctionne également dans le cadre des consonnes : les laryngales seront moins marquées que les consonnes comportant un lieu d'articulation au-dessus du larynx. Comme la Géométrie des Traits, la Phonologie de Dépendance reflète directement la marque, pour reprendre les propos de Durand & Anderson (1988 : 31-32) cités dans le paragraphe précédent, mais ne propose pas de motivation intrinsèque à la théorie justifiant la mise à l'écart des coronales par rapport aux consonnes des autres lieux d'articulation. Les coronales ne se distingue pas, en termes de marque, des labiales et des vélaires en Phonologie de Dépendance, ces trois lieux d'articulation étant de toute façon plus marqués que les glottales. Un second cadre exploite les primitives monovalentes, la Phonologie de Gouvernement. Ce cadre propose-t-il une implémentation du statut particulier des coronales ou les considère-t-il de la même manière que les consonnes des autres lieux d'articulation ? 3.3.2. Phonologie de Gouvernement Les bases de la Phonologie de Gouvernement ont été jetées par Kaye & al. en 1985, puis amendées en 1990 par Kaye & al. et Harris. Comme la Phonologie de Dépendance et la Géométrie des Traits, ce cadre suppose une hiérarchie dans les primitives infrasegmentales. Comme la Phonologie de Dépendance il définit une relation asymétrique entre les éléments. Ce qui distingue la Phonologie du Gouvernement des autres cadres post-SPE précédemment cités est, d'une part, son rejet programmatique des règles ordonnées, calquant ainsi le fonctionnement des théories syntaxiques : "it is conceivable that some of the same principles at work in syntax will be seen to be operative in phonology" (Kaye & al. 1990 : 193) ; d'autre 177 Chapitre 2 – Le caractère particulier des consonnes coronales part, son rejet de la coda et de la syllabe comme constituants. Enfin, et c'est le point majeur dans cette partie concernant la structure interne des éléments, la Phonologie de Gouvernement a pour ambition de limiter le nombre de primitives ("The set of melodic primitives must be finite, universal and minimal", Rennison & Neubarth ms : 5), et par là de prévenir la surgénération, ainsi que de réduire les opérations phonologiques possibles. 3.3.2.1. cadre général A ses débuts, la Phonologie de Gouvernement comportait les onze éléments suivants (Harris 1990)49 : (143) primitive I A U I barré v° N R h H L trait saillant pour les voyelles antérieur non-haut labial ATR voyelle froide nasalité / / / / / trait saillant pour les consonnes palatalité pharyngalité arrondi / vélarité nasalité coronal constriction bruit non-voisement voisement interprétation phonétique [i] [] [u] [] [] [] [h] Certains éléments sont réservés aux représentations vocaliques (I barré), d'autres aux représentations consonantiques (R, , h, H et L) ; d'autres encore sont susceptibles d'intervenir dans les deux types de représentations et sont donc porteurs de deux valeurs, le choix de l'une ou de l'autre étant subordonné au type d'élément squelettal auquel ils sont rattachés : l'élément I par exemple renvoie à l'antériorité s'il est lié à une position vocalique, à la palatalité s'il se rattache à une position consonantique. Il est à noter d'autre part que la voyelle froide n'est pas à proprement parler un élément dans le sens où elle n'a pas de trait saillant ('hot feature', c'està-dire "the only feature whose value is marked" selon Kaye & al 1985 : 307 ). Les éléments, en tant que constituants ultimes des segments phonologiques, sont définis par Kaye & al. (1985 : 306) comme "independently prononceable units". Cependant, il 49 Ont été ôtées les indications de charme, propriété particulière ayant un "impact on the combinations of elements that may exist and on their organisation into segmental systems" (KLV 1985 : 311-314), puisque le charme a été abandonné dans le cadre actuel. 178 Chapitre 2 – Le caractère particulier des consonnes coronales s'agit, jusqu'en 1995 (cf. Harris & Lindsey 1995) au moins, davantage d'un vœu pieux que d'une réalité avérée, dans le sens où la déclaration d'intention n'a pas été suivie d'une démonstration concluante : pour les primitives de place, il est possible de rattacher une interprétation phonétique, comme on le voit dans le tableau ci-dessus, mais en ce qui concerne les primitives de manière l'entreprise est nettement plus ardue. Deux opérations phonologiques sont possibles, et deux seulement : la décomposition, qui se traduit par une perte d'éléments d'un segment, et la composition, qui s'opère par le transfert ou la duplication d'éléments d'un phonème vers un autre (cf. Harris 1994). Les primitives peuvent donc se combiner, formant ainsi des segments composés. "The results of such combinations are derived by means of fusion operations, each of which involves two elements, one defined as the head, the other as an operator. In an expression derived by means of fusion, the operator contributes only its salient property; all other properties are contributed by the head." (Harris 1990). La tête est obligatoire, l'opérateur facultatif (Rennison & Neubarth ms). Graphiquement, cette distinction de statut des différents éléments à l'intérieur d'une représentation se traduit par une première place réservée à la tête, qui est de plus soulignée, la seconde place étant dévolue à l'opérateur. Tête et opérateur sont séparés par une virgule. A l'intérieur d'une représentation, chaque primitive a sa propre ligne autosegmentale s'il est montré qu'elle peut se combiner avec les autres primitives dans un système donné. Dans le cas contraire, deux primitives qui ne se combinent jamais partagent la même ligne autosegmentale (les lignes sont "fusionnées", cf. Kaye & al. 1985 : 307). Prenons par exemple I et U : dans certains systèmes vocaliques, I et U partagent la même ligne autosegmentale, et ne se combinent donc pas ; c'est le cas lorsqu'une langue a pour inventaire vocalique les cinq voyelles /a/, /i/, /u/, /e/ et /o/ (cf. par exemple Cyran 1997 : 22-25). La hiérarchie des éléments en tête et opérateur à l'intérieur d'une représentation, le fait que chaque primitive ait sa propre ligne autosegmentale et l'interprétation possible de chaque élément en unité prononçable font que "the double or multiple occurrence of an element (...) would not change the phonetic interpretation of the expression in which it occurs" (Rennison & Neubarth ms : 8), au contraire par exemple de la Phonologie des Particules selon laquelle chaque élément peut intervenir plusieurs fois dans une représentation, se donnant ainsi plus de poids. 179 Chapitre 2 – Le caractère particulier des consonnes coronales En ce qui concerne le lieu d'articulation, la distinction se fait à l'aide des éléments U, R et I pris en tant qu'opérateurs au sein de la représentation d'un élément. L'élément U renvoie à la labialité, il permet donc de caractériser la classe des labiales ; c'est-à-dire que tout élément (consonantique) ayant dans sa représentation l'opérateur U est labial. La classe des coronales dispose quant à elle d'un élément qui lui est propre, l'élément R. Les palatales, qui dans ce modèle sont distinctes des coronales (cf. section [2] 1.3 pour une présentation de la question des palatales par rapport aux coronales) sont identifiées par l'élément I. Quant aux vélaires, leur caractéristique est précisément de n'être identifiées par aucun élément propre. Le caractère particulier des coronales est donc mis en évidence au moyen de l'élément R, qui est le seul parmi ces éléments de place à ne porter que sur les consonnes. En fait, la raison d'être de cet élément est précisément de définir le lieu d'articulation coronal, alors que les autres éléments (U, R et I, ainsi que A pour les glottales) ont tous un rôle à jouer dans la représentation des voyelles. Par ailleurs, dans ce modèle, les coronales sont définies par un élément et non les vélaires ; le statut particulier est donc ici attribué aux vélaires et non aux coronales. Les coronales sont donc certes identifiées à part des autres consonnes, mais au même titre que les labiales ou les palatales. Ce sont les vélaires auxquelles ici est réellement accordé un statut particulier. Intéressons-nous plus particulièrement à cet élément définitoire des coronales qu'est R, et à son éviction du modèle dans un de ses développements. 3.3.2.2. L'élément R La présentation du rejet de la primitive coronale va s'organiser de la manière suivante : après avoir donné les raisons en amont du rejet de R, je présenterai l'argumentation propre à son éviction. 3.3.2.2.1. Projet de l'école londonienne Le nombre de primitives n’a eu de cesse d’être revu à la baisse, notamment sous l’impulsion de Kaye au travers de l'école londonienne SOAS, dans le but de limiter le plus possible la surgénération. Les années 90 voient ainsi passer le nombre de primitives de 11 à 5. Seront touchées prioritairement les primitives qui ne sont liées qu'à un type de constituant, 180 Chapitre 2 – Le caractère particulier des consonnes coronales c'est-à-dire les primitives qui ne sont propres qu'aux consonnes ou qu'aux voyelles, que ce soit par leur disparition en tant que primitive (v, ATR, ) ou par leur regroupement du fait qu'on les trouve en distribution complémentaire (N est fusionné avec L, R avec A). Le résultat de ce processus de réduction des primitives est connu sous le nom de Revised Theory of Elements (cf. Charette & Göksel 1994 : 65-66 par exemple). Après avoir donné brièvement les raisons de la suppression des éléments, je m'attarderai plus particulièrement sur l'élément sous intérêt ici, R. L'élément ATR est supprimé (cf. Charrette & Göksel 1994, Harris & Lindsey 1994, 2000), du fait qu'il n'est jamais tête d'une représentation d'une part, et que c'est le seul élément limité aux voyelles d'autre part. Cyran 1997, s'appuyant sur son analyse de la phonologie de l'irlandais et en concluant que cette langue n'exploite pas l'élément h, propose que l'occurrence de la primitive h relève d'un paramètre, "déclassant" ainsi d'une certaine manière le h par rapport aux autres primitives. Ce paramètre-h est exprimé de la manière suivante (Cyran 1997 : 194) : THE 'H'-PARAMETER The occurrence of 'h' in languages is parameterised (ON/OFF). Les langues se répartissent donc en deux catégories, selon que le paramètre-h est activé ('h-ful' languages) ou non ('h-less' languages). Jensen (1994) élimine quant à lui notamment à cause du fait qu'il ne porte que sur les consonnes et non sur les voyelles ; c'est aussi la raison pour laquelle les éléments N et L seront fusionnés (Ploch 1997, 1999), L ne portant que sur les consonnes. Intéressons-nous maintenant à l'élément coronal R. Il sera pour sa part éliminé par Backley (1993), la coronalité se retrouvant liée à la primitive A. 3.3.2.2.2. Rejet de R Backley (1993 : 301) lie son rejet de l'élément R à la sous-spécification : "I shall loosely adopt the position held by many working within an underspecification framework, in 181 Chapitre 2 – Le caractère particulier des consonnes coronales which some doubt is cast on the status of coronality as a phonologically significant entity." A partir de l'étude des clusters s+C anglais et de leur violation apparente de la Condition de Complexité, il propose "that all coronal obstruents lack an overt phonological place specification, thus rendering them inherently less complex than their non-coronal counterparts." Pour suivre l'argumentation de Backley, deux outils théoriques supplémentaires nous sont nécessaires : la condition de complexité et le gouvernement. Le gouvernement est une relation asymétrique entre deux positions squelettales. A l'intérieur d'un constituant, il se fait de gauche à droite (Kaye et al. 1990 : 198), tandis que le gouvernement entre deux constituants fonctionne au contraire de droite à gauche (Kaye et al. 1990 : 211). Kaye et al. (1990) établissent les relations entre les éléments au moyen de la Condition de Complexité, formulée de la manière suivante50 : (144) Condition de Complexité (Kaye et al. 1990 : 218) : A neutral segment may govern if it has a complexity greater than its governee. Harris (1990) reprend cette condition en la généralisant à tous les segments puisque le charme disparaît, et la modifie de façon à ce qu'un élément puisse gouverner un élément de même complexité que lui, et non uniquement moins complexe. On obtient donc la reformulation suivante : (145) Condition de Complexité (Harris 1990 : 274) : Let α and β be segments occupying the positions A and B respectively. Then, if A governs B, β must be no more complex than α. Backley (1993) reprend le cas des séquences initiales de mot #s+C, traitées par Kaye (1992) qui avait démontré l'impossibilité de syllaber [sp] comme une attaque branchante, du fait que [p] est plus complexe que [s] : si [sp] était une attaque branchante, alors [s] devrait 50 A ce moment de la Phonologie de Gouvernement, le charme est encore présent dans les relations de gouvernement. Cependant, du fait qu'il est abandonné par la suite et qu'il n'a aucune incidence sur la présente démonstration, les représentations et principes ici proposés s'en dispenseront. 182 Chapitre 2 – Le caractère particulier des consonnes coronales gouverner [p] puisqu'il s'agit de gouvernement à l'intérieur d'un constituant ; or [p] est plus complexe (trois éléments) que [s] (deux éléments : h et R), ce qui conduit à postuler l'hétérosyllabicité des deux segments : R | N | x A x x | s | p R | N x A x R | N | x x | n u Backley (1993 : 303) établit le nombre de primitives présentes pour les représentations des consonnes susceptibles de suivre un [s] initial : - les glides [j] (sewer) et [w] (sweet) contiennent un élément chacune, I et U respectivement ; - la liquide [l] (slope) contient deux primitives, et R ; - les nasales [n] et [m] comptabilisent chacune trois primitives : elles ont en commun et N, augmentées de R pour [n] et de U pour [m] ; - les obstruantes [p], [t], [k] et [f] sont elles aussi formées de trois éléments. Comme les représentations ci-dessous (Backley 1993 : 304) le mettent en évidence, un problème théorique se pose dans le cas de [s] suivie d'un glide : [w] et [j] comportant moins d'éléments que [s] (deux contre un), comment peuvent-ils le gouverner ? (146) R | N | x [s] + nasale A x | h | R x | R | | N snow R | N | x [s] + liquide] A x | h | R x | | R slow R | N | x [s] + glide A x | h | R x | U swim Lorsque [s] est suivi d'une nasale ou d'une obstruante, la deuxième consonne étant plus complexe que la première, le gouvernement entre constituants, de droite à gauche, s'applique 183 Chapitre 2 – Le caractère particulier des consonnes coronales automatiquement. Lorsque [s] est suivi de la liquide [l], la Condition de Complexité modifiée par Harris (1990) permet à [l] de gouverner [s], puisqu'elle n'est pas moins complexe que [l]51. Par contre, lorsque [s] est suivi d'un glide, celui-ci ne contient pas assez d'éléments pour prétendre gouverner [s]. Trois possibilités logiques sont alors en concurrence pour permettre d'homogénéiser les cas de gouvernement (Backley 1993 : 305) : a/ abandonner l'élément h, ce qui ne laisse que R pour représenter [s] ; b/ abandonner l'élément R, ce qui ne laisse que h pour représenter [s] ; c/ abandonner les deux éléments h et R et adopter "an all-new representation". Backley rejette la proposition c/ du fait que "the overall detrimental effects on the representation system as a whole would greatly outweight any advantage to be gained from a more satisfactory description of phonotactic constraints", ce qui à terme "would undermine the value of any explanatory theory" (1993 : 305), sans parler de la surgénération occasionnée par l'ajout d'un élément à l'ensemble des primitives postulées par la théorie, cet élément ne pouvant couvrir le même champ empirique ni "match the combined expressive power of a 'place' feature such as R° and a 'manner' feature such as h°" (1993 : 306). Considérons maintenant les deux premières options, à savoir la suppression soit de h, soit de R. Backley (1993 : 306-309) s'attache à démontrer que R n'a pas autant de légitimité que les autres éléments de la théorie. En effet, au contraire des autres éléments de place (I, U, v et A), R ne se justifie pas par son implication dans un processus quelconque d'harmonie en tant qu'élément actif, pas davantage dans un processus plus large d'assimilation ou dans un cas de propagation. "In fact, the only objectively observable manifestation of the coronal element that remains largely undisputed is its simplex interpretation as a tap, often constituting the result of a segmental decomplexification process affecting coronal stops". Par ailleurs, qu'il soit tête ou opérateur, R contribue exactement de la même manière à la représentation d'un segment : à partir du moment où il est présent dans une représentation, le segment considéré est coronal. De plus, R ne fonctionne que pour les représentations consonantiques et non pour les vocaliques. En outre, alors que les autres primitives de place peuvent se combiner librement entre elles R est restreint : "its amalgamation with some vocalic elements does indeed produce unlikely combinations" (Backley 1993 : 308). 51 On remarquera que la Condition de Complexité telle que proposée dans Kaye et al. (1990) n'aurait pas permis de postuler un gouvernement entre constituants à cet endroit, puisque cette Condition stipulait alors que le gouverneur devait être plus complexe que son gouverné, ce qui n'est pas le cas ici. 184 Chapitre 2 – Le caractère particulier des consonnes coronales Pour toutes ces raisons, Backley propose d'éliminer l'élément R de l'ensemble des primitives admises en Phonologie de Gouvernement. Ce faisant, il transforme la représentation de [s] qui passe des deux éléments (R, h) à (h) seulement : en anglais, [s] serait une interprétation phonétique de h. Les représentations de #s + glide deviennent alors : (147) [s] + [w] R | N | x R | N | x A x | h [s] + [j] x | U A x | h x | I swim suit Si les coronales perdent leur élément "distinctif", elles comportent alors un élément de moins que la plupart des non-coronales qui, elles, gardent leur élément de place A, I ou U. De ce fait, "coronal obstruents are rendered intrinsically less complex than their non-coronal counterparts" (Backley 1993 : 321). Toutefois, les vélaires ne comportant pas non plus d'élément de place, on peut arguer d'une complexité égale des coronales et des vélaires, et se demander comment sont distinguées une vélaire et une coronale de mode d'articulation identique. Szigetvári (1994), adhérant à l'idée de rejeter la primitive coronale R, s'intéresse précisément à ce dernier point. 3.3.2.2.3. Szigetvári (1994) Prenant pour motif le caractère non marqué des coronales par rapport aux consonnes des autres lieux d'articulation, y compris par rapport aux glottales, Szigetvári (1994) propose lui aussi d'exclure la primitive R des représentations segmentales. La suppression de R permettrait aux coronales de n'avoir aucune spécification de place au niveau sous-jacent, et donc de subir l'assimilation par une autre consonne ou de justifier leur transparence par rapport à l'harmonie vocalique ; l'absence de primitive de place dans une représentation serait par la suite interprété phonétiquement comme lié à la coronalité. Cependant, "the radical going away with the element responsible for coronality, R, leaves the representations of coronals in a serious situation." (Szigetvári 1994 : 214) En effet, 185 Chapitre 2 – Le caractère particulier des consonnes coronales les segments dont les représentations ne se distinguaient que par la présence vs. l'absence de la primitive R se retrouvent avec une représentation identique : les vélaires et les coronales ne sont plus distinguées. De ce fait, il semblerait qu'un moyen de distinguer les coronales et les vélaires serait de supposer un nouveau constituant rendant compte du caractère marqué des vélaires par rapport aux coronales. Cependant, cette dernière option constituerait une solution ad hoc, "which permeates throughout the framework with a number of other undesirable consequences" (1994 : 218). Une autre solution plausible au problème serait de réhabiliter l'élément "voyelle froide" en tant que constituant à part entière "as a 'normal' element" (1994 : 217), alors que sa raison d'être est précisément d'occuper une position vide à l'intersection d'une position squelettale et d'une position mélodique sans primitive, sans contribuer à la représentation en termes d'apport d'élément. Lorsque la voyelle froide est tête d'une représentation, cela signifie précisément que la tête de la représentation est vide. Pour rendre compte de la distinction entre coronales et vélaires il faudrait que la voyelle froide dispose de sa propre ligne autosegmentale, de façon qu'elle puisse également jouer le rôle d'opérateur et non uniquement celui de tête. Dans ce cas, il faudrait qu'elle soit en mesure de contribuer à la représentation par un trait saillant, et supposer cela serait retomber sur la solution ad hoc de supposer un nouveau constituant. La voyelle froide doit donc rester l'élément neutre qu'il est dans le cadre tel que conçu par Kaye & al (1985). Ce qui distinguera les coronales des vélaires sera en fait l'élément qui sera tête : la voyelle froide (c'est-à-dire rien) pour les vélaires, puisqu'une tête est obligatoire, et l'élément /h/ pour les coronales. Les coronales sont donc identifiées par l'absence de primitive de place dans leur représentation, ce qui traduit leur caractère universellement marqué. Le schéma suivant met en regard les représentations "classiques" des occlusives coronales et vélaires en Phonologie de Gouvernement, avec les représentations proposées par Szigetvári (1994 : 218) : 186 Chapitre 2 – Le caractère particulier des consonnes coronales (148) représentations "classiques" coronale [t] vélaire [k] h h | R v | représentations sans R coronale [t] vélaire [k] h h v | L'élément souligné représente la tête de la représentation. La représentation des vélaires ne change pas, c'est la représentation des coronales qui diffère. N'ayant plus de primitive de place, il se distingue des vélaires par le choix de l'élément /h/ comme tête de la représentation. La distinction entre les deux types de consonnes est donc maintenue. Cette représentation des coronales par le choix de la primitive // en tête unifie la représentation des trois "most common places of articulation" (cf. Szigetvári 1994 : 219) : chacune est définie non par un élément de place mais par un élément de manière (la tête des labiales est //, celle des coronales est /h/) ou pas d'élément du tout (pour les vélaires). Ce sont les classes de consonnes les moins fréquentes qui exploitent les primitives de place en tant que tête (I pour les palatales, A pour les uvulaires, U pour les labio-vélaires). Cyran (1997) s'intéresse également à la représentation de la coronalité au sein de la Phonologie de Gouvernement, mais propose une autre solution de substitution. 3.3.2.2.4. Cyran (1997) Cyran (1997) envisage la représentation de la coronalité à l'aide des deux primitives I (palatalité) et A (pharyngalité) : la coronalité serait une combinaison des deux. Il établit à partir de l'étude de l'anglais et de l'irlandais d'une part, du polonais d'autre part, que "perhaps coronality should in fact be defined as I.A" (1997 : 225) : les coronales du premier type de langue en effet sont caractérisées par l'élément A en tête, alors qu'en polonais, par exemple, ce sera I. 187 Chapitre 2 – Le caractère particulier des consonnes coronales Utiliser des primitives de place dévolues à d'autres lieux d'articulation soulève le problème de la distinction entre les classes de consonnes définies à l'aide d'une même primitive. Ce serait donc uniquement la combinaison de deux d'entre elles, I et A, qui permettrait de distinguer les classes de consonnes entre elles. Ainsi les palatales, définies par I, seront-elles distinguées des coronales par le fait que celles-ci contiennent également A. L'apport de Cyran dans la discussion est lié à la paramétralité. "It seems prudent to assume that there is no such thing as a uniform or universal representation of coronality" (Cyran 1997 : 226). 3.3.2.2.5. Scheer (1996) Scheer (1996) réévalue la structure interne des consonnes au sein de la Phonologie de Gouvernement. Il rejette lui aussi l'élément coronal R mais pour une raison intrinsèque à la primitive et non dans le but de réduire le nombre de ses primitives (comme l'école londonienne à laquelle Backley (1993) se rattache). L'éviction de R tient au statut uniquement consonantique de l'élément R : "un modèle où R contribue la coronalité est hors état de représenter des interactions entre Attaques et Noyaux impliquant cet élément" (Scheer 1996 : 144). Comment représenter dès lors une palatalisation de l'attaque par une voyelle haute par exemple ? Ou plutôt, comment expliquer la transformation de la primitive R de l'attaque coronale en I marqueur de palatalité ? Un des critères qu'il utilise pour déterminer la constitution des classes de consonnes est précisément, tout comme Szigetvári (1994), la notion de marque : [t] et [d] sont les consonnes les moins marquées dans l'inventaire consonantique des langues du monde, en tant que coronales mais aussi à l'intérieur même de la classe des coronales, et de leur statut épenthétique en français et en nouveau haut allemand. De ce fait, pour Scheer (1996 : 188-191), "[t, d] n'ont pas de substance : aucun élément mélodique (I, U, A) ne contribue à leur articulation". Comme chez Szigetvári (1994) donc, le caractère non marqué des occlusives coronales se traduit par l'absence de primitives de place dans leur représentation. Observons comment le système de Scheer (1996) distingue les coronales des vélaires, qui sont dans le modèle "classique" les consonnes les moins marquées. Les vélaires et les uvulaires comportent toutes l'élément U, ce qui les rend plus marquées que les coronales et permet de distinguer les vélaires de celles-ci. Dans les vélaires, U est opérateur. 188 Chapitre 2 – Le caractère particulier des consonnes coronales Comparons enfin les coronales aux glottales : aucune des deux ne comporte de primitive de place ; pour autant, les glottales sont distinctes des coronales en ce qu'elles comportent une primitive de moins, la voyelle froide, qui n'intervient pas dans leur représentation. De ce fait, c'est l'élément // qui est tête dans la représentation de l'occlusive glottale. Le tableau suivant établit les représentations des occlusives coronales, vélaires et glottales envisagées ici : (149) coronale [t] | h v vélaire [k] | h | U | v glottale [] | h Pour Scheer (1996) donc, les occlusives coronales s'inscrivent en termes de marque entre les vélaires (et les labiales) d'un côté et les glottales de l'autre. Cette hiérarchie de marque se traduit directement par le nombre de primitives présentes dans la représentation de chacune de ces classes de consonnes. En ce qui concerne les coronales fricatives et sonantes, sur lesquelles Szigetvári (1994) ne se prononce pas, Scheer (1996 : 186-188) attribue la sonorité aux primitives // et /h/ mais également à la primitive "de place" A : [s, z, l] ont A comme tête dans leur représentation, si bien qu'elles ne font pas partie de la classe des consonnes non marquées bien qu'elles soient coronales ; [n] comporte également A. Le fait que les coronales sont les consonnes épenthétiques par excellence en français ne peut s'implémenter en Phonologie de Gouvernement qu'à partir de la version du modèle qui prend en compte - et implémente - l'aspect non marqué des coronales. En effet, les épenthèses, consonantiques comme vocaliques, font apparaître les segments les plus simples, ceux qui comportent le moins de primitives possible dans une langue donnée. 189 Chapitre 2 – Le caractère particulier des consonnes coronales Etablissons un bilan du statut des coronales au sein de la Phonologie de Gouvernement. Quel lieu d'articulation est considéré comme non-marqué et pour quelle(s) raison(s) ? Les coronales jouissent-elles d'un statut particulier ou sont-elles au même niveau que les autres consonnes ? 3.3.2.3. Bilan sur la représentation des coronales au sein de la Phonologie de Gouvernement Deux tendances se dégagent en ce qui concerne les consonnes non-marquées : d'un côté, les partisans des vélaires, avec pour chef de file Kaye, de l'autre Szigetvári (1994) et Scheer (1996) qui se prononcent pour les coronales. Dans le premier cas, les coronales n'ont pas de statut particulier par rapport aux autres consonnes, ou en tout cas par rapport aux labiales, ce sont les vélaires qui jouissent d'une position privilégiée. Dans le second cas, les coronales ont bien un statut particulier, directement hérité de leur place dans la hiérarchie universelle de la marque. On précisera enfin que ce caractère non marqué, traduit par l'absence de primitive de place dans les représentations, ne concerne en réalité que les occlusives. Récapitulons les différents moyens mis à disposition par les théories pour rendre compte le cas échéant du statut particulier des coronales. La Géométrie des Traits fait appel à la sous-spécification, liée à la notion de marque universelle ou systémique. La Phonologie de Dépendance n'accorde pas plus de statut particulier aux coronales qu'aux vélaires, malgré le recours à la notion de marque. La Phonologie de Gouvernement réfère à la particularité des coronales soit au moyen d'une primitive qui leur est dévolue, soit là encore au moyen de la marque. Le statut singulier des coronales établi dans la section 2 est donc implémenté dans les théories phonologiques étudiées jusqu'à présent par l'intermédiaire de la notion de marque. Le troisième volet de cette section portant sur la représentation du statut particulier des coronales dans les théories phonologiques, après la Géométrie des Traits et les théories monovalentes, est consacré à la théorie de l'Optimalité, qui est précisément une théorie de la marque. 190 Chapitre 2 – Le caractère particulier des consonnes coronales 3.4. Théorie de l'Optimalité La Théorie de l'Optimalité (Prince & Smolensky 1993, McCarthy & Prince 1993) a fait son entrée en phonologie au début des années 90, et s'inscrit dans la lignée des cadres Principes et Paramètres. 3.4.1. Présentation générale du cadre La Théorie de l'Optimalité (OT) rejette la notion de règle dans le sens "moyen d'encoder et d'expliquer les généralisations grammaticales". Elle ne cherche pas à dériver les formes de surface à partir des structures profondes, mais à identifier les structures de suface outputs - correspondants aux structures profondes - inputs - en fonction de contraintes sur la bonne formation des outputs ('markedness constraints') et sur la conservation exacte des inputs (Prince & Smolensky 1993 [2002]). Comme on le voit ici, la marque est implémentée dans la conception même de la grammaire de ce modèle théorique. La grammaire définit un ensemble de structures sous-jacentes (inputs) qu'elle associe à un ensemble de réalisations possibles (outputs) au moyen de la fonction Gen (générateur) appartenant à la grammaire universelle. Chaque paire input-output est évaluée par la fonction H-eval qui donne son avis quant à sa bonne formation, classant l'ensemble des paires inputoutput correspondant à un input en fonction de leur relative harmonie les unes par rapport aux autres. "An optimal output is at the top of the harmonic order on the candidate set; by definition, it best satisfies the constraint system." (Prince & Smolensky 1993 [2002] : 4). Les fonctions Gen et H-eval travaillent non pas de manière successive mais en parallèle. La fonction Gen "which generates for any input a large space of candidates analyses by freely exercising the basic structural resources of the representational theory" (Prince & Smolensky 1993 [2002] : 6) définit l'ordre des nœuds dans la représentation : mot prosodique (PrWd) > pied (Foot) > syllabe (σ) > more (µ) > Racine (o) > trait (f) (cf. Heiberg 1999 : 29). Gen ne syllabifie pas et n'oblige pas chaque nœud à dominer du matériel segmental. C'est H-eval qui assume la partie explicative. Elle contient les contraintes de bonne formation, qui sont universelles ; c'est l'ordre de ces contraintes qui est propre à chaque langue. Nous sommes donc dans une approche Principes et Paramètres dans laquelle 191 Chapitre 2 – Le caractère particulier des consonnes coronales l'ensemble des contraintes (contenues dans H-eval et dans Gen, ainsi que leur ordonnancement dans cette dernière) correspondent aux principes, et leur ordonnancement à l'intérieur de H-eval aux paramètres. La fonction H-eval évalue les outputs potentiels de la manière suivante : tous les candidats sont en concurrence face aux contraintes auxquelles ils sont soumis. Maintenant que le cadre général est dressé, observons la représentation de la particularité des coronales dans le modèle. 3.4.2. Les coronales dans le modèle Comme je l'ai dit dans la transition entre les autres théories phonologiques et OT, la particularité de ce cadre théorique est qu'il se fonde totalement sur la marque, comme le formulent par exemple McCarthy & Prince (1997 : 55) : La théorie de l'optimalité (...) propose une approche de la théorie linguistique qui vise à combiner une théorie de la marque empiriquement adéquate avec une définition formelle précise de ce que signifie être 'non marqué'". De ce fait, accorder un statut particulier aux coronales dans ce cadre est particulièrement aisé. Ainsi Prince & Smolensky (1993 : 109) mentionnent le statut nonmarqué des coronales et indiquent qu'une consonne non-coronale doit recevoir "a noncoronal specification (Labial or Dorsal), even secondarily", tandis qu'une consonne coronale n'est pas spécifiée. 3.4.2.1. La classe des coronales Prince & Smolensky (1993) et Smolensky (1993) indiquent une hiérarchie de place dans laquelle la place la moins marquée est coronale. Lombardi (2003) amende cette hiérarchie en incluant [pharyngal] comme lieu le moins marqué, "on the basis of evidence from epenthesis, neutralization, and transparency". Les coronales sont donc, après le coup de glotte, les consonnes les moins marquées ; du fait que l'épenthèse fait appel aux segments, consonantiques comme vocaliques, les moins marqués, les coronales sont donc les meilleures candidates à l'épenthèse, comme nous allons maintenant le voir. 192 Chapitre 2 – Le caractère particulier des consonnes coronales Lombardi (1997, 2003) s'intéresse en effet aux épenthèses coronales et glottales dans le cadre de l'Optimalité. Elle développe son analyse à partir des contraintes élaborées dans Prince & Smolensky (1993) et Smolensky (1993). 3.4.2.1.1. Coronales vs. labiales et vélaires Dans l'explication de l'épenthèse de coronales, la Théorie de l'Optimalité écarte explicitement la sous-spécification : "once the only surviving candidates are those with some epenthetic consonant, the markedness constraints pick the consonant with the least marked Place. This allows us to analyze the unmarked behavior of the coronal without recourse to underspecification. The /t/ does have Place". (Lombardi 2003 : 3, également Lombardi 2001 : 28-30). Itô et al. (1995) justifient ce rejet de la sous-spécification dans la théorie par son caractère absolu, qui ne correspond pas à la réalité des faits. La sous-spécification, particulièrement sous sa forme radicale, est en lien direct avec l'inactivité phonologique : un trait qui n'est pas spécifié ne peut déclencher d'assimilation par exemple, ou influencer de quelque manière que ce soit la distribution des segments environnants. Cependant, cette hypothèse théorique ne résiste pas à l'épreuve empirique, particulièrement en ce qui concerne la sous-spécification du trait [coronal] : "numerous generalizations holding of coronals during the early derivation require reference to [coronal], and hence specification" (Itô, Mester & Padgett 1995 : 572 ; cf. également McCarthy & Taub 1992). Pour Itô, Mester & Padgett (1995 : 572), ce paradoxe de la sous-spécification des coronales, qui tantôt subissent des processus phonologiques, tantôt en déclenchent, est causé par "an incorrect theory that views phonological constraints as absolute and inviolable well-formedness conditions" ; cette "rigidité" est palliée par OT, qui dispose de contraintes violables. Dans ce modèle donc, les coronales ne sont pas sous spécifiées, mais la marque est traduite par l'ordonnancement universel de contraintes suivant : *LAB, *DOR >> *COR52 52 De Lacy (2002a : 191) lie la marque directement à l'épenthèse : "since epenthetic elements are never labials or dorsals, it must be the case that no markedness constraint favours them over glottals and coronals". 193 Chapitre 2 – Le caractère particulier des consonnes coronales *LAB est une contrainte rejetant tout segment labial, de même que *DOR rejette tout segment dorsal et *COR tout segment coronal. Les >> indiquent l'ordre de priorité. Cet ordonnancement de contraintes signifie que le rejet des labiales et des dorsales est prioritaire sur le rejet des coronales. Considérons l'exemple suivant qui évalue les outputs potentiels à une forme sousjacente /ao/ en fonction de l'ordonnancement de contraintes ici établi. On obtient dans les cas d'épenthèse (adapté de Gafos & Lombardi 1999 : 85, Lombardi 2003 : 3) le tableau évaluatif suivant53 : (150) b. abo c. ako d. a e. a.o MAXV ONSET /ao/ ) a. ato *LAB *DOR *COR * !* !* !* !* Outre les contraintes relatives au lieu d'articulation (*LAB, *DOR et *COR), deux contraintes sont utilisées ici, qui en réalité sont au même niveau dans la hiérarchie des contraintes (comme *LAB et *DOR le sont entre elles). La contrainte ONSET exige une attaque pour chaque syllabe : "syllables must have onsets (except phrase initially)" (Prince & Smolensky 1993 [2002] : 17). Cette contrainte est binaire : "a given syllable either satisfies or violates the constraint entirely" (Prince & Smolensky 1993 [2002] : 75). La contrainte MAXV fait partie des contraintes de fidélité asking for the exact preservation of the input in the output" (cf. Prince & Smolensky 1993 [2002] : 4) ; elle impose la représentation de toutes les voyelles de l'input dans la forme optimale. La séquence proposée en (150)d., parce qu'elle ne contient pas trace du /o/ de la forme sous-jacente, viole fatalement la contrainte MAXV. La forme proposée en e. ne contient pas 53 L'évaluation se présente sous la forme d'un tableau dont les lignes indiquent les candidats potentiels et les colonnes les contraintes, dans leur ordre d'importance (dans la langue considérée) de gauche à droite. Chaque fois qu'une contrainte est violée, la case correspondant en regard de la forme sera marquée d'une étoile *. Si la violation est "fatale", c'est un point d'exclamation qui sera porté en regard de la forme, excluant celle-ci de toute considération supplémentaire. La forme optimale, c'est-à-dire celle qui est prononcée de fait, est récompensée d'un doigt pointé ). 194 Chapitre 2 – Le caractère particulier des consonnes coronales d'attaque pour la deuxième syllabe, ce qui est considéré dans la langue comme une violation de la contrainte ONSET fatale pour la forme candidate. Les séquences (150)a., b. et c., parce qu'elles exploitent tous les segments de la forme sous-jacente et que leur deuxième syllabe comporte une attaque, passent avec succès le cap des deux premières contraintes et sont de ce fait jusque là équivalentes. Cependant, du point de vue du lieu d'articulation, la violation de *LAB est fatale pour la séquence b. puisque la consonne épenthésée est une labiale, de même que la violation de *DOR est fatale pour la séquence en c. puisque [k] est une dorsale. Il est vrai que la séquence a. viole la contrainte *COR, [t] étant coronale. Cependant, du fait que la contrainte *COR est placée après toutes les autres contraintes s'appliquant sur les outputs, sa violation est la moins "grave", aussi la séquence correspondante est-elle considérée comme optimale. 3.4.2.1.2. Coronales vs. glottales L'ordonnancement des contraintes liées aux lieux d'articulation post-glottaux est réglé par la hiérarchie présentée ci-dessus. Les occlusives glottales quant à elles ont un lieu Pharyngal54 ; étant donné qu'elles sont encore moins marquées que les coronales (cf. Lombardi 2001), la contrainte s'y rapportant se place dans la hiérarchie comme suit : *LAB, *DOR >> *COR >> *PHAR Le résultat est que // sera "the optimal epenthetic consonant". "Its Place markedness violation is even lower than that of the relatively unmarked /t/" (Lombardi 2003 : 4). Ainsi si l'on reprend l'exemple développé ci-dessus obtient-on le tableau suivant : (151) /ao/ )a. ao b. ato c. a d. a.o (ONSET, MAXV) *COR *PHAR * !* !* !* 54 Lombardi (2001) renvoie à McCarthy (1989, 1994), également pour la distinction entre [] et [h] d'une part, qui seraient [+glottales], et [] et [] d'autre part, [-glottales]. Dans toutes les langues, /h, / "are Phar in languages where they form a natural class with gutturals, and they are also Phar in languages with neutralization, // epenthesis, and transparency effects." (Lombardi 2001 : 30). 195 Chapitre 2 – Le caractère particulier des consonnes coronales Cette fois la séquence [ato] n'est pas optimale, puisqu'elle viole une contrainte qui n'est pas la dernière dans la hiérarchie. La séquence [ao] est préférée puisqu'elle ne viole que la contrainte la plus basse dans la hiérarchie. Reprenons l'exemple du cupeño (cf. chapitre 1 section 2.1) traité par Lombardi (2003 : 19-18) pour illustrer le traitement des épenthèses de coup de glotte en OT par rapport à l'insertion d'une dorsale ou d'une coronale. Dans cette langue, le coup de glotte est inséré en coda "to satisfy a minimal word requirement", ce qui reçoit le traitement suivant en OT : (152) /hu/ hu ) hu hut huk MINWD *DOR *COR *PHAR !* * !* !* La contrainte MINWD requiert une structure minimale en CVC pour les mots de cette langue, et les contraintes *DOR, *COR et *PHAR, dans cet ordre, gèrent le lieu d'articulation. "The Place markedness hierarchy then chooses /hu/ as optimal, since the *Place violation incurred by the glottal stop is the lowest ranked one." (Lombardi 2003 : 18). La hiérarchie des contraintes liée aux lieux d'articulation est, nous l'avons vu, universelle. Les épenthèses consonantiques sont donc universellement laryngales en priorité, et ne sont coronales que dans le cas où d'autres raisons se greffent. Pour Lombardi (1997 : 8) en effet, "there is no language where the general, phonologically driven epenthesis consonant is a coronal; in all of them the story is more complicated, confirming the generalisation that coronal epenthesis is only seen when something additional to Place markedness is active." (cf. chapitre 1 section 2.2 pour une évaluation de cette proposition). Pour Lombardi (1997 : 7), en ce qui concerne les coronales, "in onset positions, sonorants are not preferable; obstruents presumably are because of the steeper sonority cline they give up to the syllable." De cette observation concernant les coronales elle va déduire l'ordonnancement de contraintes permettant de justifier de l'épenthèse d'une coronale plutôt 196 Chapitre 2 – Le caractère particulier des consonnes coronales que d'une glottale dans les langues où le phénomène se produit (par exemple l'anglais de Bristol) ou dans les cas où au sein d'une même langue les deux types d'épenthèses sont possibles (tunica). Reprenons le phénomène de l'épenthèse de [l] en anglais de Bristol (voir chapitre 1 section 2 pour la présentation des données, chapitre 3 section 4 pour l'implémentation du mode de concaténation dans la théorie). En fin de mot se terminant par un schwa est épenthésé un [l]. Par exemple, le prénom Eva est prononcé [ivl]. Lombardi (2003 : 22-23) traite la différence de type de consonne inséré en coda ou en attaque en ajoutant une contrainte à la hiérarchie de place détaillée plus haut, à savoir SONCODA, selon laquelle "Codas should be sonorant". La violation de cette contrainte étant fatale, elle exclut les épenthèses de coup de glotte en coda avant même que l'on s'intéresse au lieu d'articulation puisque les occlusives glottales sont par définition non sonantes. Reste à choisir le type de sonante possible en coda, ce qui sera rendu possible par les contraintes *NASCODA, interdisant les nasales en coda, et *NONNASCODA, interdisant les non-nasales en coda, la violation de la première étant fatale au contraire de celle de la seconde. Le choix de l'épenthèse par la hiérarchie de contraintes détaillée ci-dessus est repris dans le tableau suivant : (153) SONCODA /iv/ )ivl iv ivn *COR *PHAR *NASCODA * !* *NONNASCODA * * * !* La séquence [iv] est exclue puisque la contrainte SONCODA exige une sonante en coda, ce que [] n'est pas, et que sa place dans l'ordonnancement des contraintes n'est pas la dernière. [ivn] est définitivement rejetée, non pas parce que la coda est une coronale (sans quoi [ivl] serait exclue également), mais parce qu'elle viole fatalement la contrainte interdisant les nasales en coda (*NASCODA). La séquence optimale est donc [ivl] : certes la coda et une coronale (ce qui viole *COR) mais c'est une sonante (ce qui correspond à SONCODA) sans être une nasale (ce qui sied à *NASCODA, placée avant *NONNASCODA en tunica). 197 Chapitre 2 – Le caractère particulier des consonnes coronales Dans une langue comme le tunica (cf. chapitre 1 section 2.1) où cette fois c'est la nasale qui est favorisée en coda, il suffit d'inverser l'ordre d'importance des deux dernières contraintes citées, de façon à ce que ce soit l'éventuelle violation de *NONNASCODA qui soit fatale (Lombardi 2003 : 25) : (154) /sahku/ sahku ) sahkun sahkum *LAB *NONNASCODA *NASALCODA !* * * !* *COR *PHAR * * La contrainte SONCODA est ici facultative : *NONNASCODA garantit une coda sonante puisque nasale ; c'est donc *NONNASCODA qui va permettre le rejet définitif de la séquence [sahku], le coup de glotte n'étant pas une sonante. Le choix entre /m/ et /n/ est réglé par l'association habituelle *LAB >> *COR. De plus, cet ordonnancement des contraintes permet de rendre compte des épenthèses de coup de glotte présentes dans cette langue : certains mots à accent final prennent une syllabe prothétique finale pour recevoir l'épenthèse finale de /n/ caractéristique de la fin d'une proposition, syllabe constituée d'un coup de glotte, d'une copie de la voyelle précédente et du /n/ : forme normale ri forme en fin de proposition riin glose "maison" Le tableau suivant, utilisant les mêmes contraintes dans le même ordre que dans le cas de l'épenthèse de [n], rend compte correctement des données : (155) /ri/ rii ) riin rinin *NONNASCODA *NASALCODA !* * * *LAB *COR * **! *PHAR ** * La séquence [riin] est optimale puisqu'elle ne viole de manière fatale aucune contrainte, au contraire de [rii] qui viole la contrainte *NONNASCODA prohibant les nasales, et donc les sonantes, de la position en coda, et de [rinin] qui contrevient à la contrainte *COR 198 Chapitre 2 – Le caractère particulier des consonnes coronales s'appliquant à l'attaque de la syllabe : universellement placée avant *PHAR, elle privilégiera les attaques en pharyngales plutôt qu'en coronales. Ce qui permet de rendre compte de la prédilection du tunica pour les coronales dans un cas mais pour les glottales dans l'autre est le fait que l'épenthèse de la glottale a lieu en attaque, qui n'est régie au niveau phonologique que par les contraintes de place, alors que l'épenthèse de la coronale se produit en coda, position sur laquelle interviennent des contraintes relatives au mode articulatoire. En attaque, les épenthèses de coronales sonantes sont dues pour Lombardi (2003 : 33) "to factors that are not purely phonological". Ainsi, dans les langues suivantes (cf. chapitre 1 sections 2.1 et 2.2) les contextes morphologiques ou mélodiques suivants jouent un rôle déterminant dans le conditionnement du lieu d'articulation de l'épenthèse : - en gokana, l'épenthèse à l'intervocalique de /l/ se manifestant par un [r] dans un contexte oral et un [n] dans un contexte nasal est restreint à deux suffixes, seulement entre deux voyelles longues et à l'intérieur d'un pied. Donc, "it is not the general phonologically-driven epenthetic consonant of the language" (Lombardi 2003 : 28-30). - en japonais, l'épenthèse de [r] en initiale de radical derrière un préfixe se terminant par une voyelle n'est pas due à une exigence de la langue - les hiatus y sont permis - mais au contexte morphologique. - en fula, l'épenthèse de [n] constatée ne fonctionne que dans un jeu de langue mais non plus généralement dans la langue. - en kçnni, [r] est inséré uniquement entre un radical et un suffixe de pluriel à condition que ce radical se termine par [aa], [çç] ou [], donc lorsque des conditions à la fois morphologiques et phonologiques sont réunies. Cette position ne permet cependant pas d'expliquer en quoi la morphologie détermine la nature de la consonne épenthésée : comment une frontière morphologique peut-elle sélectionner une mélodie particulière ? L'épenthèse en attaque de /t/, qui est certes une coronale mais qui n'est pas une sonante, répond à une stratégie différente (Lombardi 2003 : 33-36). Prenons le cas de l'axininca campa (cf. chapitre 1 section 2.1). Dans cette langue, /t/ est épenthésé en attaque entre un radical et un suffixe, donc dans un environnement 199 Chapitre 2 – Le caractère particulier des consonnes coronales morphologique déterminé : la concaténation des morphèmes /i-N-koma-aa-i/ "il repagaiera" se réalise [ikomataati]. Si // est bien l'épenthèse "par défaut" dans les langues du monde, pourquoi est-ce un /t/ qui est inséré ? Le seul critère morphologique n'est pas suffisant pour justifier ce manquement à la règle55, il faut considérer les raisons phonologiques au niveau de la grammaire universelle. Commençons par le mode d'articulation : non seulement les obstruantes sont prioritaires sur les sonantes en attaque, mais à l'intérieur même de la classe des obstruantes les occlusives sont préférables. Ceci se traduit en Optimalité par les contraintes *SONV et *OBSV qui interdisent respectivement les sonantes et les obstruantes en attaque, ordonnées universellement *SONV>>*OBSV, d'une part ; d'autre part, les contraintes *FRICV et *STOPV qui interdisent les fricatives et les occlusives en attaque, *FRICV étant universellement classée avant *STOPV. L'inventaire phonologique de l'axininca campa excluant le // mais incluant le /h/, celui-ci sera éliminé en tant que fricative, et les seules occlusives restant en lice seront celles comprenant une articulation supralaryngale. De plus, cette hiérarchie de contraintes de mode d'articulation est prioritaire sur celles concernant le lieu d'articulation, *COR et *PHAR dans le cas présent56. On obtient alors le tableau suivant57 (Lombardi 2003 : 36) : (156) /ikoma + i/ ikomahi ikomasi ikomali ) ikomati *SONV *FRICV *! *! *! *COR *PHAR * * * * 55 C'est ici le lieu d'articulation que l'on cherche à justifier et non l'apparition même d'une épenthèse à la frontière morphologique. 56 Sont également concernées *Lab et *Dorsal, qui éliminent les candidats tels que [ikomapi] ou [ikomaki] mais qui n'entrent pas en compte dans la rivalité glottales / coronales. 57 Je rappelle qu'aucun output avec la glottale n'est proposé puisque // est exclus de l'inventaire de l'axininca campa. 200 Chapitre 2 – Le caractère particulier des consonnes coronales On notera que l'ordonnancement des contraintes concernant le mode d'articulation a permis non seulement d'éliminer [] de la course, mais également la fricative [s], pourtant coronale. Plusieurs remarques sont à évoquer. Tout d'abord, il manque une contrainte concernant le voisement, afin de rayer [d] de la liste des candidats. Mais ceci n'est qu'une question de formulation et ne remet pas en cause l'analyse. L'argument suivant est en revanche plus critique. Le fait que // soit absent de l'inventaire phonologique ne constitue pas en soi une raison suffisante pour exclure la possibilité d'un [] en output. Si l'on prend l'exemple de l'allemand (Wiese 1996), la situation est précisément celle-ci : l'inventaire phonologique de la langue ne comporte pas le coup de glotte, mais celui-ci apparaît en surface, notamment en épenthèse (cf. chapitre 1 section 2.2), à l'initiale ([awtoo] pour Auto "voiture") et à l'intervocalique devant voyelle accentuée (chaotisch "chaotique" est réalisé [ka()'oot]). C'est également le cas en français : Encrevé (1988a : 32-41) relève une occlusion glottale dans les cas de liaison sans enchaînement, et ce alors que le français ne comporte pas // dans son inventaire phonologique ([ilfotntralafwa] il faut en être à la fois, [kyzessjl] que je jugeais essentiel) (cf. également Tranel 1981 : 310-311, Plénat 1999 : 128). Si l'on ne peut exclure le coup de glotte de la liste des outputs possibles, alors au terme de l'analyse présentée ici non seulement [t] et [] sont encore en concurrence, mais en plus selon les contraintes établies ici c'est [] qui est optimal et non [t], alors que c'est [t] qui est observé en surface. La forme optimale ici n'étant pas celle attestée de fait, l'ordonnancement des contraintes, l'ensemble des contraintes ou leur définition est à réétablir. Examinons un instant comment les contraintes permettent de rendre compte de la différence de marque à l'intérieur de la catégorie des consonnes coronales. 201 Chapitre 2 – Le caractère particulier des consonnes coronales 3.4.2.2. Au sein de la classe des coronales De la même manière que l'ordonnancement de contraintes permet de rendre compte du lieu d'articulation le moins marqué et donc d'élire la forme optimale (celle qui est attestée de fait), l'ajout de contraintes portant sur le mode articulatoire permet de distinguer, à l'intérieur d'une classe de consonnes, la consonne la moins marquée. Nous avons vu dans la section précédente comment les contraintes régissant le mode articulatoire en fonction de la position à l'intérieur de la syllabe permettaient d'établir la forme optimale d'une épenthèse. En coda, le fait que l'on observe prioritairement des sonantes est rendu par la contrainte SONCODA ; en attaque, les obstruantes sont moins marquées que les sonantes, ce qui se traduit par *SONV >> *OBSTRV ; au sein de la catégorie des osbtruantes, les occlusives sont préférées aux fricatives : *FRICV >> *STOPV. L'ordonnancement de ces deux derniers ensembles est universel. Il reste à s'intéresser aux différents lieux d'articulation au sein de la classe des coronales. Les contraintes traduisant la marque et l'articulation alvéolaire étant la moins marquée des articulations coronales, il suffit d'établir une série de contraintes excluant les rétroflexes, les dentales, éventuellement les palatales, puis les alvéolaires, celle-ci étant ordonnée en dernier : *RÉTROFLEXE >> *PALATALE >> *DENTALE >> *ALVÉOLAIRE. Je n'ai pu trouver trace de ces contraintes, mais le modèle permet aisément de les générer puisque, encore une fois, la théorie de l'Optimalité implémente la marque. 3.4.3. Bilan sur les coronales en OT En OT, la particularité des coronales est mise en exergue en utilisant des contraintes de marque, mais le degré de marque des coronales et des laryngales est analysé sans faire référence à la sous-spécification. Les laryngales sont les consonnes les moins marquées, mais il arrive que les coronales soient épenthésées "à leur place" pour des raisons de conflits de contraintes. Si des coronales sont épenthésées à la place de , c'est pour des raisons morphologiques ou phonologiques et non comme consonnes coronales par défaut. La hiérarchie de contraintes concernant le lieu d'articulation est donc bien universelle : *LAB, *DOR >>*COR >>PHAR. 202 Chapitre 2 – Le caractère particulier des consonnes coronales 3.5. Bilan sur la représentation des coronales dans les théories phonologiques Dans toutes les théories présentées ici – Géométrie des Traits, Phonologie de Dépendance, Phonologie de Gouvernement – soit la représentation des coronales est équivalente à celle des labiales ou des vélaires, soit elle met en exergue la particularité des coronales par rapport à la marque. Autrement dit, ce sont les données qui conditionnent les théories quant à leur position par rapport aux coronales. Aucune théorie ne propose un rapport de marque pour une raison interne à la théorie elle-même, indépendamment de l'empirie : les théories ne font qu'encoder la marque, basée sur l'empirie. Chaque théorie pourrait, du point de vue de sa structure, encoder n'importe quel autre lieu d'articulation. Seule Lombardi (1997, 2003) dépasse ce raisonnement circulaire et fait une prédiction quant au fait que l'on ne trouvera pas d'épenthèse de coronales dans les langues du monde qui ne soit conditionnée par rien d'autre que la phonologie. Dans cette partie consacrée à la présentation de l'épenthèse consonantique, le premier chapitre a été consacré à l'exposé des données dans les langues du monde, assorti d'une typologie des raisons invoquées à l'apparition de l'épenthèse et d'un inventaire des épenthèses consonantiques en français. Celles-ci étant toutes coronales, le deuxième chapitre a fait le point sur le statut de la coronalité dans les théories phonologiques génératives. Après cet éclaircissement concernant le lieu d'articulation de la consonne épenthétique, tournons nous dans le chapitre suivant vers l'implémentation du phénomène de l'épenthèse consonantique au sein de deux problématiques distinctes, dans différents cadres théoriques. 203 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français : liaison et épenthèse Les théories phonologiques ont abordé le phénomène de l'épenthèse consonantique sous deux angles : en rapport avec les alternances consonne ~ zéro du français, et pour ellemême. Nombre de travaux ont été consacrés à l'une comme à l'autre de ces perspectives. En ce qui concerne les alternances consonne ~ zéro, l'épenthèse s'est révélée une alternative d'analyse face aux imperfections de représentation du modèle linéaire. Dans la première section de ce chapitre, je passerai en revue les différentes analyses proposées pour ce type d'alternances, particulièrement en ce qui concerne la liaison, sur laquelle portera un des phénomènes analysés dans la troisième partie de cette thèse. L'épenthèse a également été envisagée en elle-même, l'enjeu étant dans ce cas non pas de l'opposer à une analyse en termes de consonne sous-jacente mais de modéliser l'apparition d'une consonne intrusive. La deuxième section de ce chapitre se propose de montrer l'évolution de traitement dont a bénéficié l'épenthèse, en fonction de la prise en compte de la structure syllabique dans le processus explicatif. 1. Epenthèse et alternances consonne ~ zéro L'étude de l'épenthèse au sein de la dérivation en français s'inscrit dans le cadre plus large des alternances consonne ~ zéro, c'est-à-dire des unités lexicales se présentant tantôt avec une consonne, tantôt sans, par opposition à deux autres catégories de termes : ceux ne comportant jamais de consonne à la finale (flou, joli) et ceux au contraire dont la consonne finale est toujours présente (lucide, agréable). Les alternances consonne ~ zéro se manifestent dans trois cas de figure : à la liaison, à la flexion et à la dérivation (cf. par exemple Tranel 1981 : 159-162, Paradis & El Fenne 1995 : 170, Prunet 1986 : 230, Wetzels 1987). Le tableau suivant propose un aperçu des cas où elles se manifestent, en fonction des contextes et de la consonne qui apparaît : 204 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (157) liaison consonne alternante t z adjectif _ nom r nom _ adjectif z entre catégories adverbe _ participe z majeures z adverbe _ substantif / adjectif p verbe _ adjectif t z verbe _ adverbe contexte après mineure avant mineure après numéral catégorie syntaxique déterminant _ substantif catégorie / adjectif préposition _ déterminant verbe _ préposition _ clitique catégorie verbe (impératif) verbe _ clitique (inversion) cinq _ adjectif huit _ six, dix _ adjectif genre substantif flexion dérivation nombre substantif personne verbe mode verbe préfixe _ base radical _ suffixe z z t z t k t s/z t d s z n t z f s t m d z v t d v m z s t p d illustration petit copain / petit ami gros castor / gros écureuil long printemps / long été premier train / premier invité athlètes français / athlètes américains très attendu très envie, *fort envie trop tard / trop important il est français / il est anglais vous chantez bien / vous chantez agréablement les parents / les enfants les petits / les anciens amis dans deux heures / dans une heure il vient à la maison manges-en ms : mange en cuisine mange-t-il cinq / cinq enfants / cinq cents huit / huit enfants / huit cents dix / dix enfants / dix copains petit / petite bavard / bavarde long / longue gros / grosse gris / grise franc / franche sain / saine avocat / avocate lépreux / lépreuse œufs/ œuf os [o] / os [çs] sort / sortent dort / dorment entend / entendent coud / cousent vit / vivent sort / sorte entend / entende vit / vivent dort / dorme défaire / désorganiser gros / grossir numéro / numéroter drap / draper décès / décéder 205 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français z nid / nicher impôt / imposer Les consonnes intervenant dans ces trois phénomènes, grande a été la tentation de les unir sous une même logique explicative (cf. pour une présentation Tranel 1981 : 162, Durand 1986b, Paradis & El Fenne 1992, 1995), notamment par les générativistes linéaires "de la première heure" que sont Schane, Selkirk et Dell (cf. section I [3] 1.1.1.2.2). C'est ce que Durand (1986b : 164) appelle l'hypothèse du parallélisme, due au fait que c'est la même consonne qui apparaît pour un item donné à la liaison, à la dérivation et à la flexion vs. son absence en finale absolue : (158) adjectif : petit verbe : mettre en finale de proposition [pti] [ilm] à la liaison [ptitami] [mtil] à la flexion [ptit] [mt] à la dérivation [ptits] [mtabl] Paradis & El Fenne (1995 : 170) formalisent cette hypothèse de la manière suivante : "the well-known consonant/ø (C/ø) alternation in French should be analyzed as much as possible in a uniform way, independently of the context where it occurs (verbal, nominal, adjectival inflection or derivation, and liaison)". Dans une première section, je soumets une revue des analyses proposées pour la liaison, sujet particulièrement sous le feu des projecteurs dans la phonologie du français dans le courant génératif ; l'épenthèse a été considérée comme l'alternative prioritaire face à une analyse posant la consonne alternante comme sous-jacente. La deuxième section propose une partition des cas de liaison, en termes d'obligation et d'interdiction et en fonction des appartenances syntaxiques des éléments en jeu. Ce bilan permettra de poser les fondements empiriques d'un cas particulier de consonne apparaissant à la liaison post-verbale, développé dans la troisième partie de cette thèse. Dans la troisième section de ce chapitre, c'est la flexion, tant nominale que verbale, qui sera étudiée à son tour, de façon à distinguer précisément, en ce qui concerne plus particulièrement le verbe, les critères déterminant l'appartenance d'une consonne à un morphème flexionnel plutôt qu'au radical. 206 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1. Analyses antérieures de la liaison La liaison est un des trois cas, avec la flexion et la dérivation, où s'observent les alternances consonne ~ zéro en français. C'est sans doute celui qui a été le plus traité, en témoignent les divers compte-rendus récapitulatifs que l'on peut en trouver, consacrés expressément à son historique (Klausenburger 1984, Encrevé 1988b, Tranel 1995a, b) ou le développant pour soutenir une analyse particulière (cf. Tranel 1981, Durand 1986b, Encrevé 1988a, Paradis & El Fenne 1992, 1995, Côté 2003). Il ne s'agit pas ici de concurrencer ces bilans, non plus que de simplement les mettre à jour, mais plutôt de mettre en évidence les arguments qui sont avancés pour défendre les différentes options d'analyse qui s'offrent face à l'apparition sporadique d'une consonne. La liaison est un cas particulier d'enchaînement de mots, délimitée par Encrevé (1988a : 23) comme "un phénomène ayant lieu dans la chaîne parlée au contact entre deux mots dont le premier, lorsqu'il est prononcé isolé ou devant un mot commençant par une consonne (C), se termine par une voyelle (V), et dont le second prononcé isolément commence par une voyelle". Le phénomène se caractérise donc par un contexte phonétique particulier - devant une voyelle vs. devant une consonne - et la présence de deux mots en contact. La nature consonantique ou vocalique de l'élément à gauche de l'alternance n'est pas considérée comme pertinente pour le phénomène. Dans cette section, je récapitulerai les différentes analyses qui ont été proposées selon lesquelles la consonne que l'on entend à la liaison est présente dans l'un des mots participant du processus58. Dans la section suivante, je tâcherai d'établir une partition des différents types de liaison possibles (section 2.2). Je distinguerai ici les analyses en fonction de la position qu'elles accordent à la consonne qui alterne dans le lexique : en fin du premier mot (section 1.1.1), en début du second (section 1.1.2), ou ni dans l'un, ni dans l'autre (section 1.1.3). La position concerne la place lexicale et non la position après syllabation, celle-ci étant, dans les cas d'enchaînement, 58 Je ne présenterai pas les cas particuliers relevant de la prise en compte des mots à "h aspiré", qui font l'objet d'une littérature importante (cf. notamment Kiparsky 1973, Ågren 1973, Klausenburger 1974, Vergnaud 1975, de Cornulier 1974, 1978, Gaatone 1978, Clements & Keyser 1981, Kaye 1984, Tranel 1981, Anderson 1982, Iverson 1983, Wetzels 1987, Spence 1988, Encrevé 1988a) et pour lesquels je proposerai une représentation en partie III (section [9] 3.2.1.4). Je ne traiterai pas non plus ceux s'intéressant plus particulièrement à la liaison après nasale (cf. entre autres Dell 1973, Tranel 1974, 1981, Anderson 1982, Prunet 1986). 207 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français toujours en attaque (Encrevé 1988a : 75 : "dans les contextes de liaison où la consonne de liaison est réalisée invariablement (liaison obligatoire), cette consonne est invariablement enchaînée à la voyelle du mot suivant"). Lorsque l'on considère la chaîne parlée, les cas où la consonne est réalisée de fait en "coda" en fin de premier mot sont minoritaires et correspondent à ce que Encrevé (1988a) attribue au non-enchaînement. En effet, "la présence de la consonne de liaison et sa position dans la structure syllabique sont deux phénomènes dissociables" (Encrevé 1988a : 30). 1.1.1. La consonne appartient au premier morphème Dans cette section sont rassemblées les analyses considérant que la consonne est présente au niveau lexical en finale du premier morphème. Envisager la consonne dans cette position plutôt qu'insérée par épenthèse (et donc non présente dans le lexique) permet de rendre compte des différences de mélodie de la consonne (petit [t] ami, long [g] été, premier [r] élément, etc) de manière unifiée. On distinguera deux traitements possibles, tous deux envisagés dans la littérature consacrée à l'épenthèse : la supplétion (section 1.1.1.1) ou la présence systématique de la consonne (section 1.1.1.2). 1.1.1.1. Supplétion La supplétion consiste à poser deux ou plusieurs allomorphes du premier mot (ou du morphème intervenant à la gauche de la consonne considérée) dans le lexique. Par exemple pour le déterminant défini pluriel les, on aura /le/ / /lez/. Le choix de l'allomorphe se règle en fonction du contexte. Cette solution a été présentée dans le traitement de la liaison dès avant la phonologie générative. 1.1.1.1.1. Cadre non génératif Paradis & El Fenne (1992, 1995) relèvent divers travaux dans lesquels la liaison est considérée sous l'angle de la supplétion (Michaut 1934, Trager 1944, Pinchon & Couté 1981). Avant 1968 en effet, il était difficilement concevable qu'un segment non-attesté dans une 208 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français réalisation phonétique soit présent dans la représentation phonologique de l'unité lexicale à laquelle il correspond59 (à l'exception de Togeby 1951). 1.1.1.1.2. Cadre génératif linéaire Devant le choix d'une consonne à élider sous certaines conditions ou d'une consonne à épenthéser dans des contextes particuliers, plusieurs phonologues ont préféré opter pour cette troisième solution que constitue la supplétion. Cependant, en phonologie générative cette solution reste marginale et correspond à deux périodes bien précises. En ce qui concerne la phase linéaire, c'est l'année 1978 qui s'est révélée féconde pour cette approche : Long, Gaatone, Encrevé et Rotenberg considèrent que la liaison correspond à un phénomène d'allomorphie. Encrevé (1988b : 87) résume ainsi la position de l'époque : "nous estimions que la moins mauvaise solution était celle de la supplétion, accompagnée d'un recours à l'information syntaxique directe." Rotenberg propose une solution originale, la 'supplétion partielle', qui permet de rendre compte du statut particulier de la consonne de liaison (c'est la seule consonne du mot dont la non prononciation n'altère pas la base) tout en gardant la généralisation "selon laquelle dans tous les cas la forme prévocalique diffère de la forme préconsonantique en ce qu'elle est plus longue d'une consonne" (1978 : 131). Tout comme Schane (1978), il suppose que la consonne qui apparaîtra à la liaison est indiquée dans le lexique, mais non de manière idiosyncratique : "à chaque mot qui peut entrer en liaison est associée une consonne de liaison, étiquetée L, que l'on peut insérer par application d'une règle". De ce fait, et comme le souligne Encrevé (1988b : 88), Rotenberg traite séparément la nature de la consonne de liaison et sa présence en surface. Par ailleurs, il établit une règle différente pour la liaison facultative de celle concernant la liaison obligatoire. 59 Le fait que le lexique puisse contenir des éléments qui n'apparaissent pas en surface a d'ailleurs fait l'objet d'un débat entre générativistes "concrets", pour lesquels le lexique ne contient que ce qui est observable, et "abstraits", qui supposent des objets dans le lexique même si ceux-ci ne se manifestent pas directement en surface. Je n'entrerai pas dans ce débat ici, cf. Tranel (1981 : xii). 209 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.1.1.3. Cadre génératif multilinéaire La supplétion a été envisagée par plusieurs linguistes, et ce jusque dans les théories actuelles ; on retiendra entre autres Klausenburger (1984), Herslund (1986), Morin (1987), Green & Hintze (1988), Perlmutter (1998), Tranel (1995b), Bonami & Boyé (2003). Côté (2003) ne formalise pas ses propositions, mais se réfère aux travaux génératifs dans sa présentation du phénomène de liaison en français, aussi ne l'ai-je pas classée parmi les linguistes non génératifs. Ses recherches en acquisition l'ont conduite à distinguer trois types de consonnes apparaissant à la liaison. Elle relève ainsi le cas des adjectifs dont la voyelle varie selon que le mot est impliqué ou non dans une liaison : (159) non liaison en [v], liaison en [vn] non liaison en [o], liaison en [t] non liaison en [e], liaison en [r] autres bon, ancien sot, idiot premier, dernier beau/bel, vieux/vieil, fou/fol, ce/cet Ces adjectifs comportent les deux formes dans le lexique, et c'est la possibilité même d'une liaison qui déclenche l'utilisation de l'un ou de l'autre allomorphe. Perlmutter (1998), Tranel (1995a) et Bonami & Boyé (2003) parlent de supplétion pour ces mêmes adjectifs. Les deux premiers en proposent une analyse dans le cadre de la Théorie de l'Optimalité, tandis que Bonami & Boyé (2003) s'inscrivent dans un cadre théorique morphologique et non phonologique. 1.1.1.1.4. Bilan sur la supplétion L'avantage de la supplétion sur l'épenthèse, tout comme celui de la présence de la consonne dans le lexique, est de rendre compte de la nature de la consonne alternante puisque celle-ci est lexicalisée. Les reproches qu'on adresse à cette conception de la liaison concernent l'absence de prise en compte du fait que dans certains cas, ce sont toujours les mêmes consonnes qui apparaissent et non une distribution aléatoire de l'ensemble des consonnes possibles à la finale 210 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français de mot en français ; par ailleurs, la supplétion n'est pas explicative, dans ce sens qu'elle ne fait aucune prédiction quant à la nature de la consonne qui apparaît ou même de la présence vs. l'absence de la consonne dans certains cas (cf. Paradis & El Fenne 1995 : 172). Tranel (2000 : 50) insiste en outre sur la différence de statut de deux types de consonnes, les consonnes intrinsèques facultatives et les consonnes latentes. Les consonnes intrinsèques facultatives "peuvent être prononcées ou non chez un même locuteur" en variation libre : toubib, exact, août, ananas peuvent être réalisés avec la consonne finale ([tubib], [ezakt], [ut], [ananas]) ou sans ([tubi], [eza], [u], [anana]). Pour Tranel, la supplétion se justifie dans le cas de ces consonnes facultatives, mais non dans le cas des consonnes latentes, mais il ne motive pas davantage son propos : "ce genre de représentations semble devoir être réservé aux cas des consonnes intrinsèques facultatives (voir ci-dessus), qui se comportent différemment des consonnes latentes". Une critique plus grave qu'il émet (également Tranel 1981, 1990, 1998, 1999) concerne le statut de la consonne finale : "intrinsèque" (c'est-à-dire fixe) ou latente réalisée, elle est représentée de la même manière alors que dans certains cas, le comportement des deux est précisément différent, l'une s'enchaînant et l'autre non. "Pour ne prendre qu'un seul exemple emprunté à Morin (1998), dans un robuste, mais petit, t-enfant, la consonne de liaison [t] se trouve normalement en position d'attaque après la pause séparant l'adjectif du nom ("enchaînement"), mais dans l'expression parallèle une robuste, mais petite, aspérité, la consonne finale intrinsèque /t/ doit rester en position de coda" (Tranel 2000 : 51). L'explication la plus courante pour les consonnes apparaissant à la liaison consiste à considérer qu'elles sont toujours présentes dans le lexique. 1.1.1.2. Présence de la consonne au niveau lexical, à la finale Que ce soit dans le cadre génératif linéaire, multilinéaire ou même non génératif, l'analyse la plus fréquemment observée consiste en effet à considérer que la consonne alternante est systématiquement présente à la finale du premier mot, mais qu'elle est omise (cadre non génératif), élidée (cadre génératif linéaire) ou qu'elle n'est pas réalisée (cadre génératif multilinéaire). 211 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.1.2.1. Cadre pré-génératif Parmi l'ensemble des travaux s'intéressant à la liaison, trois au moins sont à retenir dans ce cadre d'analyse de la liaison, en-dehors des études génératives : Bloomfield (1933 : 217), Harris (1951 : 168-169) et van den Eynde & Blanche-Benveniste (1970). Harris (1951 [1966] : 168-169) s'intéresse à la variation de genre des noms et des adjectifs français (fermier / fermière, musicien / musicienne) dans le cadre de la variation "between any phoneme in a given position and zero in that position; i.e. it may consist of omitting a phoneme." Il précise cependant en note que "instead of considering the omission of phonemes as a special case of phonemic interchange we can consider the interchange of phonemes to consist of omitting one phoneme and adding another. In this case the morphemes considered hitherto would all consist of the addition or subtraction of phonemes in respect to the rest of the utterance". Il considère l'hypothèse d'un éventuel morphème de féminin rattaché à la base masculine, mais le rejette au motif que "we would find almost every consonant phoneme in French occurring as a morphemic segment for 'female', and each occurring only ager some few particular morphemes. (...) In such cases, when many morphemes (/t/, /r/, etc.) in one position (fem.) alternate wih zero in another (masc.), it is simpler to consider the various consonants or vowels as part of the various morphemic segments: the longer (fem.) morpheme plus a single omit –phoneme morpheme". L'explication du phénomène de liaison au moyen d'une consonne finale présente dans le lexique quoique non toujours réalisée en surface est de loin la plus courante en phonologie générative. 1.1.1.2.2. Cadre génératif linéaire Dès l'avènement de la phonologie générative avec Chomsky & Halle (1968), la liaison en français a été conçue comme le résultat d'une consonne lexicale finale de mot, présente avant une voyelle initiale du mot suivant. Le principe général est le suivant : le morphème contient une consonne finale, qui est effacée par règle soit devant une consonne soit à la finale (il ne s'agit plus alors d'une liaison mais les deux cas sont considérés comme relevant d'un même processus). 212 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français L'histoire de la liaison envisagée sous cet angle commence avec Schane (1968) et la French Truncation Rule. Schane (1968) considère que l'élision (/l/ + /ami/ réalisé [lami], /ptit/ + /kamaad/ réalisé [ptikamaad]) et la liaison ([lezami] pour l'enchaînement des morphèmes /lez/ + /ami/, [ptitami] pour /ptit/ + /ami/) relèvent du même processus de troncation d'un élément en fin de mot. Il observe en effet que, en fin de mot comme en fin de morphème : "a. Consonants are truncated before consonants and liquids. b. Vowels are truncated before vowels and glides. c. Liquids and glides are never truncated." (1968 : 2) Ce parallélisme entre les deux traitements le conduit à poser cette règle de troncation (Schane 1968 : 10) : "at a boundary [α cons, -α voc, -stress] segments are truncated before [α cons] segments"; que la frontière soit entre deux mots (petit ami vs. petit camarade) ou intérieure de mot (petitesse)60. Ce qui se formalise de la manière suivante : (160) α cons -α voc -stress Æ ø / __ + (#) # [α cons] Cette règle, baptisée French Truncation Rule (FTR) par Chomsky & Halle (1968), est connue sous ce nom depuis lors, sans la partie concernant l'accent. Encrevé (1988b : 102 note 11) souligne d'ailleurs le problème inhérent à cette spécification de l'accent, destinée à protéger les voyelles qui ne s'élident pas : "la formalisation implique que ce trait s'applique également aux consonnes..." Les mots qui se terminent par une consonne finale qui se maintient devant une autre consonne (par exemple avec, sept, sens, chef, sec) doivent être spécifiés dans le lexique comme "résistant" à la règle de troncation, autrement dit comme des exceptions. La FTR s'accompagne de la règle d'effacement final (Schane 1968 : 7) suivante : "delete a word final consonant in phrase final position". Celle-ci permet de rendre compte de l'absence de la consonne en fin de proposition. 60 La formulation de Grace (1975) est bientôt plus connue que le détail de la règle elle-même : "like drops before like". 213 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français En outre, Schane signale que "liaison does not occur between just any two contiguous words. There are restrictions which are syntactically determined." (Schane 1968 : 11) ; de plus, certaines liaisons sont obligatoires mais d'autres facultatives ("its presence or absence generally being a stylistic factor" 1968 : 13). Ceci le conduit à réaffirmer le lien direct entre l'output de la syntaxe et l'input de la phonologie ("syntactic information is then available at the phonological level" 1968 : 12), et à amender la règle d'effacement final de consonne : "delete a word final consonant 1. obligatorily, a. in phrase final position b. in a singular noun; 2. optionally, in a plural noun." (Schane 1968 : 13) Cependant, ce facteur syntaxique et la règle afférente prenant en compte la variation ne reçoivent pas de formalisation dans le cadre génératif linéaire. Schane (1968) reconnaît donc trois types de facteurs : phonologiques (présence d'une voyelle suivante), syntaxique (catégorie lexicale des mots) et morphologique (frontière de morphème et de mot). Pourtant, seuls les facteurs phonologique et morphologique sont formalisés dans les règles qu'il propose. Il reconnaît également l'existence de la variation (liaison optionnelle), sans pouvoir l'implémenter dans le modèle. Dell (1970, 1973) et Selkirk (1972, 1974) rejettent l'unification de la liaison et de l'élision, suivant en cela les idées de Milner (1967) relatives au réajustement des frontières morphologiques. Schane (1973) lui-même abandonnera la FTR ("There is no French Truncation Rule"). Dell (1970) propose une métathèse de la frontière morphologique avec la dernière consonne du premier mot, permettant à celle-ci de s'attacher directement à la voyelle initiale du deuxième mot, dans le cadre d'une liaison obligatoire : C # V 1 2 3 Æ 2 1 3 Cette solution est rejetée par Selkirk (1972) du fait qu'une métathèse ne peut se produire qu'entre éléments de même nature et non entre une frontière et un segment. 214 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Selkirk (1972, 1974) reprend la FTR en amendant le contexte : "liaison occurs when one # separates two words, and not when two do" (1974 : 579) : le nombre de frontières est distribué par la syntaxe et fonction, en outre, du registre stylistique. "To be more explicit, the following assertion is true for speech in an elevated style in French : A head Noun, Verb, or Adjective which is inflected may be in a liaison context with the word that follows, if that word is in its Complements" (1974 : 581). Schane (1974) fait le bilan de l'évolution depuis Schane (1968) : il distingue la liaison et l'élision, considère que la liaison n'est impossible que devant une frontière morphologique ou une consonne et propose donc la règle suivante : C Æ ø / _ [-seg] {C, #} Tout comme la supplétion, la présence de la consonne dans la forme lexicale d'un mot permet de justifier la nature mélodique de la consonne sans avoir à la déduire du contexte, alors qu'une analyse par épenthèse est tenue de le faire. La principale critique formulée à l'encontre de ce traitement des alternances consonne ~ zéro est son opacité, c'est-à-dire le manque d'explicativité du modèle. Pourquoi certaines consonnes sont-elles élidées en finale mais non d'autres, à frontières morphologiques et nature segmentale identiques ? On a tenté de corriger cette opacité par l'insertion de schwas finaux "protégeant" la consonne lorsqu'elle doit être maintenue : comment en effet rendre compte autrement de la différence de traitement entre une consonne fixe, c'est-à-dire qui doit être systématiquement réalisée (lucide, agréable) et qui donc ne sera pas élidée, et une consonne qui alterne avec zéro ? Par ailleurs, le processus explicatif est ici circulaire : j'observe qu'il y a liaison dans certaines conditions bien définies, ce qui me permet d'élaborer un ensemble de règles les formalisant, mais je ne détermine pas pour autant les causes déclenchantes. L'ordonnancement des règles devrait pour se faire être intrinsèque, défini par d'autres phénomènes ou par le mécanisme interne de la théorie. De ce fait, jusqu'à l'avènement des cadres génératifs multilinéaires, les phonologues se sont tournés vers d'autres modes de représentation de l'alternance, au moyen de la supplétion (cf. section 1.1.1.1.1.) ou de l'épenthèse (cf. section 1.1.3.1), voire de la présence dans certains cas bien définis de la consonne à l'initiale de second mot (cf. section 1.1.2.2). 215 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Par ailleurs, se pose la question du statut de cette consonne alternante. En effet, elle est différente des autres consonnes en ce que son absence n'altère pas la base, et pourtant dans le cadre linéaire elle est traitée de la même manière que les autres consonnes (cf. Sauzet 1999). C'est le cadre multilinéaire qui va permettre de donner un statut différent aux consonnes fixes et aux consonnes latentes, pour le traitement d'une consonne présente en finale du mot immédiatement à gauche de l'alternance consonne ~ zéro. 1.1.1.2.3. Cadre génératif multilinéaire La philosophie des cadres multilinéaires est de dissocier -notamment- la mélodie des constituants squelettal et syllabique. Il ne s'agit donc plus ici de définir les contextes où la consonne va être élidée, mais de déterminer dans quel cas elle va être amenée à se réaliser. De ce fait, la consonne de liaison a désormais un statut différent des autres consonnes du mot, ce qui permet de rendre compte du fait que son absence ne nuit pas à l'intégrité du mot. La phonologie multilinéaire fait son apparition "officielle" en 1976 avec la thèse de Goldmith, bien que l'idée de répartir l'information phonologique lexicale sur plusieurs niveaux ait été en préparation depuis le début des années soixante-dix. Pourtant, l'application du principe de multilinéarité au phénomène de la liaison en français attendra trois années supplémentaires. C'est Lowenstamm (1979) en effet qui exploite le premier la distinction des niveaux, tout en reprenant la French Truncation Rule depuis longtemps abandonnée par les générativistes linéaires, et donc réunifiant la liaison et l'élision. Il établit qu'"une consonne s'efface à la fin d'un mot quand l'attaque de la syllabe suivante est remplie", donc devant une consonne, et pose la généralisation parallèle en ce qui concerne les voyelles. On retrouve cette idée dans Kaye & Lowenstamm (1984). Leur formulation est la suivante : (161) α cons - α voc A Æ ø / __ # [α segment] Anderson (1982) s'attache pour sa part à reformuler la règle d'effacement de la consonne finale, en soulignant le fait que seules les obstruantes (cf. Dell 1973) en coda sont 216 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français concernées. Il distingue ainsi le constituant syllabique de la mélodie comme l'atteste la règle de troncation suivante (1982 : 561)61 : σ (162) A R N M | __ [+ obstruent] Æ ø / # (#) A l'intérieur des cadres multilinéaires postérieurs on peut distinguer deux tendances majeures concernant l'analyse des consonnes qui alternent avec zéro. Dans les deux cas, la consonne est réputée flottante, c'est-à-dire non rattachée au niveau syllabique, mais tantôt elle est attachée à une position squelettale dès le lexique (section 3.1.1.2.3.1), tantôt elle n'est attachée à rien (section 2.1.1.2.3.2). 1.1.1.2.3.1. La consonne est attachée à une position squelettale Clements & Keyser (1981, 1983) vont plus loin dans la représentation multilinéaire que Lowenstamm (1979). Ils considèrent la consonne de liaison comme un élément flottant associé à une position consonantique mais non à un nœud syllabique, comme le [t] final de petit dans l'exemple suivant : (163) σ C | p σ V | C | t V | i C | t La réalisation de la consonne passe par une règle de liaison associant toute position consonantique non rattachée à une syllabe, à la syllabe suivante : (164) σ C | p 61 σ V | C | t σ V | i C | t V | a σ C | m V | i N indique le noyau, M la marge. 217 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Durand (1986a) implémente la représentation de Clements & Keyser (1983) dans le cadre de la Phonologie de Dépendance. Booij (1984) reprend l'idée de Clements & Keyser (1983) selon laquelle la consonne de liaison est un élément extrasyllabique62 et doit, de ce fait, soit être syllabifié, soit disparaître. Cependant cette disparition se fait au moyen d'une Convention universelle et non d'une règle, propre à une langue. Cette Convention universelle est exprimée de la manière suivante : "Suppression du segment non-syllabé : supprimez de la représentation phonétique tout segment qui n'est pas dominé par (σ)". On y reconnaît le principe (2) de Vergnaud (cf. section 1.1.1.2.3.2). Par ailleurs, il garde une règle de liaison. Plénat (1987) utilise lui aussi les consonnes extrasyllabiques, entendues ici comme reliées à leur position squelettale mais non au niveau du constituant syllabique, dans la représentation qu'il propose de la liaison, mais d'une façon différente de ses prédécesseurs. Pour lui, il existe un gabarit de la rime finale d'un mot qui limite celle-ci aux trois configurations suivantes : 1. V 2. VV 3. VC[sonante] Toute rime qui en surface ne correspond à aucun de ces gabarits est syllabifiée différemment en structure profonde, ou marquée lexicalement. Examinons les différents cas possibles : (165) -C[obstruante]## -C[sonante]## alterne avec zéro /p()tit/ fixe /apid/ alterne avec zéro fixe /pmje/ /sul/ /fil/ V_ syllabifiée en attaque suivante lexicalement marquée VC_ syllabifiée suivante /pak/ /takt/ syllabifiée en coda /film/ attaque lexicalement marquée syllabifiée suivante lexicalement marquée en en attaque lexicalement marquée Si une consonne finale de mot est située juste après une voyelle, deux cas de figure sont possibles : 62 Je n'entrerai pas ici dans le débat de l'extramétricalité de la consonne : il s'agit là d'un problème marginal par rapport au but ici recherché. Cf. Prunet (1986) et Tranel (1986, 1995 : 145-146) pour une discussion à ce sujet. 218 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français - si la consonne est obstruante, elle ne correspond à aucun des gabarits de rime finale possibles, elle est donc flottante. Ainsi sera-t-elle syllabée en attaque suivante le cas échéant, et donc audible à la liaison mais non en isolation. Dans le cas où l'on entend malgré tout la consonne en isolation, cela signifie qu'elle est spécifiée comme telle dans le lexique. - si la consonne est sonante, elle correspond au gabarit (3) et est donc syllabée en coda. De ce fait, elle est toujours audible. Si ce n'est pas le cas, elle doit être marquée à cet effet dans le lexique. Après une consonne, la consonne finale se comporte là encore différemment selon son mode d'articulation : - s'il s'agit d'une obstruante, elle est syllabifiée en attaque du mot suivant si celui-ci commence par une voyelle, et n'est audible en isolation que si elle comporte une marque lexicale à cet effet. - s'il s'agit d'une sonante, la coda étant déjà "occupée", elle sera syllabifiée dans l'attaque du mot suivant et se manifestera donc à la liaison. Si elle est présente en surface également en isolation, cela indique qu'elle est lexicalement marquée. La position de Plénat (1987) est originale en ce qu'elle pose comme non marqué le cas où la consonne obstruante alterne avec zéro, alors que dans toutes les autres analyses c'est l'alternance qui est considérée comme spéciale, et la fixité la norme. Le système de Piggott (1991) s'apparente également à celui de Clements & Keyser (1983) en ce qu'il considère que la consonne flottante est liée à une position squelettale mais non à une position syllabique. Il a ceci de particulier qu'il permet de distinguer différentes catégories de langues, non seulement en fonction du fait qu'elles autorisent les consonnes finales, fixes ou alternantes, mais également en fonction de la position de la consonne dans la structure de la syllabe : en attaque ou en coda. Ceci n'étant pas directement pertinent ici, je ne développerai pas le sujet (cf. Tranel 1995b : 149-155 pour une évaluation du modèle dans cette optique). Signalons enfin que Piggott (1991) considère, comme la phonologie de gouvernement, qu'une consonne fixe en fin de mot est syllabifiée en attaque d'une syllabe avec un noyau vide et non en coda de la syllabe précédente. D'autres modèles ont choisi de ne pas attacher la consonne à une position squelettale et donc de la représenter comme "complètement" flottante. 219 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.1.2.3.2. La consonne n'est pas attachée à une position squelettale Sous cette approche, c'est parce que la consonne n'est pas rattachée à la position squelettale qu'elle n'est de ce fait pas liée au constituant syllabique. L'absence de liaison avec le constituant syllabique est ainsi une conséquence et non un postulat de départ. C'est en 1982 qu'a été formalisé l'abandon de toute règle de liaison. Le traitement de la liaison est réalisé au moyen d'une consonne détachée non seulement du niveau de la syllabe, mais également de celui des constituants squelettaux : la formulation d'une règle de liaison devient inutile puisque le rattachement de la mélodie à la position se fait "automatiquement". Vergnaud (1982) postule en effet que la consonne flottante s'attache directement à la position vide en attaque de la syllabe initiale du deuxième mot, en vertu des deux principes suivants (cf. Encrevé 1988a : 96) : 1. toute syllabe comporte nécessairement une attaque et une rime. 2. après application des conventions de liage, les constituants demeurés flottants ne sont pas réalisés phonétiquement. Si l'on reprend l'exemple de petit ami, la représentation est donc la suivante : (166) C | x | p V | x | C | x | t V | x | i C V | x | a t C | x | m V | x | i Il ne semble pas que Vergnaud (1982) explique la formation du point d'ancrage squelettal qui doit pourtant intervenir entre la mélodie et le constituant syllabique. Prunet (1986, 1987 ; cf. également de Jong 1990) défendent une représentation qui tient à la fois de Vergnaud (1982) et de Clements & Keyser (1983) : tout mot commençant par une voyelle contient une position attaque sous-jacente, associée à la syllabe. La consonne alternante n'est liée à aucun matériel squelettal ni syllabique, mais s'adjoint à celui éventuellement disponible dans le mot suivant : (167) σ x | p σ x | x | t σ x | i x t σ x | a x | m x | i 220 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Dans cette optique, le point squelettal n'est pas généré automatiquement, il est présent dans la représentation, mais en initiale du second mot et non à la finale du premier. Hyman (1985) considère également que la consonne de liaison est flottante, c'est-àdire qu'elle n'est reliée ni à une position squelettale, ni encore moins à une position syllabique puisqu'il se situe dans un cadre moraïque dans le lexique (par exemple Hayes 1989 ; cf. Tranel 1995b : 161-165, 1995a : 803-804). Encrevé (1988a) ne rattache pas non plus la consonne au point squelettal, mais celui-ci est présent dans la représentation du mot, ainsi que le constituant syllabique coda auquel il se rapporte. Il distingue ainsi (a) les consonnes finales fixes, qui sont rattachés à un point squelettal, et (b) les consonnes finales flottantes, qui ne le sont pas : (168) (a) consonne finale fixe A y | l R | N | y | y A y | s R | N | y | i (b) consonne finale flottante A C y | d y | p R | N | y | A y | t R | N | y | i C y t En finale absolue, le [d] de lucide, puisqu'il est rattaché dès le lexique à son constituant squelettal, s'associera avec la seule position disponible : la coda. Le [t] de petit en revanche, puisqu'il n'est pas associé à sa position squelettale, n'est pas attaché au constituant syllabique et n'est donc pas réalisé. En effet, selon la Convention universelle d'association des constituants syllabiques flottants (Encrevé 1988a : 178), "les autosegments A, N et C flottants ne peuvent s'ancrer que dans des positions du squelette qui sont interprétées segmentalement". Cette représentation lui permet de rendre compte des liaisons avec et sans enchaînement : devant une voyelle, la consonne finale flottante s'attache à l'attaque et son constituant coda est effacé s'il y a enchaînement. En cas de non enchaînement, la consonne s'attache à sa position squelettale en vertu du paramètre d'ancrage des consonnes finales flottantes (Encrevé 1988a : 179) selon lequel "en français, une consonne finale flottante ne peut s'ancrer dans le squelette que si le mot suivant dans la chaîne parlée commence par une attaque nulle" ; en revanche, la consonne s'associe à sa position coda, et non à l'attaque suivante, laquelle se voit adjoindre un coup de glotte, puisque selon Encrevé (1988a : 185) "en français la consonne épenthétique non marquée est []". 221 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français La critique essentielle à porter à l'encontre d'une représentation de ce type concerne les catégories d'association en phonologie autosegmentale. Dans ce type de cadre en effet, l'association entre une position squelettale présente dans le lexique et un constituent mélodique est réputée automatique (cf. Vergnaud 1982). La représentation de la consonne flottante avec une position squelettale sans que le lien entre les deux soit automatique est donc un problème et nécessite l'adjonction de conventions supplémentaires (cf. de Jong 1990, Paradis & El Fenne 1995 : 180). Se rattache également à cette tendance de ne pas représenter le constituant squelettal de la consonne flottante la Phonologie de Gouvernement (Kaye & al. 1985, 1988, 1990, Harris 1990) comme on le constate dans les travaux de Kaye et al. (1988) ou Charette (1988, 1991). La consonne fixe finale de mot est syllabifiée en attaque et non en coda, ce qui constitue la particularité de ce cadre. Dans ce modèle, comme également pour Paradis & El Fenne (1991, 1992, 1995), le constituant squelettal n'est présent ni dans le premier mot, ni dans le second, mais il est créé au cours de la concaténation des deux, par la mise en présence du constituant syllabique du deuxième mot avec la mélodie du premier. Ceci correspond au principe de sous-spécification (cf. section I [2] 3.2.2) et plus particulièrement à la Node Generation Convention d'Archangeli & Pulleyblank (1986 : 75) : "a rule or convention assigning some feature or node x to some node b creates a path from x to b". Cette position signifie que la syllabation d'un mot se fait directement en fonction des segments et non des positions squelettales, ce qui conduira par la suite différents modèles à supprimer les constituants squelettaux (cadre CVCV, Lowenstamm 1996). Wauquier-Gravelines (ms) se rattache, dans une étude acquisitionnelle de la liaison, à l'analyse de Paradis & El Fenne. Elle démontre en effet que dans un premier temps, lorsque l'enfant "découvre" la contrainte de remplissage des attaques vides ("remplir autant que possible toutes les attaques de mots vides sur le domaine det + nom pour syllaber l'unité prosodique" ms : 15), il va avoir recours à l'épenthèse d'une consonne dont la nature est fonction des contextes dans lesquels le mot a été rencontré, et non des contextes de liaison. Dans un deuxième temps, il découvre "que le déterminant un relâche une consonne nasale au féminin, que les adjectifs comme petit, grand, gros relâchent une consonne lors d'opérations d'inflexion (petite, grande, grosse) ou de dérivation nominale (petitesse, grandeur, grandir, grosseur, grossir)" (ms : 17) ; c'est alors qu'il encode les consonnes flottantes finales dans les représentations lexicales et qu'il cesse d'avoir recours à l'épenthèse. Pour Wauquier222 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Gravelines (ms : 17), la contrainte de remplissage des attaques vides résulte alors d'une stratégie de réparation telle qu'elle a été proposée par exemple par Paradis & El Fenne (1995)". Sauzet (1999) s'inscrit dans un cadre multilinéaire particulier mais, comme la plupart des générativistes, considère que les consonnes latentes figurent dans le lexique. 1.1.1.2.3.3. Critique des modèles multilinéaires Les modèles multilinéaires reconnaissent et implémentent le statut particulier de la consonne qui alterne par rapport aux autres consonnes du mot ("une déficience qui les prédispose à l'effacement", Sauzet 1999 : 73), ce qui constitue un des atouts majeurs de ce type de cadres phonologiques et une avancée par rapport aux modèles linéaires. Pour autant, Sauzet (1999 : 72) déplore le fait que cette distinction se fasse au moyen de la suppression d'une caractéristique de la consonne qui n'est jamais que redondante dans les consonnes fixes : "la faiblesse principale de l'approche multilinéaire, c'est qu'elle doit poser que le segment flottant est marqué par l'absence d'une propriété qui est redondante dans les autres segments". Un second point fort de ces cadres est qu'ils offrent un traitement unifié des cas de liaison obligatoire à l'intérieur du groupe nominal. En revanche, ils ne permettent pas de rendre compte de l'homogénéité de la nature de la consonne de liaison dans certains cas, par exemple à l'inversion après le verbe (cf. partie III chapitre 10 pour une analyse). 1.1.1.2.4. En théorie de l'Optimalité La Théorie de l'Optimalité, bien qu'apparue chronologiquement après les cadres mutlilinéaires, se situe plutôt dans le prolongement direct de la phonologie générative linéaire. Ainsi, si l'on considère l'article de Tranel (2000) portant notamment sur l'implémentation de la liaison en OT, constate-t-on qu'il fonde sa critique des analyses précédentes sur les cadres linéaires, comme l'indique le titre de sa deuxième section : "consonnes finales et schwa : règles vs. contraintes", et non sur les cadres autosegmentaux. Le paragraphe consacré à l'analyse de la liaison en phonologie générative non-linéaire n'a qu'une visée purement informative, il se conclut par : "la question que je laisse en suspens ici est de savoir si la notion technique de consonne flottante peut ou doit survivre dans la théorie linguistique et en particulier dans un cadre OT". 223 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Je présenterai ici le modèle de Tranel (2000 : 51-59) afin d'illustrer la formalisation proposée par la théorie. Comme je l'ai dit en introduction de cette section, OT ne se préoccupe pas du statut de la consonne flottante. Il suffit de savoir que la consonne "n'appartient pas en propre au morphème (...) mais qu'il s'agit, selon les analyses, ou bien d'une consonne finale flottante, ou bien d'une consonne empruntée au féminin, ou bien encore d'une consonne de déclinaison, en tout cas d'une consonne lexicalement disponible, mais non intrinsèque" (2000 : 51). La présence de cette consonne rend l'unité lexicale marquée par rapport à celles qui n'ont pas de consonne latente, ce qui signifie qu'elle transgresse une contrainte (supplémentaire), mais cette transgression est moins forte que celle qui consiste à insérer une consonne épenthétique pure : DEP(C) >> DEP(L).63 Les contraintes MAX garantes de l'emploi de tous les segments offerts par l'input sont également à l'œuvre ici : MAX(V) pour les voyelles et MAX(C) pour les consonnes. Une contrainte relative à la résolution d'hiatus doit également intervenir : *VV, même si "d'autres facteurs que l'évitement d'hiatus sont à l'œuvre et prioritaires" (2000 : 46). Etant donné les réalisations en surface, la hiérarchie des contraintes est la suivante : DEP(C), MAX(C), MAX(V) >> *VV >> DEP(L). Le tableau suivant récapitule le traitement des quatre cas de figure observés en français : (a) réalisation d'une consonne flottante en liaison, (b) enchaînement d'un mot se terminant par une voyelle avec un mot commençant par une voyelle, (c) non réalisation d'une consonne flottante devant une consonne et (d) non réalisation d'une consonne flottante en finale de proposition. (169) (a) consonne flottante en liaison Dep(C) Max(V) /pti{t} ano/ ) a. pœtitano b. pœtiano c. pœtano * ! (i) d. pœtino * ! (a) *VV (b) enchaînement en V_V Dep(L) * *! b. çlitano c. çlano ) a. pœtipano b. pœtitpano c. pœtitano Dep (C) Max (C) * ! (p) Ma x (V) Dep(C) *VV Max(V) *VV * *!(t) * ! (i) d. çlino (c) non réalisation devant une consonne /pti{t} pano/ /çli ano/ ) a. çliano * ! (a) (d) non réalisation en finale Dep (L) *! * /(il est) pti{t}/ ) a. pœti b. pœtit Dep (C) Max (C) Max (V) *VV Dep (L) *! 63 Cf. section I [3] 2.2.2 pour les détails des contraintes. Je précise ici simplement que les contraintes DEP interdisent l'épenthèse : DEP(L) de consonnes latentes et DEP(C) de consonnes fixes. 224 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français L'analyse au moyen de cet ordonnancement de contraintes "permet d'intégrer les cas de liaison supplétive qui auparavant demeuraient sans analyse véritable" (2000 : 54-55), de type mon amie vs. ma femme ou ce livre vs. cet ordinateur. Quatre explications sont proposées par Tranel : une transgression du genre, le recours à la sous-spécification, une contrainte morphologique plutôt que syntaxique ou l'intervention d'une contrainte supplémentaire. Face à deux allomorphes dont l'un est à finale vocalique et l'autre à finale consonantique, la hiérarchie va préférer le second dans les contextes de liaison, alors même que dans les termes de Tranel (2000) il y a "transgression de l'accord en genre". La contrainte exigeant l'accord en genre entre un déterminant et un nom, GENRE[SYN], est alors "battue" par la contrainte phonologique concernant la résolution d'hiatus. Lorsqu'il n'y a pas d'hiatus, il n'y a par conséquent pas transgression de *VV, c'est pourquoi c'est GENRE[SYN] qui gère le choix de l'allomorphe. (170) (a) en hiatus /ma~m{n} ane/ a. ma ane ) b. m ane *VV Genre[Syn] Dep(L) *! * * /sœ~s{t} ano/ a. sœ ano ) b. st ano *VV Genre[Syn] Dep(L) *! * (b) devant consonne /ma~m{n} pupe/ ) ma pupe a. b. m pupe *VV Genre[Syn] *! Dep(L) *VV /sœ~s{t} pano/ ) a. sœ pano b. st pano Genre[Syn] Dep(L) *! L'inconvénient de cette analyse est de mêler contraintes syntaxiques et contraintes phonologiques, alors que la syntaxe se situe à un niveau différent de la phonologie et ne peut pas intervenir après elle. C'est pourquoi Tranel propose en deuxième hypothèse de sous-spécifier le genre masculin : "supposons que mon et cet(te) soient lexicalement non-marqués pour le genre et par conséquent compatibles avec des contextes masculins ou féminin, alors qu'au contraire ma et ce soient lexicalement spécifiés (respectivement [féminin] et [masculin]). Le résultat est que pour une paire de mots comme ma/mon, seul mon est syntaxiquement compatible avec un nom masculin, alors que ma et mon sont tous deux syntaxiquement compatibles avec un nom féminin. On aura donc toujours mon avec un nom masculin quel qu'il soit (décision 225 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français syntaxique), mais avec un nom féminin commençant par une voyelle, mon va correctement triompher de ma puisqu'il permet d'éviter l'hiatus (décision phonologique)." Une troisième possibilité serait de faire intervenir la contrainte -COD pour justifier du rejet des séquences *cet panneau et *mon poupée, la consonne nasale de mon étant considérée comme formée à partir d'une consonne nasale flottante. La quatrième solution offerte consiste à considérer que la contrainte portant sur le genre n'est pas syntaxique mais morphologique, auquel cas le problème de visibilité de la syntaxe par la morphologie ne se pose plus. Il semble cependant que cette solution soit ad hoc. En effet, cette hiérarchie de contraintes permet de rendre compte des phénomènes de liaison en français, tout du moins de liaison obligatoire, tout comme les autres modèles postulant la présence de la consonne dans le lexique. Par ailleurs, elle ne se veut pas ad hoc puisqu'elle s'applique dans une certaine mesure à l'élision en français, renouant avec l'esprit de la French Truncation Rule de Schane (1968) déjà réévoquée par Kaye & Lowenstamm (1984). Cependant, en ce qui concerne l'élision, le maintien de cette hiérarchie ne se fait qu'au prix du changement de la nature de la voyelle élidée : seul le schwa serait concerné en français. Tranel (2000 : 59) considère en effet que l'élision ne s'applique qu'au schwa (le, je, me, te, se, ce (pronom), de, ne, que) et non à la voyelle /a/ dans la (article et pronom). Pour lui, une séquence comme l'idée ne se conçoit pas comme formée à partir de /la/ et de /ide/ mais de "l'utilisation du masculin le à des fins phonologiques prioritaires". En ce qui concerne les voyelles fermées [i] et [y] qui s'élident facultativement dans les pronoms qui (le taxi qui arrive réalisé [ltaksikaiv]) et tu (tu arrives réalisé [taiv]), il affirme les considérer "comme des cas d'élision véritable" mais n'en tient pas compte dans sa représentation de la liaison. Le schwa en français, en tant que voyelle "faible", "c'est-à-dire d'une voyelle qui cède le pas quand il y a excès vocalique et qui au contraire apparaît par défaut quand il est nécessaire d'alléger des séquences de consonnes", doit être distingué des autres voyelles par des contraintes qui lui sont propres et qui seraient classées plus bas dans la hiérarchie que les contraintes semblables, relatives aux voyelles. En ce qui concerne l'élision, c'est la contrainte MAX(V) qui se dédouble en l'occurrence : MAX(SCHWA) concerne exclusivement [], MAX(V) 226 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français l'ensemble des autres voyelles. MAX(SCHWA) est placée dans la hiérarchie après MAX(V), ainsi qu'après la contrainte *VV portant sur l'hiatus (cf. Tranel 2000 : 59-61). Cependant, cette analyse en Théorie de l'Optimalité n'est pas explicative quant au statut de la consonne en question, même si elle lui reconnaît bien un statut particulier. Ne prenant pas position, elle ne prête pas le flanc à l'évaluation de sa validité. Bonami & Boyé (2003) mettent de plus en évidence que "l'idée de départ, selon laquelle on peut mettre en compétition contrainte syntaxique et contrainte phonologique, pose un problème fondationnel pour la Théorie de l'Optimalité" (2003 : 2). En effet, le cadre théorique suppose une évaluation phonologique d'un candidat syntaxique donné, et non l'interaction entre syntaxe et phonologie. 1.1.1.2.5. Bilan sur la consonne en fin de premier mot Postuler la consonne alternante en fin du premier mot permet de rendre compte de la variabilité de la nature de cette consonne. Cet aspect positif devient cependant une limite au modèle si l'on considère les cas où précisément c'est toujours la même consonne qui apparaît à la liaison, par exemple entre un verbe et un clitique donné (parle-t-il [parltil], manges-en [mz]) ; cet aspect sera plus particulièrement abordé en section III [10] 2.1. Le progrès notable des cadres de deuxième génération est la prise en compte du statut particulier de cette consonne dans les représentations lexicales. Les cadres deviennent alors réellement explicatifs, dans le sens où c'est la structure de la théorie qui permet de justifier les cas où la consonne apparaît par rapport à ceux où elle n'apparaît pas, alors que les cadres linéaires proposent un ensemble de règles purement descriptives. Cette hypothèse de la présence de la consonne en finale du premier mot est concurrencée, dans certains cas bien circonscrits, par l'alternative consistant à considérer la consonne comme appartenant au morphème suivant. 227 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.2. La consonne appartient au deuxième morphème C'est-à-dire qu'elle est présente dès le lexique, et qu'elle est éventuellement effacée par la suite. On trouve trace de cette idée dès Durand (1936 : 32), pour qui "le féminin se forme en ajoutant des phonèmes au masculin pris pour base et ce phonème est une consonne". 1.1.2.1. Supplétion L'hypothèse d'une allomorphie relative à l'initiale du mot a été peu exploitée. Ce sont essentiellement les travaux sur l'acquisition qui en font état, mais davantage en tant qu'étape transitoire dans l'apprentissage de la langue que comme résultat définitif dans le lexique d'un adulte (cf. par exemple Dugua et al. 2003, Dugua, Chevrot & Côté 2003). Seul Ternes (1977) propose de considérer la liaison comme une mutation consonantique initiale se présentant sous la forme de divers allomorphes. Selon les termes de Côté (2003 : 3), il considère en effet que "vowel-initial words have several consonant-initial variants, selected by the context" : ainsi été aura-t-il les formes [zete], [gete], [nete] ou [tete] selon qu'il sera employé dans les contextes mauvais été, long été, un été ou grand été. Dans l'ensemble, l'hypothèse de la supplétion reste minoritaire, même au sein des analyses postulant la présence de la consonne de transition dans la représentation lexicale du deuxième mot. 1.1.2.2. Présence de la consonne au niveau lexical, à l'initiale Côté (2003) considère que les liaisons constatées entre le verbe et le pronom de la troisième personne en inversion d'une part, entre le verbe et un clitique suivant à l'impératif d'autre part, sont toutes les deux dues à la présence de la consonne à l'initiale du second mot. Les pronoms sujets seraient donc dans le lexique /til/, /tl/, /t/, pour respectivement il, elle et on, et les clitiques /zi/ et /z/ pour y et en. Elle ne précise pas si elle considère la solution de l'allomorphie plutôt que celle d'un seul morphème pour lequel il faut définir les contextes d'apparition de la première consonne, mais cite Morin (1979a, b, 1986) pour qui ces enclitiques sont lexicalisés avec l'initiale (cf. section 3 pour une analyse détaillée de ce phénomène). 228 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.2.3. La consonne est le deuxième morphème impliqué Cette hypothèse a été formulée dans deux cas de liaison : après le pluriel dans le syntagme nominal, et après le verbe dans les pataquès (les liaisons "fautives"). Commençons par le pluriel. Un des premiers sans doute à avoir envisagé cette éventualité est Gougenheim (1938 : 59-60) qui met en parallèle les séquences un nez aquilin et des nez aquilins. Dans le premier cas, la liaison entre le substantif et l'adjectif est interdite (*[œnezakil]) alors que dans le deuxième elle est possible ([denezakil]). Il s'agit alors d'un élément qui se comporte comme le préfixe de l'adjectif et qui est morphologiquement conditionné (en plus de la présence nécessaire de la voyelle à sa droite). Pour autant, ce marqueur n'est pas lexicalisé à l'initiale de chaque adjectif. Morin & Kaye (1982 : 320-323) reprennent cette analyse et l'étayent au moyen de cas de liaison mettant en évidence la présence de la consonne à l'initiale du second mot plutôt qu'à la finale du second. Si l'on reprend par exemple la séquence des marchands de bière anglais [demardbjrl] réalisée des marchands de bière [z] anglais, le [z] observé ne peut pas provenir de bière, singulier ; si tel était le cas, l'adjectif anglais serait au féminin : bière anglaise [lz]. Force est donc de le supposer à l'initiale du second morphème. Le déclencheur de la présence de la consonne dans la réalisation de surface est flexionnel. "The presence of a liaison z is still triggered by the lexical head when it is plural because adjectives agree in number with the lexical head. This is a simple case of agreement, very similar in nature to the rule which accounts for final s in English verbs as in John sings, and for which one would not want to postulate a morphophonological rule of epenthesis" (1982 : 323). Morin (1979a) étend cette idée aux contextes après déterminants pluriels : quatre [z] enfants, des mini [z] ordinateurs, il y avait trop de [z] enfants. On pourrait proposer une analyse alternative sous forme d'un morphème de pluriel discontinu, distribué par un constituant syntaxique situé au niveau de la tête du syntagme nominal par exemple, ce qui permettrait de rendre compte des pluriels "à distance" (des marchands de bière [z] anglais) comme des pluriels "multiples" (des armes [z] automatiques [z] américaines). Il ne s'agirait cependant alors que d'une reformulation de l'hypothèse, qui ne remet pas en cause le fait que le [z] observé n'est pas présent dans la forme sous-jacente du premier mot impliqué, mais qu'il appartient bien à un second morphème. 229 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Morin & Kaye (1982 : 323-326) envisagent le même type d'hypothèse pour le [t] qui apparaît après un verbe dans les pataquès, quelle que soit la personne (j'ai beaucoup [t] aimé, apprends-moi [t] à parler, c'est pas [t] à moi, faisez-moi [t] un lit, ils m'ont donné [t] un don). Le [t] ici est réanalysé comme marqueur de verbe (et non de personne, cf. section III [10] 2.4.3), mais n'est pas considéré, au contraire du [z] marqueur de pluriel, comme se rattachant au mot suivant plutôt qu'au mot précédent, et ce pour les deux raisons suivantes : - "there is no obvious morphological interpretation for this marker" (1982 : 326) ; - on n'observe pas selon eux de [t] avant les compléments séparés du verbe ("to the best of our knowledge such forms do not exist" 1982 : 326) ; pourtant, ils en citent après la négation (c'est pas [t] à moi), après un complément (ils chantent tous [t] en chœur) ou un adverbe (ça doit bien [t] être cuit) (1982 : 324). Bien que l'on puisse objecter à leur exclusion de ce marqueur [t] du complément suivant, la question du rattachement du marqueur est ici secondaire. Ce qui est essentiel est le fait que la consonne n'est pas une consonne de liaison à proprement parler, mais un marqueur à conditionnement partiellement morphologique. Dans certains cas de "liaison", l'alternance consonne ~ zéro est en réalité due à la présence d'un marqueur morphologique, dont on peut relever qu'il ne se manifeste qu'à une frontière syntaxique, devant une voyelle. Le contexte de liaison est ici requis, dans le sens où l'on n'observe pas la présence de ce marqueur à la finale de proposition ; les deux cas relevés sont néanmoins en marge du phénomène de liaison propre, puisque intervient un critère morphologique (au moins dans le cas de [z]) autre que la simple présence d'une frontière ou la catégorie lexicale des mots en contact. J'ai passé en revue les analyses postulant la présence de la consonne en finale du premier mot ou faisant partie de la séquence à droite de la frontière. La troisième possibilité quant à l'apparition d'une consonne à l'enchaînement entre deux mots est l'épenthèse consonantique. 1.1.3. La consonne n'appartient à aucun des deux morphèmes Si la consonne n'appartient à aucun des deux morphèmes mis en contact, force est de considérer qu'elle est épenthésée. 230 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.1.3.1. Cadre pré-génératif A ma connaissance, aucun ouvrage ne mentionne la solution de l'épenthèse consonantique avant l'avènement du cadre génératif. C'est la présence de la consonne dans le premier mot en jeu dans la liaison qui était privilégié jusqu'alors. 1.1.3.2. Cadre génératif linéaire C'est Klausenburger (1974, également 1976, 1977, 1978a, b) qui le premier tente de proposer une règle d'épenthèse plutôt que de troncation (ce qu'avait explicitement rejeté Schane 1973b). A l'époque où cet article est écrit, la FTR est encore populaire, et il entend considérer la liaison et l'élision comme deux procédés différents, afin de ne pas postuler de règles opaques. Les morphèmes dans le lexique contiennent une consonne finale quand elle est fixe et non quand elle alterne avec zéro à la liaison. La consonne n'apparaît dans ce deuxième cas que par l'action d'une règle d'épenthèse conditionnée par la présence d'une voyelle, la règle Liaison étant de ce fait de la forme suivante : ø Æ C / _ V Klausenburger entend par là soutenir la notion d'inversion de règle proposée par Vennemann (1972) : le mécanisme d'élision de consonne attesté historiquement dans la liaison a fait place en synchronie à un mécanisme d'épenthèse. Cependant, il n'est pas plus en mesure d'implémenter les liaisons facultatives que les partisans d'une forme de base contenant la consonne (Schane 1968, Dell 1970, 1973, Selkirk 1972, 1974, etc.), et n'explicite aucunement la façon dont les consonnes insérées reçoivent leur mélodie, alors que celle-ci n'est pas prédictible. Tranel est le second chantre de l'épenthèse dans le cadre des consonnes flottantes. Au contraire de Klausenburger, il précise systématiquement la mélodie de la consonne insérée, que ce soit après voyelle nasale (1974a, 1978), après un pluriel (1976), après un adjectif (1978), ou dans tous les cas d'alternance consonne ~ zéro. Pour être précise, la règle d'épenthèse duplique la frontière morphologique et insère la consonne observée à la liaison entre les deux frontières, comme dans la règle d'insertion de n suivante (1974a ; cf. également 1981 : 240) : 231 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (171) V +nasal [-seg] V 1 2 3 Æ 1 2 n 2 3 Les règles d'épenthèse qu'il propose contiennent le cas échéant des informations relatives à la syntaxe tout en conservant les frontières morphologiques, comme on peut le noter dans la règle d'insertion de [r] après un infinitif (1981 : 234) : (172) e Verb # [+ syll] 2 3 + infinitive + first conjugation 1 Æ 1 2 r 2 3 Signalons enfin la position de Tranel (1981 : 210-221) dans le traitement de la liaison en [z] dans le groupe nominal (les enfants [lzf]) que l'on a observé notamment chez Kaye & Morin (1982) : [z] "cannot be systematically present, underlyingly, owing to a spelling rule rewriting the feature [+Plural]. Instead, it must be inserted only when it is actually present on the surface", c'est-à-dire après les substantifs, les adjectifs, les déterminants pluriels (les, des, aux, ces, mes, tes, ses, nos, vos, leurs), les quantifieurs (certains, plusieurs, etc.) et les pronoms personnels pluriel (nous, vous, les, ils, elles), ce qui est défini par la règle d'insertion suivante : (173) X # [+syll] 2 3 [+plural] 1 Æ 1 2 z 2 3 Le pronom pluriel leur ne suivant pas cette règle, il est marqué en conséquence dans le lexique. Par ailleurs, cette règle exclut les verbes, sans que Tranel (1981) explicite ce rejet dans la formulation de la règle64. Par ailleurs, il propose de remplacer le conditionnement en nombre de frontières proposé par Selkirk (1972, 1974) par une considération de la cohésion syntactique entre les 64 Il mentionne cette limite de sa règle tout en indiquant qu'un cadre supposant un morphème pluriel /z/ rencontre le même problème : "in the framework of the systematic plural-suffix hypothesis, the spelling rule that rewrites [+Plural] as /z/ has to be similarly constrained" (1981 : 217). 232 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français mots, avec une influence du style. Cette approche a l'avantage "over the word-boundary solution of capturing directly the genuine relation that exists between the syntax/style and the phonology" (1981 : 219) ; cependant, elle n'est pas formalisée au sein de la règle autrement que, précisément, par une frontière morphologique. Mentionnons également Schane (1978). Son point de vue est en réalité à mi-chemin entre la consonne lexicale et l'épenthèse, dans le sens où il propose de considérer qu'il y a épenthèse, mais d'une consonne précisée comme "épenthésable" pour chaque entrée lexicale : le (t) de /pti(t)/ par exemple. A partir du moment où la consonne est dans le lexique, il semble que considérer qu'il puisse s'agir d'une épenthèse relève davantage de l'artefact notationnel que d'un réel changement de pensée de sa part. Van Ameringen (1977) se penche sur le problème de la représentation des liaisons facultatives par rapport aux liaisons obligatoires, et propose des règles de "réajustement de bornes" pour en rendre compte. Dans les deux cas – liaison obligatoire ou facultative, les consonnes de liaison sont épenthésées et non présentes dans le lexique. Dumas (1978) s'intéresse à la liaison de pluriel à l'intérieur du syntagme nominal, celle-là même qui a été analysée par Kaye & Morin (1978, 1982) comme résultant de l'insertion d'un marqueur de pluriel et par Tranel (1981) comme une épenthèse conditionnée par la syntaxe et le style. S'opposant à Schane (1968) et aux travaux subséquents, il reproche à la théorie de la troncation de se baser sur des raisons historiques et graphiques, ainsi que de supposer facultative une liaison qui est en réalité "exceptionnelle et marginale" (1978 : 87). Il propose donc une règle d'insertion qui "insèrera à la fin des adjectifs préposés un segment [z], pourvu que le constituant suivant (adjectif ou nom) soit à initiale vocalique, l'application de la règle étant déclenchée par la présence dans le SN d'un déterminant pluriel" (1978 : 92). Cette règle d'épenthèse s'accompagne d'une règle de troncation, de portée plus vaste et moins "hétéroclite" (1978 : 96) que celle de Schane, selon laquelle "la finale consonantique s'effacera devant l'initiale consonantique du mot suivant et à la fin de tout syntagme" (1978 : 98). 233 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français L'analyse par épenthèse de l'alternance consonne ~ zéro a pour ambition de rendre compte de l'unité de certains types de liaison, en particulier celle intervenant dans un groupe nominal pluriel, sans poser de morphème de pluriel. Elle vise également à mieux représenter la différence entre liaison obligatoire et liaison facultative. En réalité, ce sont surtout des considérations théoriques portant sur le rejet de la présence d'une consonne en finale, non prononcée dans certaines conditions, qui conduisent à postuler des épenthèses. Mais dans ce cadre linéaire, le remède semble pire que le mal et les règles d'insertion au moins aussi ad hoc que celles de troncation. Tournons-nous à présent vers le traitement par épenthèse proposé dans les modèles multilinéaires. 1.1.3.3. Cadre génératif multilinéaire Dans un cadre multilinéaire, postuler une épenthèse revient à insérer une position squelettale (cf. Tranel 1995b : 140-142). D'après Encrevé (1988a : 184), une "vraie" épenthèse "augmente le nombre des places du mot", c'est-à-dire qu'elle consiste à ajouter une position squelettale, alors qu'une "fausse" épenthèse "se borne à interpréter une position du squelette déjà présente au niveau lexical". L'analyse proposée par Wetzels (1987) entre dans le cadre d'une "vraie" épenthèse selon les termes d'Encrevé. Wetzels (1987 : 300) propose de considérer la liaison comme l'assignation d'un "timing slot to a floating consonant before a vowel-initial word" au moyen de la règle Liaison formalisée de la manière suivante : (174) Æ ø C / __ V (within the appropriate domain) | [+cons] [x] Le cadre multilinéaire permet dans cette optique de profiter des avantages de la présence de la consonne dans le lexique sans les inconvénients relatifs à son élision le cas échéant. Cependant, cet aspect positif n'est valable que dans le cas où l'on compare l'approche de Wetzels avec celle postulant la position squelettale attachée à la consonne flottante, comme Clements & Keyser (1983) par exemple (cf. section 1.1.1.2.3.1). Dans ces modèles en effet, 234 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français les consonnes finales, extrasyllabiques, qui ne sont pas syllabifiées par le processus de liaison, ne sont pas réalisées et doivent donc être élidées par règle. Wetzels, en ne posant que le segment flottant et non la position squelettale associée, n'a pas besoin de recourir à une règle la concernant ; en ce qui concerne la mélodie, "just like floating tones, untimed matrices are eliminated by convention" (1987 : 301). Ce même résultat est obtenu par les approches ne postulant précisément que le segment flottant et non la position squelettale (cf. section 1.1.1.2.3.2). Par ailleurs, ces dernières sont plus explicatives que l'hypothèse de Wetzels, dans le sens où ce n'est pas une règle, aux contours morphologiques par ailleurs mal définis ("within the appropriate domain"), qui justifie de l'intrusion d'une consonne, mais c'est la structure elle-même qui la requiert. L'analyse de Wetzels se montre plus fine que les autres cependant en ce qu'elle ne fait pas intervenir uniquement un facteur phonologique (en l'occurrence la structure de la syllabe) comme conditionnement de l'apparition de la consonne sous-jacente. Dans le domaine de l'acquisition, Kilani-Schoch (1983) et plus récemment Côté (2003) considèrent certains cas de liaison comme relevant du phénomène de l'épenthèse plutôt que de la présence d'un segment sous-jacent. Côté (2003) défend l'hypothèse de l'épenthèse consonantique à la liaison entre adjectif et substantif sur la base de recherches en acquisition (Chevrot & Côté 2003, Dugua, Chevrot & Côté 2003, Dugua 2002, Chevrot 2001, Chevrot & Fayol 2000, 2001) sur des enfants de 2 à 5 ans (cf. compte-rendu de Wauquier-Graveline ms. en section 1.1.1.2.3.2), mais également des caractéristiques acoustiques (Delattre 1940, Dejean-De-La-Batie 1993, Spinelli et al. 2003) des consonnes : les consonnes épenthétiques à la liaison sont plus courtes que les consonnes fixes. 1.1.3.4. Bilan sur l'épenthèse Dans le cadre de la liaison, l'épenthèse semble globalement se révéler une solution moins satisfaisante que de supposer la consonne sous-jacente. En effet, la nature de la consonne sous intérêt est à spécifier à chaque fois, puisque dans la plupart des cas de liaison elle n'est pas prédictible par le contexte, ni phonologique, ni morphologique, ni syntaxique. De plus, l'appel à une règle d'insertion n'est pas explicatif mais uniquement représentationnel. Dans les cas où l'apparition de la consonne est liée à une contrainte syntaxique, i.e. quand elle apparaît à la liaison dans un contexte pluriel, l'épenthèse pourrait permettre de 235 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français rendre compte de l'invariabilité de la nature de la consonne, mais rien n'autorise à privilégier cette solution à celle qui consiste à voir en la consonne intrusive une marque morphologique. 1.1.4. Bilan sur les analyses antérieures de la liaison Cette section a passé en revue les diverses analyses proposées de la liaison qui justifient la présence vs. l'absence d'une consonne entre deux mots, devant une voyelle. L'hypothèse la plus fréquemment formulée, dans la majorité des cas de liaison, consiste à considérer que la consonne est présente à la finale du mot situé à sa gauche. Ce sont les limites du modèle linéaire qui ont conduit à réenvisager la solution de la supplétion de bases étudiée par certains linguistes non génératifs ; d'autres ont préféré la solution de l'épenthèse de façon à ne faire figurer dans le lexique que les éléments observables en surface. Toutefois, la supplétion n'est pas explicative en soi et l'épenthèse, dans le cadre de la liaison, se heurte au problème de la nature de la consonne épenthésée, non prédictible. L'avènement des modèles multilinéaires a relancé le débat, en permettant de séparer la mélodie des niveaux squelettal et syllabique. L'hypothèse considérant que la consonne appartient au premier morphème y a gagné en explicativité : la consonne alternante acquiert le statut particulier auquel son comportement lui permet de prétendre, et les cas de liaison (obligatoire) découlent de la bonne formation de la structure et non de règles. Pourtant, l'hypothèse de l'épenthèse ou de l'appartenance de la consonne au morphème situé à sa droite ne sont pas évacuées, car certains problèmes restent en suspens lorsque l'on considère que la consonne appartient au premier morphème : - pourquoi les consonnes alternantes sont-elles majoritairement des coronales ? - pourquoi dans certains cas la consonne de liaison apparaît-elle devant le deuxième morphème, alors que celui-ci est séparé du premier (des marchands de sucre [z] anglais) ? - pourquoi trouve-t-on systématiquement [t] à l'inversion du sujet devant les pronoms il, elle et on et non devant une préposition ou un article ? Dans l'hypothèse de la présence de la consonne flottante en finale du premier morphème, c'est essentiellement le facteur phonologique structural qui est pris en compte : il y a liaison lorsque l'attaque du second mot est vide. Ceci met alors sur un pied d'égalité les liaisons obligatoires et les liaisons facultatives et fait passer au second plan les motivations syntaxiques, morphologiques ou stylistiques. C'est ce qui permet aux générativistes de cette tendance d'unifier sous une même hypothèse explicative l'ensemble des phénomènes 236 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français d'alternance consonne ~ zéro, à savoir les cas de liaison, de flexion ou de dérivation. Cette unification sert de justification pour rejeter une analyse par épenthèse de l'un ou l'autre de ces phénomènes, faisant fi des cas particuliers tels que la "liaison post-verbale" pour laquelle je propose une analyse différente dans la partie III, au chapitre 10. S'il est vrai que l'on peut difficilement représenter au niveau phonologique les facteurs stylistiques qui sous-tendent la réalisation d'une consonne de liaison facultative, la théorie doit néanmoins être en mesure de rendre compte des liaisons obligatoires comme des liaisons interdites. Les mots commençant par un h aspiré, qui interdit toute liaison, ont de ce fait beaucoup été étudiés. Afin d'établir ce que la théorie doit réussir à implémenter, récapitulons les différents cas de liaison possibles en français, ainsi que leur statut en termes "d'obligation de réalisation". 1.2. Liaisons obligatoires, facultatives et impossibles Etablir une partition entre liaisons obligatoires, liaisons facultatives et liaisons interdites n'est pas une entreprise aisée ; en effet, la plupart des travaux sur la liaison envisagés dans ces termes sont à visée normative (Fouché 1961, Grevisse 1993) ou pédagogique (par exemple Abry & Chalaron 1994, Mauger 1968, Chevalier et al. 1964) et ne reflètent pas toute la variation que connaît ce phénomène de la liaison, tant régionale que stylistique. Grevisse (1993 : 48) lui-même prend des précautions et fournit une liste des liaisons "généralement considérées comme obligatoires" ou "généralement recommandées" plutôt qu'un classement absolu. Tranel (1981 : 223) propose un classement en termes de liaison obligatoire, facultative ou interdite. Le projet Phonologie du Français Contemporain (PFC), dont l'un des buts est précisément d'établir les contextes de liaison au moyen d'enquêtes circonstanciées, envisage les trois catégories sous l'angle de la liaison catégorique, variable et erratique. Malheureusement, la publication des premiers résultats des enquêtes menées sur le terrain ne sont pas encore disponibles au moment de la rédaction de cette thèse. C'est pourtant uniquement au moyen d'une enquête de grande ampleur comme celle du PFC que l'on obtiendra une réelle partition des liaisons en français actuel. Il ne s'agit donc pas ici d'établir une liste ferme des contextes de liaison obligatoires ou interdits, mais plutôt de recenser les tendances générales concernant tel ou tel type de liaison. Par ailleurs, les expressions figées et les locutions (petit à petit [ptitapti], de mieux en 237 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français mieux [dmjøzmjø], mot à mot [motamo], vis-à-vis [vizavi], etc. vs. pots à tabac [poataba], moulins à vent [mulav]), en ce qu'elles concernent une liaison figée (obligatoire ou interdite) à l'intérieur d'une unité lexicale, ne sont pas considérées ici. Je distinguerai ici deux cas, selon que la liaison s'établit dans un contexte "pluriel" (1.2.1) ou singulier (1.2.2.). On pourrait objecter à ce classement qu'il fait intervenir un phénomène de flexion dans une partie consacrée à la liaison. En réalité, il s'agit bien de liaison puisque l'alternance entre la présence vs. l'absence de consonne se manifeste entre deux mots et non à la finale absolue, comme dans les cas de flexion du français répertoriés ici. Toutefois, en ce qui concerne les liaisons après un "pluriel", il est vrai que l'on suppose la présence d'un morphème particulier, comme il l'a été suggéré dans l'analyse de Morin & Kaye (1982) par exemple, et comme on va le voir dans la section suivante. 1.2.1. Après un "pluriel" Le tableau ci-dessous rappelle les cas pertinents ici, en fonction du premier mot entrant en jeu. Les deux dernières colonnes du tableau permettent de distinguer les liaisons obligatoires, les liaisons interdites et les liaisons facultatives (qui ne sont ni obligatoires, ni interdites). (175) après adjectif après substantif contexte C adjectif _ nom z gentils maris / gentils enfants nom _ adjectif z athlètes français / athlètes américains z verbe _ préposition après verbe t auxiliaire participe _ t illustration liaison obligatoire 9 liaison interdite nous vivons dans le luxe / nous vivons à Paris ils chantent dans une chorale / ils chantent en chœur ils ont mangé / ils ont appelé Sont ici regroupés les cas de pluriels au sens "classique", c'est-à-dire concernant les substantifs et les adjectifs, et les cas de pluriels de personnes verbales, qui ne correspondent pas nécessairement à un pluriel dans les faits (cf. le nous rhétorique ou le vous de politesse). Ce dernier cas sera cependant réévalué lors du traitement des formes singulier du verbe dans la section suivante. 238 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Comme on peut le constater dans ce tableau, seules deux consonnes sont possibles à la jonction entre les deux mots impliqués : [z] et [t]. Pour autant, seul [z] est obligatoire, à la liaison entre un adjectif et un substantif (dans cet ordre), donc à l'intérieur du syntagme nominal. 1.2.2. Après un singulier Là encore, le tableau récapitulatif est classé en fonction de la catégorie lexicale du morphème situé à gauche de la liaison : adjectif, substantif ou verbe comme dans le tableau précédent, mais également adverbe avec une subdivision selon qu'il s'agit d'un adverbe en ment ou non, et après les clitiques : déterminants, prépositions, pronoms. Les contextes pertinents sont issus des manuels et articles abordant le phénomène de la liaison ainsi que de mes propres observations, de même que le classement en termes d'obligation ou d'interdiction de la liaison. (176) contexte après adjectif adjectif _ nom qualificatif (vs. nom _ adjectif) après substantif C illustration t t z g r petit copain / petit ami fort taux / fort accent gros castor / gros écureuil long printemps / long été premier train / premier invité savant français / savant anglais loup dangereux / loup inutile loup courbatu / loup enragé le chat arrive le chat et la souris très demandé / très attendu pas demandé / pas attendu très faim / très envie pas faim / pas envie fort tard / fort envie très gentil / très aimable fort gentil / fort aimable trop tard / trop important bien tard / bien aimable extrêmement peur / extrêmement envie extrêmement gentil / extrêmement aimable spontanément à l'esprit directement en enfer les parents / les enfants les petits / les anciens amis dans deux heures / dans une heure nom _ adjectif t nom _ participe nom _ verbe nom _ conjonction adverbe _ participe / adjectif v t t z z z z t z t p n t t adverbe après adverbe substantif de négation ou de degré _ adverbe _ adjectif adverbe_substantif après adverbe adverbe _ adjectif autre adverbe _ préposition après déterminant _ déterminant substantif / adjectif après préposition _ préposition déterminant t z z après adjectif numéral k t z après pronom pronom _ verbe sujet z cinq cents / cinq enfants huit cents / huit enfants dix copains / dix enfants nous prenons / nous avons ils prennent / ils ont liaison obligatoire liaison interdite 9 9 9 9 9 9 9 9 9 239 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français pronom _ pronom pronom Pe3 _ préposition (interrogation) pronom Pe3 _ participe (interrogation) pronom Pe3 _ infinitif (interrogation) pronom Pe3 _ pronom (interrogation) pronom Pe6 _ préposition (interrogation) pronom Pe6 _ participe (interrogation) pronom Pe6 _ infinitif (interrogation) pronom Pe6 _ pronom (interrogation) pronom Pe 4 & 5 _ préposition (interrogation) pronom Pe 4 & 5 _ participe (interrogation) pronom Pe 4 & 5 _ participe (interrogation) pronom Pe 4 & 5 _ pronom (interrogation) après pronom pronom _ verbe complément pronom _ pronom après pronom relatif dont, pronom _ pronom conjonction quand après pronom pronom _ verbe interrogatif pronom _ préposition après pronom indéfini pronom _ verbe après pronom pronom _ verbe possessif après verbe verbe _ adjectif z nous y allons, ils en prennent, à vous en croire qu'a-t-on à faire 9 9 n qu'a-t-on acheté 9 n que doit-on acheter 9 n que peut-on y faire 9 n t qu'ont-ils à faire qu'ont-elles à faire 9 t qu'ont-ils acheté qu'ont-elles ignoré 9 t que doivent-ils acheter que peuvent-elles imaginer 9 t que peuvent-ils y faire combien peuvent-elles en demander 9 z qu'avons-nous à faire qu'avez-vous à faire z qu'avons-nous oublié qu'avez-vous étudié z que devons-nous étudier que pouvez-vous apprendre z z z t t n n t z n t z verbe _ adverbe z verbe _ clitique (impératif) z que pouvons-nous y faire que pouvez-vous en attendre combien pouvez-vous en demander il nous prend / il nous entend il nous en prend quand nous venons / quand il vient dont nous venons / dont il vient 9 9 quand est-il parti comment ouvrir la fenêtre chacun à son tour chacun aura tout ira bien, tout arrive plusieurs iront le mien ira il est français / il est (c'est) anglais je suis français / je suis anglais vous chantez bien / vous chantez agréablement manges-en 9 9 9 9 9 9 240 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français verbe _ clitique + infinitif verbe _ préposition verbe _ préposition (impératif) verbe _ clitique (inversion) infinitif _ préposition infinitif _ déterminant auxiliaire _ participe z t z t r r t va en avoir des nouvelles va y mettre de l'ordre il vient à la maison mange en cuisine mange-t-il 9 9 9 chanter en chœur donner un espoir il est venu / il est arrivé 1.2.2.1. Liaison facultative Du fait précisément de la fluctuation de sa réalisation, je ne traiterai pas la liaison facultative dans le détail. Le rôle d'une théorie phonologique à son égard est d'être en mesure d'attribuer une position structurale pour l'éventuelle consonne attestée, et non de prédire dans quelles circonstances la liaison sera effectuée. Ceci dépend en effet de facteurs sociologiques, sémantiques, stylistiques, fréquentiels et contextuels que la théorie phonologique ne doit pas représenter. Cela est particulièrement vrai en ce qui concerne l'adverbe, la nature même de chaque adverbe semblant constituer un premier facteur déterminant (la liaison dans très envie [trzvi] semble bien plus fréquemment attestée que celle de fort envie [fçrtvi] par exemple). Après une préposition, après le pronom dont ou la conjonction dans, la variation est également la règle. Après le verbe à l'infinitif, il est possible de réaliser un [r] de liaison bien qu'il soit loin d'être obligatoire. La variation s'observe enfin après le verbe non infinitif, l'adjectif ou certains pronoms sujets dans des cas définis. 1.2.2.2. Liaison obligatoire Certaines liaisons sont données obligatoires par les grammaires sans que cela soit vrai pour tous les registres. Ainsi après la conjonction quand et le pronom relatif dont, la liaison est-elle réputée obligatoire : quand [t] il arrivera, la femme dont [t] il te parle. Pourtant, ces séquences sont possibles sans cette consonne de transition, pour certains locuteurs ou dans des conditions stylistiques particulières : quand [ø] il arrivera, la femme dont [ø] il te parle. 241 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français De même, après certaines prépositions (en, dans, chez, sans, sous) la liaison est-elle réputée obligatoire, mais là encore les attestations montrent qu'il s'agit plus de norme prescriptive qu'objective : chez [z] un ami peut être réalisé chez un ami. Il semble donc qu'on ne puisse attribuer de caractère impératif concernant la liaison pour l'ensemble de la catégorie lexicale, et qu'il faille là, éventuellement, considérer chaque adverbe ou chaque préposition particulièrement. Je distinguerai ici les liaisons obligatoires à l'intérieur des syntagmes ou à la frontière entre deux syntagmes. 1.2.2.2.1. A l'intérieur du syntagme nominal Les liaisons entre déterminant et adjectif ou déterminant et substantif sont obligatoires, ainsi qu'après un adjectif numéral. En revanche, ce n'est pas le cas entre un adjectif et un substantif (dans cet ordre), et contrairement à ce qui est supposé dans la plupart des modèles génératifs (par exemple Tranel 1986 : 326) : selon mes propres observations, la liaison semble facultative et non obligatoire, en tout cas pour certains locuteurs qui pourront parler d'un petit immeuble tout comme d'un petit [t] immeuble par exemple. L'exemple favori de liaison "obligatoire" dans ce contexte, à savoir petit ami, semble lexicalisé avec la consonne de liaison et non le produit de la concaténation synchronique de deux items distincts du lexique. Si des observations à grande échelle confirment cette impression, cela signifierait que même les cas de liaison "obligatoire" pris en exemple dans les théories génératives ne seraient pas uniquement dus à des facteurs phonologiques. Signalons en outre que les cas de liaison après [] sont bloqués : un fort accent n'est jamais réalisé avec la consonne de liaison (un fort *[t] accent). Il est possible d'établir une gradation dans les sons les plus fréquemment observés entre adjectif (non numéral) et substantif en liaison, sur la base d'observations il est vrai non systématisées : [t] et [z] arriveraient en tête, la liaison avec [r] ou [g] étant peu attestée en regard. Il s'agirait donc des coronales, et plus particulièrement des coronales obstruantes, [t] étant la moins marquée de toutes. Tournons-nous à présent vers la liaison à l'intérieur du syntagme verbal, qui est plus particulièrement celle sous intérêt dans ce chapitre. 242 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.2.2.2.2. A l'intérieur du syntagme verbal Je distinguerai ici deux sites de liaison obligatoire potentiels : entre verbe et clitique, et entre pronom complément et verbe. En revanche, à l'intérieur de la forme verbale même, c'està-dire entre auxiliaire et participe, la liaison est facultative (il est [t] allé ou il est allé). Si la liaison semble interdite devant préposition (il vient *[t] à la maison), elle est cependant obligatoire avant un pronom de troisième personne (mange-t-il [mtil], fait-on [ftç], prend-elle [prtl]) et avant les pronoms cliticisés en65 et y (fais-en [fz], vas-y [vazi]). Cela indique que le site [verbe _ pronom] est particulier en regard de la liaison, qu'il s'agisse de pronoms sujets ou de pronoms compléments. Je proposerai une analyse de ce type de "liaisons" en partie III chapitre [10], prenant en compte cette particularité. Le site inversé, à savoir entre pronom complément et verbe, est tout aussi intéressant. Là encore en effet, la liaison revêt un caractère impératif, en l'occurrence obligatoire : il nous [z] entend est la seule réalisation possible, la séquence sans liaison (*[ilnut]) semble inattestée. 1.2.2.2.3. Entre deux syntagmes "Dans la langue contemporaine, la liaison est en régression : on lie seulement à l'intérieur d'un groupe" affirment Chevalier & al (1964 : 24). Près de quarante ans après ces propos, est-il vrai que la liaison entre deux groupes a disparu ? La position entre deux syntagmes concerne soit deux syntagmes indépendants reliés par un élément de coordination, qui bloque la liaison (le chat *[t] et le chien, il est petit *[t] et malingre), soit par la position entre sujet et verbe. Dans ce dernier cas, il y a lieu de distinguer deux situations, selon que le sujet est ou non pronom personnel. Si le sujet est un pronom personnel, la liaison est obligatoire, tout comme l'est celle entre pronom complément et verbe (cf. section 1.2.2.2.2) : on [n] ira, nous [z] allons, vous [z] aurez, ils [z] utilisent, elles [z] estiment. Ce n'est donc pas la nature de la frontière syntaxique qui est déterminante ici, mais les catégories lexicales des éléments en contact : pronom personnel et verbe, dans cet ordre. 65 Mais pas avant la préposition en : mange *[t] en cuisine. 243 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Lorsque le sujet n'est pas un pronom personnel, plusieurs cas sont répertoriés. L'observation de la liaison lorsque le sujet n'est pas un pronom personnel mais un pronom d'une autre catégorie soutient l'hypothèse de la relation particulière entre catégories lexicales plutôt qu'entre positions relatives au syntagme. La liaison est en effet interdite si le sujet est un substantif (le chat *[t] arrive), ou s'il s'agit d'autres types de pronoms que personnels : possessifs (le mien *[n] est là), pronoms indéfinis singulier de sens affirmatif (quelqu'un *[n] est venu, chacun *[n] a un rôle) ; pour les pronoms interrogatifs, il est plus difficile d'établir une règle fixe (comment *[t] iras-tu à la gare ?, comment *[t] allons nous venir ? mais comment [t] irez-vous à la gare ?), mais il semble que l'on puisse voir dans la nonhomogénéité de traitement une particularité de la relation entre comment et la cinquième personne du verbe aller, probablement due à la tournure comment allez-vous. A l'intérieur du syntagme verbal, c'est donc le contact entre un pronom personnel et un verbe qui est source de l'obligation de liaison. Dans la section suivante, je m'intéresse aux cas de liaison interdite. 1.2.2.3. Liaison interdite Sans qu'il soit question de catégorie ou d'une quelconque frontière syntaxique, on observe qu'une consonne de liaison n'est jamais réalisée lorsqu'elle se situe après [] : *un fort [t] accent, *c'est fort [t] important. En dehors de ce cas particulier, l'interdiction de liaison s'observe dans trois sites : après un substantif, après un pronom sujet et après un verbe. Ce contexte de gauche n'est pas toujours suffisant à caractériser la position de liaison. 1.2.2.3.1. Après substantif Le substantif n'est jamais suivi de liaison, qu'il se situe à l'intérieur d'un syntagme nominal devant adjectif (savant *[t] anglais) ou participe (loup *[p] enragé), ou à la frontière entre les deux syntagmes, devant le verbe (le chat *[t] arrive) comme devant une conjonction (le chat *[t] et la souris). C'est donc bien sa nature de substantif et non la relation syntaxique entre les éléments qui détermine l'apparition, ou en l'occurrence ici la non-apparition, de la liaison. 244 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.2.2.3.2. Après pronom sujet Les sections 2.2.2.2.2 et 2.2.2.3.1 ont établi l'obligation de liaison entre pronom personnel et verbe. Il existe pourtant un cas où la liaison après pronom personnel non seulement n'est pas obligatoire, mais est même interdite : à l'interrogation, quel que soit le mot suivant (participe, infinitif, pronom, préposition), pour les personnes 3 et 6 : qu'a-t-on *[n] à faire, que doivent-ils *[z] acheter, que peut-on *[n] y changer, qu'ont-elles *[z] appris. En ce qui concerne les personnes 4 et 5, la liaison est possible mais non obligatoire : qu'avons-nous [z] à faire, que devez-vous [z] acheter, que pouvons-nous [z] y changer, qu'avez-vous [z] appris. Il semble qu'ici la syntaxe reprenne ses droits, et qu'elle soit suffisamment puissante pour passer outre la catégorie du pronom dont nous avons pourtant vu la force en ce qui concerne la liaison obligatoire. Faut-il voir dans cette interdiction de liaison un effet de l'inversion du sujet, dont nous avons vu le caractère particulier – mais dans l'autre sens – en ce qui concerne la troisième personne ? 1.2.2.3.3. Après verbe : devant préposition ou déterminant Je m'en tiendrai ici aux verbes conjugués au présent de l'indicatif, qui "ne contient aucun autre segment formel que celui du radical et celui de la personne" (Touratier 1996 : 36). Les autres temps pouvant être marqués par des morphèmes spécifiques, je ne les aborderai pas dans le cadre de ce panorama général de la liaison. Entre un verbe (au singulier) et une préposition, la liaison n'est pas interdite mais semble cependant fortement marquée (il part [t] à l'école, elle court [t] à perdre haleine, je viens [z] en retard, tu entres [z] au couvent), et ce même si la préposition introduit un complément du verbe (tu dis [z] à ton frère). Je reviendrai sur ce type de "liaison" en section III [10]. La situation est la même devant un déterminant : il part [t] un peu vite, je cours [z] un cent mètres, tu prends [z] un café, il faut [t] un peu travailler sont possibles par exemple. Les sections 1.2.2.1 à 1.2.2.3 ont permis de mettre en évidence les particularités de certaines classes d'unités lexicales dans leurs rapports face à la liaison. La section suivante en propose un récapitulatif. 245 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.2.2.4. Récapitulatif par catégorie lexicale du premier terme Le traitement est rarement uniforme pour une catégorie lexicale donnée, aussi faut-il souvent préciser davantage que la simple catégorie lexicale. En ce qui concerne les pronoms, il faut distinguer différents cas : après le pronom sujet la liaison est obligatoire, sauf dans les tournures interrogatives où elle est au contraire interdite, et ce, même si le pronom est situé devant un participe (qu'ont-ils *[z] imaginé). Après le pronom complément la liaison est obligatoire, alors qu'elle est interdite après un pronom possessif ou interrogatif. Enfin, après les pronoms indéfinis on ne peut établir de règle absolue, étant donné que la liaison est "parasitée" par la négation (aucun n'ira) ou le pluriel (plusieurs iront) ; pour les autres pronoms indéfinis il semblerait qu'il faille poser un interdit de liaison (chacun *[n] ira), sauf pour tout qui au contraire rend la liaison obligatoire. La liaison après les autres catégories de termes est plus "simple". Après le substantif, elle est interdite, tout simplement. Après l'adjectif qualificatif, elle est obligatoire ou facultative, jamais interdite. En ce qui concerne les adverbes, la liaison est ponctuellement obligatoire, jamais interdite non plus. Elle est obligatoire après un déterminant et facultative après une préposition. C'est la liaison post-verbale qui manifeste la plus grande variation parmi les catégories majeures, dans le sens où les trois types de liaison sont possibles : facultative, obligatoire ou interdite. C'est ainsi la seule des catégories majeures pour laquelle le contrôle de la liaison s'effectue aussi bien dans le sens de l'obligation que de l'interdiction66. 1.2.3. Bilan sur la liaison Les phonologues se sont essentiellement intéressés aux liaisons obligatoires, particulièrement après l'adjectif, classant les liaisons interdites parmi les phénomènes syntaxiques et les liaisons facultatives avec les processus stylistiques. On aurait pu s'attendre de ce fait à ce que la liaison post-verbale, tant à l'inversion du sujet à la troisième personne (mange-t-il) qu'après la deuxième personne de l'impératif (manges-en), soit abondamment documentée puisqu'il s'agit d'un cas de liaison obligatoire. Il n'en est rien. Peu d'analyses y sont consacrées. Parmi celles-ci, le traitement de la consonne est très varié. C'est en effet le seul cas de liaison où il a été envisagé que la 66 Cette ambivalence se retrouve également avec les pronoms sujets. 246 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français consonne soit présente à l'initiale du second mot et non seulement, classiquement, en finale du premier ou même insérée par épenthèse. Dans le chapitre 10 de la partie III, je vais m'attacher à évaluer les différentes possibilités d'analyse de la liaison post-verbale, ce qui me conduira à proposer un traitement original du phénomène en termes d'intervention de la syntaxe dans la phonologie. Pour ce faire, un deuxième phénomène est à prendre en considération, celui de la flexion. 1.3. La flexion La flexion constitue la deuxième catégorie de phénomènes mettant en lumière une alternance consonne ~ zéro. Elle aussi peut résulter de la mise en contact de deux morphèmes, mais à l'intérieur d'une unité lexicale, comme la dérivation, et non à la frontière entre deux mots. Cependant, l'alternance s'observe toujours en fin de mot, comme à la liaison. Les deux grandes familles de phénomènes flexionnels sont la flexion nominale et la flexion verbale, que je vais aborder successivement en fonction de leur rôle dans l'alternance sous intérêt. 1.3.1. Flexion nominale La flexion nominale concerne le genre et le nombre des adjectifs et des substantifs, de façon disproportionnée. 1.3.1.1. Nombre Ce cas de flexion impliquant une alternance consonne ~ zéro concerne en réalité peu d'items lexicaux, tous substantifs (cf. Tranel 1981 : 182-184) : (177) [al] / [o] V[mi-ouverte]C / V[mi-fermée] singulier cheval, bocal œuf, bœuf os pluriel chevaux, bocaux œufs, bœufs os Deux options sont possibles : soit on considère qu'il n'y a qu'une forme sous-jacente dans chacun de ces deux cas, soit on choisit de postuler deux allomorphes. 247 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.3.1.1.1. Une seule forme sous-jacente En ce qui concerne l'alternance [al] / [o], Schane (1968 : 80-81) propose de considérer que la forme de singulier présente dans le lexique soit modifiée par deux règles, qui reprennent en fait en synchronie l'historique de l'alternance. La première règle consiste à vocaliser le /l/ final, la seconde à convertir la séquence de voyelles [au] en la voyelle postérieure mi-fermée [o] : /l/-VOC l Æ u / _C /o/-CON au Æ o Il faut de plus préciser, comme l'indique Selkirk (1972 : 307-309), la nature de la frontière morphologique impliquée : la vocalisation ne peut avoir lieu que devant une frontière de morphème et non de nom (un royal prétendant et non *un royaux prétendant), le morphème suivant étant celui de pluriel /z/ dans le cas de la flexion nominale. Ces deux règles ont une portée générale en ce qu'elles permettent de rendre compte des variations non seulement dans les substantifs, mais également dans les verbes (valoir / vaut si l'on considère que le morphème de troisième personne est bien /t/, cf. section III [10] 2.1). En revanche, en ce qui concerne la dérivation (altitude / haut, falsifier / faux) et bien que l'on observe également la même alternance, ces règles ne peuvent la justifier puisque cette fois la variante [al] est précisément attestée devant consonne. L'alternance V[mi-ouverte]C / V[mi-fermée] est justifiée par les générativistes linéaires au moyen du suffixe pluriel /z/ et du nombre de frontières, qui protègent la consonne finale au singulier : les substantifs concernés sont marqués dans le lexique comme exceptions à la règle d'effacement en finale de morphème (C Æ ø / _ [-seg] C) mais pas à celle de la troncation de consonne (C Æ ø / _##). Oeuf, bœuf et os ne sont donc pas soumis à la première règle ([œf], [bœf], [çs]) mais le sont à la seconde, correspondant au pluriel ([ø], [bø], [o]). 1.3.1.1.2. Allomorphie Quatre raisons concourent à ne pas implémenter ce type d'alternance consonne ~ zéro dans le lexique autrement que comme une marque idiosyncratique. 248 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Tout d'abord, l'alternance s'accompagne toujours d'une modification du timbre ou de la hauteur de la voyelle, sans que les règles postulées par les générativistes linéaires mettent en évidence le lien nécessaire, indissociable, entre les deux catégories d'événements. Il s'agit de plus d'une alternance figée, portant sur un nombre limité d'items et non sur d'autres de mêmes terminaisons : le pluriel de bal ne sera pas *baux, celui de thermos (si tant est qu'on le prononce avec une voyelle mi-ouverte) ne sera pas [trmo]. En effet, et c'est là la troisième raison invoquée ici, ces alternances ne semblent plus productives, les locuteurs ne construisent pas un pluriel en [o] à partir d'un radical en [al]67 et, selon Tranel (1981 : 191), "the plural forms [des mots comme bœuf, œuf et os] tend to be pronounced like the singular forms, with the final consonants present". En outre, Tranel (1980, 1981 : 185-191) montre les problèmes causés par la postulation de la règle de vocalisation du [l] devant une frontière de morphème et non de mot. Il observe en particulier que, dans le cas du français, "several essential rules postulated in the framework assuming the validity of the systematic plural-suffix hypothesis in fact require that a word boundary precedes the plural marker, since the attachment of the plural morpheme /z/ has an effect upon the preceding word which is identical with that of a consonant-initial word separated from the preceding word by at least one word boundary" (1981 : 186). De ce fait, les items qui font un pluriel "irrégulier" de ce type devront être spécifiés dans le lexique pour ce faire. L'intervention de la flexion dans l'alternance consonne ~ zéro se limite donc à la flexion de genre, très représentée pour sa part. 1.3.1.2. Genre La flexion de genre concerne les adjectifs comme les substantifs. Cependant les substantifs soit n'ont pas été abordés par les théories en ce qui concerne la flexion, soit ont été traités au même titre que les adjectifs. 67 Je ne considère pas les cas éventuels d'hypercorrection, qui conduisent à construire des pluriels en [o] sur tout singulier en [al] dans certains contextes stylistiques marqués. 249 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Il est vrai que l'on peut observer une alternance entre présence vs. absence de consonne en finale des substantifs, mais celle-ci soit s'apparente à celle observée avec l'adjectif (avocat / avocate), soit relève de la forme spécifique du morphème suffixal (lépreux / lépreuse) au même titre que des variations plus importantes (instituteur / institutrice). Si la variation ne concerne que la consonne finale vs. son absence, le cas semble similaire à celui du genre des adjectifs, aussi peut-on considérer qu'il s'agit d'un même phénomène et ne pas distinguer le genre du substantif de celui de l'adjectif. Comme pour le cas de la liaison, au moins deux grands types d'approches ont été utilisées par les théories : soit la consonne est présente dans le lexique, soit elle est insérée par une épenthèse. 1.3.1.2.1. Consonne sous-jacente Les linguistes qui se sont intéressés à la liaison ont souvent abordé en parallèle le traitement du féminin de l'adjectif, puisque le féminin permet d'observer le plus souvent la même consonne que celle qui apparaît à la liaison. La différence essentielle entre la liaison et la flexion est d'ordre syntaxique : le morphème flexionnel entretient un rapport plus étroit avec sa base que deux mots enchaînés. Schane (1968 : 5) : "Since the t [final de l'adjectif petit] appears throughout the paradigm of the feminine, this segment must be followed by a vowel which protects it from truncation. The vowel in the underlying representation is the morpheme which indicates feminine gender in adjectives and certain nouns". C'est la règle de troncation à la finale ("like drops before like"), déjà à l'emploi pour expliquer la non-réalisation d'une consonne en finale d'adjectif (cf. section 1.1.1.2.2), qui explique la chute du "schwa protecteur" et donc sa nonréalisation à la finale de la forme féminine. C'est la raison qui a poussé Schane à étendre la règle de troncation à la finale de morphème et non à la réserver à la finale de mot. La plupart des phonologues génératifs se rattachent à cette unification du phénomène de liaison avec celui de flexion, qu'ils soient de première génération (par exemple Dell 1973 : 185) ou de seconde (par exemple Prunet 1986 : 227, Sauzet 1999 : 71), de manière le plus souvent implicite d'ailleurs. 250 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Pourtant, la flexion de genre a également été considérée comme relevant d'un phénomène d'épenthèse, notamment par Tranel (1981). 1.3.1.2.2. Epenthèse Pour Tranel (1981 : 251-272) le féminin est, comme dans le cas de la liaison, le résultat d'une épenthèse et non de la réalisation d'une consonne sous-jacente : "the feminine forms are derived by a general morphophonological rule inserting an unspecified consonant in word-final position: (178) X # N A 1 2 [+fem] Æ 1 C 2" La règle stipule que l'épenthèse concerne une consonne sans matériel mélodique attaché, donc en réalité la présence d'une consonne au niveau squelettal si l'on traduit cette règle en phonologie multilinéaire. Dans un premier temps, je présenterai les arguments fournis par Tranel en faveur de l'épenthèse, puis j'exposerai son étude de la nature de la consonne épenthésée. 1.3.1.2.2.1. Epenthèse vs. présence de la consonne dans la base Tranel (1981 : 267) préfère la solution de l'épenthèse à celle de la présence de la consonne sous-jacente car elle permet de rendre compte de la différence de statut, d'une part entre la consonne de la base et celle de la flexion, d'autre part entre celle de la flexion et celle de la liaison ("liaison consonants and gender consonants are derived by the application of different rules"). La différence entre les règles d'insertion dans les cas de liaison de celles dans le cadre de la flexion concerne la frontière morphologique : la consonne de liaison est séparée du mot par une frontière de mot, alors que la consonne de genre y est directement rattachée ; "this difference captures the fact that liaison consonants are in essence, as indicated by their name, connective elements between words, whereas gender consonants are markers on words which contribute to the formation of other words having an existence of their own". Tranel relève en effet plusieurs arguments tendant à démontrer la différence de statut des consonnes de flexion et de celles de liaison, différence que les générativistes partisans de 251 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français la présence d'une consonne sous-jacente ne peuvent traiter, précisément parce qu'ils unifient les deux phénomènes. En premier lieu, les consonnes de liaison subissent des changements que ne subissent pas les consonnes de genre. On relève tout d'abord une modification du voisement. A la liaison, /d/ est réalisé [t] et /s/, [z]. C'est la différence entre grande et grand [t] homme ou grosse et gros [z] avion. Toutefois, présentée en termes de "changement", cette première remarque implique que la consonne est considérée comme présente au niveau lexical, ce qui va à l'encontre de la règle d'épenthèse postulée par Tranel. Toutefois ce premier argument est valide : l'occlusive coronale est non-voisée en liaison et potentiellement voisée à la flexion, et la fricative coronale est au contraire voisée à la liaison et possiblement non-voisée à la flexion. D'autre part, le cas particulier de présence vs. absence de consonne après -r final met en exergue une autre particularité des consonnes de liaison par rapport aux consonnes de flexion : les adjectifs masculins en -r(C) ne réalisent pas leur dernière consonne à la liaison alors qu'ils la réalisent à la flexion (un court *[t] entretien vs. courte [t]#). Un deuxième argument en faveur de l'épenthèse concerne les effets des consonnes de liaison et des consonnes de flexion. Les consonnes de liaison et les consonnes de flexion ne déclenchent pas les mêmes effets sur la voyelle précédente. Ainsi en français de Montréal, les voyelles hautes se relâchent-elles dans les syllabes fermées (petit [pti] vs. petite [ptt], lu [ly] vs. lutte [lt], doux [du] vs. douce [ds]), mais ce phénomène est-il facultatif à la flexion, "showing that whereas the linking consonant [t] in petit ami automatically belongs to the next syllable, the gender consonant [t] in petite amie may close the preceding syllable". De même, en français "standard", on observe une alternance comparable des voyelles antérieures moyennes non-arrondies (premier [pmje] vs. première [pmj]) ; or au masculin, la voyelle peut rester ouverte alors qu'elle semble être en position fermée (premier étage [pmjeta]). Les voyelles postérieures moyennes manifestent un comportement parallèle dans l'adjectif sot, "in the somewhat marginal construction where it is used in prenominal position" (1981 : 270) : à la liaison, la voyelle peut être ouverte (sot ami [stami]) ou fermée (sot ami [sotami]), alors qu'elle est toujours ouverte à la flexion. 252 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Le point suivant en faveur de l'analyse par épenthèse concerne la stabilité des deux types de consonnes. "Liaison between an adjective and a noun may not always take place (...) in contrast, the consonants found in feminine marking exhibit great stability". Tranel mentionne même certains dialectes dans lesquels la liaison adjectivale a complètement disparu, alors que la distinction en genre par la présence vs. l'absence d'une consonne est maintenue. Postuler que les consonnes sont épenthésées et non présentes dans la forme sousjacente permet d'expliquer selon Tranel la différence de statut entre les consonnes de liaison et de flexion, puisque les consonnes sont épenthésées avant la frontière de mot dans le cas de la flexion, et font donc partie intégrante du mot, alors qu'elles sont insérées après une frontière dans le cas de la liaison, ce qui justifie leur statut "relatively instable". Les trois arguments présentés jusqu'à présent concernent directement la différence de statut des consonnes de flexion et de dérivation. Le dernier argument porte uniquement sur la flexion elle-même. L'analyse par épenthèse plutôt que par troncation permet de rendre compte du fait que le masculin constitue la forme non-marquée de l'adjectif, non seulement parce que c'est le générique mais également pour des motifs historiques remontant à l'indo-européen (cf. Meillet 1928, également Huot 2001 : 108). Dans cette langue préhistorique en effet, deux genres existaient : le genre "animé" et le genre "inanimé" ou neutre. Le féminin était dérivé de la forme masculine correspondant au genre "animé" : "le masculin est donc le genre commun, et le féminin en est seulement une différenciation" (Huot 2001 : 108). Après cette revue des différences entre les consonnes de flexion et les consonnes de liaison, justifiant d'une analyse par épenthèse, observons comment Tranel répond à la critique majeure que l'on peut opposer à l'hypothèse de l'épenthèse : la nature de la consonne épenthésée semble aléatoire. 253 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.3.1.2.2.2. Nature de la consonne épenthésée Tranel prétend que la nature de la consonne est prédictible en fonction de la forme de base représentée par le masculin. Le corpus qu'il utilise à l'appui de sa démonstration est celui de Durand (1936) qui rassemble 5630 noms et adjectifs. Treize consonnes, sur les vingt que recense l'inventaire phonologique du français et les dix-huit possibles en finale de mot (// et /w/ en sont exclues), sont attestées au féminin : /t/ (petite), /d/ (grande), /k/ (franque), /g/ (longue), /n/ (naine), // (maligne), /v/ (louve), /s/ (grasse), // (franche), /r/ (première), /l/ (saoule) et /j/ (gentille). Ne sont pas représentées les labiales (/p/, /b/, /m/), la labio-dentale sourde /f/ et la fricative post-alvéolaire voisée //. La prédictibilité de la consonne épenthétique s'appuie sur les observations suivantes : - seule une base à finale vocalique ou en /r/ (précédé uniquement de certaines voyelles) subit l'épenthèse d'une consonne de féminin. - sept des consonnes suscitées68 ne sont employées que dans un très petit nombre de termes : cinq ne concernent qu'un seul terme (/k/ franque, /g/ longue69, /v/ louve, /l/ saoule, /j/ gentille), // pour sa part est présent dans trois (franche, blanche, fraîche), // dans deux (bénigne, maligne). A partir de ces remarques et de l'étude de son inventaire, Tranel dégage des tendances de distribution. "The consonant-insertion rules of adjective liaison and gender formation can still be regarded as uniformly picking the needed consonant (if any) from the lexical entries, but in some cases the consonant (if any) will be truly idiosyncratic, whereas in others the burden of memory on the native speaker will not be so heavy, because of the general patterns involved" (1981 : 254). Le tableau suivant présente les généralisations dégagées par Tranel70 en illustrant d'un exemple les consonnes attestées au féminin après les terminaisons de bases répertoriées ; les chiffres entre parenthèses indiquent le cas échéant le nombre de termes concernés71 : 68 On remarquera que les sept consonnes qui ne participent pas du mécanisme productif sont toutes et seulement les non-coronales de l'inventaire, ce qui laisse uniquement les consonnes coronales comme marques de féminin : /t/, /d/, /s/, /z/, /n/ et /r/. 69 Auquel on peut ajouter oblongue. 70 Il répertorie également les termes qui ne suivent pas ces tendances, cf. (1981 : 254-266) pour le détail. Il aborde en outre les alternances de consonnes (sec / sèche, veuf / veuve, etc.) qui n'entrent pas dans le cadre des alternances [C] ~ [ø] (cf. 1981 : 265). 254 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (179) finale de base -[i] -[e] pas de consonne pp vb 2ème gpe : finie [t] [d] [s] pp vb 3ème gpe en -ire: dite -[u] -[o] -[] -V[r] 71 72 autre [j] : gentille première suff -et : grassouillette pp vb 3ème gpe en -aire : faite sujette auvergnat suff -ais : écossaise mauvaise et niaise suff -ois : pragois rase confuse (11) suff -u : barbue pp certains vb 3ème gpe : lue suff -eux : scandaleuse cas idiosyncratiques (douze termes concernés) suff -ot : suff -aud petiote lourdaude rigolote chaude ppst : grande suff -an : méritante (12) castillane lente artisan blonde (12) -[ç] -[] [r] pp vb 3ème gpe non en -ire : mise -[a] -[ø] [n] pp vb 1er gpe : chantée -[] -[y] [z] pp vb 3ème gpe : éteinte suff -on : breton bon une (7) canadienne fine (productif) [o] ~ [l] 12 termes [] : blanche (3) [k] : franque (1) [g] : longue (1) suff -aire : pp vb 3ème suff -ard : diverse supplémentaire gpe : couverte clocharde suff -oire : courte contradictoire [yr] dure [ir] pire cher [œr]72 : antérieure pp indique un "participe passé", vb renvoie à "verbe", gpe à "groupe, suff à "suffixe". En dehors du suffixe -eur dont les féminins -euse et -rice n'entrent pas dans le cadre des alternances [C] ~ ø. 255 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 1.3.1.2.3. Bilan sur la flexion nominale de genre L'hypothèse la plus généralement admise est que la consonne observée à la flexion est tout aussi idiosyncratique que celle apparaissant à la liaison, c'est pourquoi elle doit être spécifiée dans la base (cf. par exemple Sauzet 1999 : 73 "un acquis de l'analyse générative classique est que les consonnes latentes sont lexicales"). Ceci est confirmé par l'identité fréquente des consonnes de flexion avec celles de liaison. Cependant, le fait que l'on n'observe à la flexion que des coronales, que l'on constate des différences de comportement entre les consonnes de liaison et celles de flexion tout autant que des différences d'effets de l'ajout de l'une ou de l'autre, font relativiser cette position et conduisent à envisager là encore la solution épenthétique. Intéressons-nous maintenant à la flexion verbale, qui se manifeste au niveau de la personne et du mode. 1.3.2. Flexion verbale L'alternance consonne ~ zéro qui relève de la flexion est à distinguer de celle traitée dans le cadre de la liaison. Il s'agit en effet de distinguer les consonnes qui apparaissent entre la base et la désinence, qui relèvent de la flexion, de celles qui se manifestent entre une désinence et le mot suivant, ce qui est du domaine de la liaison. Je présenterai le problème de l'impératif dans ce cadre au chapitre 10, et montrerai qu'il ne faut pas prendre en compte la présence de la consonne au sein du morphème d'impératif même. Je traiterai ici le cas de l'alternance consonne ~ zéro impliquée dans le mode (section 1.3.2.1), et celui lié à la personne (section 1.3.2.2). 1.3.2.1. Mode Les consonnes concernées apparaissent au subjonctif et non à l'indicatif des verbes du troisième groupe, autrement dit des verbes "irréguliers". Je ne retiendrai pas ici les variations impliquant également des voyelles comme dans sait / sache, mais uniquement celles dans lesquelles la consonne est le seul élément distinctif du mode, de sorte que l'on observe les paires minimales suivantes : 256 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (180) indicatif : absence de la consonne sort entend vit dort vainc ø ~ [t] ø ~ [d] ø ~ [v] ø ~ [m] ø ~ [k] subjonctif : présence de la consonne sorte entende vivent dorme vainque La consonne est absente aux formes du singulier de l'indicatif présent et de l'impératif, et présente à toutes les autres formes. Envisageons les trois types d'analyses possibles : soit il s'agit d'allomorphie, soit la forme courte est issue de la forme longue, soit la forme longue provient de la forme courte, avec épenthèse. Si la forme courte est la forme de base, alors les verbes du troisième groupe doivent être divisés en sous-groupes selon la nature de la consonne qu'ils insèrent. Si c'est la forme avec consonne qui est basique, il faut supposer une règle de troncation, comme celle de Tranel (1981 : 249) : (181) C # 1 2 -subjunctive +present +singular +third conj. Æ ø 2 Tranel (1981 : 249-250) préfère la troisième solution, c'est-à-dire l'allomorphie, car d'après lui "there does not seem to be any convincing substantive evidence justifying the decision to make one form of the stems primary rather than the other". Schane (1968 : 101-103) suppose la présence d'une voyelle thématique sous-jacente dont on n'observerait jamais la manifestation phonétique directe, comme pour le schwa permettant à la consonne de féminin de l'adjectif de se réaliser. 1.3.2.2. Personne Tranel (1981 : 248) traite pareillement l'alternance [C] ~ [ø] de mode et celle de personne, c'est-à-dire que là encore il ne considère pas que la consonne est le fait d'une épenthèse, alors que c'est ce qu'il préconise dans les cas de flexion nominale ou de liaison. 257 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Paradis & El Fenne (1992, 1995) ont étudié plus particulièrement les cas de flexion verbale et les ont mis en relation, dans la tradition du cadre génératif "classique", avec les phénomènes de liaison. Elles se situent dans un cadre génératif multilinéaire posant les consonnes latentes comme complètement flottantes, c'est-à-dire non attachées à un constituant squelettal (donc encore moins à un constituant syllabique ; cf. section 1.1.1.2.3). De ce fait, elles posent la consonne alternante comme finale flottante de radical. Deux cas sont à distinguer : (182) a. la consonne alternante est la même qu'à l'infinitif sort / sortent (sortir) x x x | | | ç s r t tend / tendent (tendre) x x | | t d vit / vivent (vivre) x x | | v i v dort / dorment (dormir) x x x | | | ç d r m vainc / vainquent (vaincre) x x | | v k b. la consonne alternante est différente de celle de l'infinitif connaît / connaissent (connaître) x x x x | | | | ç k n s moud / moulent (moudre) x x | | m u l coud / cousent (coudre) x x | | k u z x | e écrit / écrivent (écrire) x x x | | | k r i v A la troisième personne du singulier, une règle d'effacement supprime les consonnes finales non rattachées au niveau squelettal en vertu du principe de légitimation selon lequel "toute unité phonologique doit être légitimée au niveau prosodique et segmental, c'est-à-dire être intégrée dans une structure phonologique immédiate complète" (1992 : 122). Le morphème de troisième personne du pluriel est une unité de temps vide (comme pour le féminin de l'adjectif), qu'une règle d'association lie à la consonne flottante dans la version de 1992, puis qui est automatiquement liée dans la version de 1995. La réalisation de la consonne flottante est donc morphologiquement conditionnée. "However, its manifestation is entirely phonological: it is caused by the presence of an empty onset" (1995 : 191). Que se passe-t-il lors de la concaténation avec le morphème de l'infinitif ? Paradis & El Fenne (1995 : 192) distinguent cinq infinitifs suffixaux : -r, -ir, -tr (toujours réalisé -dr derrière une consonne voisée), -war et -er, mais ne donnent pas explicitement leurs représentations multilinéaires non plus qu'elles n'indiquent précisément quels verbes y sont 258 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français associés. Lorsque le morphème de l'infinitif se concatène aux bases verbales telles qu'elles ont été posées, on obtient : (183) la consonne alternante est la même qu'à l'infinitif sortir, dormir x | s x | x | r x x | i t x | r x | v tendre, vivre, vaincre x x | v r x | i Si l'on considère que les morphèmes -ir et -r ont tous deux une position squelettale vide à l'initiale, on peut rendre compte de la formation de ces infinitifs de manière satisfaisante : la consonne flottante s'adjoint à la position squelettale disponible, on obtient les réalisations recherchées. (184) x | e la consonne alternante est différente de celle de l'infinitif x | k écrire x x | | r i v x | r x | k x | o x | n connaître x | s x | t x | r x | m moudre, coudre x x | | u l t x | r Cette fois, pour rendre compte adéquatement des infinitifs, il est nécessaire de postuler un morphème -r différent du précédent, en ce sens qu'il ne comporte pas de position squelettale vide à son initiale (cf. 1995 : 192). S'il en avait une, on obtiendrait *[ekrivr] ; c'est pourquoi Paradis & El Fenne (1992 : 123) considèrent écrire comme une exception ("l'infinitif écrire, dont la consonne flottante du radical /v/ est absente, semble être le résultat d'une mémorisation comme c'est le cas de nombreux participes passés"). Dans la version de 1995 en revanche, c'est vivre, ainsi que vaincre et rompre, qui sont considérés comme des exceptions, puisque ce sont les trois seuls verbes (sur 588) à consonne flottante finale qui maintiennent cette consonne devant le suffixe d'infinitif. Il n'y a donc bien qu'un seul suffixe -r : sans position consonantique à l'initiale. Le verbe tendre s'analyse alors comme un cas de consonne alternante "différente" de celle de l'infinitif, donc avec le suffixe -tr et non -r. 2. Analyses antérieures de l'épenthèse Il s'agit dans ce chapitre d'établir de quelle manière les différentes théories phonologiques génératives ont considéré le phénomène de l'épenthèse consonantique en leur sein. 259 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Si l'épenthèse consonantique a été globalement moins traitée que l'insertion vocalique, elle a cependant fait l'objet de travaux en phonologie générative dès les débuts de celle-ci. Les premières études génératives concernant le sujet datent en effet de la fin des années soixante et se situent donc dans la "première génération". Dans cette partie je passerai en revue les analyses concernant l'épenthèse consonantique en phonologie générative, en distinguant les analyses qui postulent une épenthèse dans n'importe quelle position (section 1), des analyses dans lesquelles l'épenthèse se situe dans une position syllabique pré-existante (section 2). 2.1. Cadre non syllabique : insertion d'une consonne La phonologie linéaire se caractérise par l'utilisation de règles phonologiques permettant de rendre compte des phénomènes observés dans les langues. L'ordonnancement de ces règles est propre à chaque langue, mais les règles elles-mêmes font partie d'un ensemble universel dans lequel une langue donnée puise ce dont elle a besoin. L'épenthèse au sein de cette première génération de modèles génératifs est envisagée comme l'insertion d'une consonne, qui est ensuite remplie par du matériel mélodique "emprunté" aux segments voisins ou qui apparaît ex nihilo. A l'intérieur de cette première génération "post SPE", je distinguerai trois cas de figure selon que l'épenthèse est considérée comme uniquement liée à la position en hiatus (section 2.1.1), à la mélodie des segments environnants (section 2.1.2) ou à la conjonction d'un hiatus et d'une frontière morphologique (section 2.1.3). 2.1.1. Epenthèse en hiatus : Pupier (1971) Pupier (1971) est le premier travail à ma connaissance portant sur les épenthèses consonantiques en français depuis les débuts de la phonologie générative. Il analyse l'"insertion d'une consonne avant le suffixe dans les dérivés du français standard", ceci dans un cadre génératif "de la première génération" c'est-à-dire en utilisant des règles ordonnées, dans la droite lignée de Chomsky & Halle (1968) et de Schane (1968). 2.1.1.1. Présentation de l'analyse Dans son article, Pupier distingue quatre types de dérivés du français présentant ou semblant présenter une épenthèse consonantique, de types (a) petitesse (b) enjoliver (c) rapetisser (c') numéroter, bleuter (d) faisander, caviarder. 260 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Sans surprise, le [t] suspect de petitesse est analysé comme la réalisation d'une consonne sous-jacente dont on trouve la manifestation au féminin (petite) et à la liaison (petit [t] enfant) (cf. également Schane 1968). Le [v] de enjoliver, en revanche, ne peut pas jouir du même statut, attendu qu'il n'apparaît ni au féminin (*jolive) ni à la liaison (joli [v] enfant), ni même dans un autre dérivé, joliesse (*jolivesse) ; ce [v] n'étant pas de ce fait une consonne sous-jacente, force est de supposer qu'il est fourni par une règle d'insertion. Rapetisser présente un cas de changement de [t] en [s], puisque le dérivé est formé sur petit pour lequel a été établi un [t] sous-jacent. Ce phénomène se rattache à la règle d'assibilation de Schane (1968 : 106), remaniée en fonction des traits du système de Pupier (1971 : 123) : t Æ s /_ [V +haut +antérieur] Cette règle permet dans un deuxième temps de rendre compte des dérivés comme endurcir. "On voudrait en effet appliquer le même traitement aux verbes endurcir et éclaircir qu'à (r)accourcir, qui ont la même structure de surface que lui […] et sont comme lui des verbes factitifs : ils tiennent lieu de "rendre plus ADJECTIF"." (Pupier 1971 : 124). Le problème réside dans le manque de consonne sous-jacente finale des adjectifs dur et clair au contraire de court, aussi faut-il insérer un [t] dans leurs dérivés, entre le radical et le suffixe verbal, après la formation du féminin. Cette insertion de [t] a pour corollaire d'expliquer les dérivés de type numéroter ou pianoter, et la règle aurait ainsi la forme (Pupier 1971 : 125) : ø Æ t / V_SUFFIXE]]V Il faut néanmoins que les unités lexicales auxquelles cette règle s'applique soient spécifiées comme telles, de façon à limiter son champ d'application ; en effet, à côté de bleuter et clouter on trouve bleuir et clouer, preuves que tous les radicaux ne sont pas concernés. "Ainsi numéro et piano auront le trait [insertion de t], tandis que pour bleu et clou le verbe dérivé n'a un -t- que s'il peut être paraphrasé par "mettre ARTICLE N sur" (où N est une variable qui peut prendre les valeurs bleu et clou)" (Pupier 1971 : 125). Un autre problème, de l'aveu même de Pupier, se pose. En effet, la règle d'assibilation doit être généralisée de façon à ce que tout [t] en contact avec [i] (et non seulement précédant [i]) soit changé en [s], de façon à rendre compte d'un terme comme plisser pour lequel un [t] a dû être préalablement inséré, comme pour pianoter par exemple. Ce faisant, la règle produira 261 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français des résultats erronés quant à la dérivation à partir de termes comme débit (débiter et non *débisser), bruit (ébruiter et non *ébruisser), profit (profiter et non *profisser), etc. "Rapetisser reste donc une exception, peut-être construit par analogie avec lisser" (Pupier 1971 : 128). Considérons maintenant le quatrième cas répertorié par Pupier (1971) après petitesse, enjoliver et rapetisser : faisander. L'insertion d'un [d] dans faisander ou caviarder est attestée mais problématique pour la théorie, dans le sens où on ne peut appliquer le même type de raisonnement que pour les cas considérés plus haut. Tout d'abord en effet, on ne peut arguer du caractère sous-jacent de la consonne comme on l'a fait dans le cas de petitesse puisqu'on ne trouve trace de ce [d] ni au féminin (faisane et non *faisande), ni à la liaison (caviar avarié et non *caviar [d] avarié). On ne peut non plus trouver de contexte d'apparition satisfaisant implémentable dans une règle, puisqu'un dérivé comme élancer rejette l'hypothèse d'un contexte propice à l'épenthèse de type an_er par exemple. Pupier (1971 : 130) propose alors une règle générale permettant de rendre compte des consonnes apparaissant dans les trois derniers cas considérés, en l'occurrence tous des dérivés verbaux (enjoliver, rapetisser, faisander). Cette règle consisterait à insérer une consonne coronale antérieure devant les suffixes verbaux, règle mineure qui ne s'appliquerait que pour les mots explicitement fléchés comme tels dans le lexique : [+règle 20]. Celle-ci serait formulée de la manière suivante : règle 2073 øÆ C + antérieur + coronal + ____ + A I +r V Cette règle d'insertion devrait être assortie de règles précisant la nature de la consonne dentale insérée : [s], [d] ou [t]. Le problème de l'insertion de [v] dans enjoliver reste entier, puisqu'il ne s'agit pas d'une coronale. Modifier la règle 20 de façon à autoriser n'importe quelle consonne à s'insérer impliquerait une complication des règles subséquentes, puisqu'il faudrait préciser dans la règle 73 Pupier formule la règle à l'aide de majuscules, mais il réfère dans son analyse aux phonèmes qui associés à /r/ forment les suffixes verbaux -er et -ir. 262 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français suivante non pas quelle consonne dentale est insérée, mais quelle consonne (antérieure) parmi l'ensemble des consonnes de la langue est épenthésée. Pupier (1971 : 132) propose donc une règle supplémentaire, propre à enjoliver et au féminin de bailli, baillive, qui comporte également une insertion de [v]. Examinons maintenant cet article d'un œil critique. 2.1.1.2. Critique Outre les critiques de Pupier lui-même concernant certains points de la démonstration invalidés par les données, plusieurs critiques sont à formuler à l'encontre de cette représentation du phénomène de l'épenthèse : le fait que la frontière morphologique ne soit pas prise en compte, l'obligation du fléchage des unités lexicales, la surgénération des sites possibles d'épenthèse. 2.1.1.2.1. Frontière morphologique Tous les exemples donnés par Pupier se situent à une frontière morphologique, et plus précisément à la frontière dérivationnelle suffixale. Pourtant, ce paramètre n'est aucunement pris en compte dans la formulation des règles d'insertion de consonne ; or, la formulation en règles permet de faire appel à l'information morphologique (même si elle n'explique pas comment celle-ci peut inférer l'apparition d'une épenthèse), la preuve en étant que Pupier luimême restreint les cas d'épenthèse aux seuls verbes. Cette non prise en compte de la frontière morphologique signifie que Pupier ne la considère pas comme un facteur dans l'apparition d'une épenthèse. De cette observation découle en partie une deuxième critique portant sur la surgénération des règles (cf. section 2.1.1.2.3). Avant d'aborder celle-ci, tournons-nous vers un second point faible du modèle, lié à la formulation des règles. 2.1.1.2.2. Fléchage dans le lexique Un second reproche que l'on peut adresser à ce type d'approche est le manque de globalité des règles et l'obligation de flécher les unités lexicales. Ce reproche est valable pour 263 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français l'ensemble des théories génératives de première génération, basées sur la linéarité d'une part et tentant de tout expliquer en synchronie d'autre part. Quel est en effet l'intérêt mémoriel d'indiquer par deux marques, renvoyant à deux règles différentes, que la base joli construira son dérivé verbal à l'aide d'une consonne de transition ([+règle20]), et que cette consonne sera [v], par rapport à l'inscription d'enjoliver comme entrée distincte de joli dans le lexique ? On remarquera que ce système de règles ne fait aucune prédiction puisque les unités lexicales qui se verront adjoindre l'épenthèse sont encodées en ce sens dans le lexique. Il ne s'agit donc que de l'implémentation d'une observation, celle d'une épenthèse à la frontière morphologique dérivationnelle entre radical et suffixe, et non d'une explication du phénomène de l'épenthèse par la théorie. 2.1.1.2.3. Surgénération des sites d'épenthèse La critique majeure exprimable contre la phonologie linéaire dans le traitement de l'épenthèse a cependant été soulevée par Kaye & Lowenstamm (1984 : 131 ; également Piggott & Singh 1985 : 421), elle concerne la structure des représentations sous-entendue par la formulation des règles. En effet, une règle d'épenthèse sera de la forme (cf. section 1.2.) : øÆA/X_Y Or dans la théorie telle que présentée dans le SPE et dans les travaux en phonologie générative linéaire, rien ne précise où se trouve l'ensemble vide en question ou, plus exactement, cet élément est implicitement pointé comme se trouvant entre deux segments quels qu'ils soient, donc partout. "Pourtant un petit sous-ensemble seulement des ø qui potentiellement peuvent faire partie d'une chaîne segmentale sont la cible de processus phonologiques les remplaçant par des segments. Pourquoi cet état de fait ? La question reste sans réponse" (Kaye & Lowenstamm 1984 : 131). La théorie telle qu'elle est formulée n'est donc pas en mesure de prédire les contextes dans lesquels une épenthèse est possible et ceux dans lesquels elle ne l'est pas. Cette première analyse du phénomène de l'épenthèse permet de souligner les faiblesses relatives à la représentation linéaire : l'épenthèse n'est pas assez contrainte par les règles qui, ne prenant en compte que le contexte phonologique immédiat de la position insérée, oblige à flécher les unités lexicales concernées par l'épenthèse. 264 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Un traitement parallèle s'observe lors de l'analyse, dans ce cadre non syllabique, d'un second cas d'insertion : l'épenthèse de consonne au sein d'un groupe consonantique. 2.1.2. Epenthèse et mélodie des consonnes contextuelles : Wetzels (1985), Picard (1987a, 1987b, 1989), Clements (1987) Les articles de Picard de la deuxième moitié des années 80 reprennent l'analyse de Wetzels (1985) pour en proposer une nouvelle perspective. Ce qui caractérise cette série de travaux est leur focalisation sur les épenthèses consonantiques à l'intérieur de groupes de consonnes, et non en hiatus. 2.1.2.1. Présentation de l'analyse Commençons par présenter les données sur lesquelles porte l'analyse. Wetzels (1985 : 285-289) distingue deux types d'épenthèses d'occlusives à l'intérieur d'un groupe consonantique, en synchronie comme en diachronie : I. à l'intérieur d'un groupe dont le deuxième élément est une liquide II. à l'intérieur d'un groupe dont le deuxième élément n'est pas une liquide. Le tableau suivant propose une illustration des données prises en compte (cf. chapitre 1 section 2.2) : 265 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (185) I ancien français diachronie de l'espagnol diachronie de l'italien grec ancien diachronie de l'anglais diachronie de l'écossais diachronie du germanique / slave II ancien français écossais moderne anglais moderne ess(e)re > estre cam(e)ra > chambre trem(u)lare > trembler pol(ve)re > poldre ven(i)ra > vendra sal(i)ra > saldra hom(i)nem > hombre mem(o)rare > membrare pess(u)lus > peskjo slavo > skjavo *gam-ros > gambros *me-mloka > membloka *anr-os > andros thunrian > thunder alre (acc.) > alder thimle > thimble polre > polder Gelre > Gelder s(i)roop > stroop *srow- > strawmr (vieux Norse) strem (vieil anglais) struja (vieux bulgare) annos > ants pognos > points genoclos > genults hemt ~ hempt hemden ~ hembden hat ~ hakt warmth ~ warmpth sensitive ~ sentsitive prince ~ printce "être" "chambre" "trembler" "poudre" "il viendra" "il quittera" "homme" "se souvenir" "rocher" "esclave" "marié" "il a marché" "homme (génitif)" "tonnerre" reclaimed land "sirop" "ans" "poing" "genou" "chemise" "chemises" "pend" "chaleur" "sensible" "prince" Pour Wetzels (1985 : 296-301), seules les consonnes insérées dans le type I relèvent de vraies épenthèses, celles qui figurent dans la deuxième catégorie étant en réalité des segments de contour, ce qui se manifeste par le caractère facultatif de leur apparition. Je présenterai ici successivement les cas des occlusives intrusives (section 2.1.2.1.1) et celui des "vraies" épenthèses (section 2.1.2.1.2). 2.1.2.1.1. Occlusives intrusives En ce qui concerne les épenthèses de type II, Clements (1987) considère lui aussi qu'il ne s'agit pas d'épenthèse, mais de "intrusive stops". Son analyse se situe dans le cadre de la Géométrie des Traits (Clements 1985 ; cf. section I [2] 3.2). Cette distinction entre épenthèse et occlusive intrusive fait que, tout comme Wetzels, il n'attribue pas de position syllabique à ces occlusives mais considère qu'elles sont issues d'une liaison de la cavité orale de la consonne suivante au segment nasal (b), ce qui cause 266 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français l'apparition en surface de l'affriquée de même lieu d'articulation que la première consonne (c). Il faut pour cela admettre que les deux consonnes sont dès le départ reliées à un même point squelettal74. (186) (a) situation initiale C RN LN (b) liaison de la cavité orale C RN RN LN LN (c) apparition occlusive C RN RN LN LN RN LN SLN SLN SLN SLN SLN SLN OC OC OC OC OC OC [ns] [ns] [nts] A terme, ce mécanisme peut conduire à l'effacement de la nasale, comme dans le cas d'une langue bantou, le kihungan (cf. Takizala non daté, également Clements 1987 : 42) dont le tableau ci-dessous reprend les séquences pertinentes75 : (187) devant labiale devant coronale forme sous-jacente /luN + fut/ /luN + vaatis/ /luN + sey/ forme de surface [lupfut] [lumbvaatis] [lutzey] glose "payer" "habiller" "se moquer" L'effacement est facultatif, puisqu'on ne l'observe pas par exemple dans [lumbvaatis]. Les données fournies ne permettent pas de décider si c'est le voisement de la deuxième consonne qui protège la nasale, mais cette question est marginale dans l'argument développé. L'effacement de la nasale est l'étape suivante du phénomène de concaténation ayant conduit à l'apparition de l'occlusive intrusive, réinterprétée comme un segment de contour avec la deuxième consonne : le premier nœud de racine sous la position squelettale se délie, si bien que la nasale n'est plus prononcée. 74 Je rappelle ici les sigles utilisés : RN root node LN laryngal node SLN supralaryngal node OC oral cavity 75 L'apparition d'occlusives intrusives dans cette langue répond à un phénomène plus large que celui concernant le contexte ici évoqué, à savoir une nasale suivie d'une fricative. Je ne donne ici que les données permettant de suivre la démonstration de Clements (1985). Par ailleurs, les gloses ne sont qu'indicatives, toutes les données n'étant pas fournies. 267 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Tournons-nous à présent vers ce que Wetzels (1985) considère comme étant les seuls vrais cas d'épenthèse du corpus de départ. 2.1.2.1.2. Epenthèses consonantiques Pour Wetzels (1985), c'est la mélodie qui conditionne l'insertion de la consonne épenthétique, ce qui se formule au moyen de la règle suivante (1985 : 312) : ø Æ C / C _ σ[C [+son, -nas] Sous cette formulation, la nature de la première consonne importe peu, c'est la position entre deux consonnes assortie de la frontière syllabique qui est déterminante. Le remplissage mélodique se fait par la propagation du voisement et du lieu d'articulation de la consonne précédente. Cette consonne, ou plutôt cette position consonantique occlusive, insérée est ensuite syllabifiée en première partie d'attaque branchante de la syllabe suivante. Le tableau ci-dessous récapitule les deux étapes de l'insertion d'une consonne épenthétique : insertion d'une position et intégration de celle-ci dans la structure syllabique. (188) σ V | e situation de départ σ C | s C | r σ V | e V | e insertion d'une position σ C | s C | t C | r σ V | e V | e syllabation de la position σ C | s C | t C | r V | e La différence entre l'analyse de Wetzels et Clements d'une part, et celle de Picard (1987a, 1987b, 1989) d'autre part, concerne le classement des deux types de consonnes : pour Picard, il s'agit, dans les deux cas, d'épenthèses. Le type II se caractérise par des épenthèses occlusives, certes facultatives, faisant partie d'un segment de contour et n'ayant donc pas de statut segmental autonome, au contraire des épenthèses de type I qui représentent des segments indépendants en surface. Mais les épenthèses de type II peuvent par la suite être remplacées par une réanalyse stable de la forme sous-jacente du morphème. Ainsi en anglais n'y a-t-il plus de différence, ni phonétique ni phonologique, entre empty (< aemtig), glimpse (< glimse), où le /p/ a été épenthétique au départ, et tempting, pumpkin, pants où le /p/ est d'origine. 268 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Picard propose donc de ne pas distinguer de classes d'épenthèses sur la base de statuts phonologiques mais plutôt sur la base de la structure syllabique de la langue considérée. Pour ce faire, il fait appel à deux principes phonologiques "reconnus" et aux règles qui en découlent (Picard 1987b : 274-275) selon lesquels : (189) Principe 1 Principe 2 Règle A Règle B Les langues ont une propension naturelle aux syllabes ouvertes. Dans chaque langue, les seuls groupes consonantiques qui sont permis en début de syllabe sont ceux qui sont également permis en début de mot. Insertion de frontière syllabique Dans toute séquence phonologique, $76 s'insère après chaque segment [+syllabique] sauf le dernier. Déplacement de frontière syllabique Si l'output de la Règle A crée un goupe consonantique interne qui est inadmissible en début de mot, $ se déplace obligatoirement vers la droite jusqu'à ce qu'il atteigne un groupe qui soit permis. Prenons le cas de l'épenthèse de type I de l'ancien français. Ont été touchés les groupes [mr], [nr], [lr], [sr], [zr] et [ml], qui après épenthèse sont syllabifiables en C$OL (consonne frontière syllabique - occlusive - liquide) puisqu'à l'initiale [br], [dr], [tr] et [bl] sont autorisés. En revanche, [tl] et [dl] étant interdits en début de mot, ils le sont également à l'intérieur de mot selon le principe II, c'est pourquoi il ne peut y avoir d'épenthèse d'occlusive dans les groupes [nl], [sl] et [zl] (chapitre 1 section 2.2.1.2 pour le détail du traitement de ces groupes). Il s'agit donc d'une contrainte sur la syllabe à l'intérieur d'une langue donnée. Selon Picard, l'épenthèse consonantique fonctionne donc à l'aide des conditions et contraintes suivantes (1987a : 140-141, cf. également 1987b : 283) : (I) Consonant epenthesis consists in the insertion of a stop (S) between two consonants (C1C2), that is, C1C2 > C1SC2. (II) The epenthetic stop can only appear between the following types of consonant sequences: (a) nasal + liquid, liquid + liquid, fricative + liquid (Type I) (b) nasal + stop, nasal + fricative, liquid + fricative (Type II) (III) This intrusive stop always assimilates to the point of articulation of C1, and becomes voiced only if both C1 and C2 are voiced, e.g., ml > mbl and nz > ndz, but sr > str and mt > mpt. (IV) Type I epenthesis can arise only if the styllable structure is C1$C2, whereas Type II can occur if the structure is either (a) C1$C2, or (b) C1C2$. (V) In Type I epenthesis, the stop is always inserted to the right of the syllable boundary, that is, C1$C2 > C1$SC2, where as in Type II, it always appears on the left, that is, (a) C1$C2 > C1S$C2, and (b) C1C2 > C1SC2$. (VI) Type I epenthesis occurs only if the output $SC2 (where C2 is a liquid) is a permissible wordinittial cluster (#SC2) in a particular language, e.g., Old French m$l > m$bl because of #bl but n$l > *n$dl because of *#dl. (VII) Type I epenthesis occurs only if the structural description consists of two different segments, e.g., lr > ldr but ll > *ldl, while Type II can take place only if the structural change results in a sequence of three different segments, e.g., mt > mpt but nd > *ndd. 76 $ indique une frontière syllabique. 269 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.1.2.2. Critique La critique essentielle à porter à ces analyses est le fait que, si elles fournissent une description complète et détaillée du phénomène, en témoignent les conditions et contraintes fournies par Picard, elles ne posent en revanche jamais la question du pourquoi. En effet, la frontière de syllabe sert à déterminer le contexte d'apparition de l'épenthèse mais la structure de la syllabe elle-même ne joue pas de rôle. Ce n'est pas un "problème de structure" syllabique qui induit l'apparition d'une épenthèse consonantique, c'est uniquement la présence d'une frontière de syllabe qui est en jeu ici. Le seul cas où la structure joue un rôle dans l'analyse proposée par Picard, c'est pour la resyllabation et non pour l'insertion-même de la consonne. La section suivante présente un troisième cas d'insertion de consonne analysée dans un cadre linéaire. Cette fois, et au contraire de Pupier (1971), la frontière morphologique entre en ligne de compte dans le cadre de l'apparition de l'épenthèse ; de plus, sont prises en compte non seulement les épenthèses en hiatus mais également celles après consonne. 2.1.3. Epenthèse en hiatus et frontière morphologique : Wetzels (1987) Dans cet article, Wetzels met en parallèle les consonnes de liaison en morphologie dérivationnelle et les consonnes épenthétiques en "français moderne", du fait qu'elles sont "not only functionally equivalent in sofar as they avoid hiatus by creating CV syllables, but also, to the extent that their phonetic realization deviates from the unmarked dental articulation". Son analyse incorpore des causes structurales et des motivations morphologiques. 2.1.3.1. Présentation de l'analyse Son point de départ est l'alternance consonne ~ zéro dans des séquences où la base adjectivale est seule, par rapport aux séquences dérivées de cette même base : (190) adjectif seul petit [p´ti] petite petitement grand [] franc [f] gris [i] grande franche grise grandement franchement / adjectif + suffixe petitesse grandeur franchise grisâtre rapetisser grandir franchir griser 270 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Pour Wetzels, l'analyse du phénomène en termes de troncation tel que présenté dans Schane (1968) par exemple (toute forme féminine terminée par une consonne se voit amputée de cette dernière pour former le masculin) se heurte à la multitude d'adjectifs se terminant par une consonne en français, de type honnête, simple, large, morose, vétuste, intime, bègue, jeune, etc. En effet, ôter par une règle générale toute consonne finale de l'adjectif au féminin amputerait ces adjectifs épicènes ([on], [sp], etc.). De plus, certains mots sans consonne sous-jacente - puisqu'elle n'apparaît pas à la liaison ou dans tous les mots dérivés - présentent une épenthèse dans certains dérivés mais non dans tous, comme on peut le constater dans le tableau suivant : (191) adjectif seul bleu joli bleue jolie bleuter enjoliver adjectif + suffixe bleuâtre joliesse bleuir joliment On peut supposer, avec Wetzels, que le cas est le même pour des termes dérivés à partir de noms, même si l'absence de consonne flottante est moins aisée à mettre en évidence : le féminin de caillou est pour le moins difficile à établir, de même qu'il n'est pas aisé de trouver un contexte de liaison permettant à ladite consonne de se réaliser le cas échéant. Sont concernés des dérivés tels que esquimautage formé sur esquimau, caillouteux sur caillou, hugotesque sur Hugo, silotage sur silo, chichiteux sur chichi, comateux sur coma, moscoutaire sur Moscou, dénoyauter sur noyau et ronéoter sur ronéo. Une première solution proposée par Wetzels (1987 : 285) serait une règle de type : "introduce a t (or s in the plural) between two vowels which are located at each side of a morpheme- (or word-) boundary, except for those morphemes or words which are lexically marked as acquiring no consonants at all [cf. a.] or where the liaison consonant is not t [cf. b.]". (192) a b. masculin connu hébreu aisé gaga bon gros salaud gris gentil féminin *connute *hébreute *aiséte *gagate bonne grosse salope grise gentille 271 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Cette solution présente deux inconvénients, correspondant aux deux réserves formulées par Wetzels. D'une part, on se retrouve avec une liste d'exceptions à l'insertion de [t], marquées comme telles dans le lexique (ce qui correspond aux mots de a.), ce qui rend cette solution équivalente de ce point de vue à la règle de troncation proposée plus haut. D'autre part, il est nécessaire de spécifier dans le lexique la nature de la consonne à insérer puisqu'elle n'est pas prédictible (cf. b.), ce qui est plus coûteux que dans le cas de la règle de troncation, ou bien garder "some version of the criticized truncation rule" (Wetzels 1987 : 286). Wetzels (1987 : 286) se rattache d'une part aux travaux de Bichakjian (1973), Limonard (1981) et Tranel (1981) pour la liaison envisagée en termes d'épenthèse, et à Encrevé (1983) et Hyman (1985) pour le fait que "liaison consonants in French are best represented at the level of lexical representation as floating, or untimed consonants". Il considère en effet qu'il n'y a pas épenthèse de mélodie, laquelle est déjà présente dans le lexique, mais épenthèse de position squelettale ('timing slot'), permettant ainsi à la consonne sous-jacente d'être réalisée. Autrement dit, si une base se termine par une consonne flottante, un emplacement consonantique est introduit, quel que soit le segment suivant. L'apparition phonétique d'une consonne est alors traitée à la fois comme étant en relation avec une consonne flottante et comme une épenthèse - de position et non de mélodie. Wetzels s'intéresse également aux épenthèses consonantiques après consonne, c'est-àdire en réalité [r], qui ne comportent pas de consonne flottante à la finale : cauchemardesque sur cauchemar, bazarder sur bazar, escobarderie sur escobar, butorderie sur butor. La règle qu'il propose tient compte de l'ensemble des données sur l'épenthèse consonantique sans consonne flottante - épenthèse en hiatus comme devant un [r] - et est formulée de la manière suivante (Wetzels 1987 : 293) : (193) Augment-insertion ø Æ C ] / {V, C} ] ___ ] {V, C} ] Paraphrase : "insère une consonne de liaison derrière une voyelle ou un [r] final de morphème r [+cons] r et devant une voyelle ou un [r] s'il n'y a pas de consonne flottante à cet endroit.". 272 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Cette consonne de liaison est vue par Wetzels "as an augment-like item added as a morphological extension to the vowel-final base" (1987 : 313) et non comme une partie du morphème de base ou du morphème dérivationnel. Cette règle "adequately predicts that it should not be exceptional for invariable adjectives (the ones that do not have a floating [+cons] feature) to acquire a linking consonant if followed by a vowel-initial derivational suffix" (Wetzels 1987 : 293), de type poli / politesse, bleu / bleuter / bleusaille, etc. La règle présentée ci-dessus ne remet pas en question l'insertion d'une position squelettale consonantique si une consonne flottante est disponible, elle la complète. Récapitulons les phénomènes présentés par Wetzels dans le cadre de la morphologie dérivationnelle : (194) condition segmentale condition contextuelle présence de consonne flottante {V, r} _ ]{V, r} absence de consonne flottante V_ ]V règle insertion d'une position squelettale permettant de réaliser phonétiquement la consonne flottante insertion d'une consonne de liaison L'analyse de Wetzels permet donc de distinguer les deux types d'adjectifs - ceux sans consonne flottante à la finale comme ceux avec. En ce qui concerne ces derniers, le trait [+cons] s'assortit le cas échéant des traits [+voisé] et [+nasal], de façon à pouvoir traiter des différences de type persan / grand / plaisant, qui ont respectivement un [n] (il considère que "nasal vowels in French are lexical" 1987 : 291), un [d] et un [t] épenthétiques, pour lesquels on obtient les représentations suivantes (1987 : 292) : (195) adjectifs de type persan adjectifs de type grand V V V [-cons] [+cons] [+low] [+nas] [+nas] [-cons] [+cons] Adj [-cons] [+low] [+low] [+nas] [+nas] [0 voi] Adj adjectifs de type plaisant [+cons] [+voi] Adj Adj Adj Adj 273 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français La consonne "par défaut" s'avère donc être le [t], puisqu'il n'est besoin que du trait [+cons] pour l'identifier. Par ailleurs, Wetzels (1987 : 295) précise que le trait flottant [+cons] "has the same diacritic function as the extrasyllabic consonants in Clements & Keyser (1983), the weightless consonant of Hyman (1985), and the unlinked consonant of Encrevé (1983)." Wetzels (1987 : 295) propose le schéma suivant, récapitulatif des mécanismes à l'œuvre ici : t : prédit par la règle (196) variable : [+cons] flottant (lexical) morphème de base : adjectif pas t : - traits marqués flottants (lexicaux) - prédictible par une règle (contextuellement, segmentalement) invariable Le 'timing slot' inséré ne fait pas partie pour Wetzels des morphèmes en jeu dans la dérivation, mais relève plutôt d'une extension morphologique de la base à finale vocalique. Il considère en effet la liaison comme un 'timing' et non comme une resyllabation, celle-ci devant plutôt être une conséquence de la liaison. Cette hypothèse permet de rendre compte : - de la nature (en termes de lieu d'articulation et de voisement) de la consonne épenthésée présente sous forme de trait(s) dans le lexique, elle est propre à chaque unité ; absente du lexique, c'est un [t] qui est prédit s'insérer puisque la règle Augment-insertion n'insère que le trait [+cons]. - du fait qu'une consonne n'apparaît pas toujours entre un radical et un suffixe : la règle d'insertion Augment-insertion fonctionne en hiatus, mais non pas lorsque le suffixe débute par une consonne (*polit(e)ment, *jolit(e)ment). 2.1.3.2. Critique La position de Wetzels rend compte des données et propose un point de vue justifiant la nature, en termes de lieu d'articulation, de la consonne épenthésée. De plus, il met en évidence le rôle de la frontière morphologique dans l'apparition de l'épenthèse consonantique. Toutefois, même si Wetzels réduit ainsi le caractère ad hoc des règles linéaires, restent encore plusieurs problèmes : 274 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français - il considère l'insertion de la consonne entre la base et le morphème du féminin comme une frontière "en hiatus", sans justifier de la représentation de ce morphème ; or en surface, l'insertion est à la finale. - le lexique contient plusieurs morphèmes de féminin, et pour chaque adjectif doit être indiqué quel suffixe il sélectionne ; l'abandon de la règle de troncation de Schane, à l'intérieur d'un cadre linéaire, est au prix d'un fléchage nécessaire dans le lexique et donc d'un manque de portée générale. La théorie en effet n'a pas les moyens de prédire la nature de la consonne apparaissant au féminin. - tous les hiatus en français ne déclenchent pas l'apparition d'une épenthèse consonantique. Certes Wetzels, en introduisant la frontière morphologique dans la règle, n'impose pas une épenthèse à l'intérieur d'hiatus intramorphématiques (haïr, éblouir, etc.) ; cependant, il provoque de la surgénération à l'intérieur d'hiatus intermorphématiques, que ce soit entre deux mots (il a à appeler et non *il a [t] a [t] appeler), ou à la frontière dérivationnelle, même entre base et suffixe (jouable), même lorsque la base est adjectivale (bleuir), ou encore à la frontière flexionnelle (*jolite, *bleute). - Wetzels (1987) contourne le problème de resyllabation évoqué plus haut en ajoutant un nouvel élément dans la structure, le 'timing slot', qui n'a d'autre raison d'être que précisément d'éviter la resyllabation. Il s'agit donc d'une solution ad hoc, et aucunement explicative. Elle a cependant le mérite de souligner une des faiblesses du modèle non-syllabique, de façon à ce que les héritiers du modèle y prennent garde. 2.1.4. Bilan sur le cadre non-syllabique La phonologie générative linéaire résout l'épenthèse consonantique au moyen de règles, souvent ad hoc, sans établir de connexion explicative particulière entre l'insertion d'une consonne et la morphologie. Celle-ci intervient dans le meilleur des cas sous la forme de frontière de syllabe, mais sans qu'il soit établi de lien de fonctionnement entre la frontière et l'apparition d'une consonne. De plus, la théorie n'est pas restreinte, prédisant de ce fait des types d'épenthèses non rencontrés dans les langues puisqu'une épenthèse est théoriquement possible entre deux segments quels qu'ils soient. Cette surgénération est due au fait de postuler l'insertion d'une position consonantique et non l'emploi d'une position déjà existante. C'est particulièrement patent dans l'analyse des données sur la diachronie de l'ancien français (sim(i)lare > sembler) : le groupe de consonnes 275 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français non toléré par la langue est causé par la chute d'une voyelle. L'analyse en termes de règles, synchronique, ne tient pas compte de la présence d'une position squelettale pour cette voyelle et est obligée d'en supposer la chute, puis d'insérer une nouvelle position, consonantique cette fois, pour permettre l'insertion de la consonne observée en surface. De ce fait, le cadre linéaire n'est pas prédictif en termes universels ; en termes systémiques, les règles étant directement issues de l'observation du fonctionnement de la langue en surface et non d'un fonctionnement interne à la théorie, le cadre ne peut être considéré non plus comme explicatif, il ne fait que transcrire le phénomène d'induction qui consiste à supposer la généralisation du phénomène à partir de l'observation d'un certain nombre de données. Les limites du modèle génératif non-syllabique ont conduit les chercheurs à s'attacher plus particulièrement aux contextes d'apparition des épenthèses, en termes notamment de syllabation et non d'insertion de position consonantique. 2.2. Cadre syllabique : présence d'une position consonantique 2.2.1. Epenthèse consonantique et syllabation : Piggott & Singh (1985), Itô (1989) Au début des années quatre-vingts, de nombreuses analyses prenant en compte les constituants syllabiques en relation avec le phénomène de l'épenthèse ont été proposées, parmi lesquelles Halle & Vergnaud (1978), Selkirk (1981), Singh (1980, 1981a, 1981b, 1981c), Piggott (1981), Kaye & Lowenstamm (1984) et Clements (1987). Je présenterai ici deux études parmi celles qui ont une portée universelle (et non circonscrite à une seule langue), représentatives de la tendance générale. 2.2.1.1. Piggott & Singh (1985) 2.2.1.1.1. Présentation de l'analyse Piggott & Singh (1985) s'intéressent aux cas où l'épenthèse consonantique se produit entre deux consonnes ou entre une consonne et une frontière morphologique, référant explicitement à (a) l'épenthèse diachronique d'occlusive voisée entre vieil et moyen anglais, (b) l'épenthèse synchronique d'occlusive derrière une sonante ou [s] en vieux français (Walker 1978 : 66) et (c) l'épenthèse dans certains dialectes d'anglais entre la consonne nasale [n] et la 276 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français fricative non-voisée [s] (cf. chapitre 1 section 2, cf. également Wetzels 1985, Picard 1987). Pour les deux derniers cas, l'alternance se produit en synchronie, à un moment donné de l'histoire de la langue. Dans le cas de l'ancien français, elle est due à une suffixation particulière, mais est en variation libre pour les dialectes d'anglais. Le tableau ci-dessous présente des données pertinentes : (197) a vieil anglais nemnan spinel b raiembre prendre cosdre c fence tense moyen anglais nempne spindel synchronie de l'ancien français raemons prenons cousons variation dans certains dialectes d'anglais [fnts] [tnts] glose "nommer" "épingle" "racheter" "prendre" "coudre" "barrière" "tendu" L'analyse se situe non pas dans le cadre de la phonologie linéaire avec ordonnancement de règles mais dans celui de la phonologie métrique, selon laquelle "the segments of a language are organized into syllables, syllables are organized into units called feet, and feet are organized into word trees." (Piggott & Singh 1985 : 422). Cette analyse rejette les règles ordonnées en tant que mécanisme explicatif pour une des raisons évoquées en section 2.1.1.2.3, à savoir le manque de précision quant à l'élément ø - possible virtuellement partout. Son but est donc de parvenir à formuler une prédiction quant à l'endroit où une épenthèse est possible : "an adequate theory of phonology must make formally explicit whatever link there is between rules of epenthesis and language-particular or universal constraints on sequences or segments" (1985 : 421). La prédiction est ici la suivante : "epenthetic segments arise automatically to fill empty structural positions that are created in the course of syllabification" (Piggott & Singh 1985 : 422). En effet, l'ordonnancement des segments en syllabes est soumis à des contraintes phonotactiques et aux stratégies de resyllabation d'une langue. Si les stratégies de réparation, à savoir la resyllabation, ne sont pas suffisantes, alors il y a épenthèse. Ainsi en vieux français, une sonante syllabée en coda se retrouve-t-elle dans le noyau de la syllabe précédente par l'application de la règle Move Sonorant, laissant un emplacement vide dans la structure, emplacement que seule une épenthèse peut combler, en vertu des Conditions de 277 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Bonne Formation de la structure syllabique (ce qui correspond aux "Syllable Completeness Conditions" de Selkirk 1981 : 216). (198) σ A R (a) situation initiale p σ A n N p σ A impliquant C C n R N l'épenthèse p R (b) déplacement de la nasale dans le noyau de la syllabe (c) resyllabation, consonantique N C n ø C "It should now be apparent that consonant epenthesis is invariably associated with the moving of a sonorant" (Piggott & Singh 1985 : 443) puisqu'il faut qu'une sonante anciennement en attaque se soit déplacée sur un noyau. Le [s] de cosdre a donc dans cette optique été considéré comme une sonante, ayant déclenché une épenthèse dans les mêmes conditions qu'une nasale. Ceci se vérifie indépendamment de l'épenthèse : "Old French Apocope, Cluster-Simplification, and Early Syncope treat /s/ as if it were a sonorant." (Piggott & Singh 1985 : 443, renvoyant à Reighard 1975). Sous cette analyse, l'épenthèse est donc la conséquence automatique de certains types de réajustements de la structure métrique nécessités par une violation de la contrainte pesant sur la structure de la syllabe, contrainte selon laquelle "every squeletal point must be associated with a segment and every segment must be associated with a squeletal point" (Piggott & Singh 1985 : 430). Tout ce qui ne correspond pas à cette définition n'est pas une épenthèse. 278 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.1.1.2. Critique Plusieurs remarques sont à adresser à l'encontre de cet article. La première est établie par Picard (1987b : 268, en note), qui reproche à Piggott & Singh d'"affirmer quelque chose qu'il faut sans contexte considérer comme phonétiquement injustifiable et insoutenable", à savoir que le segment [s] soit analysé comme une "fricative sonante". Il faut relativiser cette critique : Piggott & Singh relèvent un fait, à savoir que [s] se comporte comme une sonante dans le cas étudié. Ce qui est critiquable n'est pas cette constatation, mais l'analyse en termes de "fricative sonante" qui en est donnée. Si la possibilité de la présence d'une sonante dans un noyau syllabique est attestée par ailleurs (noyaux syllabiques en anglais, par exemple [btn] où [n] est noyau de la deuxième syllabe), celle de la présence d'une fricative reste à démontrer. Quel serait le résultat phonétique d'un noyau contenant [s] ? Comment cette dernière se combinerait-elle avec une voyelle dans le cas d'un noyau branchant ? Par ailleurs, la resyllabation de la nasale en noyau n'est pas appuyée par la phonétique en anglais au contraire du français, qui réalise une voyelle nasale lorsqu'un élément nasal est attaché au noyau. Il faut donc supposer dans l'hypothèse de l'analyse de Piggott & Singh (1985) un principe selon lequel ce mécanisme sous-jacent de migration de la coda "sonante" (vraie sonante ou [s]) ne se manifeste jamais en surface : quelle serait la réalisation de [l] ou [r] dans un noyau branchant ? Malgré ses imperfections, l'analyse met en évidence une réelle différence avec les analyses non-syllabiques : cette fois c'est la structure qui prédit le site de l'épenthèse, aussi ne peut-il y avoir d'épenthèse n'importe où (entre n'importe quelle séquence de deux segments) mais uniquement dans des positions déterminées par la structure de la syllabe dans la langue considérée. De plus, le motif de l'épenthèse est cette fois universel : une position syllabique non remplie appelle une épenthèse, vocalique ou consonantique. L'analyse dans une langue donnée dépend des structures de syllabe admises par cette langue. Enfin, on peut relever que cette fois, le cadre théorique implémente le motif de l'épenthèse. 279 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Piggott & Singh (1985) représentait un cas d'épenthèse entre consonnes. Les mêmes causes produisant les mêmes effets, observons avec Itô (1989) l'application de la syllabation au contexte hiatusal. 2.2.1.2. Itô (1989) Itô (1989) rejette l'épenthèse comme résultant de règles d'insertion de position squelettale et propose "a theory in which epenthesis is treated as a prosodic phenomenon and accounted for directly by syllabification" (1989 : 217). Je ne présenterai ici que les éléments pertinents pour la justification de l'implémentation de l'épenthèse dans la théorie. 2.2.1.2.1. Présentation de l'analyse En ce qui concerne la structure interne de la syllabe, deux éléments sont à considérer : les gabarits et la sonorité. La syllabification repose sur des gabarits et sur des conditions de bonne formation, et non sur des règles de construction des syllabes. Elle doit être considérée comme "a simple mapping of the syllable template to the phonological string in conformity with the parameter settings" (Itô 1989 : 225). La sonorité joue un rôle dans la constitution de la syllabe, au moyen du principe de Sonority Sequencing (Selkirk 1984 : 116) formulé ainsi : "in any syllable, there is a segment constituting a sonority peak that is preceded and/or followed by a sequence of segments with progressively decreasing sonority values". L'Onset Principle tel que présenté par Itô (1989 : 223) veille à la satisfaction de l'attaque et non à sa maximisation : toute consonne intervocalique doit être syllabifiée en attaque, mais dès lors que l'on a affaire à un groupe de consonnes interviennent des paramétrages en fonction des langues, selon qu'elles autorisent ou non les codas notamment. Ce principe est formulé de la manière suivante : "Avoid σ[v". Les langues excluant les syllabes sans attaque renforcent ce paramètre en Strict Onset Principle : "Onsetless syllables are impossible". Le Coda Filter (Itô 1986) quant à lui restreint les consonnes possibles en coda : seules le premier élément d'une géminée ou une consonne homorganique à l'attaque de la syllabe suivante sont tolérées. Il est énoncé de la manière suivante : 280 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (199) Coda Filter *C]σ Paraphrase : une consonne finale de syllabe, | donc en coda, n'est pas spécifiée pour son [place] lieu d'articulation. Itô (1989) s'intéresse aux épenthèses vocaliques et consonantiques. En ce qui concerne les consonnes, son analyse repose sur l'axininca campa (Payne 1981 ; cf. chapitre 1 section 1), langue dans laquelle un [t] est inséré dans tout hiatus correspondant à une frontière entre radical et suffixe : /noN-pisi-i/ "je balaierai" est réalisé [nompisiti]. Si une des positions du gabarit n'est pas remplie, il y a insertion d'une consonne ou d'une voyelle selon la position en question. Considérons la forme sous-jacente /noN-pok-piro-i/ "je viendrai vraiment" et appliquons les principes et les paramètres permettant la syllabification des segments : - en vertu du Coda Filter, /N/ peut être syllabifié en coda puisqu'il partagera alors son lieu d'articulation avec l'attaque suivante. - /k/ se trouve devant une consonne avec laquelle il ne peut partager le lieu d'articulation ni n'est géminé ; il ne peut donc pas, toujours selon le Coda Filter, être syllabifié en coda. Il sera donc nécessairement en attaque. - la dernière syllabe ne comporte pas d'attaque ; or l'axininca campa est une langue où l'on n'observe pas de syllabe sans attaque, ce qui indique que c'est le Strict Onset Principle qui s'applique. La structure syllabique du mot est alors la suivante : (200) σ n o σ mp σ o k σ _ p σ i r σ o _ i Aux positions laissées vides s'adjoignent les sons épenthétiques par défaut dans la langue : [a] pour les voyelles, [t] pour les consonnes. La forme de surface est alors [nompokapiroti]. 281 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.1.2.2. Critique Au moyen de contraintes de formation établies indépendamment de l'analyse de l'épenthèse, et de paramètres réglés en fonction de la langue considérée, la théorie rend compte de l'apparition d'épenthèses. Elle prédit les sites possibles d'épenthèse, et ceux qui ne le sont pas. Cependant, elle ne permet de rendre compte que des épenthèses directement liées à la structure de la syllabe, et non celles en relation supplémentaire avec la morphologie ou avec une mélodie particulière (cf. section I [1] 2.2.3) : comment justifier dans ce contexte de l'apparition d'une épenthèse en partie causée par un type particulier de morphème, ou par une frontière morphologique particulière ? Ou, plus exactement, comment empêcher, en appliquant cet algorithme de syllabation, l'épenthèse d'un segment dans une position où il n'est pas réalisé, puisque son occurrence est liée à d'autres facteurs que la simple structure syllabique ? Le point fort de cette théorie est qu'elle prédit les sites possibles d'épenthèses par des propositions internes à la théorie et non en vertu de règles ou contraintes idoines. Cependant, elle néglige tout ce qui n'est pas lié à la structure syllabique, tel que la nature de la frontière morphologique (entre deux mots, entre préfixe et radical, entre radical et suffixe, etc.), la catégorie lexicale de la base ou du suffixe, la mélodie des segments environnants, ou encore le rôle de l'accent. 2.2.1.3. Bilan sur le cadre syllabique L'avancée par rapport aux modèles non-syllabiques est ici explicative : en supposant la présence d'une position syllabique préexistant à l'épenthèse, les cadres circonscrivent celle-ci à certaines positions uniquement. L'épenthèse n'est donc plus virtuellement possible partout, comme c'était le cas dans la phonologie générative non-syllabique. On est passé d'une vision somme toute descriptive à une portée explicative de l'apparition d'une consonne épenthétique. Ce qui est paramétrable à travers les langues, c'est le type de syllabe autorisé : avec coda ou non, avec attaque obligatoire ou non. En revanche, rien de ce qui est du domaine morphologique n'entre en ligne de compte. La section suivante montre comment la morphologie peut être implémentée dans une théorie 282 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français et ainsi, à terme, intégrer une dimension explicative supplémentaire dans l'analyse de l'épenthèse consonantique. 2.2.2. Epenthèse, syllabation et morphologie : Théorie de l'Optimalité A l'intérieur de la Théorie de l'Optimalité (cf. chapitre 2 section 3 pour une présentation générale du cadre), deux écoles s'affrontent en regard de la représentation de l'épenthèse : la théorie FILL (Prince & Smolensky 1993), et la théorie DEP (McCarthy & Prince 1995). Je présenterai ici successivement chacune d'elles, en indiquant la différence de philosophie sous-jacente à leur séparation. 2.2.2.1. Prince & Smolensky (1993) : FILL theory. Prince & Smolensky (1993 : 99-106) abordent le cas de l'épenthèse au sein de leur partie consacrée à la théorie de la syllabe. Se réclamant de la typologie de Jakobson (1962 : 256), ils soutiennent que la syllabe optimale est de la forme CV, ce qui se traduit en termes optimalistes par la contrainte suivante (1993 : 98) : (201) THM. UNIVERSALLY OPTIMAL SYLLABES No language may prohibit the syllable .CV. Thus, no language prohibits onsets or requires codas. Ainsi aura-t-on les contraintes -COD (Prince & Smolensky 1993 : 17) et ONS (Prince & Smolensky 1993 : 93) de façon respectivement à éviter les codas et à obtenir une attaque. Elles sont formulées dans le texte original de la manière suivante : ONS77 Syllables must have onsets (except phrase initially) -COD A syllable must not have a coda Toutefois, si aucune langue n'interdit la syllabe de type CV, cela ne signifie pas que les langues n'autorisent pas d'autres types de syllabe, y compris les syllabes sans attaque. Ce que THM. indique, c'est que si le matériel lexical est suffisant pour obtenir une syllabe de type CV, aucune langue ne choisira d'effacer l'attaque ou de rajouter une coda. 77 Dans les versions plus récentes de la théorie, cette contrainte est appelée ONSET. 283 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français A ces contraintes s'ajoutent dans la représentation de l'épenthèse deux contraintes de fidélité, veillant à ce que les outputs soient le plus proche possible de l'input correspondant : FILL et PARSE. La contrainte PARSE (Prince & Smolensky 1993 : 94) impose que tous les segments sous-jacents soient syllabifiés : Underlying segments must be parsed into syllable structure PARSE FILL (Prince & Smolensky 1993 : 94), quant à elle, oblige la structure à remplir une position vide par du matériel segmental. Elle se présente ainsi comme la contrainte responsable de l'apparition d'une épenthèse78 : Syllable positions must be filled with underlying segments FILL En réalité, cette contrainte FILL est représentative de trois contraintes (Prince & Smolensky 1993 : 94 note 51) portant sur les constituants de la syllabe : FILLNUC Nucleus positions must be filled with underlying segments FILLMAR Margin positions (Ons and Cod) must be filled with underlying segments FILLONS Onset positions must be filled with underlying segments Prince & Smolensky (1993 : 97) qualifient l'élision et l'épenthèse respectivement d'underparsing et overparsing, du fait que les deux mécanismes violent ces contraintes de fidélité selon laquelle la structure de sortie doit être la plus proche possible du matériel lexical. L'épenthèse se justifie alors par le fait que "a syllable position node unassociated to an input segment ('overparsing') is phonetically realized through some process of filling in default featural values." (Overparsing Phonetically Realized as Epenthesis, Prince & Smolensky 1993 : 97). 78 Parallèlement, la contrainte *FILL peut être à l'œuvre pour effacer un segment. 284 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.2.1.1. Epenthèse en attaque C'est l'ordonnancement des contraintes qui décide, pour une langue donnée, de sa propension à accepter les attaques vides ou à préférer les remplir au moyen d'une épenthèse. C'est aussi elle qui décide de son exigence ou de son rejet des codas. Dans une langue n'exigeant pas d'attaque, un morphème /V/ (voyelle) sera traité de la manière suivante : (202) /V/ ).V. <V> .V. PARSE FILL ONS * *! *! Les trois candidats en lice sont les suivants : une voyelle syllabée en noyau mais sans attaque (.V.) ; une voyelle non syllabée (<V>) ; une voyelle précédée d'une position consonantique (.V.). Les violations de PARSE et de FILL sont fatales du fait que l'un des candidats – .V. en l'occurrence – satisfait ces deux contraintes. "If PARSE, FILL >> ONS, then onsets are not required" (1993 : 100). En revanche, dans une langue nécessitant une attaque en début de syllabe, mais ne disposant toujours que d'une voyelle orpheline dans le lexique, "if ONS dominates either PARSE or FILL, then onsets are required" (1993 : 101). Ceci se retrouve dans le tableau suivant (Enforcement by Overparsing (Epenthesis), 1993 : 100) : (203) /V/ .V. <V> ).V. PARSE ONS FILL *! *! * Les trois candidats sont les mêmes que dans le cas précédent, les trois contraintes également. Ce qui change, c'est l'ordonnancement de ces dernières : la violation de ONS est cette fois-ci fatale puisque ONS est placée avant PARSE et FILL. 285 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.2.1.2. Epenthèses en coda ? En ce qui concerne la coda, c'est toujours l'ordonnancement des contraintes qui va rendre compte des différences interlinguistiques, mais les contraintes considérées ne sont pas toutes les mêmes. Seront communes PARSE et FILL, sera différente -COD. Si -COD est dominé par PARSE et par FILL (appliqué cette fois au noyau, soit FILLNUC), alors les codas sont autorisées dans la langue considérée. Cependant, "autorisées" ne signifie pas que la langue tolère les épenthèses en coda. Prince & Smolensky (1993) ne considèrent pas cette option mais estiment au contraire que l'épenthèse est limitée à l'attaque et au noyau. Considérons les différents outputs proposés pour une forme sous-jacente /CVC/ dans une langue interdisant les codas : (204) /CVC/ .CV. <CVC> .CV. ).CV.C. FILLNUC PARSE -COD *! *! *! * Le premier candidat n'utilise pas tous le matériel disponible dans le lexique, aussi viole-t-il la contrainte Parse. Le second n'est pas syllabifié, c'est pourquoi il n'est pas optimal. Le troisième candidat (.CV.) comporte une position en coda alors que la contrainte -Cod est en tête de hiérarchie (du fait que l'on observe que la langue interdit les codas). L'output optimal est donc .CV. C. : il ne comporte pas de coda, utilise tous les phonèmes disponibles, et ne viole que la contrainte la plus basse dans la hiérarchie. Imaginons maintenant une langue qui exige une coda. Le système de contraintes tel qu'il est formulé ne permet pas de rendre compte de cette épenthèse, comme on le voit dans le tableau suivant : (205) /CV/ ).CV. <CV> .CV. PARSE FILL -COD *! *! Le candidat optimal est .CV., même si la contrainte -COD est placée dernière dans la hiérarchie, puisqu'il ne viole aucune contrainte. 286 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Pour rendre compte des données du cupeño, il faudrait postuler une contrainte supplémentaire COD, placée dans certaines langues avant -COD, de façon à permettre les épenthèses de consonnes en coda. Le problème serait alors que toutes les syllabes dans cette langue seraient tenues de comporter une coda, ce qui n'est pas attesté dans les langues du monde (cf. section I [1] 2.2.3.3.1) : les épenthèses en coda de syllabe sont toutes liées à un conditionnement supplémentaire. Ainsi en huariapano (cf. section 2.1.2.1.3. du premier chapitre), c'est la conjonction de la position avec l'accent qui impose l'épenthèse d'une coda. Il faut donc postuler une contrainte liée à l'accent pour rendre compte de ces données particulières. Le système de contraintes tel qu'il est présenté ici permet donc de décrire l'épenthèse en attaque et de justifier l'impossibilité de l'épenthèse en coda comme unique conditionnement. 2.2.2.1.3. Bilan Récapitulons ce qui concerne l'épenthèse en Optimalité selon Prince & Smolensky (1993 : 101-103) : (206) Onset Theorem Onsets are not required in a language if ONS is dominated by both PARSE and FILL. Otherwise, onsets are required. In the latter case, ONS is enforced by underparsing (phonetic deletion) if PARSE is the lowest ranking of the three constraints; and by overparsing (phonetic epenthesis) if FILL is lowest. Lowest constraint ONS PARSE FILLONS Onsets are… Enforced by… Not required Required Required N/A V 'Deletion' C 'Epenthesis' Coda Theorem Codas are allowed in a language if -COD is dominated by both PARSE and FILLNUC. Otherwise, codas are forbidden. In the latter case, -COD is enforced by underparsing (phonetic deletion) if PARSE is the lowest ranking of the three constraints; and by overparsing (epenthesis) if FILLNUC is the lowest. Lowest Codas are… Enforced by… constraint -COD Allowed N/A PARSE Forbidden C 'Deletion' FILLNUC Forbidden V 'Epenthesis' Le problème interne à la théorie est qu'il est nécessaire de distinguer deux contraintes FILL différentes, l'une concernant l'attaque et l'autre s'appliquant au noyau. En effet, si les deux sont sous le même intitulé, alors cela signifie que pour une langue classant FILL en dernier dans l'ordonnancement, les deux types d'épenthèses, vocalique et consonantique, sont favorisées au même titre dans cette langue. C'est ce que Prince & Smolensky (1993 : 103) appellent le "triomphe de l'épenthèse" : 287 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français (207) Input /V/ /CVC/ Optimal Analysis .V. .CV.C. Phonetic .CV. .CV.CV. Or, "nothing that we know of in the linguistic literature suggests that the appearance of epenthetic onsets requires the appearance of epenthetic nuclei in other circumstances" (1993 : 103). La contrainte FILL n'est donc pas la même dans les deux différents types d'épenthèses. Une critique est à retenir à cet endroit de la démonstration : l'épenthèse en attaque et celle en noyau répondent à deux stratégies totalement différentes puisqu'elles ne font pas intervenir les mêmes contraintes. Donc il semblerait qu'il y ait autant de points communs entre l'épenthèse en noyau et celle en attaque qu'entre un type d'épenthèse et n'importe quel autre processus phonologique, à commencer par la lénition, qui est pourtant le processus exactement inverse. Prince & Smolensky (1993) ont établi le cadre de l'Optimalité et la manière dont ce cadre pouvait rendre compte des phénomènes d'épenthèse consonantique, en liaison avec la structure de la syllabe79. McCarthy & Prince (1995) ont envisagé une autre manière de concevoir les relations entre structure de surface et structure profonde, ce qui les a conduit à proposer un autre traitement de l'épenthèse consonantique au sein de ce cadre de la Théorie de l'Optimalité. Après avoir présenté cette nouvelle approche, nous observerons un cas concret d'épenthèse consonantique en français, celui abordé par Plénat (1999). 2.2.2.2. McCarthy & Prince (1995) : DEP theory. McCarthy & Prince (1995) s'intéressent dans cet article à la Morphologie Prosodique, théorie traitant de "empirical problems lying at the phonology-morphology interface" (1995 : 1) qui préfère, aux contraintes de fidélité à l'input (FILL, PARSE) de la Théorie de l'Optimalité telle que présentée ci-dessus, des contraintes d'identité. 79 l'épenthèse dépend dans ce cadre également de la structure du pied, ce qui est implémenté au moyen de la contrainte EDGEMOST (cf. Prince & Smolensky 1993 : 29) : Edgemost position of head foot in word The most prominent foot in the word is at the right edge. 288 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.2.2.1. Principe général Le concept central est la notion de correspondance, définie comme une relation entre l'input et l'output (1995 : 4). En ce qui concerne l'épenthèse, les contraintes PARSE et FILL sont reformulées respectivement en MAX-IO, "which liberates it from its connection with syllabification and phonetic interpretation" et DEP. Celle-ci consiste en réalité en un ensemble de contraintes qui "encompass the anti-epenthesis effects of FILL without demanding that epenthetic segments be literally unfilled nodes, whose contents are to be specified by an auxiliary, partly language-specific component of phonetic interpretation (1995 : 7). Ces contraintes sont formulées de la manière suivante : MAX-IO Every segment of the input has a correspondent in the output DEP Every segment of S2 has a correspondent in S180 DEP-BR Every segment of the reduplicant has a correspondent in the base DEP-IO Every segment of the ouput has a correspondent in the input En 1993, Prince & Smolensky (1993) envisageaient l'épenthèse comme un moyen de pallier une insuffisance du matériel segmental lorsque la prosodie exige la présence d'un constituant. Cet article de 1995 estime que le segment considéré comme une épenthèse est en réalité présent dès le lexique, en vertu de ce principe de correspondance qui veut qu'il y ait autant d'éléments dans un input que dans l'output qui y est lié ; en revanche, il s'agit de déterminer parmi tous les candidats possibles lequel sera validé par la langue. Plénat (1999 : 108) illustre la position des deux versions de la théorie en regard de l'adjectif fastoche, analysé comme étant formé à partir de facile et du suffixe -oche : (208) Prince & Smolensky (1993) FILL theory fas.ç McCarthy & Prince (1995) DEP theory fas.tç (vs. fas.pç, fas.kç, etc.) Pour Plénat (1999), le fait que le coup de glotte soit la consonne la plus fréquemment rencontrée dans les langues du monde en tant que consonne épenthésée, et se place de fait comme la consonne la moins marquée, tend à valider la théorie de 1993 : si la consonne était 80 Ce qui signifie qu'aucun élément ne doit apparaître, dans une forme candidate, qui ne soit présent dans l'input correspondant. 289 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français présente dès le lexique, pourquoi correspondrait-elle systématiquement à la consonne la moins marquée ? Cependant, du fait que d'autres consonnes apparaissent en épenthèse, le degré de marque s'avère ne pas être seul déterminant de la nature de la consonne épenthésée, ce qui le pousse à préférer la deuxième théorie (comme par exemple Lombardi 1997, 2003, cf. chapitre 2 section 3). Dans la sous-section suivante, je vais présenter l'analyse d'un cas d'épenthèse en anglais, de façon à illustrer ce fonctionnement de la théorie DEP. 2.2.2.2.2. Illustration : épenthèse de [l] en coda Reprenons le phénomène de l'épenthèse de [l] en anglais de Bristol (voir chapitre 1 section 2 et chapitre 2 section 3 ; cf. Lombardi 2003). En fin de mot se terminant par un schwa, un [l] est épenthésé ; ainsi, le prénom Eva est prononcé [ivl]81. Nous avons vu que la Théorie de l'Optimalité exclut les épenthèses en coda au motif de la seule structure syllabique. Il faut donc ici postuler une contrainte préalable permettant de référer au contexte mélodique en jeu, c'est-à-dire d'exclure les schwas en fin de mot. Ce sera la contrainte *]w "word-final schwa is prohibited". Pour satisfaire la construction d'un mot se terminant lexicalement par un schwa dans ce dialecte, il faut donc décider entre l'épenthèse d'un élément ou la chute d'un autre, ce qui est régi respectivement par les contraintes DEP, selon laquelle il ne faut pas ajouter de matériel supplémentaire à celui fourni par le lexique, et MAX, selon laquelle il faut impérativement utiliser tout le matériel segmental de la forme sous-jacente. La langue préfère l'épenthèse, ce qui rend la violation de la contrainte MAX fatale, celle-ci étant placée avant DEP. Nous obtenons le tableau suivant (Lombardi 2003 : 23) : (209) /iv/ iv ) ivC iv 81 *] !* MAX DEP * !* L'article de Lombardi (2003) ne contient que cet exemple. 290 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Si la langue avait choisi la troncation, l'inversion de la hiérarchie des deux dernières contraintes aurait permis d'en rendre compte comme l'indique le tableau suivant : (210) /iv/ iv ivC )iv *] !* DEP MAX !* * Cette fois, c'est [iv] qui est optimal puisque la contrainte qu'il viole est la dernière dans la hiérarchie. 2.2.2.3. Critique Les deux théories (FILL et DEP) permettent de représenter adéquatement les données sur l'épenthèse et ce à partir de contraintes universelles, dont seul l'ordonnancement est paramétré dans une langue donnée. Toutes deux sont en mesure d'implémenter l'information concernant la structure syllabique tout comme celle relative à la morphologie : il suffit d'ajouter une contrainte qui y serait relative. Vaux (2003) reproche au cadre, non sa manière de rendre compte de l'épenthèse, mais le fait de considérer que sont épenthésés en priorité les segments non marqués : glottales, coronales (cf. chapitre 2 sections 2 et 3). Il appuie cette appréciation sur le fait que l'on observe d'autres consonnes épenthésées dans les langues du monde, comme les vélaires. Cette critique semble plutôt injustifiée, puisque le cadre permet de rendre compte de n'importe quel type d'épenthèse pourvu que les contraintes soient ordonnées correctement dans une langue donnée. En effet, ce que l'on peut reprocher aux deux, et par là à l'ensemble du cadre, c'est précisément son manque de "prédictibilité". Etant donné que le nombre de contraintes n'est pas limité, étant donné surtout que les contraintes sont toutes violables, rien n'est réputé impossible dans ce cadre. La critique majeure apportée à la représentation de l'épenthèse dans le cadre de la théorie de l'Optimalité est donc la même que celle formulée à l'encontre des cadres génératifs de première génération : ces théories sont non contraintes, elles sont capables de tout générer, y compris ce qui n'est pas possible dans la langue. Toutes ont cependant pour objectif de parvenir à un ensemble d'éléments universaux (règles ou contraintes) dont la hiérarchie serait 291 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français paramétrable selon les langues. Tant que cet inventaire ne sera pas fini, il ne sera pas possible à la théorie d'émettre des prédictions falsifiables, et elle restera de ce fait descriptive et non explicative. Tournons-nous à présent vers les contraintes elles-mêmes. Celles supposées pour rendre compte de l'épenthèse, à savoir ONS(ET), -COD, augmentées de FILL et PARSE pour un modèle ou DEP et MAX pour l'autre, sont liées à la structure de la syllabe. La théorie explique donc pourquoi il y a possibilité d'épenthèse dans les langues : c'est la structure de la syllabe qui impose une attaque là où le matériel lexical n'en fournit pas. Pour ce qui est des épenthèses en coda en revanche, la théorie n'implémente pas la nécessité d'une coda parmi les conditions favorisant son apparition, ce qui signifie qu'elle ne reconnaît pas de contrainte structurale dans ce cas de figure. Par ailleurs, la théorie ne permet pas d'expliquer comment la structure de la syllabe joue un rôle dans l'apparition d'une consonne épenthétique. Elle ne fait qu'implémenter l'observation que c'est le cas, mais n'explique pas le lien nécessaire entre les deux, et encore moins par un mécanisme interne à la théorie qui se détacherait des données pour parvenir à une réelle dimension explicative. Enfin, dans ce cadre théorique, le terme d'épenthèse n'est utilisé que par facilité ou abus de langue, dans le sens où il n'y a pas insertion d'un segment à proprement parler, mais évaluation de tous les outputs possibles. La Théorie de l'Optimalité n'évalue pas d'abord l'épenthèse face à un autre mode de résolution de la structure de la syllabe, puis les candidats mélodiques possibles pour remplir cette structure. Tous les outputs sont évalués en parallèle, qu'ils portent sur la structure même de la syllabe (donc de l'output avec élision vs. celui avec épenthèse) ou sur la nature de la consonne épenthésée. De ce fait, il ne s'agit plus d'épenthèse, comme pour les modèles théoriques précédents, mais de la simple élection du candidat optimal. Nous avons vu en section 2.2 du chapitre 1 que, outre la structure des unités et l'information morphologique, l'accent pouvait également contribuer à justifier l'insertion d'une consonne épenthétique. Tournons-nous donc vers un cas d'épenthèse conditionnée par l'accent, et l'analyse qui en est proposée. 292 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.3. Epenthèse et accent : Scheer (2000a) 2.2.3.1. Présentation de l'analyse Scheer (2000a : 151-154) s'intéresse à l'épenthèse du coup de glotte en allemand (cf. chapitre 1 section 1), dont le tableau suivant récapitule les principes82 : (211) V_V #_V accentuée non accentuée accentuée non accentuée graphie echt üben Antenne Idee Duel Poet duellieren poetisierend épenthèse de [] t yybn an’tn i’dee d’l poo’eet *du’liin *pooeeti’ziint épenthèse de glide sans épenthèse d’wl poo’eet duw’liin pooeeti’ziint glose "authentique" "s'exercer" "antenne" "idée" "duel" "poète" "se battre en duel" "poétisant" A l'initiale, une voyelle lexicale sera précédée en surface d'un coup de glotte épenthétique, et ce, quel que soit son statut en regard de l'accent. En hiatus en revanche, la question de l'accent est cruciale : non accentuée, la deuxième voyelle d'un hiatus n'est jamais précédée de l'occlusive glottale mais est réalisée avec un glide homorganique de la première voyelle si celle-ci est haute ([duwe'liin]) ou sans consonne si ce n'est pas le cas ([pooeeti'ziint]). Accentuée, la deuxième voyelle de l'hiatus peut se voir précédée d'un coup de glotte ([dl]) ou être réalisée, comme une voyelle non accentuée, avec un glide ([d’wl]) ou rien ([poo’eet]). Un coup de glotte est donc inséré à l'initiale de mot (devant voyelle) et à l'intervocalique si la deuxième voyelle de l'hiatus est accentuée. L'analyse de Scheer (2000a) se situe dans le cadre CVCV83 (Lowenstamm 1996, Scheer 1996, 1999), développement récent de la Phonologie de Gouvernement (Kaye & al 1985, 1990, Harris 1990). Dans ce cadre, le niveau squelettal consiste en une suite de C et de V en stricte alternance. Chaque position vocalique, ou noyau, doit être reliée à du matériel segmental à l'intérieur d'une représentation84 ou, à défaut, doit être proprement gouvernée85. 82 L'accent est indiqué avant la syllabe sur lequel il porte par une apostrophe (convention API). Cf. partie III chapitre 8 pour une présentation plus complète de ce cadre. 84 Ce qui n'infère pas qu'un morphème ne puisse être constitué uniquement de positions squelettales. 83 293 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Le gouvernement propre (Kaye & al. 1990) est dispensé par un noyau attaché à du matériel segmental vers une voyelle à sa gauche, de telle sorte que celle-ci peut rester phonétiquement vide. A défaut, la voyelle gouverne sa propre attaque. Dans tous les cas, le gouvernement est obligatoire. Pour des motifs extérieurs à ce cas d'épenthèse (aspiration des occlusives sourdes anglaises, loi de Verner, les voyelles issues du latin en français, la distribution du [h] hollandais), Scheer (2000a : 141) est amené à proposer l'implémentation de l'accent par un groupe de deux positions [CV] (étant donné la structure du niveau squelettal, toute insertion à ce niveau comporte nécessairement les deux positions). L'introduction de ce matériel squelettal par l'accent fournit une position vocalique supplémentaire à la structure, position qui n'est pas remplie mélodiquement. Le gouvernement doit alors s'appliquer, de façon à autoriser la présence de cette position vocalique ; de ce fait, il ne peut s'appliquer à la consonne qui le précède immédiatement. C'est ce manque de gouvernement d'une position consonantique qui conduit à l'insertion de la consonne épenthétique. Le tableau suivant illustre la différence de comportement de la langue en hiatus, selon que la deuxième voyelle est accentuée ou non : (212) deuxième voyelle non accentuée Gvt C | k V | a C V | ç C | s deuxième voyelle accentuée Gvt V C | k V | a [C V] C V | o ti Chaos ['kaçs] "chaos" chaotisch [ka'çti] "chaotique" Par ailleurs, selon cette théorie le début de mot comporte une unité [CV] (Lowenstamm 1999), dont l'existence a été postulée là encore pour des raisons indépendantes de l'épenthèse : la cliticisation en français et en hébreu. Scheer (2000b) a proposé de paramétrer cette unité [CV] pour des raisons distributionnelles86 : les langues qui ont une 85 Le principe des catégories vides (ECP) peut également être satisfait par le gouvernement infrasegmental (Scheer 1996) et le licenciement des noyaux vides finaux en ce qui concerne les voyelles. Ceux-ci ne sont pas pertinents pour le raisonnement présenté ici. 86 Cf. section III [8] pour une présentation circonstanciée du [CV] initial et du débat sur sa paramétrisation. 294 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français distribution consonantique libre à l'initiale (C, TR, RT) n'ont pas ce [CV] initial, celles qui tolèrent uniquement les consonnes simples ou les groupes de consonnes à sonorité croissante (C, TR, *RT) disposent de ce [CV] – et sont donc dans l'obligation de le gouverner. Ce débat n'est pas pertinent ici puisque, même dans l'option de Scheer (2000b), l'allemand comporte un [CV] initial. L'allemand fait partie de ce deuxième groupe de langues, et a donc un [CV] à l'initiale. Ce qui rend le traitement de l'épenthèse en allemand uniforme : "toute Attaque vide non gouvernée est remplie par un coup de glotte" (Scheer 2000a : 154). Le tableau ci-dessous met en regard les deux cas, c'est-à-dire initiale de mot vs. hiatus dont la deuxième voyelle est accentuée. (213) initiale de mot Gvt [C V] C V | ç deuxième voyelle accentuée Gvt ft C | k V | a [C oft ['oft] "souvent" V] C V | o ti chaotisch [ka'çti] "chaotique" 2.2.3.2. Critique L'analyse de Scheer (2000a) fait état des cas où il y a épenthèse consonantique, mais ne tient pas compte du fait qu'en ce qui concerne l'hiatus accentué, l'épenthèse est facultative. Selon cette analyse, l'épenthèse est obligatoire au même titre que l'est celle du début de mot, puisque c'est le maintien de la structure qui est en jeu. Cette analyse est en relation avec la structure syllabique du mot et sa bonne formation. Le cas d'épenthèse relevé ici ne portant pas sur une frontière morphologique, on ne peut évaluer de la pertinence de l'analyse dans le contexte morphologique. On peut toutefois supposer que la frontière morphologique puisse distribuer elle aussi un [CV] (cf. Pagliano 1999a, b, Barillot 2002 ; cf. partie III [11]), auquel cas il y aurait unification des contextes d'apparition de l'épenthèse et par là une prédiction de la théorie : toute position consonantique 295 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français non gouvernée en allemand doit être remplie par du matériel épenthétique – ou propagé par une voyelle haute en première partie d'hiatus, comme ici ([d’wl]). L'analyse proposée fait la prédiction suivante : toute position en rapport avec l'accent manifestera un "allongement" au sens large, traduction de l'insertion d'un [CV] dans la structure. C'est le cas dans les langues évaluées par Scheer (2000 a: 141-151). Par ailleurs, l'épenthèse est ici expliquée par un raisonnement interne à la théorie et non par une simple implémentation de ce qui est observé en surface – d'où les "ratés" dans les prédictions d'ailleurs (Poet, bien qu'accentué sur la deuxième syllabe, peut ne pas comporter d'épenthèse d'occlusive glottales en hiatus : [poo’eet]), signe de la perfectibilité de la théorie. Comme les théories prenant en compte la structure syllabique exposées en section 2.1, l'hypothèse formulée ici se veut explicative : elle établit un lien de cause à effet entre la présence de l'accent et l'apparition d'une consonne épenthétique. Les autres théories, linéaires comme basées sur des contraintes, définissent les contextes d'apparition, fournissent le cas échéant une explication en termes de frontière morphologique ou de structure syllabique, mais n'expliquent pas quelle est la motivation de l'épenthèse. 296 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français 2.2.4. Bilan Le tableau ci-dessous reprend de manière synthétique les analyses présentées dans les deux sections précédentes : (214) Analyse syllabique Æ présence de la position non-syllabique Æ insertion d'une consonne Cadre Section Pupier 71 2.1.1 Wetzels 85 Picard 87, 89 2.1.2 Wetzels 87 2.1.3 Piggott & Singh 85 2.2.1.1 Itô 89 2.2.1.2 Prince & Smolensky 93 2.2.2.1 McCarthy & Prince 95 2.2.2.2 Scheer 2000a 2.2.3 Données dérivés verbaux français Conditionnement de l'épenthèse hiatus Critique - non prise en compte de la frontière morphologique - fléchage des unités sujettes à l'épenthèse dans le lexique - surgénération des sites d'épenthèse à l'intérieur des mélodie + frontière - frontière de syllabe sans groupes syllabique dimension explicative consonantiques - plusieurs morphèmes de féminin, fléchage dans le lexique après une base en hiatus + frontière - surgénération : tous les hiatus + français morphologique frontière ne sont pas déclencheurs - 'timing slot' (remplaçant la resyllabation) à l'intérieur des position structurale groupes vide créée au cours - [s] est syllabifié en noyau consonantiques de la syllabation position structurale - ne prend pas en compte la vide dans un morphologie alors que portée générales "gabarit" créé par la générale syllabation - système non contraint générales tous - pas d'explication interne au modèle - pas d'explication du lien nécessaire entre les causes et générales tous l'épenthèse coup de glotte - non prise en compte de la accent allemand variation La répartition entre les théories du courant non-syllabique et celles du courant syllabique permet de montrer la progression dans le traitement de l'épenthèse consonantique. Les premières approches génératives manquaient de portée générale du fait qu'il leur fallait rendre compte de l'insertion de la consonne, donc être en mesure d'exclure tous les contextes dans lesquels il n'y avait pas d'épenthèse possible. En effet, la formulation générale de la règle d'épenthèse : ø Æ X / A_B avait pour principal défaut que l'ensemble vide était possible au sein de n'importe quelle séquence de segments. De ce fait, c'était au contexte d'apporter la précision, et ce contexte ne pouvait se définir qu'au cas par cas, dans une langue donnée. 297 Chapitre 3 – Traitements antérieurs des alternances consonne ~ zéro en français Au sein de la deuxième génération, les théories se divisent en deux groupes selon qu'elles implémentent simplement l'observation d'un lien de cause à effet entre un contexte donné (structure d'un constituant, information morphologique) ou qu'elles apportent une dimension explicative à l'épenthèse, cette dimension découlant de la théorie et non de la simple "traduction" des motifs de l'épenthèse. 298 Conclusion de la partie I Conclusion Au cours de cette première partie ont été exposées les différentes épenthèses consonantiques recensées dans la littérature, assorties d'un examen de leurs conditions d'apparition en termes structuraux comme morphologiques. La focalisation sur les épenthèses en français a permis d'établir l'omniprésence des coronales dans cette langue. L'examen de cette catégorie de consonnes en a montré la spécificité. J'ai présenté dans quelle mesure cette spécificité était reconnue dans différentes théories phonologiques. Un troisième chapitre s'est penché sur la place accordée, dans les théories phonologiques (génératives), à l'épenthèse. Les différentes analyses exposées ont souligné un point important : tous les phénomènes d'alternance ne relèvent pas d'un processus unique ; il est nécessaire de faire la part entre les consonnes sous-jacentes flottantes, telles qu'on les trouve par exemple à la liaison ou qui apparaissent dans certains cas à la flexion, les consonnes appartenant à un terme présent tel quel dans le lexique et non dérivé, et les épenthèses consonantiques ex nihilo. Dans la partie suivante vont être élaborés les matériaux qui serviront de base à l'étude des épenthèses consonantiques à la frontière dérivationnelle suffixale en français, de façon à compléter les informations relatives à l'épenthèse récoltées ici. Seront notamment indiquées les étapes de tri des données brutes, dont les analyses précédentes ont montré la nécessité. L'ensemble de ces outils – théoriques comme empiriques – permettra dans une troisième partie de proposer une analyse intégrant le processus d'épenthétisation à la dérivation en français à l'intérieur d'un cadre plus large d'intervention de différents niveaux de la grammaire dans la phonologie. 299 Conclusion de la partie I Index des langues A G allemand ...24, 26, 31, 32, 36, 37, 38, 41, 42, gokana24, 28, 31, 32, 37, 38, 43, 44, 45, 46, 43, 45, 46, 51, 56, 57, 58, 61, 62, 66, 68, 76, 79, 184, 197, 289, 291, 292, 293 amharique .........................35, 37, 38, 59, 76 anejom ................................................29, 38 anglais 25, 26, 29, 30, 37, 38, 39, 41, 42, 43, 44, 45, 46, 51, 53, 55, 56, 58, 60, 61, 65, 76, 79, 111, 116, 117, 125, 126, 149, 159, 178, 181, 183, 193, 201, 262, 264, 273, 275, 286 arabe .......21, 26, 38, 43, 46, 60, 61, 76, 170 asheninca campa.....34, 37, 38, 44, 45, 46, 68 atayal ..19, 20, 26, 38, 41, 42, 46, 56, 60, 76 ayutla mixtec ....13, 14, 37, 42, 46, 62, 76, 79 B 61, 66, 75, 76, 78, 80, 195 guajiro ........................ 14, 37, 41, 42, 61, 76 H hanunoo ............................ 12, 14, 37, 44, 45 hare ................ 13, 37, 44, 45, 46, 64, 76, 79 hébreu .................................... 12, 21, 37, 38 huariapano .... 13, 37, 42, 46, 62, 76, 79, 283 I ilokano18, 20, 26, 38, 45, 46, 66, 67, 74, 76, 80 indonésien 16, 20, 26, 38, 45, 46, 66, 67, 72, 76, 78, 80 baka ...27, 37, 38, 44, 45, 46, 65, 69, 76, 79, 80 bearlake ..........13, 37, 44, 45, 46, 64, 76, 79 buginese ..................9, 37, 38, 42, 46, 60, 76 bulgare ....25, 26, 38, 43, 46, 56, 61, 76, 262 C chipewyan ............................................13, 37 coréen .............................31, 32, 35, 38, 125 cupeño ......22, 26, 38, 41, 42, 46, 56, 60, 76, 192, 283 E J japonais ... 29, 37, 38, 44, 45, 46, 66, 67, 75, 76, 78, 80, 195 K kaingang ............................................... 9, 37 kisar ............... 18, 20, 26, 38, 43, 46, 61, 76 koryak .................. 22, 23, 38, 43, 46, 61, 76 L langues tchadiques ..................................... 38 larike .................................................. 20, 38 espagnol sévillan .................30, 33, 38, 44, 45 F fox ................................................14, 15, 37 français québécois ...38, 39, 71, 82, 83, 87, 90 fula ....31, 32, 37, 38, 44, 45, 46, 60, 65, 66, 76, 79, 119, 120, 121, 195 M makassar.. 17, 20, 26, 38, 41, 42, 46, 56, 61, 76 malais .. 6, 16, 17, 20, 26, 38, 44, 45, 46, 63, 71, 72, 76, 78, 79 maltais36, 37, 38, 44, 45, 46, 64, 70, 76, 77, 78 mohawk ...................................... 22, 38, 123 mongol .............................. 10, 37, 44, 45, 46 murut ................................. 9, 31, 32, 37, 38 300 Conclusion de la partie I N nisgha..................................................12, 37 O odawa.34, 37, 38, 44, 45, 46, 66, 67, 73, 76, 78 P persan ...............................22, 23, 38, 45, 69 S selayarese .17, 20, 26, 38, 43, 45, 46, 59, 65, 76, 79, 124 sundanese ............................................20, 38 T tchèque .... 25, 26, 38, 43, 45, 46, 61, 62, 66, 67, 73, 76, 80, 114 tigré........................................ 12, 24, 37, 38 tigrigna .... 21, 26, 38, 44, 45, 46, 64, 66, 67, 74, 76, 78, 80, 132 tsishaath nootka ................................... 22, 38 tucanoan ............................................. 14, 37 tunica 22, 31, 32, 37, 38, 41, 46, 58, 76, 79, 193, 194, 195 U uradhi ................................. 9, 37, 40, 41, 46 Y yagua .................................................. 14, 37 yucatec...... 12, 14, 37, 41, 42, 46, 56, 60, 76 tamil ..18, 22, 23, 26, 38, 43, 46, 61, 76, 79, 112 301 Sommaire Sommaire Introduction générale............................................................................................................... 1 PARTIE I. L’ÉPENTHÈSE CONSONANTIQUE DANS LES LANGUES EN GÉNÉRAL ................................................................................................................................ 5 Introduction .............................................................................................................................. 6 Chapitre 1. Distribution géographique, variation qualitative, contextes d'apparition et causalités ................................................................................................................................... 7 1. Définition ........................................................................................................................... 7 2. Substance des épenthèses consonantiques dans les langues du monde ........................... 12 3. Les épenthèses en français ............................................................................................... 88 Chapitre 2. Le caractère particulier des consonnes coronales : phonétique, phonologie, théories .................................................................................................................................. 109 1. Les coronales : quelques faits phonétiques .................................................................... 109 2. Le statut particulier des coronales : phonologie............................................................. 119 3. Le statut particulier des coronales : les théories génératives ......................................... 144 Chapitre 3. Traitements antérieurs des alternances consonne ~ zéro en français : liaison et épenthèse ........................................................................................................................... 204 1. Epenthèse et alternances consonne ~ zéro ..................................................................... 204 2. Analyses antérieures de l'épenthèse ............................................................................... 259 Conclusion............................................................................................................................. 299 Index des langues.................................................................................................................. 300 302 Partie II. L'épenthèse consonantique devant suffixe dérivationnel en français : les faits 300 Partie II – L'épenthèse consonantique devant suffixe dérivationnel en français : les faits Introduction Cette seconde partie est consacrée à la constitution d'un corpus portant sur l'épenthèse consonantique à la frontière dérivationnelle suffixale en français. Dans un premier temps (chapitre 4), je définirai les contours de l'objet d'étude, en précisant la nature du français pris en compte, tant du point de vue de la variation sociale que de celui de la dimension temporelle dans laquelle s'inscrit le corpus. Je proposerai également une mise au point terminologique en ce qui concerne la suffixation. Le chapitre suivant (chapitre 5) sera dévolu à la constitution de la base de données brutes. Il décrira les sources auxquelles il a été fait appel, et proposera une évaluation de leur intérêt respectif en termes de travail préalable à l'extraction mais également des résultats obtenus en regard du sujet d'étude que constituent les dérivés suffixaux français présentant une épenthèse consonantique entre les deux morphèmes minimalement en relation. Dans le troisième chapitre de cette partie (chapitre 6), je détaille les deux étapes distinctes qui ont réduit de manière significative la base de données, puisque des 859 unités lexicales initialement retenues ne subsistent dans le corpus final que 272. Au terme de chacun des deux filtres – le filtre "étymologique" comme le filtre "suffixal" – est proposé un bilan de la composition du corpus en fonction de critères morphologiques comme phonologiques. Enfin, le dernier chapitre se penche sur le rôle d'un questionnaire visant à compléter le corpus au moyen de néologismes strictement synchroniques. J'exposerai les contraintes portant sur l'établissement et la réalisation concrète du questionnaire ainsi que sur son exploitation, et présenterai les résultats obtenus, en les mettant en parallèle avec ceux issus du corpus. Au terme de cette partie, le lecteur disposera d'un corpus aux contours précis, propre à servir de fondement à une réflexion sur l'épenthèse consonantique à la frontière suffixale en français. 301 Chapitre 4 – Délimitation de l'objet d'étude Chapitre 4. Délimitation de l'objet d'étude Un des objectifs de cette thèse est d'éclaircir les conditions d'occurrence des épenthèses situées entre radical et suffixe en français, créées par les francophones quelle que soit leur catégorie sociale, leur provenance géographique ou la période dans l'histoire du français à laquelle ils les ont produites. Si les critères temporels, géographiques ou sociaux sont pertinents, ce sera précisément à l'analyse de le mettre en évidence : dans le cas où l'épenthèse obéit à un système unique, alors preuve est faite que ces critères ne sont pas pertinents. Dans l'hypothèse contraire, l'analyse indiquera la valeur de chacun. Il serait pourtant opportun de préciser davantage la – ou les – variétés de français concernée : s'agit-il du français standard contemporain ? Quels sont les registres de langue considérés ? Sur quelle période s'étend l'étude ? Dans un premier temps, je présenterai différentes définitions ou acceptions données aux notions de langue "standard", de français "populaire" ou "ordinaire". Cette thèse n'a pas pour ambition de contribuer au débat sociolinguistique sur ces notions, aussi me contenteraije de souligner les convergences entre les définitions et de rappeler les points d'achoppement. Je m'intéresserai ensuite à la "synchronie" dans le cadre d'une étude comme celle-ci. 1. Français standard, populaire, ordinaire... Il s'agit dans cette section non pas de fixer une étiquette ou un cadre sur le français concerné par cette étude, mais au contraire de montrer pourquoi aucun cadre limitatif ne peut être établi d'emblée. Je commencerai par rappeler les différentes acceptions données à la notion de "langue standard" puis envisagerai les étiquettes de "langue populaire" et "français ordinaire". 1.1. Français standard Esquissons tout d'abord la notion de "standard", telle que définie dans un premier temps par les dictionnaires de façon à appréhender les difficultés inhérentes au concept, puis 302 Chapitre 4 – Délimitation de l'objet d'étude de manière plus pointue par la sociolinguistique et la didactique des langues qui s'y sont intéressé plus particulièrement. Le Dictionnaire de linguistique et des sciences du langage de Dubois & al (1994) indique que "une forme de langue est standard quand, dans un pays donné, au-delà des variations locales ou sociales, elle s'impose au point d'être employée couramment, comme le meilleur moyen de communication, par des gens susceptibles d'utiliser d'autres formes ou dialectes. C'est d'une manière générale une langue écrite. Elle est diffusée par l'école, par la radio, et utilisée dans les relations officielles. Elle est généralement normalisée et soumise à des institutions qui la régentent. Dans ce sens, on parle aussi souvent, par exemple, de français commun. La langue standard tend à supprimer les écarts en imposant une forme unique entre toutes les formes dialectales. Elle ne se confond pas nécessairement avec la langue soutenue, bien qu'elle tende à s'en rapprocher. Ainsi, une prononciation tend à être adoptée comme celle du français courant, central dans toutes les provinces. On dira que cette prononciation est standardisée. Dans la pratique, standardisé et normalisé ont des sens voisins, bien que ce dernier terme insiste davantage sur l'existence d'institutions régulatrices (Académie française, école, etc.)". Le TLF donne l'acception linguistique suivante à la notion de standard, dans le contexte d'une langue ou d'un état de langue : "le plus couramment employé au sein d'une communauté linguistique, qui correspond à l'usage dominant jugé normal, sans tenir compte des variations géographiques ou sociales." Le dénominateur commun de ces deux définitions est la mise à l'écart des variations sociale et géographique, ainsi que la notion de "plus couramment employé". Dubois & al. (1994) insistent sur le rôle des institutions dans le "véhiculage" de ce standard, allant jusqu'à préciser qu'il ne s'agit pourtant pas de langue soutenue, tandis que le TLF met en exergue la normalité, l'usage dominant. Plusieurs problèmes se posent quant à ces définitions : outre la difficulté qu'il peut y avoir à définir exactement ce qui relève de la variation sociale ou géographique, mais qui ne peut être totalement éradiquée du fait du mouvement constant de la langue, il semble plus périlleux encore de s'engager sur le terrain de la normalité de la langue, ou de quantifier les termes d'une langue donnée pour déterminer ceux qui sont "le plus couramment employés". 303 Chapitre 4 – Délimitation de l'objet d'étude Ce manque de précision quant à la définition de la langue "standard" n'est pas inhérent aux dictionnaires consultés. En effet, si l'on consulte des ouvrages ou articles de disciplines plus précisément intéressées par le sujet, le même flou se rencontre, doublé d'une certaine hétérogénéité du concept. 1.1.1. Standard, norme et communauté linguistique Les deux disciplines que sont la sociolinguistique et la didactique des langues se sont beaucoup penchées sur la notion de "standard", liée en partie aux notions de "norme" et de "communauté linguistique". Une langue standard se détermine tout d'abord par rapport à une communauté linguistique, c'est-à-dire "un ensemble de variétés linguistiques superposées dont une, au moins, est reconnue par l'ensemble des locuteurs comme langue de référence. On appelle langue standard la variété reconnue comme modèle par l'ensemble des locuteurs. Cette variété remplit une fonction d'intégration symbolique à la communauté linguistique." (Marchand 1975 : 26-27). Cette fonction d'intégration exige pour Marchand "une norme explicite – et c'est là une des caractéristiques essentielles des langues standard." Il met en avant le lien étroit entre la communauté linguistique et sa langue standard, les deux se déterminant l'une l'autre. Le concept de "standard" fait également appel à celui de "norme". Il s'agit cependant de préciser de quelle norme il s'agit : norme objective ou norme subjective ? Et comment se définit la norme en regard des registres de langue ? Pour Baylon (1991 : 162-165), "il existe deux façons d'aborder le problème de la norme en matière de langage. D'un point de vue formel, on peut la définir par la négative, comme une moyenne : il s'agit de la langue sans les écarts. On rejette alors aussi bien les registres populaires et familiers que les usages trop distingués. On obtient une norme d'usage, statistique, qui représente le registre des habitudes linguistiques sociales qui se régularisent par la vie en société. Mais on peut aussi voir dans la norme un modèle à imiter : cette définition en positif désigne alors l'ensemble des formes habituellement considérées comme correctes. (...) La sociolinguistique s'est intéressée à la notion de norme : elle lie le phénomène normatif à l'idéologie sous un double aspect de "pratique sociale" (comportements sociaux) et de "consensus" (acceptation pour une communauté de locuteurs)." On retrouve ce lien entre norme, communauté linguistique et langue standard par exemple chez Milroy & Milroy (1997 : 52), pour qui "speech communities in which quantitative sociolinguistics have usually worked have been within nation states in which a 304 Chapitre 4 – Délimitation de l'objet d'étude standardized form of the language is considered to be a well-established superordinate norm (as contrasted with pidgin situations, for exemple)." 1.1.2. Standard et correctitude de la langue La langue standard est également mise en relation avec la "correctitude de la langue". Pour Armstrong (2001 : 4) par exemple, "the connotations of the term 'standard language', even for scholars of linguistics, have the potential to evoke notions of 'correctness'." Le lien avoué entre langue standard et aspect correct est également manifesté par Marchand (1975 : 39), qui va plus loin en dénonçant l'abus de certains travaux considérant la langue standard comme la seule langue existante ou en tout cas la seule langue possible : "Bon nombre de manuels contemporains, en particulier la plupart des manuels de grammaire en usage dans l'enseignement, rejettent nettement ces différentes variétés hors de la langue, puisque la seule opposition relevée est celle de "correct" vs "incorrect", soit "appartient à la langue française", "n'y appartient pas". (…) Ces grammaires ne signalent donc même pas l'existence d'autres usages et donnent à croire qu'il existe une langue homogène." Cet aspect radical du français standard comme porteur d'une seule variété n'est cependant pas partagé par tous les sociolinguistes. Valdman (1993 : 7-8) considère en effet que bien que le français standard soit "la principale variété linguistique" des régions où il est la langue actuelle, "même de nos jours, [il] montre une variation qui se manifeste principalement sur le plan de la prononciation et du vocabulaire" et s'étend sur une large gamme de registres de langues. 1.1.3. Standard et naturalité Outre ce problème de reconnaissance des variétés au sein d'une langue entrevu dès lors que l'on emploie le terme de langue standard, se dégage une autre difficulté liée à la nature même de cette langue standard et à son caractère artificiel. Hudson (1980 : 34) le caractérise comme "the unusual character of standard languages, which are perhaps the least interesting kind of languages for anyone interested in the nature of human language (as most linguists are). For instance, one might almost describe standard languages as pathological in their lack of diversity. To see language in its 'natural' state, one must find a variety which is neither a standard language, nor a dialect subordinate to a standard (since these too show pathological 305 Chapitre 4 – Délimitation de l'objet d'étude features, notably the difficulty of making judgments in terms of the non-standard dialect without being influenced ty the standard one)." 1.1.4. Bilan sur le français standard L'étude présentée ici ne peut être considérée comme portant sur le français standard, à supposer qu'une telle entité existe, et ce pour plusieurs raisons. Tout d'abord, le manque de clarté quant au concept de langue standard et particulièrement le manque de consensus sur le nombre de registres contenus dans une langue standard interdisent toute affirmation trop véhémente quant à l'appartenance d'un corpus à cette langue standard et à elle uniquement. De plus, la langue standard est liée à la notion de correction ou plutôt de "correctitude", or l'étude porte en partie sur des réalisations synchroniques, donc pour la plupart non attestées dans les dictionnaires : comment juger de leur degré d'acceptabilité par la langue standard ? Par ailleurs, cette étude ne souhaite en aucune façon se réduire à un français qualifié d'artificiel mais a au contraire pour ambition de s'intéresser aux mécanismes réels de la langue, c'est pourquoi la variation y est nécessaire, excluant par là-même toute référence à un système unique. Si l'on rejette le terme de français standard comme cadre de notre étude, peut-on pour autant trouver un terme définissant plus adéquatement l'ensemble des données considérées dans cette thèse ? Peut-on parler de "français populaire" ou de "français ordinaire" par exemple ? 1.2. Français populaire Le français populaire est selon Valdman (1993 : 7-8) "associé aux classes sociales inférieures de la capitale" et est un sous-ensemble du français standard, son "style familier". C'est également ce que déplorent Blanche-Benveniste & Jeanjean (1986 : 11-14) dans le sens où français populaire et français parlé sont souvent associés dans la littérature1 – à tort. Qu'il soit considéré comme partie intégrante du français standard ou non, il reste que le terme de "français populaire" est lié aux registres de langue, et l'utilisation de ce terme exclurait tous les autres registres du français, ce qui n'est pas souhaitable dans le cadre de cette étude. 1 voire français fautif, cf. Blanche-Benveniste (2002 : 11). 306 Chapitre 4 – Délimitation de l'objet d'étude 1.3. Français ordinaire Le terme de "français ordinaire" semble séduisant dans le cadre de cette étude. Gadet (1989 : préface) le définit de la manière suivante : "Le français ordinaire… Ce n'est pas là un terme habituel en linguistique. Car qui a conscience d'être, dans sa façon de parler, ordinaire, ou bien d'être autre chose que toujours ordinaire ? 'Français ordinaire' doit être compris par référence à ce à quoi on peut l'opposer. Ce n'est bien sûr pas le français soutenu, ni recherché, ni littéraire, ni puriste. Mais ce n'est pas non plus (pas seulement) le français oral ou parlé, puisqu'il peut s'écrire. Pas davantage le français populaire, ramené à un ensemble social. C'est davantage le français familier, celui dont chacun est porteur dans son fonctionnement quotidien, dans le minimum de surveillance sociale : la langue de tous les jours." Parce qu'il écarte certains registres, le terme de "français ordinaire" ne se prête que partiellement à l'étude entreprise ici. Il est vrai que tout ce qui relève du "français soutenu, recherché, puriste" échappe le plus souvent à la spontanéité de la réalisation, ce qui est dommageable lorsque l'on souhaite travailler sur le système de la norme objective et non subjective. Cependant, exclure cet ensemble a priori ampute l'analyse de données dont on ne peut évaluer à l'avance la pertinence. 1.4. Variations régionale et sociale Si l'on accepte tout type de variation stylistique puisque tous les types de registres sont susceptibles d'être représentés, comment considère-t-on ce qui relève de la variation régionale ou de la variation sociale ? La variation dialectale ou régionale, rejetée par le français standard, inclut des unités lexicales comme des structures syntaxiques influencées par le parler local, dont les mécanismes peuvent être différents de ceux de la langue française. Gadet (1989 : 8) définit ce qu'elle appelle la "variation régionale" comme "les usages régionaux du français, en France et hors de France, les particularismes régionaux ou "régionalismes", qui n'existent en tant que tels que lorsqu'une forme manque à être utilisée sur toute la zone d'extension du français. (…) Les régionalismes sont pour la plupart d'ordre lexical". Elle mentionne en outre les "phénomènes qui peuvent en être rapprochés ; les interférences, entre langues, ou entre langue 307 Chapitre 4 – Délimitation de l'objet d'étude et dialecte". De ce fait, l'inclusion de régionalismes dans le corpus pourrait fausser les données : rien ne permet en effet de savoir si une épenthèse dans une unité lexicale donnée est le résultat d'un processus typiquement "français" ou si elle est issue d'un mécanisme dialectal. La variation géographique importante que l'on peut observer dans les pays francophones me semble relever du même mécanisme, peut-être même plus accentué dans ce sens que, dans un pays où le français cohabite avec d'autres langues – l'anglais au Canada, l'allemand, l'italien et leurs variantes en Suisse, le néerlandais en Belgique, le catalan, l'occitan, l'alsacien en France, etc. – l'influence de ces langues peut modifier les processus "naturels" d'épenthétisation. Cependant, l'exclusion de termes au motif de leur caractère régional, tout comme l'exclusion de certains registres, risque d'appauvrir le corpus sans qu'il soit toujours possible de déterminer avec certitude le caractère réellement régional de certaines unités lexicales. De la même manière, les "langues de spécialité" relevant de la variation sociale, telles que le vocabulaire de la médecine ou de la chimie, ne fonctionnent pas nécessairement sur le même mode que la langue générale : elles font appel notamment à des préfixes et à des suffixes particuliers, et la création lexicale y est rarement spontanée, ce qui est un frein à toute adaptation naturelle de la langue telle que la troncation ou l'épenthèse. Cependant, il pourrait être intéressant d'étudier précisément si cette hypothèse de départ, à savoir la non-adaptation des langues de spécialité au fonctionnement général de la langue, est fondée ou non. C'est pourquoi il m'a semblé plus judicieux de garder les termes relevant de langues de spécialité, afin de déterminer leur éventuelle particularité. Ces termes seront codés comme tels dans le corpus, de façon à les traiter séparément, le cas échéant. En dehors de ces langues de spécialité, la variation sociale n'est pas si tranchée que je puisse décider avec certitude d'éliminer tel ou tel terme de mon corpus, au prétexte qu'il appartiendrait à une certaine classe sociale à l'exclusion de toute autre ; Gadet (1989 : 9) parle à ce propos de "continuum de la variation". Parallèlement à cela, tout terme dérivé produit par une classe sociale donnée répondra vraisemblablement aux règles sous-jacentes de formation du français. "Variation sociale et variation stylistique ont souvent des manifestations linguistiques semblables" (Gadet 1989 : 10), car si l'on peut parler de continuum en ce qui concerne la variation sociale au sein d'une communauté, la variation stylistique pourrait se définir dans le sens d'un continuum au niveau de l'individu : "il n'y a pas de locuteur à style unique" (Gadet 1989 : 10). 308 Chapitre 4 – Délimitation de l'objet d'étude 1.5. Bilan Ce panorama des concepts et des acceptions liés à la langue standard et aux autres étiquettes utilisées pour qualifier tel ou tel type de français à permis d'une part d'indiquer pourquoi cette étude ne peut s'inscrire dans aucun de ces cadres, d'autre part de préciser la méthode de travail ici envisagée : tout terme comportant une épenthèse entre radical et suffixe produit par un francophone, quelle que soit son origine sociale ou géographique, doit être intégré dans le corpus. Seule l'analyse établira les critères pertinents. Ce protocole s'applique également en ce qui concerne la période de création du mot construit : rien ne permet d'affirmer avant l'analyse qu'il existe un processus d'épenthétisation à une période de l'histoire du français et pas à une autre. Dans la sous-section suivante je vais rappeler là encore les divergences de définition pour chacun des concepts susceptibles de servir de cadre à l'analyse ou de se révéler pertinent a posteriori : synchronie et actualité. 2. Le français dans sa dimension temporelle Il s'agit maintenant de définir avec davantage de précision la notion d'actualité de la langue, c'est-à-dire de synchronie. Pour le TLF, la synchronie en matière linguistique est l'"état de langue considéré dans son fonctionnement à un moment donné", ce qui rejoint la définition fournie par Dubois & al. (1994) : "on appelle synchronie un état de langue considéré dans son fonctionnement à un moment donné de temps, sans référence à l'évolution qui l'aurait amené à cet état." ainsi que celle de Mounin (1974) : "l'ensemble des faits linguistiques qui assurent la communication à un moment donné de l'histoire d'une langue, dans un "état de langue" daté".2 Le plus difficile à déterminer est l'ampleur du "moment donné". S'agit-il de quelques jours ou de plusieurs décennies ? Ducrot & Schaeffer (1995 : 334) se demandent si "le français parlé en 1970 et celui qui était parlé en 1960 appartiennent (…) au même moment de développement du français", et relèvent que "de proche en proche pourquoi ne pas dire que le français et le latin appartiennent au même état de développement de la langue mère indoeuropéenne ?" 2 On trouve dans la littérature d'autres acceptions du terme synchronie. Mounin 1974 [2000] précise que le terme de synchronie peut être employé "comme abréviation de 'linguistique synchronique' et de 'description synchronique'." Ducrot & Schaeffer (1995 : 334) indiquent quant à eux que "bien que la terminologie américaine appelle descriptive linguistics, ce qui est appelé ici "linguistique synchronique", il n'est pas évident que le point de vue synchronique ne puisse pas être explicatif." 309 Chapitre 4 – Délimitation de l'objet d'étude Non seulement il est difficile de délimiter avec précision la période à considérer, compte tenu précisément des documents disponibles pour établir un corpus de travail (cf. chapitre 5), mais cette délimitation n'est pas nécessaire et pourrait même constituer une limite à l'étude ici envisagée. En ce qui concerne la frontière temporelle "supérieure", l'exploitation d'un questionnaire, l'utilisation de dictionnaires récents et l'introduction de termes issus des médias me semble garantir une base de travail "la plus récente possible", sans que je sois en position de m'avancer davantage quant aux dates concernées. Par ailleurs, l'étude étymologique des termes candidats au corpus comme la recherche dans les sources écrites (cf. section 2) ont mis en exergue des items anciens, et rien ne me permet de les exclure a priori de la base de données puisque rien ne me permet d'affirmer avant l'analyse que le facteur temporel est un critère déterminant. Exclure des termes d'emblée sous prétexte que les dictionnaires établissent leur première attestation au douzième ou au quatorzième siècle d'une part oblige à poser une date arbitraire sans réelle motivation, d'autre part prive le corpus d'une partie des termes présentant une épenthèse consonantique sans que l'on puisse corréler à cette restriction une réelle motivation scientifique. Je ne proposerai donc pas ici une définition précise ou restrictive de l'ensemble langagier dans lequel je compte situer cette étude, du fait d'une part de la difficulté à trouver un terme suffisamment englobant et consensuel, d'autre part de la volonté de ne pas priver, de manière somme toute arbitraire, l'analyse de termes pouvant se révéler riches d'enseignement. Cette délimitation de l'objet d'étude quant au temps et à l'espace, ou plus exactement ce manque de délimitation nette, aura une incidence directe sur la constitution de la base de données. 310 Chapitre 4 – Délimitation de l'objet d'étude 3. Point sur la suffixation Traiter des épenthèses consonantiques présentes entre thèmes et suffixes exige une étude rigoureuse de ce qu'on entend par dérivation suffixale et de ce que cette expression recouvre. Il faut pour ce faire définir avec précision les différents éléments intervenant dans un processus de suffixation, et quelles étiquettes leur donner : tous les linguistes ne s'accordent pas sur les définitions données à "radical" ou à "base" par exemple, aussi me semble-t-il nécessaire d'indiquer clairement ma position à ce sujet et de confronter la dérivation à la composition et à la flexion, processus proches mais dont je ne m'occuperai pas dans cette thèse. J'aborderai également la question du rattachement de la suffixation à la syntaxe ou à la morphologie, avant de m'intéresser à quelques aspects particuliers des suffixes et des dérivés, notamment à la notion de compositionalité du sens, qui se retrouveront dans la constitution du corpus. Je terminerai cette section par un tour d'horizon de quelques-unes des nombreuses appellations de l'élément sous intérêt ici, à savoir l'épenthèse consonantique à la jonction entre radical et suffixe, envisagées sous l'angle lexicologique. 3.1. Mise au point terminologique Éclaircir ce qu'on entend précisément par les termes "radical", "racine", "suffixe", "suffixoïde", etc., devrait permettre d'identifier "à coup sûr" les éléments "parasites" intervenant à la jonction d'une suffixation. Pourtant, ce que signifient ces termes, ce qu'ils désignent, est difficilement définissable. Il faut en effet en tout premier lieu sortir de la définition circulaire telle que la dénonce Debaty-Luca (1988 : 54) : "le radical est ce qui reste quand on enlève le suffixe, le suffixe est ce qui est ajouté au radical"3, et tenter de définir toutes ces notions le plus indépendamment possible les unes par rapport aux autres. Dans un premier temps, je vais rappeler brièvement ce que recouvre précisément les notions d'unités lexicales simple et construite, et m'intéresserai ensuite à ce que l'on trouve précisément dans le lexique. Je me pencherai enfin sur les acceptions données à "racine", "radical", etc. 3 Cf. entre autres Mounin (1974 : 311) : "La linguistique historique définit le suffixe comme un élément de formation qui s'ajoute à la fin d'une racine ou d'un radical." Il indique également (1974 : 279) que "la linguistique historique traditionnelle définit la racine comme l'élément irréductible du mot, obtenu par l'élimination de tous les éléments de formation, comme les suffixes thématiques, les préfixes et suffixes dérivationnels et les désinences." 311 Chapitre 4 – Délimitation de l'objet d'étude 3.1.1. Mot et lexique 3.1.1.1. Mots et unités lexicales. Pour Giurescu (1975 : 29), "la définition du concept de 'mot composé' est inconcevable en-dehors de la définition du mot lui-même."4 J'élargis pour ma part cette opinion aux mots dérivés, auxquels on ne peut faire allusion sans expliquer en premier lieu ce qu'on entend par mot. Or le terme de "mot" connaît de trop multiples acceptions (cf. par exemple Eluerd 2000 : 34-36) pour que je l'utilise tel quel ; pour reprendre Spencer (1991 : 41), c'est même "one of the most difficult and important problems in morphological theory". En effet par "mot" on peut entendre "mot graphique", c'est-à-dire l'ensemble de lettres compris entre deux blancs, ce qui signifierait que leu dans à la queue leu leu, bien que ne portant aucun signifié propre, serait un mot (cf. par exemple Apothéloz 2002 : 9). On peut également l'utiliser dans le sens de "mot phonétique", "suite de sons entre deux pauses" (Siouffi & Van Raemdonck 1999 : 132). Une troisième acception serait sémantique : une "unité de sens" (Siouffi & Van Raemdonck 1999 : 132) correspondrait à un mot. Le mot peut être compris comme "mot lexical" ou lexème. La définition structurale du mot serait "minimal free form ou minimal utterance, l'unité la plus petite capable de jouer le rôle de proposition." (Togeby 1951 : 90-91). Enfin, on peut envisager le mot en tant qu'unité accentuelle (cf. Lyche & Girard 1995). Apothéloz (2002 : 6-7) souligne que "unité par excellence de l'analyse grammaticale traditionnelle, le mot est toutefois une entité difficile à saisir, au point que c'est devenu un lieu commun de la littérature linguistique que de dénoncer cette notion comme floue et impossible à définir avec rigueur". De ce fait, nombreux sont les linguistes à avoir proposé une terminologie concurrente. Ainsi Pottier remplace-t-il le terme de mot par lexie, Benveniste par synapsie, Martinet par synthème, Guilbert par unité syntagmatique, Dubois par unité phraséologique (cf. Picoche 1992 : 23 pour une présentation plus complète), chacun indiquant le sens précis qu'il souhaite donner au terme qu'il utilise. J'emploierai pour ma part plutôt le terme d'unité lexicale, moins connoté que "mot", faisant référence non pas au "mot graphique" ou au "mot phonique", trop imprécis, ni au sens 4 Giurescu dresse à ce propos un inventaire commenté des points de vue de divers linguistes (Sapir, Meillet, Hjemslev, Martinet…) sur ce qu'ils entendent par 'mot' et comment ils le définissent. 312 Chapitre 4 – Délimitation de l'objet d'étude de lexème, trop limité, mais dans l'acception sémantique d'unité de sens et en utilisant les critères définis par Spencer (1991 : 41-57) pour le mot : - critère sémantique : les unités lexicales (simples) sont référentiellement opaques, dans le sens où "it is impossible to refer to their part" (cf. également Martinet 1970 : 296 : "un syntagme autonome formé de monèmes inséparables") - critère syntaxique : "no syntactic process to be allowed to refer exclusively to part of words", c'est-à-dire qu'il n'est pas possible de parler de *chaise très longue par exemple à partir de chaise longue. Ceci correspond en partie à ce qu'Apothéloz (2002 : 8) appelle la stabilité interne du mot, à savoir des "morphèmes ou des blocs de morphèmes dont l'ordre n'est pas modifiable", comme triste et ment dans l'adverbe tristement. Mais comme le relève Apothéloz lui-même, ce critère amène à considérer que le chat constitue un seul mot, puisqu'on ne peut permuter les deux morphèmes, aussi ajoute-t-il un critère de nonséparabilité : un mot est formé de morphèmes indissociables. - critère phonologique : dans certaines langues, les frontières de mots sont marquées par des phénomènes phonologiques ou par l'accent. En français a priori, il ne semble pas que ce genre de critère intervienne, comme le souligne Apothéloz (2002 : 7) : "définir le mot comme une unité accentuelle est impossible en français, car cette langue, contrairement par exemple à l'allemand ou à l'anglais, ne possède pas d'accent de mot mais des accents de groupes de mots.". J'emprunte le terme d'unité lexicale à Martinet (1970). La distinction entre "simple" et "construit" est quant à elle due à Corbin (1987) qui donne pour le mot construit la définition suivante : "un mot construit est un mot dont le sens prédictible est entièrement compositionnel par rapport à la structure interne, et qui relève de l'application à une catégorie lexicale majeure (base) d'une opération dérivationnelle (effectuée par une RCM [règle de construction des mots] associant des opérations catégorielle, sémantico-syntaxique et morphologique" (1987 : 6). Les mots simples, ou mots non construits pour continuer avec la terminologie corbinienne, "sont des mots dont l'éventuelle structure interne et le sens ne sont pas du tout superposables." (Corbin 1987 : 459 ; cf. également Apothéloz 2002 : 23, Huot 2001 : 20, Gross 1996 : 29, Niklas-Salminen 1997 : 52). Signalons en outre l'existence d'une catégorie intermédiaire identifiée par Corbin (1987 : 185-188) : les "mots complexes non construits". Soient les trois termes suivants (ces exemples sont les siens) : maisonnette, carpette et omelette. 313 Chapitre 4 – Délimitation de l'objet d'étude Maisonnette est un mot construit car sa base est indépendamment attestée avec un signifié propre qui se retrouve ici (cf. principe de définition des bases, Corbin 1987 : 186) et que le suffixe -ette est présent par ailleurs avec la même forme et le même signifié diminutif. Carpette est classé comme mot complexe non construit dans le sens où l'on identifie bien le suffixe -ette tant formellement que par son signifié, mais que *carpe "tapis" n'est pas attesté en tant que base. Omelette enfin n'est ni complexe ni construit : *omel n'est pas une base qui aurait pour signifié "grande omelette" ni -ette un suffixe diminutif ici. Malgré les apparences, il s'agirait alors d'un mot simple. Les mots complexes non construits "forment une catégorie intermédiaire entre les mots construits et les mots non construits. Linguistiquement, ce sont des mots non construits, qui ont néanmoins une structure interne. Psycholinguistiquement, tout se passe comme si la "connaissance" des règles dérivationnelles par le locuteur, jointe aux phénomènes d'homonymie formelle entre un affixe et une terminaison, et à la possibilité de superposer, même vaguement, l'interprétation sémantique à la structure formelle, autorisait les locuteurs à percevoir des mots morphologiquement construits comme à travers un "filtre" - au sens photographique du terme - qui modifie leur apparence extérieure" (Corbin 1987 : 188). J'entendrai donc par unité lexicale simple ou terme tout morphème pouvant se trouver, et étant de fait, en isolation. Une unité lexicale simple sera composée d'un seul morphème, une unité complexe de plusieurs, pouvant être libres ou liés. Le produit d'une opération de dérivation affixale comme d'une composition est donc une unité lexicale construite. On peut citer à cet endroit la définition proposée par Mitterand (1963 : 25-26) : "Nous retenons comme mot simple toute forme qui ne peut être amputée d'aucun élément phonique sans que la forme restante soit ou bien totalement inexistante dans la langue, ou bien une forme déclinée ou conjuguée de la forme initiale. (…) Les mots construits s'opposent aux mots simples par le fait qu'on y reconnaît au moins, soit deux éléments radicaux (mots composés et recomposés : chauffe-eau, thermomètre), soit, en sus de l'unique radical et de la désinence flexionnelle – lorsque celle-ci est marquée phonétiquement ou graphiquement – au moins un élément signifiant supplémentaire, non radical, préfixé ou suffixé au radical (mots dérivés : généreusement, générosité)." (1) Unité lexicale simple Un morphème Unité lexicale complexe Plusieurs morphèmes Libre Poisson, chat… Libres Poisson-chat, ouvre-boîte Libre et liés Re-travaill-er Composition Dérivation 314 Chapitre 4 – Délimitation de l'objet d'étude Adopter unité lexicale comme terme "neutre" est d'une certaine manière dangereux, puisqu'il semble impliquer que les éléments considérés sont tous de fait dans le lexique. Il convient donc de s'intéresser précisément à ce qui est dans le lexique, et à ce qui n'y est pas. 3.1.1.2. Que trouve-t-on dans le lexique ? J'entendrai ici par lexique l'ensemble des unités lexicales de la langue, qu'il s'agisse des morphèmes grammaticaux ou lexicaux, et non uniquement les éléments lexicaux (cf. Apothéloz 2002 : 11). Il s'agit maintenant de déterminer ce que contient précisément ce lexique : uniquement les bases et les affixes, ou également les unités lexicales construites ? Ceci permettra de préciser en quoi une thèse portant sur les dérivés peut contribuer au débat. La première option consiste à considérer que le lexique ne contient que ce qui n'est pas prédictible de quelque manière que ce soit, ni par la syntaxe, ni par la phonologie par exemple (cf. Bloomfield 1933). Pour les partisans de cette approche, le lexique contient uniquement des morphèmes, gérés par des "règles de formation des mots" (Word Formation Rules) en dehors du lexique. Cependant, du fait notamment que le sens d'un mot n'est pas toujours celui de la somme de ses éléments (cf. section 3.6), d'autres linguistes considèrent que ce sont les unités lexicales que l'on trouve dans le lexique. Il est fort à parier que la réalité se situe entre ces deux extrêmes. Le problème ne se situe pas au niveau des unités lexicales simples, composées d'un seul morphème : que l'on se place dans la théorie n'acceptant que les morphèmes dans le lexique ou dans celle exigeant les unités lexicales, les unités lexicales simples sont pour l'une comme l'autre dans le lexique. C'est donc sur le sort des unités lexicales construites qu'il faut statuer. D'un côté, certaines unités lexicales ne peuvent qu'être apprises car elles ne correspondent pas à la dérivation attendue à partir du morphème de base et du ou des affixes (l'unité lexicale construite compréhensible doit être connue, la formation classique base + suffixe à partir de comprendonnant comprenable, juste dans sa formation mais non attesté en français), ou que le sens du dérivé est trop différent de la somme du sens de ses éléments. D'un autre côté, si seules les unités lexicales étaient stockées dans le lexique, il serait difficile d'expliquer à la fois la créativité de la langue et le fait que nous comprenions la plupart des néologismes (en tout cas spontanés) la première fois que nous les entendons. Le cas de comprenable en est une parfaite illustration : le sens "que l'on peut comprendre" est 315 Chapitre 4 – Délimitation de l'objet d'étude décodé par tout locuteur du français sur la base de sa connaissance des deux morphèmes formant l'unité lexicale. La contribution de cette thèse au débat dépendra de l'analyse du mécanisme d'épenthèse en tant que mécanisme toujours actif ou figé dans le temps. Dans ce dernier cas en effet, les unités lexicales font nécessairement partie du lexique en tant qu'entités autonomes. Si l'analyse conclut au contraire à la vitalité du processus d'épenthétisation, alors elle ne pourra pas contribuer au débat sur la lexicalité des mots construits. Afin de préciser quelque peu les éléments présents dans une unité lexicale construite, tournons-nous vers les termes de racine, radical, thème et base. 3.1.2. Racines et radicaux, thèmes et bases Suivant notamment Picoche (1992 : 22), je n'utiliserai pas le terme de racine dans le cadre de la formation d'unités lexicales (cf. par exemple Dubois & al. 1994), le réservant à la reconstruction linguistique, notamment indo-européenne, et à la linguistique sémitique. Je distinguerai dans ce travail les trois notions suivantes : radical, thème et base. La base est un élément ayant un sens, et se trouvant dans au moins une unité lexicale simple ; j'entendrai donc par base l'unité lexicale autonome sur laquelle est formé un dérivé, ou pour reprendre Apothéloz 2002 : 15 "l'élément sur lequel opère un affixe". Dans le cadre de la formation de mots construits, une base peut être une unité lexicale déjà dérivée ellemême, pourvu qu'elle existe de manière indépendante : "La base d'un mot dérivé est le mot dont il dérive" (Lehmann & Martin-Berthet 1998) quel que soit le statut de ce "mot" par ailleurs, simple ou construit. Le thème est différent de la base en ce sens qu'il est la forme réellement présente dans le dérivé : changer est la base de changeable, chang- en est le thème. Je sais que -able n'est ni la base ni le thème car il n'est ni autonome ni "autonomisable". Distinct de la notion de thème et de celle de base, le concept de radical s'appuie sur la notion d'allongement thématique (cf. Benveniste 1966 chapitre 9), qui "se présente comme 316 Chapitre 4 – Délimitation de l'objet d'étude une suite d'éléments, susceptible d'avoir une forme pleine ou une forme réduite" (Huot 2001 : 44), d'origine latine. Il se trouve souvent après des radicaux verbaux. La forme pleine rassemble une voyelle ([a], [i], parfois [y]) suivie d'une consonne ([t] ou [s]), la forme réduite l'un ou l'autre de ces sons, ce qui donne les possibilités suivantes, "toutes observables dans le lexique d'aujourd'hui" (tableau de Huot 2001 : 44) : (2) Forme pleine Forme réduite V a t e/é i u - C i t t s L'allongement thématique est situé à gauche (avant dans la chaîne parlée) des morphèmes de l'infinitif ou de certains morphèmes flexionnels, ce qui pourrait militer pour la reconnaissance du morphème de l'infinitif comme désinence et non comme suffixe (cf. section 3.3). Cependant, on peut également trouver l'allongement thématique devant des suffixes (cf. section 3.2.5. et partie II chapitre 6). Il ne constitue pas un morphème dans le sens où il n'a pas de signifié propre : son rôle est de classer les verbes, comme le genre classe les substantifs, et de leur attribuer un fonctionnement particulier. Ainsi en latin, le verbe amāre se décompose-t-il en radical am-, voyelle thématique ā (cf. cantāre) et suffixe -re (cf. delēre "détruire", audīre "entendre", legĕre "lire", capĕre "prendre"). Les conjugaisons seront distinguées en fonction de la voyelle thématique : ā (première conjugaison), ē (deuxième conjugaison), ĕ (troisième conjugaison), ī (quatrième conjugaison) (cf. Cayrou 1960 : 47). Huot (2001 : 45) prête cependant à l'allongement thématique un contenu essentiellement aspectuel, "et plus précisément lié à la notion d'accompli" : un format est ce qui résulte de l'action de mettre en forme, une faillite est une situation résultant d'une défaillance. Le terme de radical désigne donc ce qui reste du thème après que l'on a ôté la voyelle thématique. Si le terme n'a pas de voyelle thématique, le radical s'identifie au thème. Je ne définirai en outre pas le radical ou le thème par rapport à l'unité lexicale construite, mais par rapport à l'ensemble des unités lexicales, simples et construites, dans lesquelles se trouvent un radical donné, tout en étant consciente que ceci ne rend pas compte de tous les types de radicaux existants car au sein d'une même famille peut se constater une allomorphie de radicaux (cf. section [5] 1.2.5.1, portant sur la constitution de la base de données). 317 Chapitre 4 – Délimitation de l'objet d'étude La mise au point terminologique a permis de préciser ce qui sera entendu par radical, thème et base tout au long de cette thèse, ainsi que par unité lexicale simple et construite. Cette dernière catégorie rassemble deux processus lexicologiques distincts, la composition et la dérivation. La présente thèse ne s'intéresse qu'à ce deuxième cas de figure, aussi est-il nécessaire de distinguer précisément ce que chacun recouvre. 3.2. Formation des unités lexicales : composition et dérivation5 Selon le Dictionnaire de linguistique et des sciences du langage de Dubois & al. (1994 : 136), "pris en un sens large, le terme de dérivation peut désigner de façon générale le processus de formation des unités lexicales. Dans un emploi plus restreint et plus courant, le terme de dérivation s'oppose à composition (formation de mots composés)". Je retiendrai quant à moi ce terme de dérivation dans la deuxième acception proposée, à savoir un des processus de formation des unités lexicales, distinct du processus de composition. Mitterand (1963 : 29-30) distingue dérivés et composés de la manière suivante : "Tandis que les mots dérivés sont formés par l'adjonction d'un ou plusieurs affixes (préfixes et suffixes) à un radical unique (sans préjudice du jeu des désinences), les mots composés associent deux radicaux, eux-mêmes éventuellement enrichis de suffixes, dans des constructions de types divers, du point de vue de leur morphologie et de leur orthographe, mais qui ont dans l'énoncé le même statut que les mots simples." Le schéma ci-dessous (Lehmann & Martin-Berthet 1998 : 114) récapitule les procédés de formation des unités lexicales construites du français contemporain. (3) Procédés de formation des unités lexicales construites du français contemporain Formation des mots dérivation dérivation affixale préfixation composition dérivation non affixale composition "populaire" composition "savante" suffixation 5 Je ne traiterai pas de la réduplication ("in which some part of a base is repeated, either to the left, or to the right, or, occasionally, in the middle", Spencer 1991 : 13), autre mode de formation d’unités lexicales, car en français elle ne se trouve pas en concurrence avec la dérivation. 318 Chapitre 4 – Délimitation de l'objet d'étude La dérivation se décompose en deux types : la dérivation affixale et la dérivation non affixale. Dans la dérivation non affixale se retrouvent les déverbaux, c'est-à-dire les "noms dérivés de verbe sans affixation, comme oubli dérivé de oublier : ils ont la forme du radical du verbe" (cf. Lehmann & Martin-Berthet 1998 : 103). On parle parfois dans ce cas de dérivation régressive ou inverse, dans le sens où l'on "perd" un morphème (cf. NiklasSalminen 1997 : 69-71). Le deuxième type de dérivation non affixale consiste en l'adaptation d'un verbe en un substantif, du type manger qui donne le manger. La dérivation non affixale est parfois appelée "dérivation impropre" ou "conversion" (Apothéloz 2002 : 95, NiklasSalminen 1997 : 68-69). Le processus de dérivation affixale consiste en "l'agglutination d'éléments lexicaux, dont un au moins n'est pas susceptible d'emploi indépendant, en une forme unique" (Dubois 1994 : 136), alors que la composition "désigne la formation d'une unité sémantique à partir d'éléments lexicaux susceptibles d'avoir par eux-mêmes une autonomie dans la langue" (Dubois & al. 1994 : 106). On opposera ainsi des termes comme refaire ou malheureux à portefeuille ou timbre-poste, les deux premiers étant composés à l'aide notamment d'un élément lexical non autonome (re-, mal-) au contraire des deux derniers. Cette distinction a priori simple rencontre pourtant des variations, l'autonomie des composés comme la nonautonomie des dérivés pouvant être remises en question, des critères graphique et sémantique se révélant également insuffisants. Je me pencherai dans cette thèse sur la dérivation suffixale, en tant que déclencheur ou révélateur de phénomènes produisant en surface l'apparition d'une consonne. Intéressons-nous quelques instants aux critères de distinction des dérivés et des composés : un critère paradigmatique est tout d'abord avancé, puis l'apport de la sémantique est envisagé ; la simple graphie est à son tour étudiée. Se posera ensuite la question de l'autonomie ou de la non autonomie des éléments d'un composé ou d'un dérivé, pour finir par l'ordre des composants des mots construits en termes de détermination. 3.2.1. Critère paradigmatique. Je n'entendrai pas ici le terme de paradigme dans l'acception retenue par Spencer (1991 : 9-12), à savoir "the set of all the inflected forms which an individual word assumes" 319 Chapitre 4 – Délimitation de l'objet d'étude (cf. également Dubois & al. 1994 : 341), mais je l'utiliserai plutôt dans le sens d'"ensemble des unités entretenant entre elles un rapport virtuel de substitualité" (Dubois & al. 1994 : 342). "Composés et dérivés ont en commun de se comporter comme les unités lexicales simples susceptibles d'apparaître dans les mêmes contextes" (Dubois & al. 1994 : 137, cf. également de Saussure 1916 : 148), ce que Ducrot & Schaeffer (1972 : 436-437) justifient pour les composés notamment par la notion de choix ("il est clair que pomme de terre fait l'objet d'un choix unique à l'intérieur d'un inventaire où se trouvent aussi poireau, chou, etc., et qu'on ne choisit pas successivement pomme, par opposition à poire, et terre par opposition à eau."). Les mêmes critères peuvent aisément s'appliquer aux dérivés : on peut opposer dans un même paradigme gentil et aimable par exemple, homme et prédicateur… A partir du moment où les unités lexicales sont toutes deux des substantifs ou des adjectifs, elles peuvent entrer dans le même paradigme. Il faut cependant noter, avec Spencer (1991 : 296), que "prefixation in general alters the subcategorization (selection) properties of verbs", a/ Tom calculated our time of arrival b/ when we would arrive c/ Tom miscalculated our time of arrival d/ *when we would arrive Si la préfixation ne change pas en français la catégorie de l'unité lexicale, elle peut induire des modifications dans la structure de la phrase. Cette thèse ne portant cependant pas sur l'ensemble des affixes mais uniquement sur les épenthèses concernant les suffixes, je ne développerai pas ce point plus avant. Le critère paradigmatique ne permet donc pas de distinguer les dérivés des composés, non plus d'ailleurs que des unités lexicales simples. Tentons notre chance avec un second critère portant sur la sémantique. 3.2.2. Amalgame sémantique. Peut-on corréler le nombre de sèmes et le type d'unité lexicale ? "Une fois admise la possibilité d'amalgames (plusieurs unités significatives sont manifestées par un seul segment phonique), comment distinguer nettement l'unité significative minimale des éléments 320 Chapitre 4 – Délimitation de l'objet d'étude sémantiques minimaux (sèmes) dont parlent des sémanticiens comme B. Pottier ou A.-J. Greimas ? Pourquoi ne pas dire que le segment phonique soupe manifeste, en les amalgamant, les choix sémantiques "aliment", "liquide", "salé", etc.?" Quelle serait alors la différence avec le segment phonique pomme de terre, lui-même amalgame des sèmes "tubercule", "comestible"… ? On ne peut pas prétendre qu'une unité lexicale simple correspondrait à un maximum de n sèmes, et qu'au-delà de ce nombre n de sèmes on n'aurait affaire qu'à des unités lexicales construites. Là encore, dérivés et composés se comportent comme des unités lexicales simples et ne se distinguent pas par ce critère. 3.2.3. Critère graphique Gross (1996 : 29) affirme que "la dérivation met en jeu une racine et des affixes (préfixes et suffixes) et forme des mots soudés. La composition quant à elle concerne des éléments lexicaux, c'est-à-dire susceptibles d'un emploi autonome, constituant entre eux des unités polylexicales, séparées par des blancs ou par d'autres séparateurs." En français, on ne trouvera pas de contre-exemple à la première partie de l'affirmation de Gross : les termes dérivés sont "soudés". En revanche, il existe des termes traditionnellement considérés comme des composés mais constitués d'éléments non séparés par des blancs ou autres séparateurs (cf. Darmesteter 1967 : 2). En effet, à côté de termes tels que pomme de terre (séparation par des blancs) ou pot-au-feu (séparation par traits d'union), des termes tels que portefeuille, malvoyant ou passeport, appartiennent également à la classe des composés bien que constitués d'éléments soudés. Pas plus que les critères paradigmatique et sémantique, le critère graphique ne permet d'identifier à coup sûr un dérivé d'un composé. Un quatrième candidat à cette distinction concerne l'autonomie des éléments formant les composés. 321 Chapitre 4 – Délimitation de l'objet d'étude 3.2.4. Autonomie des éléments formant les composés6 Benveniste (1966 : 171) reconnaît bien qu'il y a composition "quand deux termes identifiables pour le locuteur se conjoignent en une unité nouvelle à signifié unique et constant"7, donnant pour exemples aussi bien portefeuille, pour lequel porte et feuille constituent bien des unités lexicales autonomes en français, que centimètre ou palmipède. Or dans ces derniers, il est certes possible d'identifier les termes, mais peut-on considérer que centi-, palmi- ou -pède sont des éléments autonomes en français "contemporain" comme le préconise pourtant Dubois & al. (1994) ? Benveniste justifie sa classification par l'origine savante, "c'est-à-dire gréco-latine", de ces unités lexicales. Il semblerait donc que pour lui des unités lexicales formées diachroniquement à partir d'unités autrefois autonomes mais qui ne le sont plus en synchronie, relèvent du processus de composition. De même, les unités ayant astro- (astronome, astrophysique), géo- (géographe) ou cosmo- (cosmonaute, cosmodrome) pour premier élément relèvent de "la composition savante", ces éléments n'étant donc selon lui non des préfixes mais des unités lexicales autonomes et le -o- étant un "joncteur". Scalise (1984 : 75) mentionne également ces éléments que l'on considère parfois comme des préfixes ("anglo, bio, electro, franco, etc.") et ceux assimilés à des suffixes ("crat, phile, etc."). Ce classement n'est pas satisfaisant pour lui, pour plusieurs raisons récapitulées ci-dessous : a. Un élément comme phile peut se trouver aussi bien en début qu'en fin d'unité lexicale : francophile / philanthrope. Or "a "true" affix is not this free: if it occurs to the left it is a prefix, if it occurs to the right it is a suffix". (cf. également Niklas-Salminen 1997 : 72) b. Ces éléments peuvent être séparés de leur base ("it does not matter if they are philo- or anti- Soviet"), ce qui n'est pas le cas pour les "vrais" affixes : on ne peut pas dire *"I do not know if he should be dis- or encouraged." 6 Je ne retiendrai pas dans cette étude la distinction proposée par Schöne (1951 : 44-45), selon laquelle "la composition utilise les préfixes, la dérivation les suffixes". La question qui se pose ici porte sur des éléments dont il est difficile de déterminer la nature affixale ou autonome. 7 Benveniste distingue deux types de "composition verbale" : porte-monnaie, taille-crayon vs. maintenir, vermoulu (Benveniste 1966 : 103). Outre la composition, Benveniste mentionne deux autres types de formation lexicale distincts de la composition : les conglomérés (meurt-de-faim, dorénavant…) et les synapsies ( pomme de terre, avion à réaction…). Cf. Benveniste (1966 : 171-176). Mon propos n'étant pas la composition dans ses différentes variétés mais uniquement la composition en ce qu'elle se distingue de la dérivation, je ne détaillerai pas ces concepts. 322 Chapitre 4 – Délimitation de l'objet d'étude c. Ces éléments peuvent se combiner entre eux ; pour reprendre l'exemple de Scalise, on peut dire en anglais aussi bien Anglo-Italo-Soviet production que Italo-Anglo-Soviet production, ce qui n'est pas le cas avec des "vrais" affixes : indéformable mais *déinformable. d. Si l'on considère que francophile est formé d'un préfixe et d'un suffixe, où est la base ? e. Avec de "vrais" affixes, on ne peut pas avoir de structure de type [Préfixe + Suffixe] : *in + ique, *super + eux. f. Une structure comme francophile se comporte davantage comme un composé que comme un dérivé : un -o- apparaît également dans certains composés (Italo-Américain), pas dans les dérivés ; ce -o- n'appartient pas au "suffixe", on n'a pas par exemple de suffixe comme ographie (historiographie), -ophile (germanophile), -ophobe (germanophobe), puisqu'on ne le retrouve pas lorsque le morphème est situé à l'initiale : graphologue (*ographologue), philanthrope (*ophilanthrope). Ce -o- apparaît devant un second morphème d'origine grecque (musicologie), comme un -i- apparaît devant un second élément d'origine latine (insecticide, herbivore). Des éléments comme -phile ou astro- participent donc de la formation de composés, alors même qu'ils ne sont pas autonomes. C'est pourquoi je ne les retiendrai pas dans mon corpus, puisque l'analyse que je propose se base sur les formes suffixées. L'autonomie des morphèmes composant les composés n'est donc pas un critère déterminant de l'opposition composé / dérivé, rejoignant ainsi les critères paradigmatique, sémantique et graphique. Tentons notre chance du côté de son pendant, c'est-à-dire la nonautonomie des éléments formant les dérivés. 3.2.5. Non-autonomie des éléments formant les dérivés Un autre élément rend plus difficile la distinction entre composés et dérivés au lieu d'y contribuer : l'autonomie possible des affixes. Cependant, elle concerne essentiellement les préfixes. Ceux-ci en effet "peuvent correspondre à des formes ayant une autonomie lexicale" (Dubois & al. 1994 : 37). C'est le cas par exemple de contre, adverbe et préposition, qui est pourtant préfixe dans contredire ; de même bien, adverbe et substantif, est préfixe dans bienfaisant ; la préposition outre est préfixe dans outrepasser, etc. Cependant ce problème d'autonomie ne se rencontre pas avec les suffixes, puisque comme l'affirme Mitterand (1963 : 33-34), "aucun des suffixes du français contemporain ne 323 Chapitre 4 – Délimitation de l'objet d'étude peut fonctionner sans être indissolublement lié à son radical". Il note d'ailleurs que certains "grammairiens 'historisants' du siècle dernier, comme Diez ou Darmesteter, rangeaient les mots à préfixes parmi les composés", pour les deux raisons suivantes : d'une part, certains préfixes peuvent être en isolation ; d'autre part, "la plupart des préfixes remontent à des formes latines ou grecques qui apparaissent tantôt isolées, tantôt accolées à un radical". Comment déterminer si un terme donné est un composé ou un dérivé, si des éléments pourtant autonomes sont analysés comme des préfixes, et des éléments non autonomes comme faisant partie d'un processus de composition ? Cette thèse ne s'intéressant qu'à la dérivation suffixale, je considérerai le critère de non-autonomie du suffixe comme indicateur d'un dérivé. On rencontre également dans la littérature un autre moyen de distinguer les dérivés des composés : l'ordre des segments dans les unités lexicales construites. 3.2.6. Ordre déterminant / déterminé dans les unités lexicales construites Examinons maintenant un possible critère sémantique : l’ordre déterminant / déterminé dans les unités lexicales composées et dérivées. Dans la composition à partir de deux noms, "des deux membres, c'est toujours le premier qui fournit la dénomination : un oiseau-mouche est un oiseau, un poisson-chat un poisson. Le second membre apporte au premier une spécification en y apposant le nom d'une autre classe. Mais entre les deux, il n'y a qu'un rapport de disjonction : les mouches ne sont pas un embranchement des oiseaux, ni les chats des poissons. L'être désigné comme oiseau-mouche est donc en apparence membre de deux classes distinctes qui pourtant ne sont ni homogènes, ni symétriques, ni même voisines. Si cette désignation double reste néanmoins non-contradictoire, c'est que la relation qu'elle institue n'est ni logique ni grammaticale, mais sémantique. L'objet ainsi dénommé ne relève pas identiquement des deux classes. A l'une il appartient par nature, à l'autre il est attribué figurément." (Benveniste 1966 : 147-148). L'ordre des éléments serait donc, en ce qui concerne les composés formés de deux substantifs, déterminé + déterminant. Tous les composés ne fonctionnent cependant pas selon l'ordre déterminé / déterminant. Afin de démontrer ce point, je vais introduire ici une brève explication de la notion de tête en lexicologie. 324 Chapitre 4 – Délimitation de l'objet d'étude La tête d'un composé est l'élément central de ce composé, celui dont la fonction syntaxique lui permet de se substituer à l'unité construite entière ; elle correspond au "déterminé". Si la tête est comprise dans le composé, celui-ci est dit endocentrique. Si elle est extérieure au composé, celui-ci sera qualifié d'exocentrique. Dans les composés endocentriques par subordination, la tête est "généralement" à gauche en français : garde-barrière, timbre-poste… Ces composés comportent un élément modifié (garde, timbre) et un élément modifieur (barrière, poste). Il existe également des composés endocentriques par coordination, qui sont formés de deux éléments à la fois modifieurs et modifiés (aigre-doux, gris-bleu…). Dans les composés exocentriques, la tête se trouvant à l'extérieur (cf. rouge-gorge, ouvre-boîte, garde-fou, etc.), on ne peut distinguer déterminant et déterminé. De plus, il existe en français des composés de plus de deux éléments, le plus souvent comprenant une préposition en deuxième élément : substantif + préposition + substantif (pomme de terre, chemin de fer, l’homme à abattre, poudre à canon, chair à canon), adjectif + préposition + substantif (fier à bras)… D'autres encore, de types plus variés : sot-l’y-laisse, m’as-tu-vu… Tous les types de composés en fonctionnent donc pas selon le schéma déterminé suivi de déterminant. Par ailleurs, le critère inverse n'est pas valable non plus pour les dérivés suffixaux. Si l'on considère les unités lexicales comportant un thème suivi d'un suffixe, on peut les classer en deux types : ceux dont le thème est le déterminé, ceux dont c'est le suffixe qui remplit ce rôle. Dans la première catégorie on trouvera des unités lexicales telles que maisonnette ou rougeâtre, dans la seconde charcutier ou animateur. L'ordre des éléments déterminant et déterminé ne peut donc pas constituer un critère fiable dans la distinction des composés et des dérivés. Une analyse quantitative permettrait sans doute de préciser ce degré de fiabilité, en indiquant précisément la proportion de composés répondant à l'ordre déterminé suivi de déterminant par rapport à l'ensemble des composés, ainsi que celle des dérivés suivant l'ordre déterminant suivi de déterminé par rapport à l'ensemble des dérivés. 325 Chapitre 4 – Délimitation de l'objet d'étude 3.2.7. Bilan Aucun des critères évoqués ici ne fonctionne totalement dans la distinction des composés et des dérivés : dérivés et composés se comportent comme les unités lexicales susceptibles d'apparaître dans les mêmes contextes ; compter le nombre de sèmes des dérivés et des composés n'apporte aucune indication distinctive ; un critère basé sur la soudure des éléments dérivés versus la séparation des éléments des composés ne fonctionne que dans un sens (la séparation des éléments indique un composé, leur non séparation n'indique rien) ; un critère basé sur l'autonomie des éléments des composés est trop fragile pour être retenu ; enfin, l'ordre d'apparition du déterminant et du déterminé n'est pas un critère absolu non plus, puisqu'on y trouve de nombreux contre-exemples. Toutefois, cette étude portant sur la dérivation suffixale et non préfixale, le critère portant sur la non-autonomie des suffixes est valide en ce sens que si le deuxième élément d'un mot construit ne se rencontre jamais en isolation sous quelque forme que ce soit, il s'agit alors d'un suffixe et le mot à partir duquel il est formé est bien un dérivé et non un composé. Passer ces différents critères en revue aura en outre permis d'affiner la définition de la dérivation, par rapport à la composition aussi bien qu'en elle-même, ainsi que de prendre position sur les cas tangents (philanthrope, nécrophile, etc.), ceci jouant un rôle évident dans la constitution du corpus de travail. Le processus de dérivation une fois distingué de celui de composition, il s'agit maintenant d'envisager un autre cas avec lequel les frontières ne sont pas toujours très nettes, à savoir la flexion. 3.3. Dérivation et flexion. Flexion et dérivation se rejoignent en ce qu'elles font intervenir toutes deux des morphèmes grammaticaux liés (cf. par exemple Niklas-Salminen 1997 : 19-20). La flexion se caractérise par l'ajout d'une désinence qui ne crée pas de nouveau lexème mais qui apporte un changement au niveau grammatical : genre, nombre, personne, voix, aspect, cas (fonctions syntaxiques). La flexion inclut la déclinaison (flexion nominale) et la conjugaison (flexion verbale) (cf. Neveu 2000 : 44, Niklas-Salminen 1997 : 20). Elle ne provoque pas de changement de catégorie lexicale. 326 Chapitre 4 – Délimitation de l'objet d'étude En opposition à la flexion, la dérivation consiste en la création d'un nouveau lexème par l'ajout d'un affixe (préfixe, infixe, suffixe) apportant un changement au niveau sémantique. Quand il s'agit d'un ajout de suffixe, il provoque souvent un changement au niveau de la catégorie lexicale (Spencer 1991 : 9-12 "derivation typically (though not necessarily) induces a change in syntactic category."), plus rarement lorsqu'il s'agit d'un préfixe (cf. Lehmann & Martin-Berthet 1998 : 113 ; pour ce qui concerne les "exceptions" à cette règle, cf. 1998 : 118-119). Ainsi : [!"kom&'se] : [!"] modifie sémantiquement le verbe, mais n'apporte aucune information d'ordre grammatical (genre, nombre, fonction, personne) et ne modifie pas la catégorie lexicale du terme auquel il est préfixé. [mçXsyX] : [yX] donne une information sémantique ("résultat de"), ne modifie en rien les attributs grammaticaux du terme auquel il se suffixe, mais modifie sa catégorie lexicale : le verbe devient substantif. A la flexion est rattaché le terme de désinence, à la dérivation le terme d'affixe, comme le soulignent Lehmann & Martin-Berthet (1998 : 131) : "les affixes sont les préfixes et les suffixes, marques de la dérivation. Les désinences sont les marques de la flexion". Les termes d'affixe et de préfixe ne seront donc pas ici entendus comme des termes génériques référant aux morphèmes dérivationnels et flexionnels (cf. par exemple Mounin 1994, NiklasSalminen 1997 : 20) mais uniquement dans leur aspect dérivationnel. Le terme de forme fléchie renvoie aux unités lexicales comprenant une désinence, celui de forme dérivée ou dérivé à celles comportant un affixe au minimum. Cette thèse s'intéresse aux formes dérivées uniquement. Dans le sens où elle donne une indication de mode, la "terminaison" verbale serait à considérer comme une désinence (cf. Lehmann & Martin-Berthet 1998 : 131-132 , cf. Corbin 1987 : 124-129 pour une justification liée à la construction-même des mots). Pourtant, certains linguistes considèrent qu'il s'agit plutôt d'un morphème dérivationnel. Scalise (1984 : 150) est très clair à ce sujet : "the verbal suffix is not an inflectional morpheme. It is a derivational suffix". En effet, cette "terminaison" change la catégorie grammaticale de l’unité lexicale, alors que précisément "a fundamental difference between DR's [derivational rules] and IR's [inflectional rules] is that the former, but not the latter, may change the category of the base in the process of word formation" (Scalise 1984 : 327 Chapitre 4 – Délimitation de l'objet d'étude 148) ; le substantif calibre est lié au verbe calibrer par l'ajout du morphème verbal, le substantif souci au verbe soucier, le substantif fin au verbe finir, l'adjectif pâle au verbe pâlir, l'adjectif rouge au verbe rougir… Dans le cadre de cette thèse, exclure d'emblée les terminaisons verbales reviendrait à prendre position dans ce débat avant même d'avoir tenté l'expérience sur les données à traiter. Si l'on observe des consonnes épenthétiques à la frontière entre le thème et la terminaison verbale au même titre que l'on en constate devant un morphème dérivationnel, alors une des interprétations possibles sera de considérer les terminaisons -er et -ir comme des suffixes et non comme des désinences, la seconde étant d'envisager que l'épenthèse ne dépend pas de la catégorie du morphème grammatical, dérivationnel ou flexionnel, auquel elle se trouve jointe. Dans le cas où l'épenthèse au contraire ne se manifesterait jamais avec -er ou -ir mais avec l'ensemble, ou du moins la grande majorité, des morphèmes dérivationnels, elle constituerait un argument supplémentaire pour classer les terminaisons verbales parmi les désinences. Après cette mise au point terminologique portant tant sur les termes employés dans le cadre de la dérivation suffixale que sur la délimitation de celle-ci, intéressons-nous pour finir ce bref aperçu lexicologique à la dérivation suffixale du point de vue syntaxique. Si la dérivation est effectivement liée à la syntaxe, dans quelle mesure une thèse portant sur la frontière dérivationnelle doit-elle s'intéresser à cet aspect syntaxique ? 3.4. La dérivation suffixale : problème syntaxique ou morphologique ? Peu de linguistes contestent la place de la composition dans la syntaxe. Darmesteter (1967 : 5) va jusqu'à affirmer que "ce n'est pas, en somme, à la partie de la linguistique qui traite de la formation des mots, c'est à la syntaxe qu'appartient la composition, et sa théorie entre tout entière dans celle de la construction de la phrase. Les rapports qui unissent la composition à la syntaxe sont trop évidents pour qu'il soit besoin d'y insister. Un mot composé est une proposition en raccourci". Pour Giurescu (1975 : 117), les composés relèvent des transformations ; elle se range en effet "à l'opinion de W. Motsch quand il pense que les procédés de la grammaire générativo-transformationnelle peuvent être utilisés à l'étude des composés (…) Les procédés génératifs rendent plus rigoureuse l'analyse des processus de composition." Mais qu'en est-il de la dérivation ? 328 Chapitre 4 – Délimitation de l'objet d'étude Plusieurs théories ont tenté d'introduire l'étude des suffixes dans la syntaxe de la phrase : la grammaire générative, la théorie de la transposition (cf. Debaty-Luca pour une revue des différents cas). Dubois & Dubois-Charlier (1999 : 5) par exemple considèrent que "dans l'optique des rapports entre lexique et grammaire on entend par dérivation suffixale un ensemble de procédures syntaxiques aboutissant à constituer des formes lexicales à partir d'un radical verbal, nominal ou adjectival et de suffixes." Dans le cas de nominalisations, d'adjectivisations, de verbalisations et d'adverbialisations, la dérivation peut apparaître comme un phénomène syntaxique, dans le sens où un mot suffixé (ou un déverbal : Jean a démissionné ! la démission de Jean) peut "remplacer" une partie d'une proposition en transformant la phrase (cf. Dubois & DuboisCharlier 1999 : 5-9) : (4) Les bûcherons abattent les arbres Paul est inquiet Ces propos qui doivent être condamnés Le temps devient frais De façon agréable ! l'abattage des arbres ! l'inquiétude de Paul ! ces propos condamnables ! le temps fraîchit ! agréablement forme nominale d'un verbe forme nominale d'un adjectif forme adjectivale d'un verbe forme verbale d'un adjectif forme adverbiale d'un adjectif Rey-Debove (1984 : 10) souligne cependant que c'est "moins d'un cinquième du lexique courant qui relèverait de cette méthode respectant la forme, le sens et la syntaxe productive". La place de la dérivation dans la syntaxe ne doit donc pas être exagérée. Attendu cependant que la dérivation se situe au niveau de l'unité lexicale et non de la phrase, elle se trouve dans tous les manuels de linguistique classée parmi les phénomènes morphologiques et lexicologiques et non au sein de la syntaxe. Pour ma part, je m'en tiendrai à la dérivation en tant que phénomène morphologique et, tout en ne le niant aucunement, ne m'intéresserai pas à son aspect syntaxique. En effet, le but que je recherche est l'analyse des épenthèses à la frontière morphologique et non une représentation syntaxique du phénomène de la dérivation. Par ailleurs, la part syntaxique de la création d'un dérivé a lieu en amont de la concaténation à proprement parler, et ne peut donc jouer un rôle direct que par la catégorie lexicale de la base et celle du suffixe, que je prendrai en compte lors de l'analyse. 329 Chapitre 4 – Délimitation de l'objet d'étude Je vais maintenant me tourner vers deux aspects particuliers des suffixes qui vont se révéler cruciaux dans l'élaboration du corpus : leur position dans l'unité lexicale construite d'une part (section 3.5.1), les cas d'allomorphies suffixales d'autre part (section 3.5.2). 3.5. Aspects particuliers des suffixes 3.5.1. Position dans l’unité lexicale construite Un suffixe est généralement défini comme un morphème se positionnant à droite de la base. L'infixe se distingue du suffixe en ce sens qu'il est "à l'intérieur du radical" (Lehmann & Martin-Berthet 1998 : 132). Si l'on s'en tient à ces définitions, il n'y aurait alors pas d'infixe en français, puisque les cas comme celui de l'unité lexicale tapoter, composée des trois morphèmes /tap/, /ot/ et /e/, sont analysés très simplement en un morphème de base suivi de deux morphèmes suffixaux. Il n'y aurait donc pas d'infixe en français, tous les cas tendancieux pouvant être analysés comme /tapote/. Ce qui découle de ce raisonnement est qu'un suffixe n'est pas nécessairement à la finale, puisque /ot/ est situé entre le morphème de base et un autre morphème suffixal. D'autre part, que penser de l'allongement thématique (cf. section 3.1.2), positionné également à droite de la base et pouvant se retrouver en finale d'unité lexicale (cf. Huot 2001 : 44-48) ? Doit-on dans certains cas le considérer comme un suffixe, dans d'autres uniquement comme un formant ? Ne s'agirait-il pas plutôt d'une désinence ? Considérons les formes suivantes : (5) form + at faill + it(e) agrég + at mand + at renég + at(e) form + at + ion agrég + at + ion mand + at + aire Si l'on récapitule ce que l'on sait de l'allongement thématique par rapport au suffixe, un premier point commun est la non-autonomie de chacun d'eux (cf. section 3.1.2), un autre la capacité de déterminer la catégorie lexicale des termes, ce qui n'est pas le cas des désinences (cf. section 3.3). Pourtant, selon Huot (2001 : 70), l'allongement thématique ne peut pas être considéré comme un morphème dérivationnel, essentiellement du fait que sa valeur est plutôt 330 Chapitre 4 – Délimitation de l'objet d'étude aspectuelle (Huot voit dans les formes comportant -at "quelque chose qui est de l'ordre de l'accompli (un résultat ou une propriété acquise)"). L'allongement thématique ne relève pourtant pas davantage de la désinence flexionnelle, n'ayant aucun lien avec l'expression de la personne ou d'une quelconque valeur modale (à la différence de l'infinitif). Cette double non appartenance fait de l'allongement thématique un morphème spécifique, qui se distinguerait des suffixes et désinences (Huot 2001 : 134-135). Huot rapproche l'allongement thématique du morphème du participe présent, et propose de lier les deux en un suffixe aspectuel se réalisant sous les formes suivantes : (6) [-accompli] Forme pleine -ant Forme réduite [+accompli] -at -it -e/-é -i -u -t -s Les trois positions offertes par la littérature en ce qui concerne les éléments de type at- sont les suivantes : - ils appartiennent au suffixe (cf. Scalise 1984 : 140-145 ; 153) ; - ce sont des infixes ; - il s'agit d'éléments "parasites" (Corbin 1987 : 237). Il ne m'appartient de prendre parti que dans la mesure où si un tel segment appartient au suffixe, alors c'est sa frontière gauche qui va intéresser cette étude de l'épenthèse entre radical et suffixe. S'il s'agit d'un élément "parasite", je ne suis alors plus dans le contexte recherché puisque les deux frontières morphologiques possibles sont alors radical + élément parasite et élément parasite + suffixe. S'il s'agit d'un infixe, deux options sont à considérer : soit il faut étendre le contexte d'étude à la frontière entre radical et infixe, soit il faut exclure tous les cas pour lesquels il y a ambiguïté quant au statut d'un des éléments. Là encore, prendre une décision avant d'observer le fonctionnement des épenthèses après le radical conduirait à réduire le champ d'analyse de manière artificielle, sur des présomptions plutôt que sur des faits. 331 Chapitre 4 – Délimitation de l'objet d'étude Un deuxième cas particulier concerne les suffixes : l'allomorphie suffixale, qui se révèlera problématique lors de la deuxième étape de filtration de la base de données (cf. chapitre 6 section 2). 3.5.2. Allomorphie et homonymie suffixales L'allomorphie suffixale fait en réalité partie de la question plus vaste de l'allomorphie en général (cf. Corbin 1987 : 314-317). Elle doit être néanmoins abordée ici du fait de son importance quant à la délimitation des suffixes. A partir du moment où un signifié a été identifié, peut-on postuler des alternances quant à son signifiant ? Et si tel est le cas, jusqu'à quel point peut-on considérer qu'il s'agit de variantes d'un même signe ? Prenons par exemple le signifié "action de V", qui peut être obtenu en suffixant [aZ] ou [mã] à une base verbale (représentée par V dans le signifié). Peuton postuler qu'il s'agit d'un seul suffixe ? Cette attitude semble extrême du fait que les deux signifiants n'ont aucun phonème commun, ils seront donc considérés comme deux homonymes. La décision est moins aisée en revanche lorsque l'on est en face d'allomorphes de type [asj+'], [sj+'] et [j+'] par exemple (cf. Aronoff 1976, Scalise 1984 : 61). Il faudra donc se pencher avec attention sur chaque suffixe considéré lorsque la base de données sera filtrée en fonction de paramètres sémantiques portant sur le suffixe (cf. chapitre 6 section 2) et ne pas se contenter d'une généralisation hâtive qui priverait le corpus de termes intéressants ou qui au contraire en maintiendrait de non pertinents. L'homonymie et la polysémie de suffixes sont quant à elles suffisamment fréquentes pour que se pose le problème d'un éventuel dénombrement des suffixes en français. Pour ne citer que quelques exemples, considérons le suffixe -eur, qui peut produire des substantifs de sens "qualité d'être Adj" à partir d'adjectifs (grandeur, pâleur), ou des noms d'agent à partir de verbes (coureur, contrôleur)" ; le suffixe -age dans certains cas permet de dériver des noms d'action sur verbe (dérapage) et dans d'autres des substantifs collectifs à partir de substantifs (feuillage)". Après cette brève incursion du côté des suffixes, intéressons-nous un moment aux dérivés et plus particulièrement à l'élaboration de leur signifié. 332 Chapitre 4 – Délimitation de l'objet d'étude 3.6. Compositionalité du sens des dérivés. Peut-on poser l'équation suivante : (7) Sens du suffixe = sens du suffixé – sens de la base ? Est-il vrai que le sens d'un suffixé n'est que la somme des sens de ses composés, ou acquiert-il un sens propre, "produit" de ces deux sens ? Dans le cas où le sens du suffixé ne serait pas exactement la somme du sens de ses composés, comment déterminer le sens du suffixe ? Pour Aronoff (1976 : 18), "this is the basic trouble with morphemes. Because words, though they may be formed by regular rules, persist and change once they are in the lexicon, the morphemes out of which words seem to have been formed, and into which they seem to be analyzable, do not have constant meanings and in some cases they have no meaning at all." Apothéloz (2002 : 83-84) distingue quatre processus graduels de construction du sens du dérivé, au moins en ce qui concerne les suffixations transcatégorielles. Le premier est essentiellement syntaxique, c'est l'opération de transcatégorisation elle-même. "Un suffixe dont la fonction est de transformer un adjectif en nom va produire un mot dont le sens premier, calculable, est la transcription de ce transfert syntaxique, soit un sens paraphrasable comme 'qualité de ce qui est X'". De même, un suffixe transformant un nom en adjectif apportera le sens "relatif à X", un adjectif en verbe "rendre X", etc. Le sens de ces suffixes est donc prédictible. Le second processus dépasse le simple phénomène de transcatégorisation puisqu'il concerne l'apport sémantique du suffixe : -(i)fier a le signifié "rendre X" ou "transformer en X". La base apporte également un certain sens qui va modifier le sens du dérivé, ce qui constitue le troisième processus identifié par Apothéloz. Humidifier et cocufier sont bien formés à partir du même suffixe, mais humide est une propriété gradable au contraire de cocu, si bien que le sens du premier sera "rendre plus humide" alors que le sens du second sera simplement "rendre cocu". Le quatrième processus est plus insaisissable, bien que son effet soit on ne peut plus attesté. Pourquoi clouer n'a-t-il pas simplement le sens de "faire quelque chose en rapport avec un ou des clous", ou encore "garnir de clous" comme meubler signifie "garnir de meubles" ? Il s'agit là de contraintes extérieures à la langue mais qui pèsent sur elles ; 333 Chapitre 4 – Délimitation de l'objet d'étude Apothéloz les qualifie de "pratiques". Dans ce dernier cas, le sens n'est plus prédictible à partir du sens de ses composants (cf. également Corbin 1987 : 213-214 puis 221-231). A chacun de ces processus correspond un ensemble de suffixes. On voit bien alors que l'équation proposée en (7) ne concerne en aucun cas l'ensemble des suffixes de la langue, puisque tous les suffixes relevant du quatrième processus en sont exclus, le suffixe formateur de verbes -er en tête - si tant est qu'il s'agisse d'un suffixe. Il sera donc nécessaire lors de l'utilisation du critère sémantique dans le processus d'épuration du corpus (cf. chapitre 6) de ne pas travailler de manière trop "mathématique", tout en restant rigoureux quant à la procédure de sélection. Après cette mise au point sur les suffixes, je vais m'intéresser aux aspects de la construction des dérivés pertinents pour cette thèse. Une dernière partie (section 3.8) proposera une vision lexicologique des consonnes épenthétiques entre radical et suffixe. 3.7. Contraintes sur la formation des unités lexicales construites. Seront abordés ici quelques concepts concernant la formation des unités construites tels que les règles de formation des mots, l'ordre des morphèmes dans une unité construite et leurs catégories, ainsi que la dérivation parasynthétique. 3.7.1. Règles de formation de mots "Au-delà des irrégularités de tous ordres observables sur la partie attestée du lexique des mots construits, celui-ci obéit à un ensemble hiérarchisé de règles et de principes dont la nature, le contenu et le champ d'application doivent être déterminés par le linguiste." (Corbin 1987 : 1) Ces règles définissant les combinaisons de morphèmes en unités lexicales sont appelées règles de construction des mots (RCM) ou word formation rules (WFR), et s'inscrivent dans une grammaire générative, souvent dans leur propre composant. Il s'agit de règles morphologiques, qui s'ajoutent aux composants syntaxiques, sémantiques et phonologiques (cf. Scalise 1984 : 48). Pour ne prendre qu'un exemple, considérons le composant lexical du modèle proposé par Corbin (1987). Dans celui-ci, les RCM sont inscrites dans le composant dérivationnel où figurent également les mots construits possibles en relation avec elles. Ce composant 334 Chapitre 4 – Délimitation de l'objet d'étude dérivationnel est lui-même en relation avec le composant de base contenant les entrées lexicales et les règles de base, et avec le composant conventionnel à sa sortie, qui contient notamment les règles d'allomorphie et de troncation. Ce composant lexical est en relation à chaque niveau avec les composants sémantique et phonologique (cf. Corbin 1987 : 415-423 ; 469-504 pour le composant dérivationnel). 3.7.2. Ordre des morphèmes Parmi les contraintes liées à la formation des unités construites se trouve l'ordre obligatoire entre morphèmes dérivationnels et flexionnels, les premiers étant nécessairement plus proches du radical que les seconds si les deux types figurent au sein d'une même unité. Autrement dit, alors que les morphèmes dérivationnels et donc les suffixes sont nécessairement en contact avec le radical, les morphèmes flexionnels ne peuvent se concaténer directement au thème qu'en l'absence de morphème dérivationnel. Signalons également que parmi les affixes sont distinguées par certaines théories deux ou plusieurs classes d'affixes en fonction également de leur position par rapport au radical lorsque plusieurs d'entre eux cohabitent au sein d'une même unité lexicale (cf. Spencer 1991 : 179 ; chapitre 4, Scalise 1984 : 115-117, etc.). Katamba (1989 : 273) utilise la métaphore de l'oignon pour expliciter la formation des unités lexicales ; le radical forme le cœur de l'oignon, les affixes de niveau 1 une première pellicule autour, "enveloppés" dans les affixes de niveau 2. J'ajouterai une pellicule supplémentaire pour les morphèmes flexionnels, ce qui donne le schéma suivant : (8) [[morphème flexionnel] [[affixe de niveau 2] [affixe de niveau 1] radical [affixe de niveau 1] [affixe de niveau 2]] [morphème flexionnel] ] Non seulement les morphèmes doivent s'enchaîner dans un ordre prédéterminé, mais leur combinaison dépend en outre de la catégorie lexicale de la base et de celle du suffixe. 335 Chapitre 4 – Délimitation de l'objet d'étude 3.7.3. Combinaison des morphèmes Une contrainte supplémentaire pèse sur la construction des unités lexicales : tous les suffixes ne s'attachent pas à tous les types de bases, toutes les bases ne peuvent pas recevoir de suffixes (cf. Scalise 1984 : 46). De plus, "certains suffixes obéissent à des contraintes morphophonologiques particulières et ne peuvent opérer sur certaines bases sans les tronquer." (Apothéloz 2002 : 85). La combinaison des morphèmes sera discutée lors du deuxième bassin de filtrage dans lequel passe la base de données à partir de laquelle est construit le corpus sur lequel repose l'analyse (chapitre 6 section 2), et sera directement exploitée dans le chapitre 7 concernant l'élaboration d'un questionnaire visant à favoriser la production d'épenthèse entre radical et suffixe. Un dernier aspect de la construction des unités lexicales est abordé dans la soussection suivante : la parasynthèse. 3.7.4. Parasynthèse Un mot enfin sur la dérivation parasynthétique (Darmesteter 1894 : 196)8, qui se définit par l'ajout simultané d'un préfixe et d'un suffixe (cf. Lehmann & Martin-Berthet 1998 : 119), qui est alors parfois considéré comme un morphème discontinu particulier appelé circonfixe, "a special kind of discontinuous affix" (Spencer 1991 : 13 ; cf. également Apothéloz 2002 : 86-91) : /e…i/ dans élargit, /a…"/ dans alite, /a…i/ dans atterrit, etc. Le critère déterminant est le fait que la base avec un seul des deux affixes n'existe pas (cf. Scalise 1984 : 147, Lehmann & Martin-Berthet 1998 : 119) ; on ne trouve en effet ni *élarge ni *largit par exemple. Outre ce cas du circonfixe, Apothéloz (2002 : 88-91) distingue trois autres cas de figure. Dans le cas de dérivés de type égrène ou étripe, le é- est doté d'un signifié propre que l'on retrouve dans épépine ou épouille : la notion d'"enlever". Dans ce cas é- est un vrai préfixe, mais qui se trouve nécessairement employé simultanément à un suffixe dérivateur de verbes. Apothéloz qualifie ce cas de "couplage préfixe-suffixe". Pour Apothéloz, c'est à la fois ces couples préfixe-suffixe et les affixes discontinus qui sont regroupés sous l'étiquette de 8 Cf. Corbin (1987 : 541 note 46) pour une considération sur le statut de l'analyse parasynthétique dans les analyses existantes. 336 Chapitre 4 – Délimitation de l'objet d'étude dérivés parasynthétiques, "appellation dont la paternité est traditionnellement attribuée à A. Darmesteter". Le deuxième cas concerne les antonymes, et se divise lui-même en trois parties. Tout d'abord ce qu'illustrent les paires enracine / déracine ou encourage / décourage : un "système à double marquage", chacun des deux termes comportant un préfixe. Les paires gèle / dégèle ou masque / démasque exposent une deuxième variante, à savoir le "système à marquage négatif": un seul des deux termes possède un préfixe marquant l'antonymie. Son pendant est le "système à marquage du terme positif", "dans lequel un seul des termes est morphologiquement marqué, celui doté d'un sens 'positif'", comme dans plume / emplume. Ces systèmes ne sont pas étanches, comme l'illustrent les verbes encrasse vs décrasse, qui relèvent du double marquage, mais qui sont également en relation avec le verbe désencrasse, qui introduit alors un marquage à terme négatif. Le dernier cas identifié par Apothéloz touche des verbes comme enrichir ou adoucir. Les paires de type grandit / agrandit ou maigrit / amaigrit comportent une différence aspectuelle : le verbe préfixé implique un résultat, et non le verbe sans préfixe. Que faire alors du verbe enrichir, qui implique un résultat mais dont le pendant *richir "devenir riche" n'est pas attesté ? Certains linguistes distinguent base attestée et base virtuelle afin de réduire, voire de supprimer les parasynthèses : il n'y aurait alors plus simultanéité, mais successivité de la préfixation et de la suffixation (cf. Lehmann & Martin-Berthet 1998 : 119-121, Corbin 1987 : 134-137, Spencer 1991 : 13). Pour certaines unités construites, il n'est pas possible de déterminer qui de la préfixation ou de la suffixation est intervenu avant l'autre (cf. Apothéloz 2002 : 54-59), y compris en synchronie, car les sens induits par chacun des chemins dérivationnels sont proches ou sont tous deux possibles pour l'unité lexicale considérée. Prenons pour s'en convaincre l'exemple de l'adverbe indirectement : (1) direct ! indirect ! indirectement ("de manière indirecte") (2) direct ! directement ! indirectement ("non directement") L'analyse des parasynthétiques est pertinente ici notamment dans le cadre de la création du corpus de travail : faut-il les considérer comme des éléments suffixés ou comme une catégorie à part ? Je garderai la position que j'ai adoptée jusqu'ici, à savoir ne pas exclure d'emblée, arbitrairement, une catégorie de termes, mais attendre de voir si l'analyse elle-même 337 Chapitre 4 – Délimitation de l'objet d'étude leur attribue un statut particulier (pour les problèmes que ce choix peut induire dans la création du corpus, cf. chapitre 5). Ces quelques considérations sur les radicaux, les suffixes et les dérivés ne laissent qu'une catégorie passée sous silence : les "éléments intermédiaires". 3.8. Les "éléments intermédiaires" Nous avons étudié dans le chapitre 3 de la première partie les différentes analyses phonologiques proposées en ce qui concerne l'épenthèse consonantique. Les lexicologues et morphologues se sont bien sûr également penchés sur ces "éléments intermédiaires". Je ne présenterai pas ici de théorie complète mais proposerai un échantillon de ce qui a été proposé pour représenter et traiter le problème. Huot (2001 : 26) parle d'un "son de transition" entre deux voyelles, c'est-à-dire lorsque le thème se termine par une voyelle et que le suffixe commence également par une voyelle. Gruaz (1988 : 60-61) s'intéresse à l'ensemble des "éléments intermédiaires" que sont à la fois les extensions de suffixe relevant de l'allomorphie suffixale (cf. chapitre 6 section 2) et les "phonèmes/ graphèmes placés après le syntagme fondamental (ex. n de journal) ou un groupe séquent (ex. n de paternel, t de facultatif)." Il propose de les classer, avec les consonnes latentes finales de radical, dans la catégorie des tenseurs, "éléments qui, tant par leur position que par leur fonction, 'étendent', prolongent, le syntagme fondamental". Dubois & Dubois-Charlier (1999) mentionnent les "additions" de consonnes lorsqu'ils en constatent au hasard de l'étude d'un suffixe donné (par exemple p. 194) qu'ils appellent aussi à d'autres endroits consonnes épenthétiques (par exemple p. 252) sans qu'il n'y ait apparemment de différence de statut entre les deux types. Ils ne proposent pas de tentative de représentation, ceci ne constituant pas l'objet de leur travail. Pour Apothéloz (2002 : 67-68), ces segments sont "des ajouts inexplicables", qui certes "trouvent presque toujours une explication" d'un point de vue diachronique mais qui posent problème en synchronie puisqu'on ne peut leur attribuer de signifié. "La seule certitude est qu'on ne peut pas les considérer comme des morphèmes." Il distingue trois solutions théoriques : soit ces segments appartiennent à la base et relèvent de l'allomorphie radicale, soit ils sont intégrés dans le suffixe et c'est cette fois 338 Chapitre 4 – Délimitation de l'objet d'étude l'allomorphie suffixale qui est en jeu, soit il faut les considérer comme des "segments intercalaires, pures séquences de signifiant intervenant entre les bases et les affixes." Il ajoute une quatrième option : le segment serait la conséquence d'une mécoupure. Par exemple, le -lde tissulaire a vraisemblablement son origine dans une mécoupure d'adjectifs comme musculaire, oculaire, etc., mécoupure qui a conduit à rattacher la consonne -l- au suffixe aire, créant ainsi, de fait, un allomorphe -laire. La multiplicité des appellations souligne la difficulté de représentation de ces segments parasites, qui ne correspondent à aucun élément du dérivé et qui pourtant y sont présents. Ceci conclut ce tour d'horizon sur la suffixation, mais aussi le premier chapitre de cette partie consacrée à l'élaboration de matériaux de travail. Les concepts nécessaires et les critères d'élaboration sont maintenant en place, il est temps de passer à la constitution d'une base de données propre à servir de point de départ à une analyse portant sur l'épenthèse consonantique entre radical et suffixe. Cette élaboration fait l'objet du chapitre suivant. Le chapitre 6 sera consacré à l'épuration de cette base de données pour arriver au corpus à proprement parler. Quant au chapitre 7, il fera le point sur l'apport de données au moyen d'un questionnaire dans le cadre de la production d'épenthèses consonantiques à la dérivation suffixale. 339 Chapitre 5 – Constitution de la base de données Chapitre 5. Constitution de la base de données "A vrai dire, un corpus est chose complexe ; il est fait à la fois d'éléments déjà donnés, et d'éléments qu'on se donne, les uns et les autres étant rassemblés selon certains critères qui commandent leur choix". (Préface du TLF, vol. 1 : XXI). "Il ne suffit pas de décrire et d'observer pour rendre compte d'un objet linguistique; il faut encore le construire et l'interroger dans une problématisation scientifique qui seule permet de le saisir comme objet." (Durand & Lyche à paraître : 53). S'interroger sur la création d'un corpus propre à l'analyse des épenthèses entre radical et suffixe en français n'est pas trivial, le rassemblement des unités lexicales comme leur traitement et leur tri devant nécessairement faire l'objet d'une réflexion approfondie, de façon à ce que l'analyse s'appuie sur des données fiables. Les données peuvent être de deux types : orales ou écrites. Chacun présente des avantages comme des inconvénients, qui vont avoir pour conséquence l'impossibilité de se limiter à l'un ou à l'autre pour la constitution du corpus. Commençons par les données orales. Elles ont pour point fort par rapport à l'écrit la plus grande spontanéité de leur réalisation (cf. Blanche-Benveniste & Jeanjean 1986 : 21), assortie le plus souvent d'une vigilance métalinguistique plus faible (sauf éventuellement en cas d'hypercorrection, comme on a le verra en ce qui concerne les épenthèses consonantiques syntaxiques, cf. partie III). De ce fait, c'est à l'oral que sont créés la plupart des néologismes, ceux qui vont perdurer comme ceux qui ne figureront jamais dans un dictionnaire de par leur fugacité, mais qui ne sont pas moins révélateurs de la dynamique de la langue9. Enfin, ce qui 9 Pour Dumas (1978 : 87), les données orales sont les seules valides : "C'est au contraire dans le français parlé le plus courant et dans le français populaire qu'il faut chercher les faits pertinents. Non seulement ce registre est capable de les fournir tous, mais il est aussi le seul légitimé à le faire. En effet, c'est ce registre-là qui est représentatif de la langue parce qu'il représente le produit linguistique le plus pur qu'il soit possible d'isoler. Parce qu'il est lié à l'exercice de la parole dans les conditions pratiques de la vie individuelle et sociale, il est le moins directement perméable à l'influence essentiellement conservatrice de la langue "cultivée", de la culture livresque qui invoque l'histoire, le primat de la forme écrite, l'intention esthétique et tout le métalinguistique en général comme les justifications supérieures de l'expression linguistique, et impose un "fétichisme de la langue" très bien décrit par Bourdieu (1975)". Cette tirade passionnée étant produite à propos de la liaison en français, on peut penser que la dérivation puisse également tirer profit des données orales. 340 Chapitre 5 – Constitution de la base de données est produit verbalement n'est par définition pas "relu", et ne sera donc pas "corrigé" par le "bon" terme, celui exigé par la norme, le cas échéant. Il est vrai que cette attitude correspond à la tendance dénoncée par Blanche-Benveniste et Jeanjean (1986 : 21) de ne considérer dans ce prologue que l'aspect familier du français parlé ; cependant, étant donné la méthode de recueil aléatoire pour laquelle j'ai opté en ce qui concerne les données orales, ce défaut sera corrigé de lui-même. Par ailleurs, cette étude est avant tout phonologique et celle-ci "est d'abord confrontée à l'hétérogénéité et à la dispersion des façons de parler. Elle cherche à dégager une analyse unifiée de ces pratiques orales diversifiées et secondairement à reconstruire une norme d'usage qui ne se livre jamais comme telle." (Laks 2002 : 6) Les données orales - ou du moins celles qui le sont réellement, hors discours pré-écrits par exemple - sont donc incontestablement plus intéressantes du point de vue de cette étude que les éléments écrits, qui ne sont finalement bien souvent que le reflet des séquences pérennes et négligent les mots bien construits en regard du fonctionnement de la langue mais qui n'ont pas eu l'heur d'être relevés par un lexicographe ou entérinés au-delà d'un phénomène de mode. Cependant, c'est l'aspect technique de la récupération des données orales qui va restreindre leur poids dans un corpus comme le nôtre. Les données écrites en revanche sont bien plus faciles à la fois à collecter et à attester. De plus, elles constituent bien évidemment le seul moyen d'accéder aux termes contenant des épenthèses entre radical et suffixe créés antérieurement à l'époque actuelle, ou dans le meilleur des cas antérieurement à l'apparition des premiers enregistrements oraux. Il aurait toutefois été dommageable de se limiter aux données écrites dans le cadre de cette étude, pour les raisons évoquées dans le paragraphe précédent, mais également parce que leur incorporation dans le corpus doit faire l'objet d'un traitement préalable. Une grande vigilance s'impose en effet quant à la date d'apparition des termes à retenir (l'étude porte sur le français, non sur le latin), et nécessite donc un contrôle de chacun d'entre eux. De plus, et tout particulièrement en ce qui concerne le français, la graphie pose de nombreux problèmes d'identification des épenthèses, ce sur quoi je reviendrai plus en détail dans la partie suivante. 341 Chapitre 5 – Constitution de la base de données 1. Création d'un corpus à partir de sources écrites. Travailler à partir de données écrites permet de multiplier les sources, étant donné que le problème d'y accéder ne se pose pas dans les mêmes termes que pour les données orales. La première étape a été une extraction automatique des termes dérivés susceptibles de contenir une épenthèse consonantique (A). Cette première liste d'unités lexicales a été complétée par des données issues de différents dictionnaires d'argot (B), par une recherche d'expressionsclés dans le Trésor de la Langue Française informatisé (C), par les termes proposés dans les articles scientifiques comme dans la presse (D), par l'étude plus précise de termes liés aux suffixes établis comme les plus fréquemment déclencheurs d'épenthèses (E), puis par le dépouillement des Néologismes du français contemporain (H) et du Dictionnaire des mots sauvages (K). La récolte ne s'est pas faite aussi linéairement que cette présentation ne le laisse entrevoir ; les données, notamment celles issues d'articles ou recueillies à l'oral, ont été incorporées au fur et à mesure de leur découverte et non en un seul bloc. Avant de présenter plus en détail ces différentes sources, j'expliquerai pourquoi certaines autres n'ont pas été exploitées dans la création de ce corpus. 1.1. Ressources non exploitées Dans ce bilan sur les ressources utilisées et leur intérêt dans la constitution du corpus, quatre sources sont à mentionner. Pourquoi en effet ne pas avoir exploité cette gigantesque base de données qu'est Internet ? Pourquoi avoir rejeté l'exploitation des journaux disponibles sur CD-ROM ? Pourquoi ne pas avoir tiré parti de la base de données Frantext ? Et puisque le travail porte en grande partie sur les néologismes, pourquoi avoir négligé la base de néologismes qu'est Bornéo? Un corpus portant sur le "français d'aujourd'hui" peut tirer beaucoup de profit d'Internet, dans le sens où il s'agit là sans doute de la plus grande base de données disponible. De plus, certains outils d'extraction sont dorénavant disponibles pour exploiter les ressources d'Internet, par exemple Webaffix (cf. Hathout & Tanguy 2002), développé à Toulouse par Ludovic Tanguy et en accès libre sur le site http://www.univ-tlse2.fr/erss/textes/ pagespersos/tanguy/webaffix.html. Ce logiciel permet d'isoler les néologismes construits trouvés sur Internet via le moteur de recherche Altavista, en fonction de leur suffixe, pourvu que l'on ait fourni au programme 342 Chapitre 5 – Constitution de la base de données une liste d'entrées lexicales attestées ainsi qu'une liste des séquences de trois lettres possibles en initiale de mot dans la langue considérée. Par ailleurs, divers journaux sont disponibles "en ligne" mais également sous la forme de CD-ROMs, ce qui donne accès à des données récentes pouvant entrer dans le corpus. S'ajoute à cela la base de données Frantext, rassemblant des textes littéraires du XVIème au XXème siècle, datés. Ces sources auraient certainement apporté beaucoup à un corpus comme celui présenté ici ; en effet, "l'exploration systématique de bases textuelles numérisées pérennes (comme les CD-ROM de journaux) ou éphémères (comme les pages web) permet d'amasser en très peu de temps des données incomparablement plus nombreuses que l'antique lecture." (Plénat & al 2002 : 133). Cependant, cet apport ne peut se faire qu'à condition d'avoir un moyen d'accéder aux données de manière automatique étant donnée leur ampleur, et de pouvoir trier les termes par rapport à leurs suffixes, comme le propose le logiciel Webaffix par exemple, mais également à leur base, de façon à isoler les éventuelles consonnes présentes à la frontière. Une autre piste de travail intéressante est proposée par Mathieu et al. (1998), qui ont extrait automatiquement 2840 néologismes à partir des 23 millions d'occurrences du corpus du journal Le Monde de 1993, par une méthode semi-automatique : après un protocole informatisé, seule l'extraction manuelle a permis de finaliser la recherche. Cependant, la recherche de termes présentant une épenthèse entre radical et suffixe serait là encore un travail manuel, comparable à la recherche dans des dictionnaires non informatisés (cf. sections 1.3, 1.7 et 1.8). En fait, il aurait fallu pouvoir appliquer le protocole d'exploitation testé sur la base de données de 64.296 mots (cf. section 1.2). Or les données disponibles sur Internet comme sur les cd-roms ou sur Frantext ne se prêtent pas à ce genre de traitement. Dans le meilleur des cas, il est possible de les trier par suffixe, mais l'exploitation de la base de données par suffixe (cf. section 1.6.) a montré le manque de rentabilité d'une telle pratique. En dehors des difficultés inhérentes à l'extraction de données utilisables, l'exploitation de ce type de sources se heurte à de nombreux autres inconvénients (cf. notamment Plénat & al 2002 : 127-129, Tanguy & Hathout 2002 : 248, Grefenstette 1999 : 1) parmi lesquels le "bruit" généré par les fautes de frappe ou de découpage de la chaîne, ainsi que le manque de contrôle des sources : est-ce bien un locuteur natif qui a produit tel ou tel néologisme ? Toutefois, ces sources restent un bon moyen de contrôle ou d'étude d'un suffixe particulier, comme l'ont montré Plénat & al (2002). 343 Chapitre 5 – Constitution de la base de données Une base de données constituée dans le cadre de l'Analyse et Traitement Informatique de la Langue Française (atilf) de l'Institut National de la Langue Française (INaLF, actuellement Institut de Linguistique Française) du Centre National de la Recherche Scientifique (CNRS) était également intéressante a priori pour la constitution d'un corpus cherchant à éclaircir les conditions d'occurrence des épenthèses consonantiques entre radical et suffixe. Il s'agit de la Base d'Observation et de Recherche des Néologismes (Bornéo), qui est un recueil de néologismes relevés "dans des énoncés de presse contemporaine" entre 1976 et 1997. De ce fait, elle était également fort tentante dans le cadre d'une analyse comme la mienne. En effet, les néologismes sont une garantie d'actualité pour une éventuelle épenthèse. Cependant, le mode d'interrogation de la base (mode de recherche Stella), en tout cas au moment de la rédaction de cette thèse, ne permet pas l'extraction de termes épenthésés puisque la recherche de termes se fait au moyen de mots, d'expressions ou de la flexion des mots, mais pas par chaîne de caractères participant à un mot. Il n'est donc pas possible d'extraire la liste des termes se terminant par tel ou tel suffixe ce qui, sans permettre l'extraction directe de termes contenant une épenthèse, aurait néanmoins permis d'étudier plus précisément un suffixe particulier. C'est pourquoi les ressources présentes dans cette base n'ont malheureusement pas pu être exploitées. Parmi les ressources effectivement utilisées dans le cadre de ce travail figure tout d'abord un recueil de termes français disponible sur ordinateur, ceci permettant un traitement en partie automatisé. 1.2. Liste informatisée de 64.296 mots du français (A) La base de départ de cette source de mots construits contenant des épenthèses est une liste informatisée de 64.296 mots français établie par le laboratoire Langues, textes, traitement informatique, cognition (Lattice, UMR 8094) pour les besoins du traitement automatique des langues, modifiée par quelques ajouts et troncations personnels, lorsque certains termes se sont révélés inattestés (cachoutanique par exemple) ou manifestement le produit d'erreurs de traitement. Cette liste a été exploitée sous le logiciel de gestion de bases de données Access, de façon à en faciliter le tri et à autoriser la recherche de séquences intérieures de mot. 344 Chapitre 5 – Constitution de la base de données 1.2.1. Méthode et justification L'idée sous-tendant la méthode d'extraction des unités lexicales comprenant une épenthèse est la suivante : si une unité lexicale comporte une épenthèse entre le thème et le suffixe, cette épenthèse n'appartient ni au thème ni au suffixe, selon les définitions données à "thème" et à "suffixe" dans la partie sur les suffixes (cf. section 3.1) : un thème se définit par rapport à toutes les unités lexicales associant un même sens à une même forme (pour les alternances de radicaux, cf. section 1.2.5.1) ; un suffixe est considéré comme tel s'il se retrouve avec le même sens ou un sens voisin, et la même forme. La démarche envisagée serait donc dans un premier temps d'écarter les préfixes puis les accents graphiques (aigus, graves, circonflexes), pour par la suite comparer automatiquement les formes ainsi obtenues entre elles, en commençant par la gauche pour isoler les thèmes, puis par la droite pour déceler les suffixes en reprenant ces formes une deuxième fois. 1.2.2. Traitement préalable du corpus Ce traitement n'a ni la prétention ni la vocation d'être linguistique. Il s'agit d'une analyse portant sur des chaînes de caractères, ayant pour but de permettre au programme informatique leur examen. A cette étape de la création du corpus en effet, il n'est fait nul appel au sens ni même à un pré-découpage en morphèmes ; l'objectif est d'obtenir une première "récolte" se basant uniquement sur la comparaison des unités lexicales entre elles et non sur une liste de suffixes préalablement insérée, qui ne serait pas complètement objective puisqu'elle constituerait nécessairement le fruit d'une analyse antérieure. La première étape de la préparation du corpus consiste à retirer les préfixes des unités lexicales en comportant, de façon à accéder directement aux thèmes. Pour ce faire, j'ai utilisé la liste des préfixes du français offerte par le Tlfi (cf. annexe 1n), et ai procédé à un "découpage" informatique avec vérification manuelle, faisant ainsi intervenir cette liste de manière raisonnée. Utiliser une liste pré-existante de préfixes est moins dangereux dans le protocole de préparation que d'exploiter une telle liste concernant les suffixes, dans le sens où l'analyse ne porte pas sur les préfixes. Par ailleurs, la démarche se devait d'être au moins partiellement manuelle, car une extraction automatique aurait conduit à nombre d'amputations injustifiées, et de ce fait la part de subjectivité tant redoutée pour les suffixes était de toute façon nécessaire en ce qui concerne le traitement des préfixes. En effet, "il n'est (…) pas 345 Chapitre 5 – Constitution de la base de données surprenant que beaucoup de mots simples commencent ou se terminent par une séquence de phonèmes identique à un affixe." (Apothéloz 2002 : 68). Pour s'en convaincre, prenons le cas du préfixe ré-, que l'on trouve dans des termes comme réinsérer, réouverture, réorienter, réopérer, réorganisateur, etc, mais qui semble également formellement présent dans les unités lexicales réaliser, rétamer, résilier, répulsif, réputation, réprimander, réussir, répéter, répondre, répartir, etc. Un traitement automatique aurait supprimé le préfixe de la première série de termes, permettant d'obtenir respectivement insérer, ouverture, orienter, opérer et organisateur. Mais cette découpe aveugle laisserait également des segments orphelins tels que -aliser, -tamer, -silier, -primande, -ussir, aussi bien que des segments qui se confondraient avec des termes appartenant à d'autres familles lexicales : -péter, -putation, -pulsif, -pondre, -partir, etc. Il ne s'agit pas d'un cas d'homographie isolée, comme en témoigne l'allomorphe représent dans retravailler, resituer, refaire, mais dont la graphie se retrouve aussi dans rectifier, responsabilité, remiser ou restaurer. Pour ceux-ci, supprimer ces deux lettres leur feraient perdre leur sens – et leur famille10. La suite graphique sur- est dans le même cas : préfixe dans surabondance, suraigu ou surdéveloppé, elle n'est que partie de morphème dans surdité, suranné ou surplomb (le rapport avec plomb n'étant pas immédiat…) ; la variante imdu préfixe privatif, que l'on trouve par exemple dans imperturbable, improbable, immortel se révèle indissociable de sa suite dans imagé, imiter, imposable (malheureusement pas "ce qu'on ne peut poser"), imprimable (qui n'est pas "ce à quoi on ne peut donner de prix" ou "ce qu'on ne peut primer") ; dé-, préfixe dans défriper, défroisser ou dégarnir n'a plus le même statut dans déguiser ou délai, et n'indique en aucun cas un lien sémantique entre déterminer et terminer. La méthode employée pour isoler les préfixes a donc consisté à prendre une liste de préfixes, en l'occurrence celle fournie par le TLFi, et à partir de cette liste et du lexique informatisé à notre disposition, d'isoler les listes de mots commençant par chaque préfixe. Chaque unité lexicale a ensuite été analysée "humainement" pour déterminer si la séquence 10 Jalenques (2001) propose une analyse sémantique synchronique du cas de figure dans lequel "la forme préfixale est morphologiquement identifiable au préfixe RE, mais dont le sens n'est pas intuitivement perçu comme compositionnel par rapport au sens de RE et à celui de la base (tels que renier, remarquer, regarder)" (2001 : 39). Le traitement que j'applique ici n'est pas linguistique mais pratique, il vise à permettre l'identification de bases sans faire appel à la sémantique, aussi ai-je traité des verbes comme ceux cités par Jalenques comme des dérivés de nier, marquer et garder respectivement, sans que cela implique un quelconque parti pris linguistique. 346 Chapitre 5 – Constitution de la base de données initiale était réellement un préfixe ou une simple homographie. Dans les cas où il s'agissait réellement d'un préfixe, c'est-à-dire pour lesquelles l'ablation du préfixe laissait un segment identifiable en tant que base, le préfixe a été ôté. L'étape finale a consisté à reprendre l'ensemble du dictionnaire travaillé dans ce sens et à éliminer les doublons. Une question peut ici se poser : n'aurait-il pas été plus simple de supprimer directement les termes identifiés comme préfixés ? La réponse se trouve dans la position que j'ai choisi de tenir en ce qui concerne les dérivés parasynthétiques, cf. section 3.7.4. Du fait que j'adhère à l'hypothèse des bases virtuelles, ôter les préfixes peut laisser des formes non attestées (°largir sur élargir, °richir sur enrichir, etc.) mais correspondant à un radical français (large, riche). Pour les cas où le doute était permis, le contrôle par le dictionnaire du TLF a levé l'ambiguïté et permis de prendre une décision. Pour les cas où le préfixe était en cours de perte d'identité, mon choix a évidemment été subjectif : ce qui me semblait facilement identifiable comme base, soit par rapport à une base existant effectivement, soit par rapport à une base qui se dégageait de plusieurs mots préfixés (par exemple -scription sur suscription, inscription, description), a été conservé. Des unités lexicales comme encombrer en revanche, formé sur l'ancien français combre à l'aide du préfixe en-, n'ont pas été décomposées, le préfixe n'étant plus guère analysable comme tel en synchronie. Un second travail préliminaire à toute comparaison a consisté à éliminer les accents du corpus, c'est-à-dire à remplacer notamment tous les é et è par un simple e. Cette étape se situait nécessairement après l'ablation des préfixes, au moins pour la commodité du travail manuel. Ôter les accents a permis d'être en mesure de comparer sévère avec sévérité par exemple, c'est-à-dire des unités lexicales de même famille qui portent des accents différents, que l'ordinateur n'aurait par la suite pas reconnus comme tel ; les mots sans accents pourront également être mis en regard des mots accentués correspondants, comme dans le cas de liberté et libérer, café et cafetier ou cafetier et cafetière… En ce qui concerne l'accent circonflexe, la "traduction" n'est pas un e simple mais une séquence es, de façon à mettre sur le même plan forêt et forestier ou ancêtre et ancestral par exemple. Il est vrai que dans une analyse purement synchronique, ces deux unités lexicales ne devraient pas être mises au même niveau puisque précisément la base n'est pas la même ; il me semble cependant que les locuteurs français identifient bien forestier comme étant de la même famille que forêt, c'est pourquoi j'ai gardé cette identité commune. Dans le cas où toutes les unités lexicales d'une famille donnée n'ont que la variante avec accent, sans 347 Chapitre 5 – Constitution de la base de données alternance avec la variante en -s, le passage du ê à es ne change rien à la comparaison terme à terme future : blême, blêmir, blêmissement seront analysées comme appartenant à une seule famille, même si ces unités lexicales sont présentées sous la forme blesme, blesmir, blesmissement. Quelques cas isolés d'homonymie causée par cette traduction, comme apprêter qui, sans son préfixe et l'accent converti en s, peut être assimilé à la famille de preste, ne m'ont pas semblé suffisants pour rejeter la formule de conversion. Appliquer le même mécanisme aux autres voyelles se révèle inutile dans le cas de î et û. En effet, le peu de cas avérés d'alternances possibles connaissent une modification supplémentaire du terme, ce qui signifie que même si l'on remplace û par us, l'ordinateur ne sera pas en mesure de coupler les termes de même famille : goût alterne certes avec un radical comportant un -s, mais qui de plus est privé de la lettre o (gustatif). En ce qui concerne â, deux cas sur les trois relevés subissent également une transformation supplémentaire : pâques alterne avec pascal, c'est-à-dire qu'à l'ajout du s est couplé une modification de la consonne graphique ; château et castel ont bien la même origine et ont toutes les chances d'être identifiés par les locuteurs comme faisant partie de la même famille, mais le -h- présent dans l'un et non dans l'autre interdit pareille identification par la machine. Dans le cas de ô, le remplacement de la lettre accentuée par la séquence -os- est pertinent pour deux cas uniquement : côte / costal et hôpital / hospitalier. Pour peu rentable que soit le traitement de ces voyelles, il ne crée qu'un seul problème de confusion avec d'autres unités lexicales : remplacer â par -as- confondra la famille de pâtisserie avec pastis. L'objectif n'étant pas à cet endroit linguistique mais uniquement graphique, les voyelles comportant un accent circonflexe ont donc été modifiées manuellement dans le cas des voyelles autres que e de façon à éviter l'appariement malheureux de pastis et pâtisserie, et le changement de ê par -es- a quant à lui été implémenté automatiquement. A l'intérieur de cette partie consacrée à l'harmonisation du corpus se trouve également, après la suppression des préfixes et le traitement des accents, la conversion de ç en c, de façon à être en mesure de comparer des termes comme glaçon et glace, amorçage et amorcer, effaçable et effacer, etc. Bien sûr, ceci mettra également en regard des termes n'ayant synchroniquement plus aucun lien, comme garçon et garce, mais ce manque de lien synchronique (excepté, selon le Robert Etymologique, dans la région méditerranéenne où garce a gardé son sens de "jeune fille", féminin de gars) est dû à des raisons sémantiques dont je ne peux traiter dans cette thèse. 348 Chapitre 5 – Constitution de la base de données Ce corpus une fois travaillé dans le sens de l'harmonisation des thèmes, la comparaison terme à terme est alors possible. Cette comparaison va se faire en deux temps : tout d'abord par la gauche, puis par la droite. 1.2.3. Comparaison des unités lexicales par la gauche Comparer les unités lexicales par la gauche permet d'isoler des séquences communes, qui doivent alors correspondre à des thèmes. Ce travail ne sera pas effectué manuellement mais automatiquement, à partir d'un programme baptisé "épenthèse" réalisé par Yvon Deschamps, maître de conférences de la faculté d'Orsay, pour les besoins de cette thèse, en fonction de la méthode détaillée ci-dessous. Il est nécessaire de commencer par rechercher les séquences communes les plus longues possibles, de façon à obtenir des thèmes et non une liste en ordre alphabétique, ce que nous aurions si nous avions commencé par une séquence commune la plus courte possible. Pour s'en convaincre et expliciter pleinement la démarche, analysons le petit corpus suivant à la manière de l'ordinateur : (1). néon (2). nu (3). nudité (4). nuire (5). nuisible (6). nuit (7). nuitée Si l'ordinateur commence par rechercher la séquence commune la plus courte, il gardera l'ordre alphabétique de ce corpus : la séquence commune la plus courte est la lettre n… L'ordinateur va donc commencer par chercher la séquence commune la plus longue possible. Dans ce corpus, la séquence la plus longue est de huit caractères ; a priori, les doublons ayant été éliminés il ne peut y avoir deux séquences avec huit caractères identiques. L'ordinateur va donc passer à 7, en ne regardant que les séquences de plus de sept caractères, en l'occurrence ici uniquement nuisible (huit caractères). Ne trouvant toujours pas deux séquences comportant le nombre de caractères communs requis, l'ordinateur va essayer 6, puis 5, puis 4 caractères. A cette étape de la recherche, il isole les séquences (6) et (7) qui ont quatre caractères communs, et les déclare comme étant de la même famille. Il les enlève alors 349 Chapitre 5 – Constitution de la base de données du corpus pour les mettre dans un fichier à part (B), dans lequel le radical est isolé de la terminaison. Voici schématiquement l'état du travail à cette étape : (9) Fichier A (1) (2) (3) (4) (5) Fichier B néon nu nudité nuire nuisible (1) (2) nuit nuit ée Puis l'ordinateur continue son travail de comparaison avec 3 éléments communs ; l'état des deux fichiers devient alors le suivant : (10) Fichier A (1) (2) (3) néon nu nudité Fichier B (1) (2) (3) (4) nuit nuit nui nui ée r sible Avec deux caractères communs, nous obtenons : (11) Fichier A (1) néon Fichier B (1) (2) (3) (4) (5) (6) nuit nuit nui nui nu nu ée r sible dité A la fin du travail, il ne reste plus dans le fichier A que les unités lexicales n'ayant pas de "partenaire", c'est-à-dire néon dans le cas de ce petit corpus de démonstration, mais dans le cadre du corpus de 64.296 termes chaque terme "seul" se trouve accouplé avec au moins un autre terme "seul" commençant par la même lettre. Dans le cadre général de ce travail, il a été proposé à l'ordinateur de commencer par rechercher 13 caractères communs, puis 12, puis 11, etc, en enlevant du Fichier A les unités lexicales correspondantes dès qu'elles étaient trouvées. Le but est en effet d'éviter que nuitée ne se retrouve en comparaison avec nuisible ou nu, dès lors que son partenaire a été établi. 350 Chapitre 5 – Constitution de la base de données Cette première comparaison effectuée, il va ensuite être demandé à l'ordinateur de travailler à partir du "déchet", c'est-à-dire de ce que l'ordinateur a établi ne pas être le radical, ce qui se trouve dans notre exemple dans la troisième colonne du fichier B. 1.2.4. Comparaison du "déchet" par la droite Il s'agit donc maintenant de distinguer les suffixes et de les écarter, pour qu'il ne reste que la consonne (ou voyelle) épenthétique. A cet endroit une question peut se poser : pourquoi ne pas partir d'une liste de suffixes, de la même manière que j'ai utilisé une liste de préfixes pour mieux les éliminer ? Mon but était de construire une base de travail objective, sans me laisser influencer, autant que possible, par d'autres travaux. Là encore, on part de la séquence la plus longue possible ; dans le cas contraire, l'ordinateur fournira la liste de tous les suffixes se terminant par exemple par -e, ceux se terminant par -r, ceux se terminant en -x, etc, classant en "épenthèse" tous les caractères précédents. Prenons par exemple les suffixes -ique, -iste, -isme et -ité, ce dernier ayant perdu son accent lors des préliminaires à la comparaison ; comme tous se terminent par -e, si l'ordinateur commençait par la séquence commune la plus courte il considérerait que -iqu-, ist-, -ism- et -it- sont des épenthèses. Afin de mieux appréhender le mode de fonctionnement du processus en jeu ici, considérons une nouvelle fois un corpus illustratif ; il s'agit d'un corpus de "déchets", dont la provenance est allouée entre parenthèses : (1). sible (2). ible (3). teur (4). teur (5). er (6). ter (nuisible comparé avec nuit, reste -sible) (conductible comparé avec conducteur, reste -ible) (folioteur comparé avec folio, reste -teur) (agioteur comparé avec agio, reste -teur) (accidenter comparé avec accident, reste -er) (abriter comparé avec abri, rester -ter) L'ordinateur va commencer par chercher la séquence la plus longue possible. Une différence notable entre cette étape de comparaison et la précédente est que les doublons sont cette fois non seulement admis mais même supposément fréquents, étant donné que l'on doit trouver dans cette partie "déchets" notamment les suffixes qui sont employés sans épenthèse. Les doublons étant permis dans ce corpus, comme l'illustrent par exemple les séquences (3) et (4), la comparaison doit s'effectuer à partir du nombre maximal de caractères présent dans une séquence, 5 en l'occurrence dans notre corpus. La séquence sible n'est présente qu'une fois, 351 Chapitre 5 – Constitution de la base de données l'ordinateur peut donc passer à la comparaison de 4 caractères. Cette fois il trouve bien une coïncidence entre les deux premières séquences, ce qui lui permet d'isoler -s-. Par ailleurs, l'ordinateur compare les séquences (3) et (4) et identifie la même séquence, ce qui lui permet de la basculer dans le fichier C de résultats. Nous obtenons alors les deux fichiers suivants : (12) Fichier B (1) (2) accident abri er ter (1) (2) (3) (4) s Fichier C ible ible teur teur nuisible conductible folioteur agioteur La recherche de trois caractères communs reste sans résultat, mais l'ordinateur obtient des résultats pour deux caractères communs, donnant aux fichiers l'allure suivante : (13) Fichier B (1) (2) (3) (4) (5) (6) s t Fichier C ible ible teur teur er er nuisible conductible folioteur agioteur accidenter abriter Le fichier C comporte alors, en regard du terme analysé, le suffixe isolé par comparaison et surtout l'éventuelle consonne intermédiaire : s pour nuisible, t pour abriter. Récapitulons les étapes de dépouillement de la base de données initiale dans le tableau suivant, qui met en évidence le fonctionnement du protocole au travers d'un mini-corpus composé des unités lexicales forêt, déforestation, glace, déglaçage, remorquage, remorque, déglutir, déglutition : 352 Chapitre 5 – Constitution de la base de données (14) 0. 1. 2. 3. 4. 5. Etapes du traitement corpus brut élision des préfixes traitement des accents traitement du ç comparaison par la gauche, en commençant par la séquence la plus longue comparaison par la droite, en commençant par la séquence la plus longue exemples forêt forêt déforestation glace déglaçage remorquage remorque déglutir déglutition glace glaçage remorquage remorque déglutir déglutition forestation forest forestation glace glaçage remorquage remorque deglutir deglutition forest forestation glace glacage remorquage remorque deglutir déglutition ø ation e age age e r tion ø a ø ø ø ø r ø La première étape consiste à ôter les préfixes. Dans le mini-corpus proposé, six séquences comportent à l'initiale une suite de lettres pouvant correspondre à un préfixe : déforestation, déglaçage, remorquage, remorque, déglutir, déglutition. Pourtant, seules deux d'entre elles vont se retrouver amputées, le traitement manuel permettant de "sauver" remorque et remorquage d'une part, déglutir et déglutition d'autre part : *morque et *glutir ne sont ni des unités lexicales attestées en français, ni même possibles par commutation avec d'autres unités si l'on tient un tant soit peu compte du signifié. L'étape suivante, à savoir le traitement des accents, permet d'une part de convertir le ê de forêt en la séquence -es-, d'autre part d'ôter les accents des "faux préfixes" de déglutir et déglutition. On obtient alors respectivement forest, deglutir et deglutition. Le traitement du ç constitue la dernière étape du traitement préalable du corpus. Dans les exemples donnés dans le tableau, seul glaçage est concerné et se voit transformé en glacage. Les étapes cinq et six sont celles que l'on trouve dans le programme Epenthèse. Il s'agit de la comparaison des éléments, par la gauche d'abord, puis par la droite de ce qui reste. Forêt, réécrit forest, et forestation permettent d'isoler la séquence -ation. Glace et glacage, anciennement glaçage, détachent -age d'un côté et -e de l'autre, de même que 353 Chapitre 5 – Constitution de la base de données remorquage et remorquer. La comparaison de déglutir et déglutition met quant à elle en évidence les terminaisons -r et -tion. La dernière étape du processus consiste à comparer ces terminaisons en commençant par la séquence la plus longue et par la droite. Si l'on ne commençait pas par la séquence la plus longue mais la plus courte, on obtiendrait -ag- pour -age comparé avec -e, ce qui serait une aberration au regard de l'objectif poursuivi. En commençant par la séquence la plus longue sont isolés -a- à partir de -ation et -tion, puis -r puisque ce mini-corpus n'en comporte pas d'autre. Cette méthode de travail, très rigoureuse et efficace sur le papier, a rencontré dans les faits un certain nombre de problèmes que je vais détailler dans la section suivante. 1.2.5. Obstacles et difficultés En effet se sont révélées toutes sortes de "complications", telles que les alternances de radicaux et de suffixes, les homographes partiels ou totaux, des unités lexicales de même famille présentant une même épenthèse, un suffixe donné présentant systématiquement la même épenthèse, enfin le fait que la graphie masque certaines épenthèses. Puisque l'idée développée ici est le traitement automatique de la liste de 64.296 mots, cette partie abordera ces différents points sous l'angle de la graphie et non de la phonologie ou de la sémantique. 1.2.5.1. Alternances de radicaux Les alternances de radicaux, auxquelles il a été fait allusion dans le chapitre 4 (section 3.1.2), constituent un premier obstacle à une recherche automatique de termes épenthésés. Je n'inclus pas dans ce chapitre les alternances avec radicaux savants de type crédible / croire, extinction / éteindre, pour lesquels le radical n'est pas prévisible à partir de la base. Lehmann & Martin-Berthet (1998 : 139) précisent que "du point de vue historique, ce sont des radicaux savants (…). Le locuteur rencontrant alacrité ne le mettra peut-être pas en relation avec allègre, et il faut connaître l'étymologie pour savoir que diurne est une forme savante de jour". Du fait que mon analyse se veut synchronique, opérable à un moment donné quel que soit ce moment, un appel obligatoire à l'étymologie dans la définition des radicaux ne peut y prendre place. Pour la même raison et de manière encore plus évidente, j'écarte du corpus les radicaux supplétifs, pour lesquels "la forme du radical est totalement différente de celle du 354 Chapitre 5 – Constitution de la base de données mot avec lequel le dérivé est en relation" (Lehmann & Martin-Berthet 1998 : 139) puisque l'étymologie de la "base" est différente de l'étymologie du radical ; c'est le cas des paires céc(ité) / aveugle, lud-(ique) / jeu par exemple. Certaines variations radicales, bien que classées parmi les variations savantes du fait qu'il y a opposition entre radical savant, emprunté au latin ou au grec et peu modifié, et radical populaire, qui a subi l'évolution phonétique du français, obéissent à des règles. Le locuteur identifie alors les deux radicaux comme étant de la même famille. C'est le cas de v qui alterne avec p devant -tion (recevoir / réception, percevoir / perception, concevoir / conception, décevoir / déception, leurs dérivés et composés) ; [E] en syllabe fermée alterne avec [e] en syllabe ouverte, ce qui avait déjà été partiellement corrigé par l'ablation des accents mais qui subsiste dans des termes comme peine / pénal ; la séquence -eux en fin d'adjectif est remplacée par -os dans la formation des dérivés en -ité, comme dans sinueux / sinuosité, adipeux / adiposité, religieux / religiosité, contagieux / contagiosité, etc. ; la suite graphique -qu- est remplacée par -c- dans les dérivés d'adjectifs en -ique (informatique / informaticien, mécanique / mécanicien, technique / technicien, etc.) mais également dans les dérivés suffixés de verbes en -quer (fabriquer / fabrication, abdiquer / abdication, alterquer / altercation, etc.) ; les substantifs en -eur à partir desquels il y a dérivation avec le suffixe -iser voient ce -eur remplacé par -or (faveur / favoriser, terreur / terroriser, valeur / valoriser, etc.) ; les verbes en -ettre voient leurs dérivés en -ion exiger une modification en -iss- : admettre / admission, commettre / commission, permettre / permission, etc. ; lorsqu'on forme un dérivé à partir des adjectifs en -ible et en -able, la terminaison de l'adjectif est modifiée en -ibil- (sensible / sensibilité, perceptible / perceptibilité, amovible / amovibilité, etc.) et -abil(adaptable / adaptabilité, calculable / calculabilité, implacable / implacabilité, etc) respectivement ; etc… Ces modifications de radical sont implémentables dans l'ordinateur : si je ne peux pas lui demander par exemple de remplacer tous les v par p au risque que l'on confonde pie et vie, valve et palpe, vulve et pulpe, etc., il est possible en revanche de remplacer -ption- par -vtion-, c'est-à-dire l'ensemble de la séquence comprenant la lettre à changer et le contexte (57 termes concernés dans le corpus de départ). Indiquer par un espace final la fin de mot (-ption -) n'est pas nécessaire car les unités comprenant la séquence -ption- en leur sein sont issues de séquences la comprenant à la finale : les seules unités recensées dans ce cas à partir du corpus 355 Chapitre 5 – Constitution de la base de données de départ sont réceptionner, réceptionnaire, réceptionniste < réception ; optionnel (puis optionnellement) < option, exceptionnel (puis exceptionnellement) < exception ; perceptionnisme < perception ; anticonceptionnel < conception. De la même manière, il faudrait remplacer la séquence -osité- par -euxité- (53 termes dans le corpus de départ) de façon à rendre compte de la parenté de monstruosité avec monstrueux par exemple. Outre le fait de permettre la reconnaissance des termes de même famille, un autre avantage serait de déterminer clairement quelle est la base de l'unité lexicale adiposité, puisque adipeux comme adipose existent, et donc de lever l'ambiguïté de sa formation. Pour l'unité lexicale rugosité se pose le problème du u qui sera absent après le g dans la forme modifiée rugeuxité, empêchant l'identification du substantif avec l'adjectif rugueux, mais cette identification n'aurait de toute façon pas été possible en gardant l'orthographe "normale". Un problème se pose en revanche en ce qui concerne les unités morosité et virtuosité, dans le sens où elles ne proviennent pas d'adjectifs en -eux mais bien d'adjectifs en -ose, et que la réécriture *moreuxité et *virtueuxité empêche d'identifier les substantifs en -ité avec les adjectifs en -ose correspondants morose et virtuose. Le corpus de départ recense quelques 259 unités lexicales comprenant la suite graphique -ei- mais sans être -ein-, -oei- et -uei-, dont 76 en syllabe fermée (je considérerai que des séquences -ei- suivies d'une syllabe dont la voyelle est un schwa, comme appareillement, sont en réalité en syllabe fermée, cf. Rizzolo 2002) et 161 en syllabe ouverte (22 sont des emprunts dont la prononciation en français est restée proche de la prononciation d'origine et ne peut donc pas s'assimiler à [-] ou [e] : geischa, reichstag, lei…). Il est donc difficile de soutenir que la graphie -ei- soit la marque de la syllabe ouverte par opposition à la syllabe fermée ! En réalité, il semble que l'exemple de peine / pénal soit idiosyncratique, et que seule cette paire soit à modifier. Remplacer -ique- par -ice- ne pose pas de problème (4901 termes en -ique- dans le corpus de départ, 80 en -icité, 36 en -ication provenant de verbes en -iquer sur 194 en -ication au total) car cette modification s'applique aussi bien aux adjectifs en -ique (électrique sera converti en électrice de façon à pouvoir être comparé avec électricité ; domestique réécrit en domesticité sera facilement assimilable à la famille de domesticité ; authentique retranscrit en authentice est maintenant confrontable à authenticité ; etc.) qu'aux adverbes qui en sont 356 Chapitre 5 – Constitution de la base de données dérivés (électriquement, domestiquement, authentiquement, etc.), ainsi qu'aux verbes en iquer (mastiquer réécrit masticer sera facilement mis en relation avec mastication ; répliquer sera traduit par l'ordinateur en réplicer, permettant de le comparer aisément avec réplication ; intoxiquer sera identifié comme étant de la même famille que intoxication sous l'habillage intoxicer ; etc.). Trois remarques sont à évoquer ici. Tout d'abord le fait que dans le corpus de départ ont pu être isolées 80 unités lexicales ne correspondant ni à un adjectif en -ique, ni à un adverbe en -iquement, ni à un verbe en -iquer : une première série rassemblant des termes tels que belliqueux, briquet, tourniquet, etc., pour lesquels la modification ne semble pas causer de problème puisqu'ils sont soit seuls dans leur famille (tourniquet), soit à la base de dérivés qui seront eux aussi modifiés (belliqueux, briquet) ; un deuxième ensemble comprenant des unités lexicales comme chiqueur, critiqueur, trafiqueur, etc., pour lesquels non seulement la modification ne pose pas de problème mais est nécessaire, de façon à pouvoir identifier ces dérivés de verbes en -er avec leurs bases qui, elles, auront été modifiées. Par ailleurs, en ce qui concerne les 4785 termes en -ique qui n'ont pas de dérivé en icité ni en -ication, la modification de -qu- par -c- ne semble pas poser de problème. Prenons par exemple l'adjectif et substantif dynamique et regardons l'ensemble des unités lexicales de sa famille : dynamicien, dynamiquement, dynamisation, dynamiser, dynamisme et dynamiste ; pour les deux premiers termes, soit le -c- est déjà présent, soit il va intervenir lors de la conversion de -qu- en -c- ; pour les quatre derniers, la lettre suivant le -i- n'est de toute façon ni -q-, ni -c-, la transformation n'aura donc aucune conséquence néfaste quant à l'identification de la famille. En outre, la proximité des familles de dynamique et de dynamite n'est pas "aggravée" par un caractère commun supplémentaire. Le troisième point à relever ici concerne plus particulièrement les termes en -ication dont 36 sur 194 seulement proviennent de termes en -iquer. La majeure partie de ces substantifs – 148 – sont en relation avec des verbes en -er sans -iqu-, en -ifier le plus souvent : notifier / notification, purifier / purification, simplifier / simplification, mais aussi multiplier / multiplication. Aucun de ceux-là n'est affecté par la modification qui touche les séquences -ique-. En revanche, ce ne sont pas seulement les verbes en -iquer qui sont susceptibles d'alterner avec -ication, mais également d'autres verbes en -quer. Le corpus de départ rassemble 293 verbes en -quer, dont 196 en -iquer (qui aura à cette étape déjà été traité par le remplacement de "ique" en "ice"). Trois cas majoritaires se décèlent : le type "éduquer / éducation", dans lequel le -qu- passe à -c- ; le type "bloc / bloquer / blocage", dans lequel le 357 Chapitre 5 – Constitution de la base de données qu- alterne avec un -c- en amont comme en aval ; le type "arnaquer / arnaque", dans lequel il n'y a pas d'alternance. Dans le cas d'alternance, remplacer -qu- par -c- permet l'harmonisation, dans le cas où l'on trouve -qu- dans toutes les formes, le remplacer partout par -cn'empêchera pas l'identification. De la même manière, harmoniser les substantifs en -eur avec leurs dérivés en -iser semble pouvoir se faire simplement, en sélectionnant dans le corpus de départ tous les verbes se terminant par la séquence -oriser et en les remplaçant par -euriser. Ainsi un substantif tel que faveur ou terreur sera-t-il par la suite aisément reconnu par l'ordinateur comme étant de la même famille que favoriser retranscrit faveuriser ou terroriser réécrit terreuriser. Or dans le corpus de départ sont recensés 51 verbes en -oriser, dont 24 seulement sont en relation avec des substantifs en -eur (moteur / motoriser et remotoriser, inférieur / inférioriser, facteur / factoriser, vapeur / vaporiser, etc.). Les 27 verbes restants sont également de formation savante mais pour eux, soit la base ne se retrouve pas directement en français actuel car le substantif en -eur correspondant n'existe pas (arboriser / *arbeur ; herboriser / *herbeur, est donné par le Robert Etymologique comme dérivé de herboriste ; autoriser / *auteur, la retranscription aboutirait ici à une confusion de familles lexicales ; corporiser / *corpeur ; temporiser / *tempeur ; marmoriser / *marmeur) ; soit ils sont issus d'adjectifs ou de substantifs en -ore (sonoriser / sonore et ses trois dérivés, métaphoriser / métaphore, phosphoriser / phosphore, météoriser / météore) ; soit ils sont en relation avec des substantifs ou des noms propres en -or (sponsoriser / sponsor, ténoriser / ténor, transistoriser / transistor, fluoriser / fluor, tayloriser / Taylor) ; pour d'autres la base est un substantif en -ie, à laquelle a été adjoint le suffixe -iser ou -er (allégoriser / allégorie, catégoriser / catégorie et son dérivé recatégoriser, euphoriser / euphorie ou euphorique, théoriser / théorie, caloriser / calorie ou calorique) ; d'autres encore sont à associer à des unités en -oire (historiser / histoire ou historique, mémoriser / mémoire) ; reste enfin mordoriser, probablement issu de mordoré mais dont l'étymologie n'a été confirmée ni par le Robert Etymologique ni par le TLF. Pour ces 27 verbes non issus de substantifs en -eur, quelle serait la conséquence d'une retranscription abusive ? En d'autres termes, remplacer automatiquement -or- devant -iser par -eur- bloquerait-il de quelque manière que ce soit l'identification de familles lexicales ? Un premier élément de réponse se trouve dans le fait que les verbes en -oriser, qu'ils proviennent de termes en -eur ou pas, ont à leur tour produit des dérivés, notamment en -ation : inférioriser / infériorisation, factoriser / factorisation, valoriser / valorisation, etc., pour les 358 Chapitre 5 – Constitution de la base de données verbes en relation avec des substantifs en -eur ; phosphoriser / phosphorisation, sponsoriser / sponsorisation, mémoriser / mémorisation, etc. pour les verbes d'autres provenances. Il faudrait alors, toujours pour sauvegarder l'intégrité des familles lexicales, modifier également -or- en -eur- dans ce contexte et dans tous les autres correspondant à des dérivés possibles des verbes en -oriser. Ceci reviendrait peu ou prou à modifier toute séquence -oris- du corpus de départ, soit 177 unités lexicales. Parmi ces 177 unités, 51 sont les verbes en -oriser comme factoriser, déjà traités plus haut ; 40 sont des substantifs en -orisation tels que factorisation, également mentionnés précédemment ; 25 sont des substantifs en -orisme (pythagorisme, phosphorisme, rigorisme, etc.) ; on trouve 20 substantifs en -oriste (rigoriste, folkloriste, terroriste, etc.) ; puis pêle-mêle 7 termes en -orisant (désodorisant, dévalorisant, euphorisant, historisant, ténorisant, terrorisant, valorisant), 6 -oristique (aoristique, aphoristique, aprioristique, floristique, humoristique, hypocoristique), 6 -orisé (arborisé, autorisé, catégorisé, herborisé, réflectorisé, vélomotorisé), 6 -oris (clitoris, coloris, doris, favoris, loris, pyrrhocoris), 2 -orisable (autorisable, valorisable), 3 -orisateur (herborisateur, temporisateur, vaporisateur), 1 -orissement (endolorissement), 1 -orise (pyrocorise), 1 oristiquement (humoristiquement), 3 -oriseur (déodoriseur, vaporiseur, terroriseur), 1 orisage (vaporisage). Cette transformation de -oris- en -euris- n'occasionnerait pas de dommage dans la plupart des cas, mais il faut cependant garder à l'esprit deux familles de mots qui se trouveraient touchées par pareille manipulation : la famille correspondant à autoriser et celle correspondant à humoristique. Dans le premier cas, et comme il l'a déjà été noté plus haut, autoriser réécrit auteuriser apparenterait erronément le verbe et ses dérivés (autorisation, autorisable, autorisé) à la famille lexicale du terme auteur ; dans le deuxième cas, la confusion engendrée par la retranscription de -or- en -eur- rattacherait humoristique, humorisme, humoriste et humoristiquement à l'humeur et non à l'humour. Il semble donc que la retranscription de -oris- en -euris- ne se fasse pas sans quelques accrocs à l'intégrité du corpus. Un second élément de réponse, incontestable cette fois, est la perte de reconnaissance familiale d'une telle retranscription pour 21 des 27 verbes en -oriser mentionnés plus haut (les 21 derniers cités : sonoriser et ses trois dérivés, métaphoriser, phosphoriser, météoriser, sponsoriser, ténoriser, transistoriser, fluoriser, tayloriser, allégoriser, catégoriser, recatégoriser, euphoriser, théoriser, caloriser, historiser, mémoriser, mordoriser), puisque si l'on remplace par exemple sonoriser par soneuriser, l'ordinateur perdra le radical et ne verra que trois caractères communs avec sonore, au lieu de cinq. Remplacer la séquence -or- quel que soit le contexte environnant permettrait certes d'homogénéiser les termes d'une même 359 Chapitre 5 – Constitution de la base de données famille dans le cas présent, puisque sonore serait réécrit soneure et donc comparable avec soneuriser ; cependant, le nombre d'unités lexicales en -or- dans le corpus de départ s'élevant à 3576, il semble difficile d'être en mesure de contrôler toutes les conséquences d'une telle retranscription. De plus, ce travail serait nécessairement manuel et fastidieux, pour un résultat somme toute peu important en regard du but avoué de cette thèse. Examinons maintenant les substantifs en -ission correspondant à des verbes en -ettre. Le corpus de départ contient 25 substantifs en -ission, dont 18 sont en relation avec des verbes en -ettre : admettre / admission / réadmission, commettre / commission, compromettre / compromission, démettre / démission, émettre / émission / surémission, intromettre / intromission, omettre / omission, permettre / permission, réadmettre / réadmission, réémettre / réémission, remettre / rémission, soumettre / soumission / insoumission, transmettre / transmission / neurotransmission / retransmission / télétransmission / vidéotransmission. En revanche, si promission a bien été lié à promettre, il ne l'est plus synchroniquement, promettre étant maintenant en relation avec promesse ; il l'a pourtant été, et est noté comme "vieux ou littéraire" par le TLF. Repromettre souffrira une analyse identique. De même on mettra synchroniquement en relation mainmettre avec mainmise, mais mainmission existait en moyen français ; manumission, présent en synchronie, est rattaché à la fois par le sens et par l'étymologie à mainmettre, mais moins par la forme : lors de la recherche automatique l'ordinateur va rapidement le mettre de côté. Mission, si l'on s'en tient à la règle de correspondance entre les formes en -ission et les verbes en -ettre édictée plus haut, devrait être relié à mettre ; il s'agit là d'un mauvais partenariat, même s'ils sont effectivement reliés étymologiquement, puisque le sens synchronique n'est pas en relation : la mission n'est pas le résultat de mettre. Fission, scission et rescission n'ont pas de verbe correspondant en français actuel, ils seront considérés comme seuls représentants de leurs familles respectives, rescission étant éliminé à l'étape de l'enlèvement des préfixes. Le seul problème rencontré par le traitement automatique de -ission en -ettrion se porte sur mission et son assimilation avec la famille du verbe mettre. Le dernier cas de réécriture envisagé ici est celui concernant des alternances de type mer / maritime, clair / clarté, pour lesquels l'alternance est certes contextuellement justifiable par la présence vs. l'absence d'un morphème suffixal, mais que l'on ne peut en aucune manière implémenter dans l'ordinateur. Dans le corpus de départ en effet on dénombre 3209 termes comprenant la séquence -er- en leur sein (en-dehors de ceux la comprenant à la finale) ce qui 360 Chapitre 5 – Constitution de la base de données condamne un remplacement hâtif de -er- par -ar-, et 4777 termes comportant la suite graphique -ar-, ce qui engendre le même interdit ; le contexte n'étant pas son donné mais la présence d'une syllabe suivante, il ne reste aucun moyen de réécrire les termes de façon à faire apparaître leur lien de parenté. Certaines variations sont plus ponctuelles ; ainsi le -t final de court, fort et effort passant à -c- dans accourcir, forcir et efforcer ne subit pas la même modification en ce qui concerne désert, import et confort qui permettent de former respectivement déserter, importer et conforter ; un -x final (en-dehors de la terminaison -eux déjà traitée) se verra remplacé par ss- dans la création de certains dérivés (roux / roussir), par -c- pour d'autres (doux / douceur), ou encore par -s- (époux / épouser), cette variation n'étant nullement due à la qualité de la voyelle précédente, à la catégorie de la base ou à celle du dérivé ; un -d- devant le morphème infinitif de premier groupe sera remplacé lors de la dérivation tantôt par -s- (corroder / corrosion, décider / décision, tendre / tension, etc.), tantôt par -ss- (accéder / accession, concéder / concession, succéder / succession, etc.) ; dans le même contexte, un -t- sera parfois maintenu (affecter / affection, éditer / édition, compacter / compaction, etc.), parfois remplacé par -s- (apparemment deux cas seulement : convertir / conversion, pervertir / perversion et leurs dérivés), parfois remplacé par -ss- (discuter / discussion, percuter / percussion, connecter / connexion, etc.)… Dans tous ces cas, un traitement automatique de remplacement d'une ou de plusieurs lettres par une ou plusieurs autres ne donnera que peu de résultats pour beaucoup d'erreurs, c'est pourquoi il doit être rejeté. Il faudra donc tenir compte, dans les résultats finaux de recherche "automatique" de termes épenthésés, de ces variations qui produiront autant d'erreurs. Si beaucoup des allomorphies de radicaux peuvent somme toute être traitées de façon satisfaisante par l'ordinateur, qu'en est-il des allomorphies de suffixes ? 1.2.5.2. Allomorphies suffixales L'allomorphie de suffixes est si l'on peut dire plus "gênante", dans le sens où elle porte sur l'ajout ou l'enlèvement d'un son précisément à la frontière avec le morphème radical (cf. chapitre 4 section 3.5.2). Dans le cadre de cette étude, la confusion peut se faire entre une consonne allomorphique et une consonne épenthétique ; c'est pourquoi il est nécessaire de définir le plus précisément possible ce que l'on entend par allomorphie suffixale et ce qu'elle 361 Chapitre 5 – Constitution de la base de données recouvre concrètement dans un premier temps, puis de se pencher plus précisément sur des cas d'allomorphies suffixales faisant intervenir des consonnes à la frontière radical / suffixe. Prenons un cas d'allomorphie suffixale dans lequel les allomorphes peuvent comporter une initiale vocalique aussi bien que consonantique : le morphème /sjõ/ que l'on trouve sous les formes -tion (distribu + tion, conven + tion, prémuni + tion, contribu + tion, etc.), -ation (admir + ation, accélér + ation, harmonis + ation, etc.), -ition (abol + ition, fin + ition, pun + ition, mais aussi décompos + ition, impos + ition, inhib + ition, etc.) et -ion (édit + ion, adopt + ion, infus + ion, etc.)11. Un certain nombre de grammaires s'accordent pour donner tion comme forme de base du suffixe (par exemple Lehmann & Martin-Berthet 1998 : 140). Étudions de plus près la distribution de ces variantes. L'allomorphe -ition est présent à la finale de 105 unités lexicales du corpus de départ : 44 ne sont pas dérivés de verbes, au moins synchroniquement (dentition, partition, tradition, etc.) ; 5 sont dérivables synchroniquement de verbes du troisième groupe (apparition, réapparition, disparition, perdition, déperdition) ; seuls 15 proviennent de verbes en -ir (déglutition, punition, expédition, etc.) alors que 41 sont en relation avec des verbes en -er (déposition, imposition, superposition, etc.). Ces deux derniers nombres mettent à mal l'hypothèse selon laquelle la variante -ition apparaîtrait après les verbes en -ir. Il est à noter que dans le cas des 15 termes issus de verbes en -ir, le découpage est malaisé, comme nous l'avions noté dans le paragraphe concernant le morphème /-mã/ : faut-il considérer que le -i appartient au radical (puni + tion) ou qu'il est au contraire la propriété du suffixe (pun + ition) puisque le découpage du morphème verbal -ir laisse au radical cette forme sans -i ? Lehmann & Martin-Berthet (1998 : 141) proposent même de classer ce -i en voyelle de transition, donc de considérer qu'il n'appartient ni au radical, ni au suffixe. La quatrième possibilité logique serait que le radical comme la base comportent un -i, et que les deux -i en contact se seraient simplifiés en surface. Cette dernière hypothèse s'appuierait sur un parallèle fait avec les consonnes géminées (cf. Ségéral & Scheer 2001b). L'allomorphe -ation est présent en finale de quelque 2139 substantifs, dont on peut supposer qu'ils correspondent à des verbes en -er. On trouve la variante -tion non seulement éventuellement combinée avec des radicaux issus de verbes en -ir, comme nous l'avons vu plus haut (abolition, démolition, répartition, etc.), mais également avec des participes passés en -u (parution, irrésolution, etc.). 11 Je rappelle que je ne considère pas ici la parenté étymologique mais celle que l'on peut déceler en synchronie. 362 Chapitre 5 – Constitution de la base de données Un autre cas d'allomorphie suffixale concerne les suffixes -er et -iser. Le suffixe -iser est reconnu dans le TLF, qui lui donne le sens de "rendre" + adjectif (collectiviser, extérioriser, sensibiliser, etc.), "transformer en" + substantif (carboniser, miniaturiser, caraméliser, etc.) et/ou "soumettre à (l'action de)" + substantif (alcooliser, javelliser, islamiser, etc.), mais qui parmi les modifications morphologiques imposées lors de la suffixation ne mentionne pas la perte du -i-. Comment considérer alors des formes comme allégoriser, aïoliser ou anatomiser ? Si l'on regarde ce que le TLF propose pour chaque entrée, on se rend compte qu'il estime que toutes ces formes sont suffixées en -iser, quand bien même il n'indique pas cette possibilité de modification dans la partie "morphologie" du suffixe. La sémantique peut-elle aider à départager les dérivés comportant le suffixe -iser de ceux comportant le suffixe -er ? Je reviendrai sur ce point précis en section [6] 1.5.1. D'autre part, il faut rappeler qu'à un suffixe formel peuvent correspondre plusieurs suffixes de fait, c'est-à-dire qu'il existe des cas d'homonymie de suffixes (cf. section [4] 3) dont l'ordinateur ne peut tenir compte puisqu'il n'est pas possible d'implémenter pour chaque entrée du corpus de départ une analyse sémique du suffixe. L'aspect sémantique des suffixes sera traité dans le troisième chapitre de cette même partie (section II [ 6] 2). En dehors des cas d'allomorphies radicale et suffixale, un troisième point vient gêner le découpage automatique des séquences. Il s'agit de l'homographie de radicaux, qui peut être partielle ou même totale. 1.2.5.3. Homographie de radicaux Le problème ne se pose pas dans le cas d'unités lexicales très proches de type dynamisme / dynamite, mentionné plus haut, car dans ce cas les dérivés de chacun permettront de distinguer les deux familles : dynamicien, dynamique, dynamiquement, dynamisation, dynamiser, dynamisme, dynamiste d'une part ; dynamitage, dynamiter, dynamite, dynamiterie, dynamiteur, d'autre part. L'ordinateur va distinguer trois cas : dynamis- et dynamit-, mais également dynamic- correspondant aux trois premiers termes (les -ique- étant d'ores et déjà passés à -ice-, cf. section 1.2.5.1). La reconnaissance des familles ne va donc pas être parfaite, mais au moins n'y aura-t-il pas confusion entre deux familles, ce qui n'est pas le cas en ce qui concerne les homographes partiels comportant le même nombre de caractères identiques. 363 Chapitre 5 – Constitution de la base de données Dans le cas d'homographes partiels de type communisme / communiquer en effet12, l'ordinateur va considérer les deux termes comme étant de la même famille, la base commune étant communi-. Si une telle homonymie se produit à l'encontre de deux termes similaires, mais dont l'un présenterait une épenthèse là où l'autre aurait une consonne parfaitement intégrée, l'épenthèse sera invisible au découpage automatique. C'est d'ailleurs très exactement ce qui se passe dans le cas d'une homographie totale comme celle de briqueterie / briqueterie : l'un des deux termes est formé sur brique à l'aide du suffixe -erie avec intercalation d'un -t-, l'autre vient de briquette, toujours avec le suffixe erie, mais sans épenthèse. L'ordinateur n'a aucun moyen de déceler l'épenthèse du premier terme : il va comparer avec le mot ayant le nombre maximal de caractères identiques, en l'occurrence briquet, et ne verra pas l'épenthèse puisque briquet comporte un -t- à l'endroit même de l'épenthèse dans briqueterie. Outre le fait qu'il n'associera pas le dérivé avec la base correcte, le traitement automatique appauvrira le corpus d'une unité lexicale épenthésée. Quand bien même une préparation soigneuse du corpus permettrait de pallier les inconvénients dus aux phénomènes d'allomorphie et d'homographie, se dresserait sur le chemin menant au corpus une difficulté supplémentaire : que faire lorsque plusieurs unités lexicales d'une même famille comportent la même épenthèse ? 1.2.5.4. Epenthèse commune à une famille lexicale Le cas ne semble pas isolé. Prenons pour s'en convaincre et illustrer notre propos les deux séries suivantes : 1/ bijou, bijouter, bijoutier, bijouterie, bijoutaille 2/ caoutchouc, caoutchouter, caoutchoutage, caoutchouteux L'ordinateur commence par rechercher la séquence la plus longue en commun dans une série : bijouter- dans la série (1), caoutchoute- dans la (2), ce qui lui permet d'"éliminer" bijouter et bijouterie d'une part, caoutchouter et caoutchouteux d'autre part. (15) Fichier A 1/ bijou, bijoutier, bijoutaille 2/ caoutchouc, caoutchoutage Fichier B bijouter bijouter caoutchoute caoutchoute ie r ux 12 Je rappelle que je travaille sur les liens synchroniques entre les termes et non sur un rapport étymologique ; sémantiquement parlant, communisme et communiquer ne partagent rien actuellement. 364 Chapitre 5 – Constitution de la base de données Notons à cet endroit que les déchets correspondants à bijouter et caoutchouter, à savoir rien vs. -r, montrent un autre problème de traitement que je n'approfondirai pas, celuici pouvant en effet être résolu par la grande masse des données traitées : d'autres verbes du premier groupe seront tantôt divisés avant le -e-, tantôt après. Puis l'ordinateur passera à bijoute- et ne trouvera rien, donc à bijout- et caoutchout-, éliminant bijoutier et bijoutaille, mais gardant caoutchoutage puisque ne pouvant le comparer à une autre séquence dont les dix premiers caractères seraient également caoutchout-. (16) 1/ bijou 2/ Fichier A caoutchouc, caoutchoutage Fichier B bijouter bijouter bijout bijout caoutchoute caoutchoute ie ier aille r ux Dans une troisième étape, il lui reste dans la première série bijou, seul et non mis en relation avec ses dérivés, dans l'autre caoutchouc et caoutchoutage, pour lequel il isolera la base caoutchou-. (17) 1/ bijou Fichier A 2/ Fichier B bijouter bijouter bijout bijout caoutchoute caoutchoute caoutchou caoutchou ie ier aille r ux c tage A terme, la machine n'aura pas décelé d'épenthèse dans la première série, et n'en aura décelé (potentiellement) qu'une sur trois dans la seconde. Je mentionnerai ici une question à laquelle je répondrai plus longuement tout au long de la section 2, et qui est la suivante : lorsque plusieurs termes de la même famille ont la même épenthèse, comment puis-je déterminer qu'il s'agit bien d'une épenthèse et non d'une consonne sous-jacente ? 365 Chapitre 5 – Constitution de la base de données De même que plusieurs termes de la même famille peuvent comporter la même épenthèse, il se peut qu'un même suffixe rencontre plusieurs fois la même épenthèse. 1.2.5.5. Epenthèse identique devant un même suffixe Prenons pour illustrer notre propos les unités lexicales suivantes : 1/ abri, abriter, numéro, numéroter, piano, pianoter, biseau, biseauter 2/ Chicago, chicagotesque, méga, mégatesque, kafka, kafkatesque, manga, mangatesque (cf. Plénat & al. 2002 pour les données). Dans un premier temps, l'ordinateur aura comparé les termes simples avec les termes dérivés, et aura gardé, pour la série (1) quatre fois le "déchet" -ter, pour la série (2) quatre fois le "déchet" -tesque. Lors de la deuxième étape, qui consiste à comparer les déchets par la droite en commençant par la séquence la plus longue possible, l'ordinateur ne va donc pas être en mesure d'isoler le -t- dans la première comme dans la deuxième série puisque tous les éléments à comparer le possèdent. Quand bien même on ajouterait à la liste de déchets des suffixes simples (-er, -esque dans les cas présents), du fait que l'ordinateur commence par la séquence la plus longue commune à au moins deux séquences, il n'identifiera toujours pas le t- comme un élément à part. Un problème plus insidieux car difficilement identifiable est celui de la graphie pouvant masquer certaines épenthèses. 1.2.5.6. Aveuglement graphique Étudions par exemple le cas de l'unité lexicale abricot et de ses dérivés. L'étymologie diachronique informe que abricot provient de l'arabe al barkouq ; ceci signifie que le -t final n'est qu'un artefact graphique qui ne correspond en aucune façon à une consonne sous-jacente, comme c'est le cas par exemple pour l'adjectif petit, dont la forme féminine indique le statut sous-jacent de la consonne finale. De ce fait le -t-, présent dans les dérivés abricoté, abricotée, abricoter, abricotier, abricotin, abricotine, abricotis, est vraisemblablement épenthétique, ce que le TLF explique comme étant un "cas de dissimilation des 2 [k] dont le 2e est remplacé par une autre occlusive sourde [t]." Entre le XVIème et surtout le XVIIIème siècle, la langue française a connu beaucoup de réfections orthographiques, du type du -g- réintroduit dans la graphie de doigt d'après le 366 Chapitre 5 – Constitution de la base de données latin digitus (cf. Bourciez 1967 : 145). Certaines de ces réfections orthographiques peuvent maintenant conduire à une disparité de formes au sein d'une même famille d'unités lexicales, pourtant identifiable synchroniquement comme telle. L'ordinateur n'a bien entendu aucun moyen de "deviner" si la consonne graphique correspond ou non à une réalité étymologique. 1.2.6. Bilan Toutes ces difficultés sont néfastes à un traitement automatique satisfaisant du corpus. S'il est vrai que les alternances de radicaux peuvent être traitées en partie, il n'en est pas de même en ce qui concerne les alternances de suffixes et les homographes ; les radicaux de même famille comportant la même épenthèse, tout comme un suffixe donné comportant plusieurs fois la même consonne épenthétique, ne sont pas non plus traitables par la machine, qui n'aura aucun moyen de reconnaître d'éventuelles épenthèses ; enfin, les erreurs dues à la graphie sont difficilement évaluables et quantifiables. Tous ces motifs concourent à conférer à l'analyse automatique, malgré son apparence plutôt prometteuse, des résultats médiocres. Ce traitement informatique ne donne en effet que les épenthèses uniques avec un suffixe donné, pourvu que le radical soit le même dans les deux termes comparés. En ajoutant après ce travail mécanique tous les termes de mêmes familles présents dans le TLF et dans le Robert Etymologique, par exemple bleuter lié à bleusaille, on obtient en tout et pour tout les 21 termes suivants : (18) 1 2 3 4 5 6 7 8 9 10 11 12 13 terme potentiellement porteur d'une épenthèse banlieusard bleusaille bleuter bleuterie chevaucher chimiatrie diablotin dortoir harnacher joufflu noircir portraicturien roitelet consonne épenthésée z z t t 1 t2 (o)t t 1 f s k t base banlieue bleu bleu bleu cheval chimie diable dor(mir) harnais joue noir portrait roi suffixe ard aille er erie er ie in oir er lu ir urien elet 367 Chapitre 5 – Constitution de la base de données 14 15 16 17 18 19 20 21 traquenard verdâtre verdelet verdeur verdier verdir verdoyer verdure n d d d d d d d traque(r) vert vert vert vert vert vert vert ard âtre elet eur ier ir oyer ure Cette liste était bien évidemment à compléter, non seulement par la recherche systématique, pour un suffixe apparemment déclencheur, de termes correspondants (cf. section 1.4), mais également par des sources différentes, plus proches de l'oral que ne peuvent l'être des dictionnaires usuels : les dictionnaires d'argot. 1.3. Dictionnaires d'argot (B) Un travail sur le français actuel ne pouvait laisser de côté les dictionnaires de français populaire et de français argotique, pour cette raison que, pour citer Henri Bauche en 1920 (repris par Caradec 2000 : VIII), le français populaire est "l'idiome parlé couramment et naturellement par le peuple". Boudard (2001 : préface de Colin, Mével & Leclère) présente quant à lui l'argot comme une langue que l'on utilise "tout naturellement", ce qui en fait un fournisseur de séquences originales à ne pas négliger. 1.3.1. Dictionnaire de l'argot français et de ses origines Le premier dictionnaire retenu pour la recherche de termes épenthésés est le Dictionnaire de l'argot français et de ses origines de Colin et al., publié chez Larousse en 1990 puis 2001. Ce dictionnaire a en effet le double avantage de ses 863 pages, soit "environ 7000 entrées, auxquelles s'ajoutent quelques centaines de sous-entrées présentant variantes et dérivés", et de fournir l'origine des unités lexicales proposées. Les termes recensés datent de la fin du XVIIIème siècle jusqu'à nos jours, et les auteurs indiquent avoir "recensé les mots et les locutions qui, ou bien sont encore (au moins un peu) vivants à l'heure actuelle, ou bien l'ont été au cours du XIXème (…) L'exhaustivité n'était, en tout état de cause, pas possible : nous avons négligé certains archaïsmes très passagers, pour lesquels aucune attestation fiable ne se présentait, ainsi que des termes plus patoisants qu'argotiques (…). Nous avons exclu également des mots rares, liés à une actualité 368 Chapitre 5 – Constitution de la base de données fugace, qui, aujourd'hui, ne sont plus employés ni compris". Du fait que ce dictionnaire est un "dictionnaire-papier", le travail est nécessairement "manuel", et cette indication étymologique permet d'associer directement un terme à sa base, donc de repérer immédiatement les épenthèses éventuelles. L'étymologie proposée pour chaque terme par les lexicographes s'appuie sur "le dépouillement de nombreux dictionnaires anciens (…) Par ailleurs, la parution en 1994 du 16e et dernier volume du Trésor de la Langue Française ainsi que celle du Bouquet des expressions imagées (…) nous ont permis de corriger un assez grand nombre de datations ou d'étymologies." Ce dictionnaire rassemble en outre les argots spécifiques suivants : bello, brution, calaõ, calo, cant, canut, coa, faria, fayau, fourbesque, germania, ghos, jargon, javanais, jobelin, joual, largonji, louchébem, lunfardo, ménédigne, mormé, mourmé, poissard, rochois, romani, rotwelsch, slang, terratsu et verlan (cf. annexe 1p). La méthode de dépouillement a été la suivante : pour chaque terme listé dans le dictionnaire, j'ai identifié à l'aide de l'étymologie indiquée, ou de recherches dans le TLF et le Robert Etymologique le cas échéant, la base et le radical (papelard a ainsi été écarté avec certitude puisqu'il est issu de papier, certes, mais par substitution des suffixes -el et -ard, enquiquiner provient certes de quiqui comme l'indique le Dictionnaire de l'argot, mais il est dérivé avec le suffixe -iner, le -n- n'est donc pas épenthétique), de façon à déterminer s'il comportait une épenthèse ou non. Dans le cas où l'unité lexicale considérée semble comporter une épenthèse consonantique, je l'intègre au corpus de travail. Le relevé "brut" des termes pouvant présenter une épenthèse entre le radical et le suffixe comporte quarante-trois éléments, auxquels vont s'ajouter ceux issus d'un second dictionnaire d'argot. 1.3.2. Dictionnaire du français argotique et populaire Un deuxième dictionnaire a été consulté dans le but de compléter l'apport "argotique" de termes épenthésés à notre corpus, tout en introduisant une dimension plus "familière", moins technique. Il s'agit du Dictionnaire du français argotique et populaire de François Carradec, publié en 2000, dans lequel cohabitent "tous les mots de la tchatche et du français bien vivant d'aujourd'hui. Un passionné de la vie du langage les a recueillis dans les cafés, les transports et autres lieux publics, aux portes des écoles ou des lycées, en famille ou entre 369 Chapitre 5 – Constitution de la base de données amis, dans la presse et dans les livres, à l'écoute de la radio et de la télévision." Cet ouvrage répond donc à la volonté de ne faire intervenir dans notre corpus du "français actuel" - il prétend rejeter ce qu'il qualifie de "mots d'argot fossiles" - et apporte cette dimension orale qui manquait tant à notre première élaboration du corpus. L'inconvénient majeur de cet ouvrage est qu'il n'indique pas l'étymologie des termes proposés : "En indiquer l'étymologie (ce qui est parfois tentant) serait prendre le risque de détourner l'attention de leur sens actuel". Ce dictionnaire de 219 pages comporte environ 4700 termes. Vingt-deux termes susceptibles de comporter une épenthèse à l'endroit intéressé ont été ajoutés aux quarante-trois précédemment relevés dans l'autre dictionnaire d'argot consulté, une fois qu'ont été éliminés les termes suspects présents dans les deux dictionnaires. 1.3.3. Récapitulatif des termes relevés dans les dictionnaires d'argot Les soixante-quatre mots relevés sont présentés dans le tableau suivant, classés par terminaisons dans l'ordre décroissant du nombre de termes concernés : (19) Terminaison Nombre de termes er 16 on 7 eux 4 ard 3 erie 3 Base bagou berlue caf(ard) cran crapahut cul flou glagla miro pieu pipeau tabac tafia yoyo zieu biffe caf(é) from(age) grive gueule mec pav(é) caf(ard) cinéma cra(sseux) sida faffe queue vice cul Nombre de termes 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 Termes bagouler berlurer caf(e)ter cranter crapahuter trouducuter flouter glaglater miro(i)ter pieuter ; dépieuter (se) pipeauter tabasser tafiater yoyoter zieuter biffeton cafeton frometon griveton gueuleton mecton paveton cafeteux cinémateux crapoteux sidateux faflard queutard vicelard cuterie ; trouducuterie 370 Chapitre 5 – Constitution de la base de données ier 3 age 2 dé 2 eur 2 go 2 ière 2 in 2 bar 2 ance bri caille dé é ième in ingue mar mon ot iat ar té 27 terminaisons 1 1 1 1 1 1 1 1 1 1 1 1 1 1 64 termes marlou cul marlou marlou zieu foin fouigne caf(ard) zyeu ici là-bas lolo rue auver(gnat) marlou colis cro(quis) cuis(ine) colis ici jour noix combien gosse louf café café gosse marlou cam(ion) con 46 bases différentes 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 marlouserie trouduculier marloupier ; marlousier marloutage zieutage foindé fouignedé cafeteur zyeuteur icigo labago lolotière rutière auverpin marloupin colibar crobard cuistance colibri icicaille jourdé noité combientième gosselin louftingue cafemar cafemon gosselot marloupiat camtar conceté Après le traitement automatisé d'une liste de mots et la consultation de dictionnaires argotiques, le corpus a été enrichi également à partir d'une recherche systématique des expressions renvoyant à l'épenthèse consonantique au sein de la version informatisée du TLF. 1.4. Recherche à partir d'expressions dans le TLFi (C) La mise à disposition du TLF sur Internet depuis 2001 a également permis d'interroger cette base de données à partir d'expressions liées à la notion d'épenthèse. L'utilisation du mode de recherche appelé "recherche complexe", "la manière la plus avancée d'utiliser le TLF" selon les propres concepteurs du programme, autorise en effet à s'intéresser à des expressions susceptibles d'apparaître dans les articles qui correspondent à des entrées comportant une épenthèse consonantique. Le TLF a été établi à partir de sources diverses telles que des "dictionnaires, inventaires de toute nature (inventaires proprement dits du type I.G.L.F. [Inventaire Général 371 Chapitre 5 – Constitution de la base de données de la Langue Française], index, glossaires, concordances), thèses, livres, articles de périodiques et de journaux" (préface du TLF, vol. 1 : XXI) auxquels s'est ajouté "un nombre important de textes susceptibles de nous livrer une langue relativement proche de la langue parlée : journaux intimes, correspondances, mémoires, théâtre en prose, parties dialoguées des romans, poésie lyrique jusqu'à un certain point." (préface du TLF, vol. 1 : XXIII). La liste des textes exploités pour la constitution du TLF, à savoir 1002 ouvrages littéraires (416 pour le XIXème siècle, 586 pour le XXème) représentant environ 70 millions d'occurrences, auxquelles se sont ajoutés 20 millions d'occurrences issues de textes techniques, est disponible dans le premier volume du TLF (préface : XVIX-XCVII). L'utilisation du TLF dans la constitution du corpus avait permis d'observer une grande hétérogénéité dans l'indication de consonnes susceptibles de relever d'une épenthèse. Figuraient pour mentionner le cas des expressions comme "t anal", "consonne de liaison", "épenthétique", "parasite", etc. La recherche systématique de ces expressions dans le TLFi a permis de compléter le corpus préalablement établi ; il est à noter qu'une recherche portant sur "anal" dans le TLFi recense tous les termes comportant cette séquence, donc portera également sur "anal.", "analogie" et "analogique", ceci fonctionnant pour toutes les séquences raccourcies, comme la non distinction entre minuscules et majuscules. Les résultats de chaque requête sont récapitulés dans le tableau suivant : (20) Expression recherchée 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 anal t anal d anal s anal t de trans d de trans s de trans t de liaison d de liaison s de liaison -t- anal -d- anal -s- anal addition de -t- 16 -d- Nombre d'entrées concernées 13538 1 1 0 1 0 0 1 0 0 1 0 0 96 3282 33 Entrées concernées -age (suffixe) -eau aspertule (au moyen-âge) voilà (ne voilà-t-il pas) bijoutaille deux pertinents : bijoutaille, papetier inclues les épenthèses syntaxiques type ajouta-t-il barreaudage (-d- de soutien) brelander (-d- de transition) calembourdier cauchemarder, cauchemardesque engendrer (consonne transitoire) faisander et "passages de -t- à -d-, de -s- à -d-, etc." 372 Chapitre 5 – Constitution de la base de données 17 -s- 98 18 consonne de 25 19 épenthétique 36 20 épenthèse 16 21 parasite 431 (graphies, prononciations) cambrésine (-s- consonne de liaison) halloysite (-s- de transition) myrosine (-s- épenthétique) odalisque (-s- parasite) pertinents : barreaudage bourriauder (picard), bourreauder cafetier, cafetière caillouter, caillouté, cailloutis cambrésine (de Cambrai) chaotique chichiteux (dans article chichi) conchyoline congolais échotier froufrouter lambdatique (dans article -ique) médiumnique (dans article -ique) clamecycois (dans article -ais) souriquois (dans article -ais) spadois (dans article -ais) graylois (dans article -ais) togolais (dans article -ais) vinçanais (dans article -ais) pouillyzois (dans article -ais) arroutain (dans l'article -ain) broutain (dans l'article -ain) samaritain (dans l'article -ain) pierrefeucain (dans l'article -ain) valéricain (dans l'article -ain) pertinents : amadouvier atlastique calendrier calfeutrer casserole prononcé castrole colombe dépiauter filouter gueuleton juter, juteux masselote mendigot mycélium myrosine pivoine poireauter pertinents : dénoyauter (épenthèse euphonique) filandre patraque polacre vrille pertinents : accoutrer baroufle cible odalisque tringle 373 Chapitre 5 – Constitution de la base de données 22 adventice 50 23 24 1 83 28 consonne transitoire transitoire -t- de soutien / t de soutien -d- de soutien / d de soutien -s- de soutien / s de soutien additionnelle 29 consonne graph 1 30 [t] 103 31 [d] 35 32 [z] 101 33 inorganique 56 25 26 27 pertinents : agioter dompter engendrer pertinent : engendrer 0 0 0 15 pertinent : dompter montpelliérain (articulation de la consonne graphique -r de la base) indications de prononciation, de graphie ou de contexte casserole prononcé castrole indications de prononciation, de graphie ou de contexte pertinents : banlieusard (addition de [z]) bondieusard (addition de [z]) pertinent : éreinter Certains des termes isolés par cette recherche avaient déjà été découverts et traités par ailleurs : amadouvier, barreaudage, cauchemarder et cauchemardesque, faisander, cafetier et cafetière, caillouter et cailloutis, chaotique, échotier, dépiauter, filouter, juter et juteux, poireauter, éreinter. Ceux-ci ne seront bien sûr pas intégrés à nouveau dans le corpus. Le traitement du TLFi a mis en exergue, outre des épenthèses syntaxiques (ne voilà-til pas, ajouta-t-il, etc.), des termes savants comportant une épenthèse (myrosine, cambrésine, halloysite, conchyoline, mycélium), des suffixations de toponymes, (arroutain, broutain, clamecycois, congolais, graylois, javanais, pierrefeucain, pouillyzois, samaritain, souriquois, spadois, togolais, valéricain et vinçanais), et des termes "normaux" (atlastique, bourreauder, brelander, calembourdier, chichiteux, froufrouter, gueuleton, lambdatique et médiumnique). Il semble logique d'intégrer à ce paragraphe les quelques termes trouvés dans les articles correspondants aux suffixes dans le TLF, dans la mesure où certains d'entre eux sont apparus par le tri sus-cité. Ont bien sûr été ôtés les termes déjà présents dans le corpus, comme filoutage ou numérotage, ce qui ne laisse que les deux termes suivants : bamboutage, pinceautage. Le Robert historique mentionne également pinceauter, dont serait dérivé pinceautage. Au total, les quarante-huit termes suivants ont été intégrés dans le corpus : 374 Chapitre 5 – Constitution de la base de données (21) Terminaison à déterminer Nombre de termes 9 Base à déterminer à déterminer er 9 ain 5 ois 5 ais 4 age 3 ier 3 ine 3 ique 3 ement eux ien ite 12 terminaisons 1 1 1 1 48 termes bourreau brelan chichi froufrou pinceau arrou brou pierrefeu samarie valéry clamecy gray pouilly souris spa congo java togo vinça à déterminer bambou pinceau à déterminer brelan calembour à déterminer Cambrai myro atlas lambda médium à déterminer chichi Cambrai Halloy 27 bases identifiées Nombre de termes 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Termes barouf(le) cible coudre filandre mycélium patraque polacre tringle vrille accoutrer calfeutrer dompter engendrer bourreauder brelander chichiter froufrouter pinceauter arroutain broutain pierrefeucain samaritain valéricain clamecycois graylois pouillyzois souriquois spadois congolais javanais togolais vinçanais calfeutrage bamboutage pinceautage calendrier brelandier calembourdier conchyoline cambrésine myrosine atlastique lambdatique médiumnique calfeutrement chichiteux cambrésien halloysite En-dehors du traitement semi-automatique d'une liste de mots, du dépouillement manuel de dictionnaires d'argot, de l'interrogation du TLFi par mots clés, une source supplémentaire de termes contenant potentiellement des épenthèses a été, tout au long de la 375 Chapitre 5 – Constitution de la base de données constitution du corpus, l'exploitation des données relevées dans les articles, linguistiques mais aussi de diverses sources non scientifiques. 1.5. Données issues d'articles (D) D'autres termes se sont en effet ajoutés au corpus, fournis par les articles et les livres mentionnant le sujet ou trouvés au hasard de lectures personnelles. La liste ci-dessous les récapitule en regard de leur source respective quand ces termes sont issus d'articles linguistiques, et en liste alphabétique pour ceux trouvés dans des articles non linguistiques. Ont été ôtés les termes déjà recensés (piétaille, escobarderie, voyouterie, etc.). (22) articles linguistiques amiganesque kafkatesque ferblantesque goyatesque chicagotesque gargantuanesque gargantualement) gargantualesque cacatesque (d'où cacatoire) ceaucesculesque Plénat & al. (2003) Lehmann & MartinBerthet (1998 : 132) Wetzels (1987 : 285 ; 287) Schane (1968) Dubois & DuboisCharlier (1999 : 193 ; 206) Temple (1996 : 318-328) articles non linguistiques abritement (d'où abriter) absolutisme (d'où absolutiste) bénitier blaireauter butorderie (d'où cadeauter delducatesque escargotesque gogotesque (d'où gogotisme) hugolesque (d'où hugolien, hugolâtre) hugotesque mangagesque manganesque mangatesque mégatesque shungatesque zolatesque enfourner hugotesque (id Plénat & al.) silotage (d'où ensiloter) ronéoter bazardier papousie partisan gueusaille (d'où gueuser, gueuserie, gueusard) cachimantier rapiaterie (d'où rapiater) grigouterie janoterie (d'où janotisme) canulardesque caviardage (d'où caviarder) dénoyauter (d'où dénoyautage, dénoyauteur) dieutelet élancer ensiloter épauletier favoritisme fermeté gruauter hiverner météoriser onusienne piapiatage sidatique sidénologue têtutesse tissulaire tissuterie tissutier zougloutique 376 Chapitre 5 – Constitution de la base de données Les quatre-vingt-quatorze termes ainsi recueillis se répartissent de la manière suivante en fonction de leur terminaison : (23) Terminaisons Nombre de termes esque 21 er 13 erie ier isme age on ique iser ement ien ière ir aie aille aire an ard âtre é eau elet esse eur eux ie iste oire ologue 29 terminaisons 6 6 6 5 5 4 4 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Termes amiganesque ; cacatesque ; canulardesque ; ceaucesculesque ; chicagotesque ; delducatesque ; escargotesque ; ferblantesque ; gargantualesque ; gargantuanesque ; gogotesque ; goyatesque ; hugolesque ; hugotesque ; kafkatesque ; mangagesque ; manganesque ; mangatesque ; mégatesque ; shungatesque ; zolatesque abriter ; blaireauter ; cadeauter ; caviarder ; dénoyauter ; élancer ; enfourner ; ensiloter ; gruauter ; gueuser ; hiverner ; rapiater ; ronéoter butorderie ; grigouterie ; gueuserie ; janoterie ; rapiaterie ; tissuterie bazardier ; bénitier ; cachimantier ; épauletier ; escargotier ; tissutier absolutisme ; favoritisme ; gogotisme ; hugotisme ; janotisme ; médiatisme caviardage ; dénoyautage ; escargotage ; piapiatage ; silotage aileron ; bûcheron ; mancheron1 ; mancheron2 ; tâcheron hugotique ; médiatique ; sidatique ; zougloutique eczématiser (s') ; médiatiser1 ; médiatiser2 ; météoriser abritement ; gargantualement hugolien ; onusienne boucautière ; escargotière beausir ; durcir aspergeraie gueusaille tissulaire partisan gueusard hugolâtre fermeté manchereau dieutelet têtutesse dénoyauteur eczémateux papousie absolutiste cacatoire sidénologue 94 termes L'article de Plénat & al (2002), de par le fait qu'il porte précisément sur les dérivés en esque, a grossi le nombre de termes présentant une épenthèse pour un seul suffixe. Il conviendra donc d'en tenir compte au moment du décompte final par suffixe. C'est d'ailleurs une des deux raisons pour lesquelles je n'ai pas intégré dans ce corpus les dérivés proposés par Plénat (1997, 1999) : ces articles portant précisément sur l'épenthèse devant trois suffixes particuliers, l'ajout des termes afférents aurait conduit à une disproportion du corpus en termes de représentation de ces suffixes mais aurait également faussé toute généralisation relative au type de segment final de radical ou initial de suffixe. De plus, il n'est pas apparu avec 377 Chapitre 5 – Constitution de la base de données certitude, après évaluation des données, que l'on puisse attribuer la consonne à une épenthèse et non à une variante du suffixe (cf. section I [1] 3.3.2.1.2 pour une discussion). La méthode de recueil que le lecteur va découvrir maintenant a elle aussi biaisé en partie le nombre de termes contenant une épenthèse par suffixe, dans le sens où elle s'est faite en exploitant à nouveau la base de 64.296 termes (cf. I [5] 1.2), mais de façon ciblée et manuelle cette fois, à la recherche de certains suffixes. Cependant, il s'agit de suffixes dont il est apparu la fréquence dans la base de données, le choix de ces suffixes étant ainsi mieux justifié que par la simple disponibilité de la source. 1.6. Examen systématique des termes présentant les suffixes -ier, -age et -erie (E) Un moyen supplémentaire de compléter le corpus a été de dresser la liste des termes de la base de données exploitée en section 1.1 présentant le suffixe -ier, puis le suffixe -age, enfin le suffixe -erie, et de trier ces listes manuellement. Ces trois suffixes ont été sélectionnés à partir d'une liste intermédiaire des suffixes les plus fréquemment rencontrés après une épenthèse consonantique. Cette liste ne correspond pas au cumul des suffixes trouvés jusqu'à présent mais à celle établie à un moment M de la constitution de ce corpus, alors que la plupart des moyens d'extraction étaient en cours mais non aboutis : les termes issus d'articles comme les données orales ont été insérés continuellement dans le corpus et non à un instant précis. Le suffixe le plus fréquemment lié à une épenthèse est -er, mais il concerne 9992 termes dans la base de données, ce qui représente un très gros travail manuel qui ne se justifierait que par une rentabilité intéressante de cette méthode d'extraction, rentabilité qui ne s'est pas avérée. Venaient ensuite et dans cet ordre les suffixes -ier, -age et -erie. L'expérience n'a pas été poussée plus avant étant donné le manque de productivité de la méthode par rapport au temps investi. Un premier tri dans la matière première constituée des listes de mots en -ier (1238 termes dans la liste de mots de départ), -age (2293 termes) et -erie (470 termes) a permis d'extraire 350 candidats, qui se répartissent par terminaison de la manière suivante : 378 Chapitre 5 – Constitution de la base de données (24) Terminaisons Nombre de termes er 106 ier 70 age 62 erie 48 é 8 eur 8 in on ement aire eau et eux fier ie ière aille 4 4 3 2 2 2 2 2 2 2 1 Termes aborder ; acclimater ; affûter ; agioter ; ajouter ; argenter ; argoter ; arpenter ; badauder ; bahuter ; biseauter ; boiser ; bonneter ; border ; briqueter1 ; briqueter2 ; cafarder ; caillouter ; chaluter ; chamoiser ; cimenter ; clabauder ; cliqueter ; coqueliner ; cureter ; déliter ; dépiauter ; dépiéter ; dévergonder ; diamanter ; doigter ; ébruiter ; écanguer ; échafauder ; écoqueter ; emblaver ; émeriser ; empiéter ; épisser ; épousseter ; équeuter ; ergoter ; escobarder ; essarter ; fagoter ; faisander ; farder ; farter ; fauberder ; fauberter ; faucarder ; feuilleter ; filouter ; folioter ; formater ; ganter ; garancer ; hourder ; jeter ; jobarder ; jointer ; joncher ; larder ; luter ; mailleter ; maquereauter ; marauder ; marchander ; massicoter ; mégot(t)er ; merceriser ; minauder ; miroiter ; moiser ; moleter ; mortaiser ; moucheter ; organsiner ; pailleter ; panneauter ; papilloter ; paqueter ; parqueter ; patenter ; pelleter ; piéter ; plomber ; pointer ; porter ; puiser ; queuter ; rabioter ; raboter ; rabouter ; ravauder ; saborder ; soucheter ; tableauter ; tamiser ; tan(n)iser ; tarauder ; terreauter ; tricoter ; truander ; vagabonder ; venter abricotier ; aiguilletier ; alfatier ; alleutier ; amadouvier ; arbalétrier ; archetier ; argotier ; avocatier ; bahutier ; bonnetier ; brancardier ; briquetier ; buandier ; bufettier ; canotier ; cédratier ; chaînetier ; chalutier ; chocolatier ; cocotier ; coquetier1 ; coquetier2 ; cordelier ; courtier ; dinandier ; doigtier ; dossier ; drapier ; fagotier ; faisandier ; ferblantier ; ferratier ; forestier ; fournier ; gazetier ; giletier ; grainetier1 ; grainetier2 ; gravatier ; guichetier ; îlotier ; jambosier ; kolatier ; laitier ; lingotier ; lotier ; maquereautier ; matelassier ; minotier ; miroitier ; panetier ; papetier ; paquetier ; paradisier ; peaucier ; peaussier ; pelletier ; potier ; prime(-)sautier ; puisatier ; quartier ; rivetier ; sagoutier ; tableautier ; tabletier ; taillandier ; taxaudier ; vivandier ; vomiquier aciérage ; agiotage ; argotage ; badaudage ; barreaudage ; biseautage ; boisage ; bouvetage ; brigandage ; briquetage1 ; briquetage2 ; cailloutage ; chalutage ; chariotage ; clavetage ; courtage ; crabotage ; déhourdage ; délutage ; démâtage ; dépiautage ; échevet(t)age ; écointage ; écoquetage ; emboucautage ; émerisage ; enfantillage ; épiétage ; épincetage ; époutissage ; esquimaudage ; esquimautage ; fardage ; faucardage ; ferroutage ; filoutage ; folletage ; foulardage ; fournage ; gobetage ; îlotage ; laitage ; maf(f)iotage ; maquereautage ; masselottage ; matelotage ; millerandage ; moyettage ; museletage ; palotage ; paquetage ; partage ; platelage ; pontage ; ridelage ; souchetage ; sténosage ; terreautage ; torsinage ; trématage ; versage ; zérotage afféterie ; archeterie ; badauderie ; baguenauderie ; bigoterie ; bimbeloterie ; biscuiterie ; bluterie ; boiserie ; boiterie ; bouverie ; briqueterie1 ; briqueterie2 ; briqueterie3 ; buffleterie ; cagoterie ; closerie ; descenderie ; dinanderie ; droiterie ; escobarderie ; faisanderie ; ferblanterie ; filouterie ; finauderie ; fonderie ; forfanterie ; fruiterie ; gailleterie ; goujaterie ; graineterie ; homarderie ; huisserie ; loterie ; manécanterie ; marqueterie ; matoiserie ; miroiterie ; mousqueterie ; musarderie ; passementerie ; pelleterie ; retorderie ; robinetterie ; rustauderie ; tabletterie ; vanterie ; verroterie abricoté ; barreaudé ; biseauté ; écoté ; effronté ; joncé ; miroité ; vignet(t)é ; agioteur ; argoteur ; bardeur ; biseauteur ; coqueleur ; paqueteur ; soucheteur ; taxateur coquebin ; fagotin ; piétin ; tableautin enfançon ; moucheron ; piéton ; vigneron empiètement ; miroitement ; piètement moscoutaire ; sursitaire faisandeau ; ponceau coquelet ; coqueret caillouteux ; coqueleux cocufier ; statufier baraterie ; daterie coquetière ; giletière piétaille 379 Chapitre 5 – Constitution de la base de données asser ation elle eter euse if ifier ine iner ion ique ir is isme iste ot otte otter ourde ton uche ure 39 terminaisons 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 350 termes avocasser colorisation coquerelle piqueter émeriseuse taxatif salifier abricotine piétiner taxation argotique accourcir cailloutis argotisme argotiste queusot masselotte picoter coquelourde cureton coqueluche fourniture A ce stade de l'élaboration du corpus, il est apparu que l'étude des néologismes recueillis par différents auteurs pouvait contribuer à enrichir les données sur lesquelles allait porter l'étude. Deux ouvrages ont été sélectionnés à cet effet, choisis en fonction de l'étendue des sources auxquelles ils ont fait appel. 1.7. Données issues de Néologismes du français contemporain (H) Le premier recueil de néologismes utilisé dans cette étude a été publié par l'Institut National de la Langue Française dans la collection Datations et documents lexicologiques. Dans cet ouvrage sont rassemblés par K.E.M. George les néologismes trouvés entre 1971 et 1991, issus de trois sources : - le roman "populaire", représenté par Albertine Sarrazin, Victoria Thérame, Christiane Rochefort, Raymond Queneau, René Fallet et Alphonse Boudard. - la presse, au moyen des Archives du français contemporain et de La quinzaine littéraire. - des travaux lexicologiques et lexicographiques sur l'argot des poilus d'Esnault, le parler des jeunes d'Obalk, Soral et Pasche, le Répertoire de termes inventés par la SF de Scherwinsky, divers dictionnaires d'argot parmi lesquels celui de Marks, Johnson & Pratt. Les termes relevés à l'issue du dépouillement de ces sources ont ensuite été contrôlés dans des dictionnaires "de référence" tels que le Dictionnaire des anglicismes de Rey-Debove 380 Chapitre 5 – Constitution de la base de données & Gagnon (1982), le Dictionnaire de l'argot français et de ses origines de Colin, Mével & Leclère (1990), le Dictionnaire du français non-conventionnel de Cellard & Rey (1980), le Dictionnaire des mots contemporains de Gilbert (1980), l'Insolite, Dictionnaire des mots sauvages de Rheims (1989, cf. paragraphe suivant), mais également des dictionnaires plus "normatifs" tels que le Grand Larousse de la langue française coordonné par Guilbert et al. (1971-1978), le Grand Robert de la langue française de Robert & Rey (1985), le Dictionnaire de la langue française de Littré (1863-1872 et ses suppléments de 1877), le Trésor de la Langue Française, etc. L'avantage de ce recueil de néologismes est de répertorier la date de parution du néologisme en regard de l'entrée correspondante et de se limiter à une période relativement courte et proche de nous, ce qui permettra, si les résultats de l'analyse l'imposent, de statuer sur la création d'épenthèses à différentes périodes de l'histoire du français et notamment du français "actuel". Un tri manuel a permis d'opérer une première sélection, en éliminant les termes dont la nouveauté consistait à changer de catégorie grammaticale ou de sens, mais sans qu'il s'agisse d'une création lexicale mettant en jeu la dérivation suffixale. Ont également été écartés des termes formés certes par la suffixation, mais préférant la troncation à l'épenthèse, comme comme alibabesque. Tous les termes pour lesquels il n'a pas été possible de trouver une première attestation ont été gardés, dans le sens où l'ouvrage dont ils sont extraits porte précisément sur les néologismes. Les termes précédemment enregistrés dans le corpus, comme embijouté ou gagater, n'ont bien sûr pas été ajoutés. Au final, ce sont vingt-cinq termes supplémentaires qui ont trouvé le chemin de la base de données. Le tableau suivant permet de les découvrir en fonction de leur terminaison : 381 Chapitre 5 – Constitution de la base de données (25) Terminaison Nombre de termes er 7 erie 3 ée 2 eur 2 ure 2 aille ant asse ation é esque eux ton ude 1 1 1 1 1 1 1 1 1 14 terminaisons 25 termes Base calor glaviot mélimélo MRP pogo tatami vravra pageot ripou tutu boche yeux cul glaviot cuir yeux hobereau trotski biberon calor cambouis alibaba biscoto boche breton 20 bases différentes Nombre de termes 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Terme caloriser glavioter méliméloter (se) émerpiner pogoter tatamiser (se) vravrater pageoterie ripouserie tututerie bochetée yeutée trouducuteur glavioteur cuirture yeuture hobereautaille trotskisant biberondasse calorisation cambouité alibababesque biscotonneux bocheton bretonnitude Il a été fait appel à un deuxième recueil de termes susceptibles de contenir une épenthèse, le Dictionnaire des mots sauvages de Rheims (1990). 1.8. Données issues de L'insolite, Dictionnaire des mots sauvages (K) Ce dictionnaire a pour vocation de rassembler "les mots insolites, les néologismes recueillis dans les œuvres des XIXème et XXème siècles" (quatrième de couverture). Rheims a puisé dans des ouvrages de Guillaume Apolinaire, Céline, Jean Giono, Victor Hugo, Honoré de Balzac, Edmont Rostand, aussi bien que de Gaston Bachelard, Jean-Paul Sartre, George Sand ou San Antonio, pour proposer une liste de termes qui "obéissent aux règles de formation du français et sont aptes à faire carrière". Le même protocole manuel de tri a été opéré, permettant de ne pas faire figurer à nouveau des termes déjà recensés par ailleurs. Les soixante-et-un termes recrutés dans ce dictionnaire sont présentés dans le tableau ci-dessous : 382 Chapitre 5 – Constitution de la base de données (26) Terminaison Nombre de termes er 18 é 5 eur 5 ique 4 on 4 ement 3 erie 3 esque 3 iser 3 ette 2 aille ant âtre 1 1 1 do 1 Base adulte drapeau fumant génie glou glouglou glue infini maou museau névralgie perle perlouse roulis Stromboli symétrie you crachat képi phraséologie pluie porche blaireau chou glouglou radio symétrie centauresse déchet drapeau épopée double bleui(r) igloo société glouglou hip hip hourra piou bousard hurluberlu rococo escouba (prov) piou sofa abruti Othello radio source tarte bedeau glouglou égo cul (botte au cul) Nombre de termes 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Terme adultiner drapeauter enfumanter engéniser glouter glouglouter englumer (s') infiniser, infinitiser mamaouter musotter névralgiser emperlizer emperlouser rouliser stromboliser symétriser youyouter crachaté enképissé phraséologisé pluité emporchézé blaireauteur chouteur glouglouteur radioteur symétriseur centaurestique déchétique drapeautique épopétique doublezon bleuison iglouchon sociéteton glougloutement hipipourassement pioutement bousarderie hurluberluterie rococoterie escoubellesque pioup(i)esque sofalesque abrutiliser othellotiser (s') radiotiser sourcelette tartelette bedeaudaille glougloutant égolâtre botocudo 383 Chapitre 5 – Constitution de la base de données ien ier in ir isme iste ure 1 1 1 1 1 1 1 21 terminaisons 61 termes lune figaro bouc glouglou Naga néant noir 52 bases différentes 1 1 1 1 1 1 1 lunaisien figarotier bouquetin glougloutir nagualisme néantiste noirdure L'Insolite constitue la dernière source écrite exploitée dans la création de la base de données, première étape vers le corpus sur lequel portera l'analyse. Il convient donc maintenant de s'arrêter quelques instants pour faire un premier bilan de ces différentes ressources. 1.9. Bilan des ressources écrites. Les ressources écrites exploitées dans le cadre de l'élaboration du corpus sur lequel s'établira l'analyse ont été diverses, tant par les méthodes d'extraction que par les sources elles-mêmes. Certains dépouillements ont en effet été fortement automatisés, comme le tout premier envisagé à savoir l'exploitation d'une liste de mots informatisée (A), et la recherche à partir d'expressions clés dans le TLFi disponible en ligne (C). D'autres ont été entièrement manuels, comme l'extraction dans les dictionnaires d'argot (B) ou de néologismes (H et K). Toutes ces méthodes ont cependant en commun leur rigueur : l'ensemble de chaque base de données disponible a été exhaustivement dépouillé. Une étude reposant en partie sur des néologismes ne pouvait se passer cependant de ces termes que l'on trouve au hasard d'une lecture personnelle ou, de manière moins hasardeuse, dans les articles traitant du sujet. Plusieurs suffixes se détachent des autres par la fréquence avec laquelle ils se rencontrent accompagnés d'une épenthèse consonantique. Il convient toutefois de tempérer la prépondérance de certains d'entre eux au regard de la méthode d'extraction. Ainsi le suffixe esque est-il extrêmement représenté, du fait que Plénat & al (2002) ont fourni 19 des 20 termes relevés ici. Les suffixes -ier, -age et -erie sont de même quantitativement surreprésentés puisqu'un des moyens d'extraction a été précisément d'effectuer une recherche par suffixe. 384 Chapitre 5 – Constitution de la base de données Ce corpus ne saurait être complet sans une incursion du côté des données orales, ce qui permet de capturer des épenthèses qui n'auront pas nécessairement été répertoriées à l'écrit, considérées comme des "fautes" ou tout simplement de durée de vie limitée. 2. Introduction de données uniquement orales (G) Il était nécessaire d'exploiter les données orales pour rendre compte au mieux du phénomène synchronique d'épenthèse consonantique. Pour ce faire cependant, la méthode d'extraction a été plus aléatoire puisque soumise en grande partie au hasard. Aux unités lexicales extraites de données écrites se sont greffés les termes entendus à la radio ou à la télévision (loftstorisant), ou obligeamment proposés par des collègues ou amis sensibilisés à la question (stabiloter, pyjamateux, faucuseté, etc.), totalisant 196 termes se répartissant par terminaison de la manière suivante : (27) Terminaison er Nombre de termes 55 Base bazar bec bijou bilan bisou blabla bobo boyau cacao cach(er) caoutchouc catégorie cauchemar chapeau chèvrot chipie chouchou clou coin coucou dépôt dieu favori fayot gaga gateux jus macadam Nb de termes associés 1 1 1 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 Terme bazarder becqueter bijouter bilanter bisouter blablater boboter boyauder ; boyauter cacaoter cachotter ; cachotterie caoutchouter catégoriser cauchemarder chapeauter (dé) chevroter chipieter chouchouter clouter coincer coucouler déposer bondieuser ; débondieuser favoriser fayoter gagater gatouser juter macadamiser 385 Chapitre 5 – Constitution de la base de données ier 15 age 14 eur 13 marabou Marivaux noyau numéro pansement piano poireau pou poutou psycho rebus recrue rein (é) sabot sauv(er) sirop stabilo tango texto tour tuyau verge voyou zozo bijou boyau cacao cach(er) caf(é) caoutchouc colza domino écho grue indigo morue mot (gros) obus sort bazar caoutchouc chimie fayot jus marais Marivaux noyau numéro piano poireau pourri sauv(er) tuyau bazar fayot indigo noyau numéro 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 (dé)marabouter marivauder noyauter numéroter pansementer pianoter poireauter pouiller poutouner psychoter rebuter recruter éreinter saboter sauveter siroter stabiloter tangoter textoter tourner tuyauter vergeter voyouter zozoter bijoutier boyaudier cacaotier cachottier cafetier caoutchoutier, ière colzatier dominotier échotier grutier indigotier morutier gromotier obusier sorcier bazardage caoutchoutage chimicage fayot(t)age jutage marécage marivaudage noyautage numérotage pianotage poireautage pourrissage sauvetage tuyautage bazardeur fayoteur indigoteur noyauteur numéroteur 386 Chapitre 5 – Constitution de la base de données erie 10 eux 9 ique 8 é 7 ement 5 ure 5 ière 4 isme 4 piano pourri recrue sabot sauv(er) sirop sorc(ier) tuyau bijou boyau clou cul dieu domino indigo lama sorc(ier) tuyau cafard caoutchouc cauchemar coma grisou jus pyjama velours verrue bureau caoutchouc chaos climat climat Jura schéma tennis bijou cheveu rein royal soudain velours verge bazar piano pourri recrue sorc(ier) cheveu ferm(er) nourri pourri verge cacao caf(é) souris tabac dieu gaga 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 pianoteur pourrisseur, euse recruteur saboteur sauveteur siroteur ensorceleur tuyauteur bijouterie boyauderie clouterie cucuterie bondieuserie dominoterie indigoterie lamaserie sorcellerie tuyauterie cafardeux caoutchouteux, -euse cauchemardeux comateux grisouteux juteux pyjamateux velouteux verruqueux bureautique caoutchoutique chaotique climatérique climatique jurassique schématique tennistique bijouté (e) échevelé reinté royauté soudaineté velouté vergeté bazardement pianotement pourrissement recrutement ensorcellement chevelure fermeture nourriture pourriture vergeture cacaotière cafetière souricière tabatière bondieusardisme gagatisme 387 Chapitre 5 – Constitution de la base de données iser 3 oir 3 on 3 al 3 eau 3 able 2 ain 2 ard 2 ation 2 aute 2 té 2 (o)logie aille ant axie éen eler eraie esque et ette ie ien ille ine ir oire oque u ude ume 43 terminaisons 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 196 termes inapproprié Je m'en fous climat ghetto schéma dépôt pourri vomi coin (é) nourri œil cul horizon vie lion louve souris catégorie pourri amalfi chef dieu catégorie numéro aqua cochon cul climat bijou loft story zoo saba sorc(ier) bambou cauchemar vers Barbie tabac Jura brin indigo bout(a) aléa chin(ois) cheveu dégourdi amer 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 inappropriétisme je(-)m'en(-) foutisme climatiser ghettoriser schématiser dépotoir pourrissoir vomitoir écoinçon nourrisson oeilleton soucutal horizontal vital lionceau louveteau souriceau catégorisable pourrissable amalfitain cheftaine bondieusard ; bondieusarderie catégorisation numérotation aquanaute ; cosmonaute cochonceté faucuseté climatologie bijoutaille loftstorysant zootaxie sabatéen ensorceler bambouseraie cauchemardesque verset barbinette tabagie jurassien brindille indigotine aboutir aléatoire chinetoque chevelu dégourditude amertume 97 bases 388 Chapitre 5 – Constitution de la base de données 3. Bilan sur les méthodes de constitution du corpus L'annexe 3a récapitule l'ensemble des 859 termes recueillis en fonction de leur origine, qui est indiquée par la lettre majuscule correspondante, en regard du nombre de mots récupérés pour chaque. Le tableau suivant rappelle quelques-uns de ces termes : Recherche suffixe par E. Termes G. recueillis à l'oral Articles divers D. Dictionnaires d'agot B. Dictionnaire des K. mots sauvages Expressions clés C. dans le TLFi Néologismes du H. français Liste de mots A. informatisée Nombre de termes Type de source Code (28) Termes aborder ; abricoté ; abricotier ; abricotine ; acclimater ; accourcir ; aciérage ; 350 afféterie ; affûter ; agiotage ; agioter ; agioteur ; aiguilletier ; ajouter ; alfatier ; al(l)eutier ; amadouvier ; arbalétrier ; archeterie ; archetier ; etc. (dé)marabouter ; aboutir ; aléatoire ; amalfitain ; amertume ; aquanaute ; 196 bambouseraie ; barbinette ; bazardage ; bazardement ; bazarder ; bazardeur ; becqueter ; bijoutaille ; bijouté ; bijouter ; bijouterie ; bijoutier ; etc. abritement ; abriter ; absolutisme ; absolutiste ; aileron ; amiganesque ; 94 aspergeraie ; bazardier ; beausir ; bénitier ; blaireauter ; boucautière ; bûcheron ; butorderie ; cacatesque ; cacatoire ; cachimantier ; etc. auverpin ; bagouler ; berlurer ; biffeton ; caf(e)ter ; cafemar ; cafemon ; cafeteur ; 64 cafeteux ; cafeton ; camtar ; cinémateux ; colibar ; colibri ; combientième ; conceté ; cranter ; crapahuter ; crapoteux ; crobard ; etc. abrutiliser ; adultiner ; bedeaudaille ; blaireauteur ; bleuison ; botocudo ; 61 bouquetin ; bousarderie ; centaurestique ; chouteur ; crachaté ; déchétique ; doublezon ; drapeauter ; drapeautique ; égolâtre ; emperlizer ; etc. accoutrer ; arroutain ; atlastique ; bamboutage ; baroufle ; bourreauder ; 48 brelander ; brelandier ; broutain ; calembourdier ; calendrier ; calfeutrage ; calfeutrement ; calfeutrer ; cambrésien ; cambrésine ; chichiter ; etc. alibababesque ; biberondasse ; biscotonneux ; bochetée ; bocheton ; bretonnitude 25 ; calorisation ; caloriser ; cambouité ; cuirture ; émerpiner ; glavioter ; glavioteur ; hobereautaille ; méliméloter (se) ; pageoterie ; etc. banlieusard ; bleusaille ; bleuter ; bleuterie ; chevaucher ; chimiatrie ; diablotin ; 21 dortoir ; harnacher ; joufflu ; noircir ; portraicturien ; roitelet ; traquenard ; verdâtre ; verdelet ; verdeur ; verdier ; verdir ; verdoyer ; verdure 859 La source qui s'est révélée la plus prolifique en termes comportant potentiellement une épenthèse entre radical et suffixe est la recherche systématique, à l'intérieur de la liste de 64.296 termes, de ceux se terminant par les suffixes -ier, -age et -erie : plus de la moitié des mots relevés à partir de sources écrites (350 termes sur 663 issus de sources écrites) proviennent de ce traitement. C'est ensuite l'origine orale qui se distingue (196 termes), puis les données issues d'articles (94 termes). Les dictionnaires d'argot, de néologismes et autres mots sauvages sont moins bien représentés (64, 25 et 61 termes respectivement), la recherche par expressions-clés dans le TLFi n'ayant quant à elle fourni que 48 items. 389 Chapitre 5 – Constitution de la base de données Le tableau suivant permet d'évaluer la part prise par chaque source dans la constitution de la base de données, à l'intérieur des sources écrites pour celles qui sont concernées puis par rapport à l'ensemble du corpus. (29) 21 64 48 94 350 taux dans le corpus "écrit" 3.17 % 9.66 % 7.24 % 14.18 % 52.79 % taux dans le corpus total 2.44 % 7.45 % 5.59 % 10.95 % 40.74 % H. K. 25 61 3.77 % 9.20 % 2.91 % 7.10 % G. 663 196 100 % / 77.18 % 22.82 % type de source Code liste de 64.296 termes dictionnaires d'argot interrogation du TLFi articles étude des suffixes -ier, -age et -erie dictionnaire des néologismes dictionnaire des mots sauvages total sources écrites sources orales A. B. C. D. E. total du corpus termes sélectionnés 859 / 100 % Un peu moins d'un quart des termes contenus dans la base de données proviennent de sources orales (22.82 %), ce qui est près du double de ce qu'une répartition moyenne des termes par source aurait laissé supposer (12.50 %). Les sources n'ont dans la réalité pas été exploitées aussi linéairement que ne le suggère ce tableau, mais parfois en parallèle : un terme entendu à la télévision a pu être ajouté au même moment qu'était procédé au traitement automatique (A.), puis un autre alors que les dictionnaires d'argot étaient dépouillés, etc. Etant donné que la règle était "first arrived, first served", c'est-à-dire qu'une fois qu'une unité lexicale était introduite dans le corpus par quelque source que ce soit, elle disqualifiait ses éventuelles autres occurrences trouvées par un autre biais, les sources exploitées vers la fin de la constitution de la base de données (dictionnaires de néologismes) semblent moins riches qu'elles ne l'étaient en réalité. En effet, la source dépouillée en second n'a pas été créditée des mots déjà enregistrés dans la liste car présents dans la première, les items proposés par la troisième source n'ont été retenus que dans la mesure où les deux premières ne les avait pas proposés, etc. Ce choix certes biaise partiellement la comparaison par source, mais pointe de manière encore plus cruciale le manque de succès de la recherche automatique, première source exploitée, par rapport aux autres : bien que tous les termes qu'elle a offerts ont été retenus au contraire des autres sources utilisées, elle est malgré tout celle qui en a fourni le moins. 390 Chapitre 5 – Constitution de la base de données Il ne s'agit ici que de la première étape de sélection des unités lexicales qui figureront dans le corpus sur lequel se basera l'analyse. Il sera plus pertinent de comparer les différentes sources entre elles après que la base de données sera passée à travers deux filtres distincts (cf. chapitre 6 de cette partie II), de façon à évaluer la validité des méthodes d'extraction ici exploitées. De même qu'un premier bilan quant aux différentes origines de constitution du corpus a été dressé, intéressons-nous aux terminaisons de ces 859 unités lexicales. 4. Bilan sur les terminaisons représentées dans le corpus On ne peut parler à cette étape de suffixes étant donné qu'aucune analyse sémantique n'a encore permis de les établir ici. Le tableau ci-dessous, récapitulant pour chaque terminaison le nombre de termes concernés, a donc uniquement une valeur indicative, antérieurement à tout filtre étymologique ou sémantique effectué sur la base de données. On en trouvera la version complète triée à l'intérieur de chaque terminaison par la consonne supposée épenthésée en annexe 3b. er ier age erie eur on esque é ique eux ement isme ure iser ière ard in ir ain ? eau aille ois oire Nombre de termes Terminaison (30) Termes 226 99 85 75 32 26 26 25 20 18 14 11 10 10 10 10 9 7 7 7 6 6 5 5 abriter ; aborder ; boiser ; adultiner ; coincer ; chevaucher ; accoutrer ; bagouler... abricotier ; bazardier ; dossier ; jambosier ; cordelier ; arbalétrier ; vomiquier ; fournier... agiotage ; badaudage ; masselottage ; époutissage ; boisage ; chimicage ; fournage ... afféterie ; badauderie ; baguenauderie ; boiserie ; sorcellerie ; huisserie ; bouverie... agioteur ; argoteur ; bardeur ; bazardeur ; coqueleur ; ensorceleur ; pourrisseur... biffeton ; aileron ; bûcheron ; écoinçon ; enfançon ; bleuison ; iglouchon ; cafemon... cacatesque ; ceaucesculesque ; amiganesque ; canulardesque ; alibababesque... abricoté ; bijouté ; barreaudé ; foindé ; enképissé ; joncé ; emporchézé ; échevelé... argotique ; atlastique ; bureautique ; médiumnique ; jurassique cafeteux ; cafardeux ; cauchemardeux ; verruqueux ; coqueleux ; biscotonneux... abritement ; empiètement ; ensorcellement ; hipipourassement ; bazardement... absolutisme ; argotisme ; favoritisme ; gagatisme ; gogotisme ; hugotisme ; nagualisme... cuirture ; fermeture ; fourniture ; nourriture ; pourriture ; vergeture ; noirdure... climatiser ; eczématiser (s') ; médiatiser1 ; abrutiliser ; ghettoriser boucautière ; cacaotière ; cafetière ; coquetière ; escargotière ; giletière ; souricière... banlieusard ; bondieusard ; faflard ; vicelard ; crobard ; traquenard ; queutard bouquetin ; diablotin ; fagotin ; piétin ; tableautin ; auverpin ; coquebin ; gosselin... accourcir ; durcir ; noircir ; aboutir ; glougloutir ; verdir ; beausir amalfitain ; arroutain ; broutain ; samaritain ; cheftaine ; pierrefeucain ; valéricain filandre ; patraque ; polacre ; tringle ; vrille ; baroufle ; cible lionceau ; ponceau ; souriceau ; faisandeau ; manchereau ; louveteau bijoutaille ; hobereautaille ; piétaille ; bleusaille ; gueusaille ; bedeaudaille clamecycois ; souriquois ; spadois ; graylois ; pouillyzois aléatoire ; cacatoire ; dépotoir ; dortoir ; vomitoir 391 Chapitre 5 – Constitution de la base de données ine ien ie ation ais té iste ette et elet âtre ar ant al aire ude ot go fier ée aute able urien ume uche u ri re oyer ourde otter otte oque ologue oir o lu ium ite is ion ingue iner ille ifier if ième iat euse eter esse eraie elle eler éen dé caille axie 5 5 5 4 4 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 abricotine ; indigotine ; cambrésine ; myrosine ; conchyoline cambrésien ; lunaisien ; onusienne ; hugolien ; jurassien baraterie ; daterie ; tabagie ; chimiatrie ; papousie calorisation ; catégorisation ; colorisation ; numérotation congolais ; togolais ; javanais ; vinçanais cochonceté ; conceté ; faucuseté absolutiste ; argotiste ; néantiste sourcelette ; tartelette ; barbinette coquelet ; coqueret ; verset dieutelet ; roitelet ; verdelet égolâtre ; hugolâtre ; verdâtre cafemar ; colibar ; camtar loftstorysant ; trotskisant ; glougloutant vital ; horizontal ; soucutal moscoutaire ; sursitaire ; tissulaire bretonnitude ; dégourditude gosselot ; queusot icigo ; labago cocufier ; statufier bochetée ; yeutée aquanaute ; cosmonaute pourrissable ; catégorisable portraicturien amertume coqueluche chevelu colibri coudre verdoyer coquelourde picoter masselotte chinetoque sidénologue pourrissoir botocudo joufflu mycélium halloysite cailloutis taxation louftingue piétiner brindille salifier taxatif combientième marloupiat émeriseuse piqueter têtutesse bambouseraie coquerelle ensorceler sabatéen jourdé icicaille zootaxie 392 Chapitre 5 – Constitution de la base de données asser asse ance an aie (o)logie (ill)age 89 1 1 1 1 1 1 1 859 avocasser biberondasse cuistance partisan aspergeraie climatologie enfantillage Quatre-vingt-neuf terminaisons différentes sont recensées à ce stade de la création du corpus. Les plus fréquemment observées sont -er13 (226 unités lexicales, soit 26.30 % de l'ensemble), -ier (99 termes, soit 11.53%), -age (85 mots, 9.9 %) et -erie (75 items, 8.73 %), résultat à contempler avec précaution étant donné que la source la plus productive de termes a précisément été la recherche systématique de mots comportant ces trois derniers suffixes. Par ailleurs, quarante-trois de ces terminaisons, soit près de la moitié d'entre elles (48.31 %) ne sont représentées qu'une fois dans la base de données. Cette base de données ne constitue qu'une matière brute qu'il va maintenant falloir nettoyer. Les étapes de filtre successives par lesquelles elle est passée pour fournir le corpus sur lequel pourra se fonder l'analyse font l'objet du chapitre suivant. 13 Hors -ier, -eter et les terminaisons autrement distinguées dans le tableau. 393 Chapitre 6 – De la base de données au corpus de travail Chapitre 6. De la base de données au corpus de travail La base de données ainsi réunie contient 859 termes présentant potentiellement une épenthèse consonantique entre radical et suffixe. Elle comporte cependant beaucoup de "bruit". En effet, tous les termes retenus à cette étape de la constitution du corpus ne contiennent pas tous réellement une épenthèse, comme l'indique par exemple, dans une certaine mesure, l'étymologie ou les alternances radicales ou suffixales ; par ailleurs, les termes restant en lice nécessitent des regroupements permettant une analyse unifiée autant que possible et non au cas par cas. Le corpus brut constitué de la mise en commun des termes soupçonnés présenter une épenthèse à l'endroit intéressé va donc passer par deux filtres différents. Le premier consistera à l'épurer des termes pour lesquels l'épenthèse n'est pas à l'endroit souhaité et de ceux pour lesquels l'étymologie ou les alternances radicales ou suffixales excluent l'épenthèse. Un second filtre s'intéressera plus particulièrement aux suffixes devant lesquels semble se produire une épenthèse et tâchera d'étudier chaque cas en fonction des bases possibles et des signifiés de la base, du suffixe et du terme dérivé. A chaque traitement du corpus trois cas seront distingués. Un premier ensemble rassemblera les termes définitivement rejetés comme non pertinents pour l'analyse ; un second groupe sera constitué des éléments pour lesquels le manque ou l'hétérogénéité des informations recueillies ne permet pas de décider de leur rejet ni de leur acceptation ; enfin, dans une troisième catégorie seront identifiées les unités lexicales contenant une consonne épenthétique, c'est-à-dire celles qui relèvent de l'étude envisagée ici. 394 Chapitre 6 – De la base de données au corpus de travail 1. Premier filtre : étymologies et consonnes sous-jacentes Ce premier filtre a pour mission d'épurer le corpus brut des termes identifiés comme non pertinents pour l'analyse, que ce soit par l'étymologie ou du fait des alternances de radicaux ou de suffixes. Sont rejetés également les termes récupérés par les moyens automatiques, notamment par l'analyse du TLFi par séquences clés (méthode de recueil C.), pour lesquels l'épenthèse n'est pas à l'endroit voulu. On trouvera le traitement des 859 termes de la base de données initiale en annexe 3c. Pour chaque terme écarté est indiquée en regard la cause de cette exclusion, de façon à assurer la traçabilité de son traitement. Les deux premières causes de rejet sont extérieures à la dérivation : il s'agit de l'introduction malheureuse d'unités lexicales composées et non dérivées, ou dont l'épenthèse n'est pas à l'endroit souhaité. Viennent ensuite les différents traitements liés à l'étymologie, suivis de l'étude des consonnes sous-jacentes non apparentes diachroniquement mais révélées par le féminin de la base. Les alternances radicales et suffixales poursuivent ce premier filtre. Seront ensuite présentées trois familles lexicales (pied, sorcier, coq) afin d'appréhender de manière plus ciblée l'impact de traitement de cette première étape vers un corpus fiable. 1.1. Terme composé et non dérivé Six termes se sont avérés relever du phénomène de composition et non de dérivation, ce qui les écarte d'emblée de l'étude, d'une part parce que celle-ci porte sur l'épenthèse dans le cas particulier de dérivation qu'est la concaténation d'un radical et d'un suffixe, d'autre part du fait que l'éventuelle consonne épenthésée correspondait en réalité au début du second élément de composition. Ainsi dans hugolâtre ne doit-on pas supposer une concaténation du radical hugo et du suffixe par ailleurs attesté -âtre, mais une composition dudit radical avec l'élément -lâtre "adorer". Les termes composés (cf. chapitre 4 section 3.2) portent la marque de cette élimination du corpus sous la forme de l'indication "comp" portée en regard de chacun d'eux dans la colonne "code explicatif". Le tableau suivant en fournit la liste en fonction de la source d'extraction de chaque terme : 395 Chapitre 6 – De la base de données au corpus de travail (31) Méthode de recueil A. B. C. D. E. G. H. K. total Nb de termes concernés 0 0 0 1 1 3 0 1 6 Termes éliminés motif "comp" hugolâtre coquelourde aquanaute ; cosmonaute ; zootaxie égolâtre Une autre catégorie de termes a été éliminée préalablement à toute analyse car ne correspondant pas à l'objectif visé dans cette étude ; il s'agit de ceux comportant certes une épenthèse consonantique, mais pas à la frontière morphologique entre radical et suffixe. 1.2. Epenthèse mal placée La méthode de recueil par recherche de séquences clés telles que "épenthèse" ou "consonne de transition" dans le TLFi (cf. section [5] 1.4) a permis de récupérer 48 termes, parmi lesquels 8 ne contiennent pas l'épenthèse entre radical et suffixe mais ailleurs dans le mot, ce qui exclut ces termes du champ de cette étude14. Ces termes seront identifiés dans le corpus par une étiquette "mp" pour "mal placée", faisant référence au positionnement de l'épenthèse consonantique, et seront exclus définitivement du corpus. (32) Nombre de termes issus de C. Nombre de termes présentant une épenthèse mal placée Termes éliminés motif "mp" 48 8 baroufle ; cible ; coudre ; engendrer ; filandre ; polacre ; tringle ; vrille Ces huit termes ont été incorporés dans la base de données initiale du fait de la méthode de recueil exploitée, c'est pourquoi l'erreur "d'aiguillage" porte sur ce petit nombre seulement. Si la mauvaise position de l'épenthèse ne concerne somme toute que 8 unités sur 859, un nombre bien plus conséquent de termes en revanche se verront exclus du fait de leur étymologie. 14 On notera que ces termes sont dus à ce que "le groupe formé de consonne+r étant favorisé par la langue, il en est résulté qu'à des époques diverses un r parasite a été inséré" (Bourciez 1967 : 181). 396 Chapitre 6 – De la base de données au corpus de travail 1.3. Etymologie Dans cette section sont rassemblées les raisons liées à l'étymologie justifiant de l'exclusion de certaines unités lexicales ou du maintien d'autres. Le but d'une recherche étymologique pour chacune des unités lexicales recensées dans la base de données est double : - d'une part écarter les épenthèses qui sont antérieures au français et remontent au latin (voire au grec) type amaritudinem pour amertume ; - d'autre part écarter les consonnes sous-jacentes en synchronie mais diachroniquement présentes, dont on peut supposer qu'elles ont laissé une trace dans le morphème (bleusaille : dérivé de bleuse, féminin dialectal de bleu) En revanche, les "fausses" épenthèses, c'est-à-dire celles qu'une étymologie populaire ou un peu hâtive indiqueraient comme telles sans qu'elles en soient (clouter < gallo-roman clouster, dérivé de clouet et non de clou), souvent mises en évidence dans les dictionnaires, n'ont pas été écartées. En effet, dans quelle mesure l'interprétation populaire de la formation de ces termes intervient-elle dans l'analogie ? Donc dans la création d'épenthèses ? Trois dictionnaires ont été utilisés pour établir l'étymologie des unités lexicales sous intérêt : le Trésor de la Langue Française (version papier puis informatisée), le Robert, Dictionnaire historique de la langue française (1992 [2000], dorénavant Rey et al.), et le Dictionnaire étymologique de la langue française de Bloch & Von Wartburg (1932 [1968] ; dorénavant Bloch & Wartburg). Le Bloch & Wartburg est destiné à un public non spécialiste et ne contient "que le vocabulaire usuel du français contemporain au sens large du mot : ce vocabulaire comprend de nombeux mots techniques, auxquels l'usage et la langue écrite donnent une diffusion". Les auteurs ont écarté les termes jugés archaïques s'ils ne sont plus employés même dans la langue littéraire, ainsi que les termes très techniques. En revanche, ils ont intégré beaucoup de termes du français populaire, usuels dans la langue parlée, bien qu'ayant à peine trouvé place dans les dictionnaires", tout en excluant l'argot jugé "souvent passager, et qui pose des problèmes délicats ou insolubles dans l'état de nos connaissances." (1968 : XIX). Considérant que "l'étymologie ne consiste que dans l'histoire des mots et des notions qu'ils expriment" (1968 : XX), Bloch & Wartburg ont choisi de présenter l'histoire de chaque mot depuis le latin, en donnant des dates précises notamment quant à la première apparition et 397 Chapitre 6 – De la base de données au corpus de travail l'entrée réelle en usage d'un terme. Ils ont exploité en ce sens nombre d'ouvrages, dictionnaires ou histoires de la langue française (cf. 1968 : XXI), parmi lesquels le Dictionnaire général de la langue française, de Darmesteter et al., les ouvrages de Sainéan, "surtout ceux qu'il a consacrés au français populaire du XIXe siècle et à l'argot", l'Histoire de la langue française de Brunt, celle de Brunot, les travaux de Gilles Ménage, et surtout, et de plus en plus au fur et à mesure des rééditions du Bloch & Wartburg et de l'avancée du FEW, le Französisches Etymologisches Wörterbuch (FEW) de Wartburg. Le Robert, Dictionnaire historique de la langue française (Rey & al) a pour objet d'étude "le vocabulaire du français moderne" (1992 : VIII). Il ne s'arrête pas au latin mais mentionne également les origines indoeuropéennes ou sémitiques. Comme le Bloch & Wartburg, il se réclame de ses nombreux prédécesseurs Gilles Ménage, Friedrich Diez, Walter von Wartburg, Kurt Baldinger, mais également Pierre Guiraud - ainsi que de moults dictionnaires - le Grand Robert, le Grand Larousse de la langue française et le Trésor de la Langue Française : "toutes les sources publiées et raisonnablement diffusées ont été utilisées ici ; même des travaux non publiés nous ont été communiqués" (1992 : XIV). La datation proposée se veut là encore la plus précise possible, compte tenu du manque d'information quant à la date précise de certains textes et surtout du fait qu'il ne s'agit que des sources attestées, ne préjugeant pas de la première apparition du terme à l'oral ou dans d'autres ouvrages non répertoriés. Le Trésor de la Langue Française est un dictionnaire réalisé à partir de plus de 1500 oeuvres littéraires des XIXème et XXème siècles (qui constituent actuellement la moitié environ des oeuvres contenues dans la base de données Frantext), à partir desquelles ont été extraits à l'aide de l'ordinateur les 100 000 termes et les 430 000 exemples que compte le dictionnaire. La parution du TLF s'étale sur près d'un quart de siècle (1971 - 1994), et ce dictionnaire est disponible depuis 2001 en accès libre sur le réseau internet (http://www.atilf.fr/_ie/index_TLFi.htm). Le TLF se veut "un dictionnaire descriptif et non normatif - le dictionnaire de la langue écrite et parlée du XIXème et du XXème siècle. Il s'attache au génie de la langue qu'il décrit dans sa richesse, dans ses renouvellements, dans sa spontanéité, telle qu'elle apparaît "parlée" dans les textes littéraires" (Présentation du Trésor de la langue française : 2). Par ailleurs, le TLF s'est efforcé d'intégrer de nombreux termes scientifiques aussi bien que 398 Chapitre 6 – De la base de données au corpus de travail techniques, "pour rendre compte de la diffusion des vocabulaires de spécialité, en particulier au cours de la seconde moitié du XXe siècle". (Présentation TLF : 2). Le TLF a également la vocation, à travers sa rubrique Etymologie et Histoire que l'on trouve pour chaque article, de constituer "un passionnant dictionnaire historique de la langue française d'une richesse exceptionnelle, véritable dictionnaire caché dans le dictionnaire. On y trouve les différentes étapes de l'histoire du mot et de ses divers sens dès leur première apparition dans la langue. On y apprend qui, dans l'état actuel de nos connaissances, a très probablement osé utiliser pour la première fois le mot ou le sens" (présentation TLF : 4). La partie historique du dictionnaire est basée sur le FEW de Wartburg et "quelques autres dictionnaires étymologiques modernes, ceux notamment des principales langues romanes " (TLF vol. 1 : XLIII). C'est cette richesse étymologique déclarée qui m'a conduite à utiliser le TLF en sus des deux autres dictionnaires, plus ouvertement historiques, que sont le Bloch & Wartburg et le Robert historique. Consulter ces dictionnaires permet également de distinguer dans certains cas des homophones formés sur des bases différentes, dont l'un présente une épenthèse intéressante. Arrêtons-nous un instant sur le terme briqueterie. Un détour par le TLF démontre que l'on a en réalité affaire à trois termes différents : briqueterie1 formé sur brique, briqueterie2 sur briquette et briqueterie3 sur briquet, les signifiés confirmant ces formations. De ce fait, briqueterie1 est maintenu dans le corpus mais ses deux acolytes sont rejetés. En revanche, les dictionnaires ne seront pas considérés comme arbitres dans la décision finale relative à une consonne candidate à l'épenthèse dans un terme donné. Prenons pour définir le propos le cas du dérivé agiotage. Le TLF le considère comme dérivé du verbe agioter, alors que Bloch & Wartburg le rattachent directement à agio. Dans un cas il y a épenthèse et le terme est intéressant pour l'analyse, dans l'autre l'épenthèse n'est qu'"empruntée". Il en est de même pour le terme biseautage : le TLF et le Rey & al le lient au verbe biseauter, mais le Bloch & Wartburg le dérivent sur le substantif biseau. Que faire si l'on a pris comme critère décisionnel absolu l'avis des dictionnaires étymologiques et qu'il ne s'entendent pas ? Il conviendra plutôt de prendre une décision en fonction de l'étude du suffixe -age et des bases sur lesquelles il peut s'adjoindre, concernant l'ensemble des dérivés en -age : sont-ils tous rattachables à un verbe en -er, attesté ou virtuel ? Le suffixe -oter pose également problème si l'on tente de trouver un traitement unifié pour un suffixe donné. Considérons pour s'en convaincre les termes ergoter et agioter. Le 399 Chapitre 6 – De la base de données au corpus de travail premier est dit dérivé de ergo à l'aide du suffixe -oter, mais le second à l'aide du suffixe -er et d'une épenthèse. Faut-il néanmoins postuler un traitement unifié pour les deux, à partir du moment où la base est de même longueur et se termine pas la même voyelle ? Faut-il au contraire s'en tenir aux étymologies proposées par les dictionnaires consultés ? Là encore, ce n'est qu'un examen plus approfondi des suffixes -er et -oter qui permettra de proposer une solution. Cet examen des suffixes attestés dans le corpus ne fait pas l'objet de ce premier filtre, on le trouvera en section 2 de ce même chapitre. Les raisons liées à l'étymologie concernant le statut d'une unité lexicale sont au nombre de cinq, dont trois en faveur du rejet des termes concernés. Un premier ensemble de termes sera en effet exclu du fait qu'il ne s'agit pas d'unités lexicales dérivées en français, mais que la consonne potentiellement intéressante appartient en réalité à un terme latin. Les bases qui comportent une consonne sous-jacente à la finale, indiquée par leur étymologie, disqualifient les dérivés associés. Un troisième groupe de termes éliminés, plus modeste, contient les dérivés pour lesquels la consonne potentiellement épenthésée n'est que graphique et ne correspond à aucun élément étymologique ni phonologique. Certains dérivés font l'objet d'un croisement de plusieurs étymologies, rendant malcommode l'appréhension de leur formation ; c'est pourquoi ils inaugurent la catégorie des "indécis" du corpus, c'est-à-dire des termes pour lesquels il n'est pas possible, au moins à cette étape de leur traitement, de décider de leur maintien ou de leur rejet. Enfin seront examinés dans une dernière sous-section les termes pour lesquels l'étymologie indique une consonne en finale de base, mais pas la même que celle qui est épenthésée dans le dérivé correspondant. Les unités lexicales concernées seront maintenues dans le corpus au terme de ce premier filtre. 1.3.1. Héritage d'un terme latin Une première cause d'exclusion du corpus est le fait qu'un terme peut avoir été directement hérité d'une forme latine contenant la consonne dont on aurait pu penser qu'elle était épenthétique. C'est le cas par exemple du terme noircir, dont on pouvait supposer la dérivation à partir de l'adjectif noir à l'aide du suffixe -ir, et semblait de ce fait présenter une épenthèse de 400 Chapitre 6 – De la base de données au corpus de travail [s]. Une vérification de l'étymologie du mot établit son origine latine (lat pop °nigrescre), l'excluant par là-même du corpus de travail. Vingt-trois termes de la base de données initiale sont concernés de manière certaine, auxquels se rajoutent quatre termes pour lesquels la base n'est pas certaine. Ces termes sont identifiés par le code "2a" porté en regard de leur entrée dans la colonne "code explicatif" pour ceux-là, le code "2" pour ceux-ci. Le tableau suivant récapitule les termes exclus par ce critère en fonction de leur provenance en termes de méthodes de recueil : (33) Méthode de recueil A. B. C. D. E. G. H. K. total Nombre de termes Termes éliminés motif "2a" concernés 4 chevaucher ; dortoir ; joufflu ; noircir 0 2 calendrier ; mycélium 2 fermeté ; hiverner daterie ; enfançon ; grainetier2 ; jeter ; luter ; manécanterie ; piétaille ; 10 +2 piéter ; porter ; taxation ; (forestier) ; (ponceau) aléatoire ; amertume ; climatérique ; nourrisson ; sorcier ; tourner ; 9+2 verruqueux ; vital ; vomitoir ; (chevelure) ; (soudaineté) 0 0 27+4 Outre un héritage direct excluant tout processus de dérivation en français, l'étymologie peut également indiquer la présence d'une consonne sous-jacente dans le radical. 1.3.2. Présence de la consonne dans la base Une consonne n'apparaissant pas en surface, dans la réalisation d'une base en isolation, peut en effet être mise en évidence par l'établissement de la forme dont elle est issue. Prenons pour illustrer le propos le cas des dérivés de la famille de vert : verdeur, verdure, verdâtre, verdelet, verdir, verdoyer ; deux hypothèses proposées par les dictionnaires : soit ils sont issus de vert lui-même du latin viridis, comportant donc un -d- dans la position correspondant à la fin du radical, soit du terme moyen-âgeux verde dans lequel le -d est audible en finale. Quelle que soit l'hypothèse retenue, le [d] est présent dans le radical, soit en tant que consonne sousjacente (en concurrence avec [t] qui apparaît à la liaison), soit en finale de radical dans la deuxième option considérée. Le [d] n'étant pas épenthétique, ces termes sont disqualifiés, ce qui est indiqué par un code "2b" dans la colonne "code explicatif". Sont également marqués par le code "2b" les termes pour lesquels on trouve trace d'une forme comportant la consonne à une période postérieure au latin ou dans une langue 401 Chapitre 6 – De la base de données au corpus de travail régionale indiquée comme source par les dictionnaires consultés. C'est le cas par exemple pour le terme traquenard, issu d'une forme occitane, gasconne ou languedocienne tracanart, dérivée de tracan. Le tableau suivant récapitule l'ensemble des 229 termes "réformés 2b" de la base de données initiale, en fonction de la méthode de recueil dont ils sont issus, augmentés des quatre termes cités dans le paragraphe précédent pour lesquels la motivation de rejet est incertaine. (34) Méthode de recueil Nombre de termes concernés A. 9 B. 3 C. 7 D. 9 E. 140+2 G. 51+2 H. K. 1 6 226+4 total Termes éliminés motif "2b" diablotin ; traquenard ; verdâtre, ; verdelet ; verdeur ; verdier ; verdir ; verdoyer ; verdure bagouler ; cinémateux ; trouduculier accoutrer ; calembourdier ; calendrier ; calfeutrage ; calfeutrement ; calfeutrer ; conchyoline ; patraque absolutisme ; absolutiste ; bénitier ; élancer ; enfourner ; épauletier ; médiatiser1 ; météoriser ; partisan aborder ; accclimater ; accourcir ; aciérage ; affèterie ; affûter ; aiguilletier ; ajouter ; arbalétrier ; archèterie ; archetier ; argenter ; avocatier ; baguenauderie ; baraterie ; bigoterie ; biscuiterie ; bluterie ; boisage ; boiser ; boiserie ; boiterie ; border ; bouverie ; bouvetage ; brigandage ; briquetage2 ; briqueter2 ; briqueterie2 ; briqueterie3 ; cédratier ; chamoiser ; chariotage ; chocolatier ; cimenter ; clavetage ; closerie ; cordelier ; cureter ; déliter ; délutage ; démâtage ; descenderie ; dévergonder ; diamanter ; doigter ; doigtier ; dossier ; drapier ; droiterie ; ébruiter ; échevet(t)age ; écoté ; effronté ; emblaver ; enfantillage ; épisser ; époutissage ; essarter ; fardage ; farder ; farter ; fonderie ; forfanterie ; formater ; fournage ; fournier ; fruiterie ; gailleterie ; ganter ; garancer ; gazetier ; guichetier ; hourder ; huisserie ; îlotage ; îlotier ; jambosier ; joncé ; joncher ; laitage ; laitier ; larder ; loterie ; lotier ; mailleter ; marchander ; marqueterie ; matelassier ; matelotage ; mégot(t)er ; merceriser ; minotier ; moiser ; moleter ; mortaiser ; mousqueterie ; moyettage ; organsiner ; pailleter ; papilloter ; paquetage ; paqueter ; paqueteur ; paquetier ; paradisier ; parqueter ; partage ; patenter ; peaucier ; peaussier ; platelage ; plomber ; pointer ; pontage ; potier ; prime(-)sautier ; puiser ; quartier ; raboter ; rabouter ; ravauder ; retorderie ; rivetier ; robinetterie ; saborder ; salifier ; sténosage ; tamiser ; torsinage ; trématage ; tricoter ; truander ; vagabonder ; vanterie ; venter ; verroterie ; versage ; vignet(t)é ; vomiquier ; (forestier) ; (ponceau) (dé)marabouter ; aboutir ; bondieusard ; bondieusarderie ; bondieusardisme ; bondieuser ; bondieuserie ; cheftaine ; chevelu ; chevroter ; climatique ; climatiser ; climatologie ; coincer ; colzatier ; comateux ; coucouler ; débondieuser ; dépotoir ; échevelé ; écoinçon ; gromotier ; horizontal ; je(-)m'en(-) foutisme ; jurassien ; jurassique ; lionceau ; louveteau ; marécage ; nourriture ; obusier ; oeilleton ; pouiller ; pourrissable ; pourrissage ; pourrissement ; pourrisseur ; pourrissoir ; poutouner ; rebuter ; saboter ; saboteur ; sauvetage ; sauveter ; sauveteur ; schématique ; schématiser ; souriceau ; souricière ; tabagie ; verset ; (chevelure) ; (soudaineté) pageoterie bleuison ; bouquetin ; emperlouser ; nagualisme ; néantiste ; pioupesque Cet effectif constitue la majeure partie des termes rejetés du fait de leur étymologie. Parmi les termes exclus sous le motif "2b" une sous-classe a été constituée, rassemblant les 402 Chapitre 6 – De la base de données au corpus de travail termes pour lesquels certes une consonne est identifiable en finale de la base en diachronie, certes ladite consonne correspond bien à celle qui est épenthésée, mais cette consonne n'apparaît qu'au génitif latin et non au nominatif. Ceci concerne onze termes, identifiés par le label "cl" pour climat, qui sert de prototype pour cette sous-catégorie. (35) Méthode de recueil A. B. C. D. E. Nombre de termes concernés / / / / 4 G. 7 H. K. / / 11 total Termes éliminés motif "2b" appartenant au sous-ensemble "cl" / / / / acclimater ; diamanter ; époutissage ; trématage climatique ; climatiser ; climatologie ; comateux ; horizontal ; schématique ; schématiser / / Jusqu'à présent nous avons envisagé les cas où un terme est exclu du corpus parce qu'il existait déjà dérivé en latin avec la consonne suspecte ou qu'il est issu d'une base comportant la consonne candidate en fin de radical. Une troisième cause d'éviction est constituée par le leurre graphique que peut constituer une consonne indiquée à l'écrit mais qui d'une part n'est jamais prononcée, d'autre part ne correspond à aucun phonème dans l'histoire du mot. 1.3.3. Consonne uniquement graphique Deux termes de la base de données initiale présentent une consonne à l'écrit entre le radical et le suffixe, ce qui justifie de leur intégration dans le corpus dans un premier temps, mais sans que cette consonne ne corresponde à un élément phonologique. Dans les termes portraicturien (origine A.) et dompter (origine C.) en effet, les consonnes -c- et -p- ne sont jamais réalisées, ni ne sont attestées dans l'étymologie. Les dictionnaires consultés parlent à leur encontre de "consonne graphique" due à de l'analogie ou à une volonté de donner un "aspect archaïque" au terme. Seront donc écartés du corpus, dès cette première étape de sélection, trois types d'unités lexicales : - celles pour lesquelles la consonne incriminée n'est que graphique et ne correspond à aucune réalité phonologique, passée ou actuelle ; 403 Chapitre 6 – De la base de données au corpus de travail - celles pour lesquelles la consonne possiblement épenthésée se trouve en réalité en finale de radical, ce qui est indiqué par l'étymologie du terme ; - celles enfin qui remontent à un terme comportant déjà l'épenthèse, ou d'une manière plus large la consonne soupçonnée d'être épenthétique, en latin. Tournons-nous maintenant vers le cas où l'étymologie n'est pas clairement établie, les dictionnaires consultés ne fournissant pas une source mais plusieurs s'influençant l'une l'autre. 1.3.4. Croisement de plusieurs étymologies Trois termes dans la base de données ont des étymologies croisées, c'est-à-dire qu'ils sont réputés issus de certaines unités lexicales mais avec l'influence d'autres unités, celles-ci comportant précisément une consonne dans la position sous intérêt. Il s'agit de coquebin, vivandier et déposer, les deux premiers étant de source E. (examen des termes par suffixe, cf. section [5] 1.6) et le troisième d'origine G (données orales, cf. section [5] 2). Il est nécessaire de préciser ici que la modestie du nombre de termes concernés est due au fait que ne sont considérés ici que les termes pour lesquels ce n'est pas seulement la base qui est source de multiples interprétations, mais l'ensemble du dérivé. Les trois termes coquebin, vivandier et déposer ont été écartés du corpus final du fait précisément de l'impossibilité de déterminer leur formation, sans être pour autant éliminés avec certitude. Ils sont marqués dans le corpus par le code "3" porté dans la colonne "code explicatif" en regard de leur entrée. Un dernier cas en relation avec l'étymologie est ici considéré, mais dans le sens d'un maintien des séquences concernées et non de leur rejet ou de leur mise à l'écart. Il s'agit des unités lexicales correspondant à des bases comportant une consonne en finale, sans que cette consonne s'identifie avec la consonne épenthésée dans le dérivé correspondant. 1.3.5. Consonne différente de celle de l'épenthèse Cette section traite des termes présentant effectivement, après vérification étymologique, une consonne en finale de base. Cependant, cette consonne n'est pas la consonne qui apparaît à la dérivation. De ce fait, la consonne qui apparaît à la dérivation est soit un avatar de la consonne en finale de base, soit une consonne réellement épenthétique. A 404 Chapitre 6 – De la base de données au corpus de travail cette étape de l'élagage du corpus, aucune décision ne peut être prise dans un sens ou dans l'autre, c'est pourquoi ces termes sont maintenus dans le corpus, accompagnés du label "P" pour "position". Dans le cas où la consonne est considérée comme épenthétique, une sous-distinction est possible par rapport aux consonnes épenthétiques insérées derrière une base ne présentant aucune consonne finale sous-jacente ; en effet, dans le cas présent on ne sait pas si la consonne épenthétique est simplement une épenthèse de mélodie sur une position fournie par la consonne finale de la base, ou s'il s'agit d'une épenthèse "totale", à savoir mélodie et position. Soixante-quatre termes présentent une consonne entre radical et suffixe différente de celle qui est flottante à la finale de la base. Il faut retrancher à ces soixante-quatre termes les quatre de la famille de sorcier : ensorceler, ensorceleur, ensorcellement, sorcellerie, qui seront traités plus particulièrement en section 1.7.2. Les soixante termes restants se répartissent, en fonction des différentes sources à l'origine de la base de données initiale, de la manière suivante : (36) Méthode de recueil A. B. C. D. E. G. H. K. Total Nombre de termes Termes retenus étiquette "P" concernés 2 banlieusard ; harnacher 0 3 brelander ; brelandier ; myrosine 6 dieutelet ; escargotage ; escargotesque ; escargotier ; escargotière ; ferblantesque 32 (+7) abricoté ; abricotier ; abricotine ; al(l)eutier ; arpenter ; bahuter ; bahutier ; colorisation ; dépiéter ; échafauder ; écointage ; (émerisage) ; (émeriser) ; (émeriseuse) ; empiètement ; empiéter ; équeuter ; esquimautage ; faisandeau ; faisander ; faisanderie ; faisandier ; (fayot(t)age) ; (fayoter) ; ferblanterie ; ferblantier ; (giletier) ; (giletière) ; miroité ; miroitement ; miroiter ; miroiterie ; miroitier ; piètement ; piétin ; piétiner ; piéton ; sursitaire ; taillandier 9 (+1) bilanter ; boyauder ; boyauderie ; boyaudier ; (fayoteur) ; jutage ; juter ; juteux ; reinté ; tabatière 0 0 52 (+8) Les termes de la famille d'émeriser (émerisage, émeriser, émeriseuse) seront comptabilisés avec les suffixes en -iser (section 1.5.1.), ceux de la famille de giletier (giletier et giletière) avec les suffixes en -eter (section 1.5.2.) et ceux de la famille de fayoter (fayotage, fayoter et fayoteur) avec les suffixes en -oter (section 1.5.3.), de façon à pouvoir les conserver pour une raison supplémentaire. C'est pourquoi ils sont ici indiqués entre 405 Chapitre 6 – De la base de données au corpus de travail parenthèses. Seuls cinquante-deux termes seront donc considérés comme définitivement traités au terme de cette section. Au terme de cette première série de critères de filtre, récapitulons leur impact quant au contenu du corpus par rapport à la base de données initialement constituée. 1.3.6. Bilan sur l'apport de l'étymologie sur la constitution du corpus 1.3.6.1. En fonction des critères retenus. Dans le tableau ci-dessous figurent le nombre de termes traités jusqu'à présent avec les critères détaillés dans les sections précédentes, avec un rappel du code explicatif correspondant au critère décisionnel et le code de couleur employé dans la présentation du corpus (annexe 3c). (37) Section Détail Code explicatif Traitement après 1er filtre Code de couleur Nombre de termes concernés 1.3.1. héritage d'un mot déjà dérivé avec la consonne en latin 2a rejeté vert 31 1.3.2. présence de la consonne dans l'étymologie de la base 2b rejeté vert 226 G rejeté vert 2 3 indécision rose 3 P maintien 1.3.3. 1.3.4. 1.3.5. la consonne graphique n'est pas prononcée, l'étymologie n'indique rien croisement de plusieurs étymologies l'étymologie présente une consonne, mais pas celle de l'épenthèse bleu 52 Illustration chevaucher fermeté diablotin emperlousé nagualisme ; ; ; portraicturien ; dompter coquebin vivandier abricotier jutage faisander ; ; ; 314 1.3.6.2. En fonction de la provenance des termes possiblement porteurs d'une épenthèse A cette étape du filtrage des dérivés arrêtons-nous un instant pour prendre un instantané de leur traitement, en fonction de la méthode d'extraction de chaque terme et des critères envisagés jusqu'à présent, c'est-à-dire de ceux correspondant à la nature du mot construit ("comp"), à l'emplacement de l'épenthèse ("mp") et aux divers critères liés à l'étymologie ("2a", "2b", "G" ; "3" ; "P"). 406 Chapitre 6 – De la base de données au corpus de travail (38) A. B. C. D. E. G. H. K. "comp" "mp" "2a" "2b" "G" total rejetés "3" - indécis 0 0 0 1 1 3 0 1 6 0 0 8 0 0 0 0 0 8 4 0 2 2 10 +215 9 +2 0 0 27 +4 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 14 3 18 12 153 65 1 7 273 0 0 0 0 2 1 0 0 3 "P" maintenus 2 0 3 6 32 9 0 0 52 Le plus gros apport, en termes de quantité de termes traités, de l'étymologie dans le traitement de la base de données a été de mettre à jour les consonnes sous-jacentes présentes en fin de base du fait de son origine. Les consonnes sous-jacentes peuvent cependant être révélées par un autre moyen, à savoir le féminin du terme considéré - lorsqu'il existe. 1.4. Consonne sous-jacente révélée par le féminin L'étymologie des dérivés et des bases a permis de mettre en évidence les consonnes sous-jacentes de 269 termes. Ce n'est pas cependant la seule méthode de mise au grand jour des consonnes sous-jacentes. Celles-ci peuvent en effet apparaître à la liaison (un petit [t] enfant) ou au féminin (une grande amie). Les termes pour lesquels il est possible d'accéder au féminin, à savoir les adjectifs qualificatifs et certains substantifs, ont donc bénéficié d'un garde-fou supplémentaire destiné à s'assurer du caractère réellement épenthétique de la consonne suspecte entre radical et suffixe. Le tamis étymologique ayant déjà éliminé la plupart d'entre eux, ne restent ici que les termes pour lesquels le féminin fait apparaître une consonne sans que cette consonne soit présente dans l'étymologie du mot ; ces termes seront alors exclus du corpus sous la mention "C f" pour "consonne sous-jacente apparaissant au féminin". Sont concernés les dix-neuf termes suivants : 15 Les termes étiquettés "2" figurent arbitrairement dans cette colonne "2a" plutôt que "2b". 407 Chapitre 6 – De la base de données au corpus de travail (39) Méthode de recueil A. B. C. D. E. G. H. K. total Nombre de termes Termes éliminés motif "C f" concernés 0 0 0 8 butorderie ; favoritisme ; gueusaille ; gueusard ; gueuser ; gueuserie ; rapiater ; rapiaterie 8 finauderie ; jointer; matoiserie ; rustauderie ; badaudage ; badauder ; badauderie ; esquimaudage 2 chouchouter ; voyouter 0 1 chouteur 19 Ces dix-neuf termes correspondent à douze bases différentes, se rassemblant en neuf types de finales différentes comme on peut le voir dans le tableau suivant, mettant en regard le type de terminaisons, les dérivés et le nombre de bases correspondant : (40) Terminaison de la base -at -aud -eux -i -ois -ord -ou Dérivés concernés rapiater rapiaterie badaudage badauder badauderie esquimaudage finauderie rustauderie gueusaille gueusard gueuser gueuserie favoritisme matoiserie butorderie chouchouter voyouter chouteur Nombre de bases correspondant 1 base Source des dérivés considérés D. 4 bases E. 1 base D. 1 base 1 base 1 base 3 bases D. E. D. G., K. Type de sources sources écrites source orale Plusieurs cas sont à distinguer ici. En effet, il n'est pas possible de considérer que les consonnes établies comme sous-jacentes du fait de leur mise en évidence au féminin sont épenthétiques au même titre que celles démontrées par l'étymologie, dans le sens où dans le cas du féminin non établi par l'étymologie il y a bien eu épenthèse consonantique à un moment donné. Je distinguerai ici trois cas particuliers, correspondants à trois types de terminaisons de la base : les bases en -aud, les terminaisons en -at et la famille de gueux. Dans une dernière sous-section j'attirerai l'attention sur les dérivés constitués à partir de bases en [u]. 408 Chapitre 6 – De la base de données au corpus de travail 1.4.1. Bases en -aud Six termes sur les dix-neuf considérés dans cette section sont formés à partir d'une base en -aud. Parmi ces six termes, distinguons deux cas : d'une part les termes effectivement dérivés à l'aide du suffixe -aud, d'autre part ceux pour lesquels les dictionnaires indiquent une réfection à l'aide de ce suffixe à partir d'une autre terminaison, homophone, de la base. Dans le premier compartiment sont rangés les dérivés finauderie et rustauderie, respectivement formés sur finaud(e) et rustaud(e), pour lesquels donc l'identité de la consonne sous-jacente est confirmée par la nature du suffixe (cf. section 1.6.2.3). Dans la seconde catégorie se trouvent les quatre termes restants, soit en réalité deux bases différentes : badaud et esquimau. Ces deux bases sont indiquées par les dictionnaires consultés comme étant formés à partir de badau de suffixe provençal -au et esquimau ou esquimo, terme emprunté à l'amérindien. Le suffixe -aud n'est donc que secondaire, et sans doute supposé par les dictionnaires précisément à cause de l'apparition de la consonne [d] à la jonction entre le radical en [o] et le suffixe suivant. Dans ce cas, ces quatre termes devraient être normalement considérés comme maintenus dans le corpus, puisque l'analogie n'est pas prise en compte à cette étape de sa constitution. Cependant, le féminin de badaud se fait à l'aide d'un [d], soit comme si la réfection de suffixe avait vraiment eu lieu. Donc il s'agit d'une sous-classe particulière de termes avec une consonne sous-jacente n'apparaissant qu'à la dérivation et non en diachronie : c'est le féminin qui fait apparaître une consonne, c'est vrai, mais cette consonne correspond à celle attendue s'il y a eu réfection du suffixe. Ce cas n'est donc pas à mettre sur le même plan que les cas où le féminin fait apparaître une consonne alors que la terminaison radicale ne correspond à aucun suffixe répertorié, type [u] dans chou ou voyou. Le traitement est le même pour esquimaudage, dont on peut supposer que d'autres dérivés construits sur la même base présenteront la même consonne épenthétique. 1.4.2. Terminaison en -at Les termes rapiater et rapiaterie sont formés sur la base rapiat dont l'origine n'est pas claire. Peut-on rattacher cette base aux unités lexicales formées sur un radical concaténé au suffixe -at (cf. section 1.6.2.) ? Quelle que soit son origine, la base présente au féminin une consonne finale qui correspond précisément à celle présente à la dérivation des termes sous intérêt. C'est pourquoi, bien qu'en l'absence de toute certitude quant à sa formation, la base rapiat et les termes qui en sont dérivés sont exclus du corpus dès ce premier filtre. 409 Chapitre 6 – De la base de données au corpus de travail 1.4.3. La famille de gueux Prolifique, la base gueux a produit quatre dérivés, tous présentant un [z] entre radical et suffixe, [z] que l'on retrouve au féminin de l'adjectif. Ce [z] pourtant n'est pas présent dans l'étymologie du terme, emprunté au moyen néerlandais guit fournissant gueu en français, sans consonne sous-jacente. Le -x en fin de base n'est en effet que graphique, il n'indique aucunement un [z] sous-jacent. Cependant, les dictionnaires proposent d'expliquer l'apparition du [z] au féminin, et a fortiori dans la dérivation, par une réinterprétation de la terminaison par le suffixe -eux. Là encore, ce n'est pas la réinterprétation du suffixe qui a emporté la décision d'exclure les termes dérivés de gueux du corpus, mais la présence de la consonne au féminin de l'adjectif. 1.4.4. Terminaison en [u] Sur les six termes restants, à savoir favoritisme, matoiserie, butorderie, chouchouter, voyouter et chouteur, trois sont dérivés à partir d'une base en [u] et tous trois comportent la même consonne au féminin : [t]. La relative importance de cette terminaison est-elle indicatrice d'un phénomène d'épenthèse propre à ce contexte ? Une fois l'ensemble du corpus totalement traité, il sera intéressant d'établir l'existence éventuelle d'une tendance générale à épenthéser une consonne après [u], que ce soit au féminin ou à la dérivation, et si cette consonne est bien [u]. Un questionnaire basé notamment sur les terminaisons du corpus (cf. II[7]) permettra également de répondre à cette question. Du fait que l'étymologie n'a pas établi de consonne sous-jacente pour les dix-neuf termes examinés dans cette section, la consonne qui apparaît au féminin est épenthétique dans le sens où elle a été créée ex nihilo. Il n'est pas possible de déterminer, pour huit cas sur les dix-neuf, si c'est le féminin qui a reçu l'épenthèse le premier pour ensuite la communiquer à la dérivation, ou l'inverse. C'est pourquoi tous ces termes seront exclus du corpus. 1.4.5. Bilan du premier filtre à ce niveau du traitement Le tableau suivant récapitule les dérivés examinés jusqu'à maintenant en fonction de la décision finale – rejet du corpus, indécision ou maintien – et de l'origine de ces termes. 410 Chapitre 6 – De la base de données au corpus de travail (41) A. B. C. D. E. G. H. K. "comp" "mp" "2a" "2b" "G" "C f" total rejetés "3" - indécis 0 0 0 1 1 3 0 1 6 0 0 8 0 0 0 0 0 8 4 0 2 2 10 +2 9 +2 0 0 27 +4 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 0 0 0 8 8 2 0 1 19 14 3 18 20 161 67 1 8 292 0 0 0 0 2 1 0 0 3 "P" maintenus 2 0 3 6 32 9 0 0 52 La première étape de filtrage de la base de données initiale a tenu compte du type de construction des termes, de l'emplacement de la consonne épenthésée, de l'étymologie des bases comme des dérivés et des éventuelles consonnes sous-jacentes mises en évidence par le féminin des adjectifs et de certains substantifs. Tournons-nous maintenant du côté de l'initiale des suffixes, également en contact avec la frontière morphologique. 1.5. Alternances suffixales (en début de suffixe du dérivé) Trois cas sont distingués ici, correspondant à trois alternances en initiale de suffixe du dérivé. Dans un premier temps, je m'arrêterai sur le suffixe -iser en relation avec le suffixe -er et sur le critère permettant d'établir la présence de l'un ou de l'autre dans un dérivé. J'étudierai ensuite les terminaisons en -et(t)er, pour lesquelles je distinguerai d'une part le suffixe -eter du suffixe -er, d'autre part le suffixe diminutif -et en finale de base. Un traitement parallèle concernera ensuite les terminaisons en -ot(t)er. Dans un deuxième temps, je présenterai quelques suffixes argotiques. 1.5.1. -iser vs. -er Le corpus rassemble vingt-et-un termes se terminant par la séquence -iser, -iseur, iseuse, -isant ou -isable, indiqués par le code "1" dans la colonne "code catégoriel" : catégorisable, catégorisation, catégoriser, colorisation, émerisage, émeriser, émeriseuse, favoriser, infiniser, loftstorysant, macadamiser, merceriser, névralgiser, phraséologisé, rouliser, stromboliser, symétriser, symétriseur, tan(n)iser, tatamiser (se) et trotskisant. Trois cas sont distingués ici, dont deux conduisent au rejet des unités lexicales correspondant : 411 Chapitre 6 – De la base de données au corpus de travail - la consonne [z] appartient au terme considéré et non au suffixe -iser. C'est le cas de merceriser, issu non pas de mercerie mais de l'anglais mercerize. Rejeté, ce terme se voit adjoint le code "2b" que j'ai détaillé en section 1.3.2. - le sens du dérivé correspond à "rendre X" ou "transformer en X" selon que la base est un adjectif ou un substantif, X représentant la base. Ceci concerne six termes de la base de départ. Dans ce cas, l'unité lexicale est considérée comme étant bien formée à l'aide de l'infixe -is- suivi d'un des suffixes -er, -eur, -euse, -ant ou -able, et non de l'un de ces suffixes augmenté d'une épenthèse de [z], aussi sera-t-elle écartée du corpus et marquée du code "Su" dans la colonne "code explicatif". Les termes en -iser rejetés se répartissent en fonction de leur origine dans la base de données initiale de la manière suivante : (42) Méthode Nombre de de recueil termes éliminés A. / B. / C. / D. / E. 1 G. 1 H. 1 Nombre motif "2b" / / / / 1 / / Terme éliminé motif "2b" / / / / merceriser / / Nombre motif "Su" / / / / / 1 1 K. 5 / / 5 total 8 1 / 7 Termes éliminés motif "Su" / / / / / favoriser tatamiser infiniser ; stromboliser ; symétriser ; symétriseur ; rouliser / Le troisième cas envisagé ici est le pendant du cas précédent. Seront considérées comme réellement porteuses d'une épenthèse les unités lexicales pour lesquelles ne peut pas être mis en évidence, au moins directement (cf. section 2.7.2.2), le sens "rendre X" ou "se transformer en X". Le code explicatif sera également "Su" puisqu'il s'agit tout autant d'une justification par le suffixe, mais le traitement sera différent puisque ces termes sont maintenus dans le corpus à cette étape du traitement. Sont concernés les douze termes suivants : (43) Méthode de recueil A. B. C. D. E. G. H. K. total Nombre de termes maintenus / / / / 5 5 1 2 13 Termes maintenus motif "Su" / / / / colorisation ; émerisage ; émeriser ; émeriseuse ; taniser catégorisable ; catégorisation ; catégoriser ; loftsorysant; macadamiser trotskisant névralgiser ; phraséologisé 412 Chapitre 6 – De la base de données au corpus de travail Les deux alternances suffixales suivantes sont proches à la fois par leur traitement et par le signifié du premier suffixe supposé. Il s'agit en effet de -eter vs. -et + -er d'une part, de ot(t)er vs. -ot et -er d'autre part, dans lesquelles -et et -ot véhiculent tous deux l'idée de petitesse. 1.5.2. -eter vs. -et + -er La base de données initiale rassemble quarante-deux unités lexicales se terminant par une séquence pouvant être analysée comme base + -et- + suffixe ou base + -eter/-etage/etier/-etique/-eteur/-eterie. Le traitement de ces cas va les distribuer dans les trois compartiments que sont les termes rejetés, indécis et maintenus déjà établis plus haut. Les termes rejetés le seront pour l'un des deux critères appliqués également aux termes en -iser (cf. 1.5.1.), à savoir : - soit le sens du dérivé indique que celui-ci est fait sur le diminutif de la base et non sur la base elle-même, comme dans le cas de archetier "fabricant d'archet" ou paqueter "faire des paquets", autrement dit de "petits packs". C'est le cas pour douze des termes considérés ici. - soit le sens du dérivé indique l'emploi du suffixe -eter introduisant une idée de fréquence, comme dans piqueter "parsemer de petits points, de petits trous, de petites tâches". Trois termes sont ainsi éliminés. (44) Méthode de recueil A. B. C. D. Nombre de termes éliminés / / / / Nombre motif "2b" / / / / E. 15 12 G. H. K. 2 / / 17 1 / / 13 total Termes éliminés motif "2b" / / / / archeterie ; archetier ; bouvetage ; grainetier2 (motif 2a) ; guichetier ; marqueterie ; paquetage ; paqueter ; paqueteur ; paquetier ; parqueter ; robinetterie louveteau / / Nombre motif "Su" / / / / Termes éliminés motif "Su" / / / / cliqueter piqueter ; moucheter ; 3 1 / / 4 becqueter / / 413 Chapitre 6 – De la base de données au corpus de travail Seront maintenus en revanche les termes pour lesquels il n'est possible de mettre en évidence ni l'aspect fréquentatif propre au suffixe -eter (feuilleter ne signifie pas *"parsemer de feuilles" par exemple) ni la dimension de petitesse invoquée par le diminutif -et (un chaînetier ne fabrique pas uniquement des chaînettes mais est spécialisé dans les chaînes en général). Parmi ces termes figurent ceux pour lesquels les dictionnaires indiquent une "réfection de suffixe" ou une "substitution de suffixe", comme giletier ou buffleterie. (45) A. B. C. D. E. Nombre de termes maintenus / / / / 14 G. H. K. total 2 / 1 17 Méthode de recueil Termes maintenus motif "Su" / / / / buffleterie ; chaînetier ; coquetier1 ; écoquetage ; écoqueter ; feuilleter ; giletier ; giletière ; grainetier1 ; graineterie ; museletage ; pelleter ; pelleterie ; pelletier clouter ; clouterie / déchétique Pour huit unités lexicales enfin, le traitement du suffixe se combine avec une identification malaisée de la base, c'est pourquoi ils seront classés parmi les indécis. (46) Méthode de recueil A. B. C. D. E. Nombre de termes indécis / / / / 8 G. H. K. total / / / 8 Termes indécis / / / / bonneter ; bonnetier ; bufettier ; courtage ; courtier ; épincetage ; épousseter ; gobetage / / / Les cinq cas de figure rencontrés dans cette section sont récapitulés dans le tableau cidessous : (47) Détail le sens du dérivé indique que celui-ci est fait sur le diminutif de la base le sens du dérivé indique que celui-ci est fait en utilisant -eter impossible de décider, problème de base en sus "réfection" ou "substitution de suffixe" (type -ot, -et) aucun des cas précédents Code Traitement Code de couleur 2b Su rejet vert indécision rose maintien bleu Su Su 414 Chapitre 6 – De la base de données au corpus de travail 1.5.3. -ot(t)er vs. -ot + -er Les cinq mêmes cas que pour les terminaisons comportant la séquence -ot- avant un éventuel suffixe sont distingués ici. Sur trente-sept unités lexicales correspondant à cette section, quinze sont rejetés pour une des deux raisons suivantes : - le sens du dérivé indique que celui-ci est formé sur le diminutif de la base pour neuf termes ; - le sens du dérivé indique que celui-ci est formé à partir du suffixe fréquentatif -eter en ce qui concerne quatre termes. (48) A. B. C. D. Nombre de termes éliminés 1 / / / Nombre motif "2b" 1 / / / E. 7 6 G. 4 1 H. K. total 1 / 13 1 / 9 Méthode de recueil Terme éliminé motif "2b" diablotin / / / chariotage ; îlotage ; îlotier ; minotier ; tricoter ; verroterie chevroter pageoterie / Nombre motif "Su" / / / / 1 3 / / 4 Termes éliminés motif "Su" / / / / picoter cachotter ; cachottier / / cachotterie ; Sept termes sont maintenus, qu'il s'agisse d'une "réfection de suffixe" selon les dictionnaires comme pour canotier ou non, le critère décisionnel étant qu'il n'est pas possible de mettre en évidence un quelconque aspect fréquentatif ou diminutif. (49) Méthode de recueil A. B. C. D. E. G. H. K. total Nombre de termes maintenus / / / / 2 3 2 / 7 Termes maintenus motif "Su" / / / / canotier ; lingotier fayotage ; fayoter ; fayoteur glavioter ; glavioteur / Pour dix-sept termes enfin, la base n'est pas suffisamment claire pour qu'il soit possible de prendre une décision à cette étape de la constitution du corpus. Ces termes se répartissent de la manière suivante : 415 Chapitre 6 – De la base de données au corpus de travail (50) A. B. C. D. E. Nombre de termes indécis / / / / 16 G. H. K. total 1 / / 17 Méthode de recueil Termes indécis / / / / argotage ; argoter ; argoteur ; argotier ; argotique ; argotisme ; argotiste ; bimbeloterie ; cagoterie ; crabotage ; ergoter ; fagoter ; fagotier ; fagotin ; palotage ; rabioter déposer (motif 3) / / Le tableau suivant récapitule les différents cas de figure répertoriés en ce qui concerne les terminaisons en -oter et -eter. Il rappelle les conséquences des choix adoptés dans la constitution du corpus ainsi que les codes directement liés aux décisions prises et les codes explicatifs indiqués dans le corpus en annexe 3c. (51) Détail le sens du dérivé indique que celui-ci est fait sur le diminutif de la base le sens du dérivé indique que celui-ci est fait en utilisant -eter ou -oter impossible de décider, problème de base en sus "réfection" ou "substitution de suffixe" (type -ot, -et) aucun des cas précédents Code Décision Code de couleur 2b Su rejet vert indécision rose maintien bleu Su Su 1.5.4. Suffixes argotiques Une place à part doit être réservée aux suffixes argotiques, dans le sens où ce n'est pas le signifié qui donne une indication de l'identité du suffixe, mais le registre de langue. Ces suffixes sont d'ailleurs identifiés comme tels dans le Colin, Mével & Leclère (1990). Certains dérivés ont donc été écartés, parce que dérivés à l'aide d'un suffixe présentant une consonne à l'initiale, suffixe identifié par le dictionnaire lui-même en tant qu'entrée dans bien des cas : ainsi le suffixe -ton, "suffixe servant à former de nombreux substantifs argotiques : biffeton, cureton, frometon, mecton, paveton, etc., auxquels il communique une nuance d'humour ou de dédain", a-t-il permis d'éliminer, outre les termes cités en exemple, griveton, gueuleton, cafeton et sociéteton. De même les suffixes -go et -caille ont élagué le corpus de icigo, icicaille et labago. Le suffixe -dé n'est pas indiqué en tant qu'entrée dans le Colin, Mével & Leclère (1990), mais est présent dans un certain nombre de dérivés : fouignedé, foindé, jourdé, dans lequel il est indiqué comme une "suffixation argotique". 416 Chapitre 6 – De la base de données au corpus de travail Sont considérées comme "sûres" des unités lexicales pour lesquelles la base est reconnue par le Dictionnaire (miroter et miroiter sont dans l'article miro, pieuter est indiqué comme dérivé de pieu, etc.) et le suffixe aisément identifiable, c'est-à-dire attesté dans la liste des suffixes préalablement établie ou le cas échéant indiqué dans le Dictionnaire. Un problème se posait avec le suffixe -(t)ance présent dans cuistance : fallait-il considérer qu'il s'agit d'un suffixe argotique ou d'une épenthèse précédant le suffixe -ance ? L'explication analogique des dictionnaires, qui mettent en parallèle cuistance avec bectance, n'est pas suffisante pour justifier de l'existence d'un suffixe -tance ; en effet, bectance est possiblement formé sur le verbe becter par ailleurs attesté, alors qu'on ne trouve pas trace de *cuister. En revanche, la base de données initiale (cf. A.) révèle un autre terme en -tance, bouffetance, qui lui non plus ne correspond pas à un verbe *bouffeter mais à *bouffer, sans [t] et qui correspond au même registre de langue. Il semblerait donc bien que -tance constitue lui aussi un suffixe argotique, c'est pourquoi cuistance est éliminé du corpus. Le tableau suivant récapitule les différents suffixes argotiques en mettant en regard les dérivés du corpus correspondant avec une indication de leur origine. (52) Suffixe -lard -ance -bar -bri -caille -dé -do -go -mar -mon -oque -piat -pier -pin -tar Nombre de termes éliminés Origine Nombre de termes maintenus 2 1 2 1 1 1 1 2 1 1 1 1 1 2 1 1 8 -ton Total Termes éliminés motif catégorie "arg" 1 27 cuistance colibar ; crobard colibri icicaille jourdé botocudo icigo ; labago cafemar cafemon chinetoque marloupiat marloupier auverpin ; marloupin camtar bocheton biffeton ; cafeton ; cureton ; frometon ; griveton ; gueuleton ; mecton ; paveton sociéteton Termes maintenus motif catégorie "arg" faflard ; vicelard Origine B. B. B. B. B. B. K. B. B. B. G. B. B. B. B. H. B. K. 2 417 Chapitre 6 – De la base de données au corpus de travail Sur les vingt-neuf termes pour lesquels est portée en regard la mention "arg" dans la colonne "code catégoriel", seuls deux sont maintenus dans le corpus : vicelard16 et faflard, pour lesquels le suffixe argotique -lard n'est pas explicitement relevé dans les dictionnaires argotiques alors que le suffixe -ard existe bel et bien. Les suffixes argotiques ne sont pas les seuls à avoir fait l'objet d'une attention particulière. D'autres suffixes ou variantes ont été étudiées de façon à éclaircir le sort de plus d'une vingtaine de termes incertains. 1.5.5. Autres variantes suffixales Vingt-quatre termes restent pour lesquels deux cas se distinguent, décidant de l'élimination ou du maintien sous condition des dérivés. Huit unités lexicales - bochetée, royauté, avocasser, cocufier, statufier, pansementer, pansementerie et chimiatrie - avaient été mal indexées, ou plus exactement les suffixes à partir desquels elles avaient été constituées avaient été mal identifiés, pour des raisons orthographiques (bochetée comportant un -e en finale orientait l'analyse vers le suffixe -ée et non -té ; on notera à cet endroit que le terme yeutée ne peut pas être analysé pareillement, attendu que le suffixe -té d'une part ne se forme que sur des adjectifs (cf. Dubois & DuboisCharlier 1999 : 222-224), d'autre part que le signifié en est "qualité de A" où A est la base adjectivale ; or yeutée est formé sur le substantif yeux et son sens n'est pas "qualité des yeux" mais "vue, coup d'oeil"), de cumul de suffixe (chimiatrie n'est pas formé sur chimie suivi du suffixe -ie mais sur chimie + atre + ie) ou de manque d'analyse du signifié (statufier et cocufier indiquent respectivement "transformer en statue" et "transformer en cocu", renvoyant bien au suffixe -(i)fier). Deux termes, pansementer et pansementerie, se distinguent en ce sens que c'est le suffixe substantif -ment pour lequel la consonne finale sous-jacente [t] devait être mise en évidence indépendamment. Une recherche dans la base de données exploitée sous A. indique quarante-quatre dérivés en -menter et deux en -menterie formés à partir de substantifs en -ment, établissant ainsi le [t] sous-jacent final. 16 En ce qui concerne vicelard, Corbin (1987 : 780 note 12) propose de le construire sur le nom °vicier de signifié "N [+hum] en rapport avec le vice", lui-même construit à l'aide du suffixe -ier "profession, état habituel" sur le nom vice, vicier ayant subi une allomorphie r ~ l. Cependant, vicieux existant déjà avec précisément ce signifié, l'hypothèse ne me paraît pas suffisamment convaincante pour exclure vicelard de la suite des opérations. 418 Chapitre 6 – De la base de données au corpus de travail Quinze termes sont à classer parmi les indécis. Six d'entre eux appartiennent à la famille lexicale de coq, sur laquelle je reviendrai en section 1.7.3. Les autres se séparent en deux catégories : d'une part les suffixes présentant une variante suffixale non répertoriée dans les dictionnaires, de type -chon dans iglouchon (mais -ichon existe), -itude dans bretonnitude et -ture dans pourriture et fourniture (-ature est cependant attesté, cf. section 2.5.15) ; d'autre part les suffixes dont la variante est répertoriée et attestée plusieurs fois, mais sans qu'elle corresponde à un signifié particulier. Ce dernier cas concerne les suffixes -ette et -on, pour lesquels les variantes -elette (sourcelette, tartelette) et -eron (aileron ; bûcheron ; mancheron1 ; mancheron2 ; tâcheron ; moucheron ; vigneron) correspondent au même signifié : pourquoi tarte se voit adjoint la variante -elette et non -ette, le signifié étant dans les deux cas "petite" ? Pourquoi une petite mouche est-elle indiquée par le signifiant moucheron et non mouchon ? Les dix-huit termes concernés seront donc classés dans la catégorie "indécis". (53) Suffixe -té -asser -fier -er -erie -ie -elle Nombre de termes éliminés Termes éliminés motif "Su" Origine 2 1 2 1 1 1 bochetée ; royauté avocasser cocufier ; statufier pansementer passementerie chimiatrie G. E. E. G. E. A. Nombre de C termes épenthésée indécis Origine r coquerelle E. 1 l coquelet E. 1 r coqueret 1 -et Termes indécis motif "Su" E. -ette 2 l -eur 1 l sourcelette tartelette coqueleur -eux 1 l coqueleux E. l coqueliner E. -iner 1 ; E. 1 1 aileron ; bûcheron ; mancheron1 ; mancheron2 ; tâcheron moucheron ; vigneron iglouchon -ude 1 t bretonnitude -ure 2 t pourriture fourniture 5 r 2 r -on Total 8 K. ; D. E. K. H. G. E. 19 Des vingt-quatre termes considérés ici, aucun ne fera partie du corpus final, tous ayant été écartés dès cette première étape. 419 Chapitre 6 – De la base de données au corpus de travail Au terme de ce tour d'horizon des alternances suffixales, établissons un bilan des termes rejetés, de ceux qui restent indécis et de ceux qui continuent l'aventure. 1.5.6. Bilan sur les alternances suffixales Le tableau suivant propose une synthèse du traitement réservé aux termes se terminant par -iser, -eter et -oter ainsi que des suffixes particuliers abordés dans cette section, en rappelant la section dans laquelle les explications sont fournies et le code explicatif indiqué dans le corpus en annexe 3c. (54) Paragraphe code "Su" "2b" 1.5.1. 1.5.2. 1.5.3. 1.5.4. 1.5.5. Total "1" : -iser "9" : -et(er) "10" : -ot(er) "arg" autres 2 4 4 26 8 44 6 13 9 / / 28 total rejetés 8 18 13 27 8 74 total indécis / 8 17 / 19 44 "3" / / 1 / / 1 maintenus total 12 17 7 2 19 42 37 29 24 151 38 Cent cinquante-et-une unités lexicales ont été envisagées ici. Près de la moitié ont été exclues, et seules 38, soit un quart de l'effectif, se sont maintenues dans le corpus. Avant de passer à l'examen des alternances radicales, récapitulons le traitement de l'ensemble des 478 termes examinés jusqu'à présent dans ce premier filtre. 1.5.7. Récapitulatif du traitement du corpus jusqu'à présent Les termes rejetés aux motifs "2b" et "3" avaient déjà été comptabilisés. S'ajoutent donc seulement ceux marqués "Su", les termes indécis et les termes maintenus. (55) A B C D E G H K comp mp 2a 2b G Cf Su total rejetés 3 indécis total indécis P main tenus 0 0 0 1 1 3 0 1 6 0 0 8 0 0 0 0 0 8 4 0 2 2 10 +2 9 +2 0 0 31 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 0 0 0 8 8 2 0 1 19 1 23 0 0 8 9 2 7 50 15 26 18 20 169 76 3 15 342 0 0 0 0 2 1 0 0 3 0 0 0 5 33 1 1 3 43 0 0 0 5 36 2 1 3 46 2 0 3 6 32 9 0 0 52 0 2 0 0 21 9 3 3 38 total main tenus 2 2 3 6 53 18 3 3 90 420 Chapitre 6 – De la base de données au corpus de travail Plus de soixante-dix pour cent des unités ont été rejetées, moins d'un cinquième de l'ensemble des termes examinés figureront dans le corpus à l'issue du premier filtre. Tournons-nous maintenant vers les alternances radicales. 1.6. Alternances radicales Je distinguerai deux cas d'alternances radicales : les bases incertaines d'une part, certains suffixes présents en fin de base d'autre part. 1.6.1. Bases incertaines Les soixante-et-un termes relevant de cette catégorie, outre ceux déjà traités en même temps que les alternances suffixales (cf. section 1.2.5.2), sont identifiés par la mention "B" pour "base" dans la colonne "code catégoriel". Plusieurs cas de figure se présentent, selon le type de bases supposées. Si toutes les bases proposées par les dictionnaires comportent la consonne que l'on trouve dans le dérivé à leur finale, les dérivés sont rejetés sous le motif "2" ou "2b" (cf. section 1.3.2). Dix-huit termes sont ainsi exclus du corpus. Seuls six termes sont maintenus dans le corpus final. Il s'agit des termes pour lesquels parmi les bases proposées, au moins une est actuelle, c'est-à-dire réanalysable en synchronie comme étant dérivée dans le français "contemporain". Le cas de figure s'était posé avec clouter et clouterie, traités avec les termes en -et : si l'on considère que clouter est formé sur clouet et non sur clou, il faut expliquer ce qu'est devenu le [e] ; s'il s'est schwaïsé comme l'alternance " / - dans appeler / appelle, comment peut-on mettre en évidence cette alternance ? Dans les termes considérés ici, l'exemple phare est bleusaille : ce terme est-il dérivé sur bleu ou sur bleuse ? En synchronie, il est réanalysé comme étant formé sur bleu. Ce n'est que l'examen du suffixe au terme de l'analyse qui permettra éventuellement d'écarter par la suite ce dérivé. Tous les autres termes, soit 37 sur les 61 détaillés ici, restent frappés du sceau de l'indécision, soit parce qu'ils comportent plusieurs bases qu'on ne peut départager, soit que la base reste désespérément obscure. Là encore, ce ne seront que les filtres suivants qui permettront de reclasser une partie d'entre eux. Le tableau suivant récapitule le traitement de chacun des soixante-et-un termes ici considérés en fonction de leur origine : 421 Chapitre 6 – De la base de données au corpus de travail (56) Méthode de recueil A. Nombre termes rejetés Termes rejetés motif "2(b)" 7 verdâtre ; verdelet ; verdeur ; verdier ; verdir ; verdoyer ; verdure B. C. D. Nombre termes indécis 4 vivandier G. 20 3 3 chevelure ; œilleton ; soudaineté Termes maintenus foindé ; fignedé ; louftingue calfeutrage ; calfeutrement ; calfeutrer ; conchyoline partisan 1 Nombre termes mainte nus 1 3 4 Autres termes indécis bleusaille ; bouverie ; forestier ; ponceau E. Termes indécis motif "3" 5 5 durcir ; manchereau ; sidénologue ; zougloutique bardeur ; brancardier ; clabauder ; coqueluche ; déhourdage ; écanguer ; emboucautage ; épiétage ; fauberder ; fauberter ; faucardage ; faucarder ; ferratier ; ferroutage ; folletage ; maffiotage ; masselottage ; millerandage ; ridelage chimicage ; gatouser ; velouté ; velouteux ; zozoter chalutage ; chaluter ; chalutier ; dinanderie ; dinandier 5 H. 5 K. total 5 18 37 doublezon ; emperlizer ; enfumanter ; englumer ; escoubellesque 6 Le traitement des bases incertaines peut conduire les termes incriminés dans les trois compartiments précédemment définis : soit ils sont rejetés au motif que la base comporte de fait la consonne suspectée ; soit au moins une des bases proposées est analysable actuellement 422 Chapitre 6 – De la base de données au corpus de travail et son dérivé peut donc être considéré comme faisant partie des termes maintenus ; soit la base reste désespérément obscure, aussi ne peut-on placer les termes que dans la catégorie des indécis. (57) Détail Si toutes les bases proposées comportent de toute façon la consonne dans la bonne position Si indiquée "origine obscure" et aucune explication ou qu'aucune étymologie n'est trouvée Si plusieurs bases sont proposées sans qu'il soit possible de les départager Si deux bases sont proposées dont une actuelle Code Décision Code de couleur 2(b) rejet vert indécision rose maintien bleu 3 Dans le tableau récapitulatif de l'ensemble des termes analysés jusqu'à maintenant ne figureront pas les termes rejetés sous le motif "2" ou "2b", puisqu'ils ont déjà été comptabilisés ; ne seront indiqués donc que les 35 indécis et les 6 maintenus, en regard de leur source d'origine : (58) A B C D E G H K com p mp 2a 2b G Cf Su 0 0 0 1 1 3 0 1 6 0 0 8 0 0 0 0 0 8 4 0 2 2 12 11 0 0 31 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 0 0 0 8 8 2 0 1 19 1 23 0 0 8 9 2 7 48 total reje tés 15 26 18 20 169 76 3 15 342 3 0 0 0 0 2 1 0 0 3 indéc indéc is is "B" 0 0 0 3 0 0 5 4 33 20 1 5 1 0 3 5 43 37 total indé cis 0 3 0 9 55 7 1 8 83 P 2 0 3 6 32 9 0 0 52 maint maint total enus enus main "B" tenus 0 1 3 2 0 2 0 0 3 0 0 6 21 5 58 9 0 18 3 0 3 3 0 3 38 6 96 A l'intérieur de cette section sur les alternances radicales figure un deuxième chapitre, celui concernant certains suffixes présents en fin de base pour lesquels il faut établir la présence ou l'absence d'une consonne sous-jacente finale. 1.6.2. Suffixes présents en fin de thème Quatre suffixes seront ici étudiés : -ard, -at, -aud et -is. A la différence des suffixes étudiés dans la section concernant les alternances suffixales (1.5), c'est ici leur frontière droite qui est sous intérêt puisqu'ils sont situés dans la base. 423 Chapitre 6 – De la base de données au corpus de travail 1.6.2.1. -ard : foulardage, bousarderie, musarderie, jobarder Les quatre termes de la base de données présentant la terminaison [ar] en fin de radical ont été marqués d'un label "Su -ard" dans la colonne "code explicatif". C'est en effet parce qu'ils comportent ce suffixe qu'ils ont été écartés du corpus dès ce premier filtre. Le suffixe -ard est issu de l'adjectif allemand hart "dur", dans lequel la consonne finale est prononcée. De ce fait, il semble raisonnable de supposer que le suffixe français comporte une consonne sous-jacente /d/ à la finale. Pour les termes comme faucardage et faucarder, pour lesquels la base est incertaine comme on l'a vu en section 1.6.1., aucune décision n'a été prise quant à leur éviction étant donné justement qu'il n'était pas possible d'établir avec certitude la présence du suffixe -ard. Par ailleurs ce suffixe, lorsqu'il est inclus dans un adjectif qualificatif, permet précisément à un [d] final de se réaliser au féminin (cf. section 2.6.3). 1.6.2.2. -at : gravatier, goujaterie / crachaté / taxateur, taxatif Cinq termes seraient candidats à recevoir le label "Su -at" et donc à être éliminés du corpus, le suffixe -at étant issu d'un suffixe latin -atus ou -atum, présentant donc un [t] sousjacent à la finale. Il convient cependant de distinguer les termes gravatier et goujaterie, dans le sens où la séquence -at à la finale de leurs bases respectives n'est pas due au suffixe suscité : pour gravats, il est donné comme formé sur gravois par les dictionnaires ; quant à goujat, il s'agit d'un terme provençal se terminant en [a] et possiblement re-suffixé. Gravatier et goujaterie sont donc maintenus dans le corpus à l'issue de ce premier filtre. Restent les termes crachaté, taxateur et taxatif. Deux cas sont représentés ici : - crachaté est réellement formé à partir du suffixe -at provenant du latin -atus ou -atum. De ce fait, il est éliminé. On notera à cet endroit que rapiater et rapiaterie, parce qu'ils sont formés sur l'adjectif rapiat présentant un [t] final au féminin, avaient déjà été éliminés du corpus. - taxateur et taxatif présentent quant à eux un élément -at possiblement dû à un allongement thématique ; ils seront traités avec les termes en -ation lors de la deuxième étape de filtrage, et restent pour le moment en lice. 424 Chapitre 6 – De la base de données au corpus de travail 1.6.2.3. -aud : marauder, minauder, rustauderie, finauderie, badaudage, badauder, badauderie, esquimaudage Les termes de la famille de badaud – badaudage, badauder et badauderie –, esquimaudage ainsi que finauderie et rustauderie ont déjà été traités – et exclus du corpus – du fait que le féminin de l'adjectif atteste l'existence d'un [d] sous-jacent. Par ailleurs, finauderie et rustauderie sont clairement dérivés à l'aide du suffixe -aud au contraire de la famille de badaud ; or le suffixe -aud est issu du suffixe francique -wald, de walden "gouverner", comportant donc bien un [d] sous-jacent. Cependant, cette vérification d'une éventuelle consonne sous-jacente n'est pas possible pour marauder et minauder, maraud et minaud n'étant pas attestés au féminin. C'est l'étymologie du suffixe qui permet d'enlever la décision : il y a bien un [d] sous-jacent, les deux termes sont donc exclus. 1.6.2.4. -is : roulis Le suffixe -is provient d'une forme -ëiz en ancien français, du latin -aticiu. Le [z] est donc bien sous-jacent, disqualifiant ainsi le terme roulis. Au terme de cet examen des suffixes identifiés en fin de base, récapitulons le traitement choisi pour chacun. 1.6.2.5. Récapitulatif Le tableau suivant permet de visualiser le traitement appliqué aux unités lexicales construites à partir d'une base se terminant par l'un des suffixes traités dans les paragraphes précédents, en indiquant les codes explicatifs que l'on trouve en annexe 3c. 425 Chapitre 6 – De la base de données au corpus de travail (59) Suffixe considéré Code explicatif provient de l'adjectif allemand hart "dur" -ard Su -ard -aud Su -aud -is Su -is -at Nombre de dérivés Origine du suffixe suff a f -alt du suffixe francique -wald de walden "gouverner" -ëiz du latin -aticiu provient du suffixe latin atus ou -atum simple terminaison et non suffixe -at- suppose une base en ation ; cf. 2ème filtre Su -at 4 8 1 1 2 2 Illustration foulardage bousarderie jobarder musarderie minauder marauder badauder… roulis crachaté gravatier goujaterie taxateur taxatif 18 Décision Code de couleur rejet vert maintien bleu 14 rejets, 4 maintiens Sur ces dix-huit termes, huit avaient déjà été traités par ailleurs. Seuls dix sont donc nouvellement intégrés, qu'ils soient rejetés ou maintenus, dans l'ensemble des termes évalués. (60) Méthode Nombre de Nombre de recueil termes traités motif "Su X" A. / / B. / / C. / / D. / / E. 7 5 G. H. / / / / K. 3 3 total 10 8 Termes éliminé motif "Su X" / / / / foulardage, jobarder, musarderie, minauder, marauder / / crachaté, roulisé, bousarderie Nombre motif "Su" / / / / Termes maintenus motif "Su X" / / / / taxateur, taxatif 2 / / / / / / 2 Au terme de ce premier filtre, il convient de dresser un tableau récapitulatif des termes étudiés jusqu'à présent : (61) A B C D E G H K comp m p 2a 2b G Cf Su 0 0 0 1 1 3 0 1 6 0 0 8 0 0 0 0 0 8 4 0 2 2 12 11 0 0 31 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 0 0 0 8 8 2 0 1 19 1 23 0 0 8 9 2 7 50 0 0 0 0 5 0 0 3 8 total reje tés 15 26 18 20 174 76 3 18 350 3 0 0 0 0 2 1 0 0 3 indé indé total P main main tenus tenus cis cis indé "B" "B" cis 0 0 0 2 0 1 0 3 3 0 2 0 0 0 0 3 0 0 5 4 9 6 0 0 33 20 55 32 21 5 1 5 7 9 9 0 1 0 1 0 3 0 3 5 8 0 3 0 43 37 83 52 38 6 0 0 0 0 2 0 0 0 2 total main tenus 3 2 3 6 60 18 3 3 98 426 Chapitre 6 – De la base de données au corpus de travail La section suivante permet d'évaluer le poids des choix pris quant au maintien ou au rejet des dérivés dans trois familles lexicales, particulièrement prolixes. 1.7. Trois familles lexicales particulières Seront abordées ici les familles des bases pied, sorcier et coq, de façon à apprécier l'hétérogénéité de traitement possible au sein d'une même famille. 1.7.1. La famille de pied Les termes de la famille de pied sont au nombre de neuf dans la base de données initiale. Parmi eux, deux ont été rejetés au motif que la soi-disant épenthèse était en réalité présente dès le latin (motif "2a") : piétaille et piéter. Les sept termes restant – dépiéter, empiéter, empiètement, piétement, piétin, piétiner et piéton - sont possiblement formés à partir de la base pied, dont l'étymologie indique qu'elle est formée à partir du latin pedem, accusatif de pes, pedis. Selon les critères établis plus haut, ils ont donc été maintenus dans le corpus, puisque la consonne apparaissant entre le radical et le suffixe n'est pas la consonne sousjacente. A l'intérieur d'une même famille lexicale donc, des termes semblant relever du même cas de figure puisque présentant la même consonne épenthétique au même emplacement, seront pourtant traités différemment en regard de ce premier filtre. Au terme du deuxième filtre, la situation aura encore évolué au sein de cette famille. Une seconde famille considérée est la famille de sorcier, pour laquelle seul un terme a été étudié jusqu'à présent. 1.7.2. La famille de sorcier La famille des termes en rapport avec sorcier comprend cinq termes. Sorcier lui-même a été exclus du fait qu'il correspond à un terme latin comportant déjà la consonne suspecte (motif "2a"). Les quatre autres termes (ensorceler, ensorcellement, ensorceleur et sorcellerie) en revanche avaient été "mis de côté" en section 1.3.5. car s'ils correspondent à un terme comportant déjà une consonne, la consonne en question est un -r- et non un -l-, c'est pourquoi les dictionnaires analysent le -l- présent dans ces unités lexicales comme due à de la 427 Chapitre 6 – De la base de données au corpus de travail dissimilation. Autrement dit, il n'y aurait pas épenthèse à proprement parler puisque la position comme le matériel lexical sont déjà disponibles. C'est cette ambivalence de traitement qui m'a conduite à réserver mon jugement quant à ces termes, qui seront au terme de ce premier filtre classés parmi les indécis. La dernière famille examinée ici est celle de coq, comportant elle aussi quelques termes qui n'ont pas encore été abordés dans ce filtre. 1.7.3. La famille de coq Cette famille comporte 14 termes : - un composé : coquelourde ; - un terme de base incertaine codé "B" : coqueluche ; - un terme pour lequel plusieurs bases sont proposées, référencé "3" : coquebin ; - six termes pour lequel la base est incertaine, donc notés "Su" : coquelet, coqueret, coquerelle, coqueleur, coqueleux, coqueliner ; - trois termes traités avec les terminaisons en -eter et maintenus dans le corpus : coquetier1, écoquetage, écoqueter ; - deux termes enfin non encore traités du fait qu'ils n'ont rien de particulier et semblent présenter une épenthèse pertinente pour l'analyse : coquetier2 et coquetière. Le tableau ci-dessous permet de visualiser le traitement des quatorze unités de la famille de coq, dont seules cinq parviennent jusqu'au second filtre. (62) Eliminés Nombre de dérivés 1 Indécis 8 Maintenus 5 Consonne épenthésée l Code explicatif comp Nombre de dérivés concernés 1 l Su 4 r b l t Su 3 B 2 1 1 2 t Su, 9 3 Termes coquelourde coqueleux ; coqueliner ; coquelet ; coqueleur coquerelle ; coqueret coquebin coqueluche coquetier2 ; coquetière coquetier1 ; écoquetage ; écoqueter 14 428 Chapitre 6 – De la base de données au corpus de travail 1.7.4. Bilan Le sort de chacune 535 unités lexicales de la base de données initiale faisant l'objet d'un traitement particulier est rappelé dans le tableau suivant : (63) A B C D E G H K comp mp 2a 2b G Cf Su 0 0 0 1 1 3 0 1 6 9 3 7 9 140 51 1 6 226 1 0 1 0 0 0 0 0 2 0 0 0 8 8 2 0 1 19 1 23 0 0 8 9 2 7 50 0 0 8 0 0 0 0 0 8 4 0 2 2 12 11 0 0 31 total 3 rejetés 0 0 0 0 5 0 0 3 8 15 26 18 20 174 76 3 18 350 0 0 0 0 2 1 0 0 3 indé indé cis cis "B" 0 0 0 3 0 0 5 4 33 20 1 5 1 0 3 5 43 37 total sorc indé ier cis 0 0 0 3 0 0 0 9 0 55 4 11 0 1 0 8 4 87 P 2 0 3 6 32 9 0 0 52 main main tenus tenus "B" 0 1 2 0 0 0 0 0 21 5 9 0 3 0 3 0 38 6 0 0 0 0 2 0 0 0 2 total main tenus 3 2 3 6 60 18 3 3 98 Parmi les termes maintenus, certaines sous-catégories ont été identifiées au fur et à mesure du traitement de la base de données. La section suivante rappelle ces sous-ensembles. 1.8. Codage des termes maintenus Il est apparu au cours de l'examen des 859 termes de la base de données préalablement rassemblée que certains dérivés étaient formés à partir de bases comportant une consonne à la finale sans que ce soit celle de l'épenthèse, ou qu'ils renvoyaient à des noms de pays ou d'habitants, possiblement issus de formation savante. Sans que ces précisions soient sources de rejet, elles ont toutefois été encodées dans le corpus. 1.8.1. Position Un P marque les termes pour lesquels la base présente une consonne dans la position occupée par l'épenthèse, mais sans que cette consonne soit celle choisie par la dérivation. Puisque ce n'est pas cette consonne qui est choisie, la consonne présente dans le mot construit doit être considérée comme épenthétique. Au total, 64 termes comportent cette indication P (dont 52 ne comportent que cette seule indication), dont 4 font partie de la catégorie des indécis (ceux de la famille de sorcier). 60 termes sont donc maintenus avec indication de position (cf. section 1.3.5). 429 Chapitre 6 – De la base de données au corpus de travail 1.8.2. Formation savante : noms d'habitants et de pays D'autres termes sont vraisemblablement de formation savante dans le corpus : la graphie de lunaisien ou le sens très spécialisé de myrosine en sont des indices. Toutefois seuls ont été indexés les noms de pays et surtout d'habitants, ceux-ci étant formés à l'aide de suffixes particuliers sur lesquels je reviendrai en section 2.2. (64) noms d'habitants Ha bleu 14 noms de pays (suff-ie) Hb bleu 1 1.8.2.1. Nom de pays Un nom de pays est recensé dans le corpus : Papousie, formé sur papou (origine D.). Le code "Hb" est porté dans la colonne "code explicatif". 1.8.2.2. Noms d'habitants Quatorze substantifs ont été codés "Ha" pour les identifier en tant que nombre d'habitants. Parmi eux, un seul est d'origine orale (amalfitain), tous les autres sont issus de C. Ils se répartissent, en fonction des suffixes à partir desquels ils sont dérivés, de la manière suivante : (65) Suffixe Nombre de termes concernés -ain 6 -ais 4 -ois 4 Consonne épenthésée t k t l n k l z d Nombre de termes par consonne 3 2 1 2 2 1 1 1 1 Dérivés amalfitain ; arroutain ; broutain pierrefeucain ; valéricain samaritain congolais ; togolais javanais ; vinçanais clamecycois graylois pouillyzois spadois 14 430 Chapitre 6 – De la base de données au corpus de travail 1.9. Bilan au terme du premier filtre Les 859 unités lexicales de la base de départ se répartissent au terme de ce premier filtre de la manière suivante : - 350 termes ont été définitivement rejetés, soit 40.75 % de l'ensemble ; - pour 87 cas, soit 10.13 %, il n'a pas été possible de prendre une décision, ni pour leur éviction ni en faveur de leur maintien ; - 422 termes ont passé avec succès cette première étape de sélection, ce qui signifie que près de la moitié (49.13 %) de la base de données initiale n'est pas rejetée par des critères étymologiques ou allomorphiques ou du fait de la présence d'une consonne sous-jacente. Parmi les 422 termes maintenus, certains ont pourtant été directement testés lors du premier filtre, ce sont les 98 qui figurent dans le dernier tableau récapitulatif (cf. (63)). Quinze autres sont référencés comme relatifs à des noms de peuples ou de pays par la mention des codes Ha et Hb en regard de leur entrée dans le corpus (cf. section 1.8.2). Les 310 restants ne comportent aucune mention particulière, puisqu'ils n'entrent dans aucune des catégories répertoriées lors de ce premier "écrémage". 1.9.1. Bilan des méthodes de recueil 1.9.1.1. Récapitulatif des termes rejetés, indécis et maintenus Le tableau suivant permet de visualiser, pour chaque source exploitée, le nombre de termes qui ont été rejetés au terme de ce premier filtre, ceux pour lesquels aucune décision n'a pu être prise, et ceux qui poursuivent leur chemin jusqu'au second filtre. (66) Méthode de recueil A. B. C. D. E. G. H. K. total Nombre termes rejetés 15 26 18 20 174 76 3 18 350 Exemples accoutrer bagouler calendrier élancer enfançon aléatoire pageoterie infiniser Nombre termes indécis Exemples 0 3 0 9 55 11 1 8 87 louftingue tâcheron coquebin sorcellerie bretonnitude tartelette Nombre termes mainte nus 6 35 30 65 121 110 20 35 422 Exemples Total banlieusard berlurer atlastique canulardesque agiotage bambouseraie cuirture bedeaudaille 21 64 48 94 350 197 24 61 859 431 Chapitre 6 – De la base de données au corpus de travail 1.9.1.2. Evaluation du succès de chaque méthode Le tableau suivant offre une vision synoptique de l'intérêt relatif de chaque source dans la création du corpus à cette étape. (67) termes taux dans sélectionnés la bdd A liste de 64.296 termes 21 2.44 % B dictionnaires d'argot 64 7.45 % C interrogation du TLFi 48 5.59 % D articles 94 10.95 % E étude des suffixes -ier, -age et 350 40.74 % -erie H dictionnaire des néologismes 25 2.91 % K dictionnaire des mots sauvages 61 7.10 % total sources écrites 663 77.18 % G sources orales 196 22.82 % total du corpus 859 100 % type de source termes retenus 6 35 30 65 121 20 35 312 110 422 taux de taux dans réussite le corpus 28.57 % 1.42 % 54.69 % 8.29 % 62.5 % 7.11 % 69.15 % 15.40 % 34.57 % 28.67 % 80 % 57.38 % 47.06 % 56.12 % 49.13 % 4.74 % 8.29 % 73.93 % 26.07 % 100 % La colonne "taux de réussite" réfère au pourcentage de termes maintenus par rapport aux termes de la base de donnée de départ, pour chacune des sources. Ceci permet d'évaluer la pertinence de l'utilisation de chacune dans la composition d'un corpus portant sur l'épenthèse consonantique. Le taux de réussite le plus faible est enregistré par la première méthode d'extraction exploitée, à savoir la recherche semi-automatique à partir de la liste de termes (A.) : elle a perdu plus de 70 % de son effectif dès ce premier filtre. Sa part dans le corpus réduit de plus de 40 % puisqu'elle passe de 2.44 % de la base de données de 859 mots à 1.42 % du corpus de 422 termes. Le résultat à ce niveau de la création du corpus est à peine meilleur en ce qui concerne la recherche par suffixe (E.) : plus de 65 % des unités lexicales ainsi obtenues sont dès à présent rejetées, ce qui représente une perte importante pour le corpus puisqu'il s'agissait là de sa source la plus prolifique. Son importance dans le corpus chute de 30 % au cours de ce premier filtre (40.74 % des 859 mots, mais plus que 28.67 % des 422 termes). La source la plus intéressante en termes de succès à ce niveau de la constitution du corpus est le dictionnaire des néologismes, puisque 80 % de son effectif est maintenu, même si sa part dans le corpus total est de moins de 5 %. Son succès se vérifie si l'on compare la place de cette source dans la base de données (2.91 %) à sa place dans le corpus tel qu'il est constitué après le premier filtre (7.74 %) : elle a pratiquement triplé (265.95 %). 432 Chapitre 6 – De la base de données au corpus de travail Je ne commenterai pas davantage ce tableau étant donné que le corpus n'est pas encore arrivé à sa phase finale. Il ne s'agit pour le moment que de tendances qui demandent à être réévaluées après le deuxième filtre. Avant de passer à cette deuxième étape de filtration du corpus, arrêtons-nous un instant pour observer la composition des termes restants à ce niveau. 1.9.2. Composition des 422 termes maintenus dans le corpus 1.9.2.1. En fonction de la méthode de recueil du terme dans le corpus Le tableau ci-dessous (reprenant une partie des informations fournies en section 1.9.1.) récapitule le nombre de termes retenus pour chaque source d'extraction. On trouvera en annexe 1a l'ensemble des 422 termes en regard de leur source, triés pour chacune en fonction de la base puis de la consonne épenthésée supposée. (68) Méthode de recueil A B C D E H K liste de 64.296 termes dictionnaires d'argot interrogation du TLFi articles étude des suffixes -ier, -age et -erie dictionnaire des néologismes dictionnaire des mots sauvages total sources écrites G sources orales total du corpus termes retenus 6 35 30 65 121 20 35 312 110 422 taux dans le corpus 1.42 % 8.29 % 7.11 % 15.40 % 28.67 % 4.74 % 8.29 % 73.93 % 26.07 % 100 % Exemples banlieusard berlurer atlastique canulardesque agiotage cuirture bedeaudaille bambouseraie 1.9.2.2. Tri en fonction de la base des dérivés Les 422 unités lexicales correspondent à 254 bases différentes, de abri à Zola, dont on trouvera le détail en annexe 1b. 1.9.2.3. Tri en fonction de la finale de la base La finale de la base peut se révéler constituer un élément déclencheur dans l'apparition d'une épenthèse consonantique, aussi est-il nécessaire d'évaluer dans quelle mesure n'importe 433 Chapitre 6 – De la base de données au corpus de travail quel son peut se trouver à la gauche du suffixe, et si certains phonèmes sont prépondérants dans cette position. 1.9.2.3.1. Et des bases elles-mêmes Les termes sont ici présentés en fonction d'une part du dernier son précédant la consonne épenthésée (ou supposée comme telle à l'issue du premier filtre), d'autre part de la liste de chaque base accompagnée du nombre de termes dérivés pour chacune. On trouvera en annexe 1c le détail pour chacun des 422 termes encore en lice. (69) Finale de la base Nombre Termes o 132 a 53 u 46 i 31 y 31 r 20 ø 18 &' 15 e 10 s 10 k -' 9 7 6 Bases (nombre de termes associés) noyau (6) ; biseau (4) ; boyau (4) ; escargot (4) ; indigo (4) ; numéro (4) ; piano (4) ; tuyau (4) ; abricot (3) ; agio (3) ; cacao (3) ; fayot (3) ; Hugo (5) ; maquereau (3) ; tableau (3) ; barreau (2) ; blaireau (2) ; domino (2) ; drapeau (2) ; glaviot (2) ; gogo (2) ; Janot (2) ; Marivaux (2) ; piau (2) ; pinceau (2) ; poireau (2) ; radio (2) ; silo (2) ; sirop (2) ; terreau (2) ; beau (1) ; bedeau (1) ; biscoto (1) ; bobo (1) ; boucau (1) ; bourreau (1) ; bureau (1) ; cadeau (1) ; canot (1) ; chaos (1) ; chapeau (1) ; Chicago (1) ; coco (1) ; Congo (1) ; échafaud (1) ; écho (1) ; esquimau (1) ; figaro (1) ; folio (1) ; ghetto (1) ; gruau (1) ; hobereau (1) ; lingot (1) ; lolo (1) ; massicot (1) ; mélimélo (1) ; miro (1) ; museau (1) ; myro (1) ; Othello (1) ; panneau (1) ; peau (2) ; pipeau (1) ; pogo (1) ; psycho (1) ; rococo (1) ; ronéo (1) ; stabilo (1) ; tango (1) ; taraud (1) ; texto (1) ; togo (1) ; yoyo (1) ; zéro (1) miroi(r) (5) ; Gargantua (3) ; manga (3) ; média (3) ; caca (2) ; eczéma (2) ; gaga (2) ; sida (2) ; alfa (1) ; alibaba (1) ; amiga (1) ; blabla (1) ; cra(sseux) (1) ; del Duca (1) ; glagla (1) ; goujat (1) ; goya (1) ; gravats (1) ; hip hip hourra (1) ; java (1) ; kafka (1) ; kola (1) ; lama (1) ; lambda (1) ; méga (1) ; noix (1) ; piapia (1) ; pyjama (1) ; roi (1) ; saba (1) ; shunga (1) ; sofa (1) ; spa (1) ; tabac (1) ; tafia (1) ; vinça (1) ; vravra (1) ; zola (1) bijou (5) ; caoutchouc (5) ; glouglou (5) ; caillou (4) ; filou (3) ; marlou (3) ; bambou (2) ; clou (2) ; amadou (1) ; Arrou (1) ; bisu (1) ; Bou (1) ; Ceaucescu (1) ; flou (1) ; froufou (1) ; glou (1) ; grigou (1) ; grisou (1) ; maou (1) ; Moscou (1) ; Papou (1) ; piou (1) ; ripou (1) ; sagou (1) ; you (1) catégorie (3) ; émeri (3) ; abri (2) ; chichi (2) ; abruti (1) ; amalfi (1) ; Barbie (1) ; cambouis (1) ; chipie (1) ; Clamecy (1) ; coloris (1) ; dégourdi (1) ; génie (1) ; képi (1) ; loft story (1) ; névralgie (1) ; phraséologie (1) ; pluie (1) ; Pouilly (1) ; puits (1) ; Samarie (1) ; souris (1) ; sursis (1) ; Trotsky (1) ; Valéry (1) cul (7) ; chahut (3) ; jus (3) ; recrue (3) ; tissu (3) ; bahut (2) ; berlue (1) ; bu(er) (1) ; crapahut (1) ; grue (1) ; hurluberlu (1) ; morue (1) ; ONU (1) ; rue (1) ; têtu (1) ; tutu (1) bazar (5) ; cauchemar (3) ; cafard (2) ; calor (2) ; caviar (2) ; escobar (2) ; canular (1) ; cuir (1) ; homard (1) ; noir (1) (z)yeux (5) ; queue (4) ; bleu (3) ; pieu (2) ; al(l)eu (1) ; banlieue (1) ; dieu (1) ; pierrefeu (1) faisan (4) ; fer-blanc (3) ; brelan (2) ; Dinant (2) ; arpent (1) ; bilan (1) ; cachiman (1) ; cran (1) pied (7) ; épopée (1) ; inapproprié (1) ; MRP (1) gosse (2) ; taxe (2) ; atlas (1) ; centauresse (1) ; masse (1) ; taxus (1) ; tennis (1) ; vice (1) coq (5) ; brique (4) Cambrai (2) ; gilet (2) ; déchet (1) ; Gray (1) ; harnais (1) rein (2) ; brin (1) ; coin (1) ; combien (1) ; pain (1) 434 Chapitre 6 – De la base de données au corpus de travail f n l 1 < ç' 3 m j p t 23 sons 3 2 1 1 422 6 5 5 4 4 caf(ard) (3) ; caf(é) (2) ; faffe (1) graine (2) ; chaîne (1) ; lune (1) ; tan (1) pelle (1) ; table (2) ; buffle (1) ; musel(er) (1) souche (3) ; porche (1) verge (3) ; asperge (1) biberon (1) ; cochon (1) ; con (1) ferm(er) (1) ; macadam (1) ; médium (1) feuille (1) ; taill(er) (1) pap(ier) (1) adulte (1) Cent trente-deux termes sur 422 sont formés à partir de bases se terminant par le son [o], ce qui représente plus de 30% de l'ensemble alors que 23 sons différents sont possibles dans cette position, ce qui correspondrait à une moyenne d'environ 18 termes par son (environ 4.27 % de dérivés pour chacun dans le corpus). Se situent également au-dessus de cette moyenne théorique les sons [a] (53 mots construits, 12.56 % de l'ensemble), [u] (46 unités lexicales, 10.90 %), [i] et [y] (31 items chacun, soit 7.35 %), et [r] (20 termes, 4.74 %). [ø] est quant à lui exactement dans la moyenne. Deux tendances se dégagent ici, qui seront à vérifier dans la version finale du corpus. Tout d'abord, peu de bases se terminant par une consonne sont suivies par une épenthèse consonantique (70 sur 422, soit 16.6 % pour 12 sons différents sur 23), et la plupart de ces consonnes finales concernent peu de termes. Seul [r] semble pouvoir être classé parmi les "gros déclencheurs". Un second point est à souligner ici : les voyelles en fin de base qui sont corrélées à la présence d'une consonne épenthétique sont majoritairement arrondies, comme le tableau suivant le met en exergue : (70) Voyelles arrondies en finale de base 132 o 46 u 31 y 18 ø 15 &' 3 ç' 245 Voyelles non arrondies en finale de base 31 i 10 e 7 6 -' total 54 53 a 107 435 Chapitre 6 – De la base de données au corpus de travail Le résultat varie du simple au double selon que la voyelle finale est arrondie ou pas. Cette tendance qui apparaît à cette étape de la création du corpus devra être vérifiée à l'issue du second filtre : la nature de la voyelle précédant l'épenthèse détermine-t-elle la présence de celle-ci ? 1.9.2.3.2. Et de la consonne épenthésée Le détail de ce tri figure en annexe 1d. Le tableau ci-dessous permet son évaluation quantitative. (71) Finale de la base Nombre de termes associés à la finale de la base o 132 a 53 u 46 i 31 y 31 r 20 ø 18 &' 15 e 10 s 10 Consonne épenthésée (nombre de termes associés) t (113) d (11) l (4) z (2) n (1) r (1) t (39) n (5) l (3) z (2) b (1) d (1) g (1) s (1) t (39) z (5) l (1) v (1) t (12) z (13) k (3) l (1) n (1) s (1) t (26) z (2) d (1) l (1) r (1) d (17) z (2) t (1) t (14) z (3) k (1) d (8) t (7) t (9) n (1) t (5) 436 Chapitre 6 – De la base de données au corpus de travail k 9 - 7 -' 6 f 6 n 5 l 5 1 4 < 4 ç' 3 m 3 j 2 p t 1 1 422 l (4) d (1) t (9) t (3) z (2) 1 (1) l (1) t (5) d (1) t (5) l (1) t (3) z (2) t (5) t (3) z (1) t (3) r(1) s (2) d (1) n (1) t (1) z (1) t (1) d (1) t (1) n (1) Il ne semble pas que l'on puisse faire un lien entre la finale de la base et la nature de la consonne épenthésée. En effet, il n'y a pas d'adéquation entre un type de son final de base et une consonne épenthétique particulière, la distribution semble aléatoire et correspond en fait à ce qui est statistiquement attendu du fait de la prépondérance du [t] et des coronales en général dans les consonnes épenthésées. L'épenthèse consonantique sous intérêt apparaît à une frontière morphologique dont on vient d'étudier l'impact possible de la marge gauche. Le pendant de cette attitude est d'observer ce qui est présent à la frontière droite lorsque l'on constate une épenthèse. 1.9.2.4. Tri en fonction de l'initiale du suffixe Peut-on observer là encore une prépondérance des voyelles arrondies dans le contexte immédiat de la consonne épenthésée, ou est-ce une autre tendance qui se dégage en regard de la frontière droite de l'épenthèse ? 437 Chapitre 6 – De la base de données au corpus de travail 1.9.2.4.1. Et du suffixe Le tableau ci-dessous présente les résultats du tri des termes en fonction de l'initiale du suffixe, puis des suffixes eux-mêmes. On en trouvera la version exhaustive en annexe 1e. (72) Initiale du suffixe e j a " i Nombre de termes Suffixe Nombre de termes er 108 é 13 ée éen 1 1 ier 49 ière 9 ien 4 ième 1 age 36 aille 4 ard 4 ation 4 able al asse 1 1 1 erie 32 ement 11 elet eraie 2 1 ique 14 iser 6 ine 4 123 63 51 46 38 Consonne épenthésée t d z n S r t z d s t t t d v z t z l t t d z t d z l t z z t z t d t d z t d l s t z t n t l r t Nombre de termes 85 12 7 2 1 1 9 2 1 1 1 1 39 8 1 1 9 3 1 1 31 4 1 2 1 1 2 1 1 3 1 1 1 1 24 5 3 8 1 1 1 2 1 13 1 4 1 1 2 Exemple dépiauter bazarder caloriser adultiner harnacher berlurer abricoté empochézé barreaudé enképissé yeutée sabatéen alfatier taxaudier amadouvier marlousier cacaotière cambrésien hugolien combientième dépiautage barreaudage émerisage bijoutaille bedeaudaille bleusaille faflard queutard banlieusard calorisation numérotation catégorisable soucutal biberondasse bijouterie boyauderie lamaserie abritement bazardement gargantualement hiphipourrassement dieutelet bambouseraie atlastique médiumnique eczématiser (s') abrutiliser ghettoriser abricotine 438 Chapitre 6 – De la base de données au corpus de travail - 34 œ 21 ø 14 -' y w isme 6 ir 2 ie if ille iner is ite 1 1 1 1 1 1 esque 24 ais 4 aire 3 aie esse ette 1 1 1 eur 21 eux 13 euse 1 ain 6 in 3 ure 5 ude 1 ois 5 oire 1 ant 3 ot 2 eau 1 9 7 6 &' 3 o 3 t 3 té 3 + +' 1 1 422 otte on 1 1 422 z t t z z t d t t z t l n d b l n t l r t n t d t d n z t k t l t d t k d l z t z 2 6 1 1 1 1 1 1 1 1 13 4 3 2 1 2 2 2 1 1 1 1 20 1 10 2 1 1 4 2 2 1 4 1 1 2 1 1 1 1 2 cambrésine gagatisme glougloutir beausir papousie taxatif brindille piétiner cailloutis halloysite cacatesque ceaucesculesque amiganesque canulardesque alibababesque congolais javanais moscoutaire tissulaire aspergeraie têtutesse barbinette agioteur bazardeur cafeteux cafardeux biscotonneux émeriseuse amalfitain pierrefeucain piétin gosselin cuirture noirdure dégourditude clamecycois spadois graylois pouillysois cacatoire loftstorysant t l z d s z l t 1 1 1 1 2 1 1 1 422 glougloutant gosselot queusot faisandeau cochonceté faucuseté masselotte piéton La tendance inverse à celle observée pour les voyelles finales de base s'observe ici : les voyelles corrélées à une épenthèse sont cette fois-ci les voyelles antérieures, dans une proportion encore plus marquée que les voyelles postérieures dans le cas précédent. 439 Chapitre 6 – De la base de données au corpus de travail (73) Voyelles non arrondies en début de suffixe 123 e 63 j 51 a 46 " 38 i 34 9 -' 364 Voyelles arrondies en début de suffixe 21 œ 14 ø 7 y 6 w 3 &' 3 o 1 + 1 +' 56 86.26 % des épenthèses consonantiques se situent devant une voyelle non arrondie. Si cette forte tendance se confirme dans le corpus final, il ne sera pas possible d'écarter ce paramètre du conditionnement d'apparition des consonnes entre radical et suffixe. 1.9.2.4.2. Et de la consonne épenthésée Le détail pour chacun des dérivés figure en annexe 1f. Le tableau suivant permet la visualisation quantitative des consonnes étudiées en regard de l'initiale du suffixe suivant. (74) Initiale suffixe Nombre de termes e 123 j 63 a 51 " 46 i 38 C épenthésée t d z n r s S t d z l v t z d l t d z l s t z d Nombre de termes 96 13 9 2 1 1 1 48 8 4 1 1 36 7 6 2 34 6 4 1 1 29 5 1 Exemple abriter bazarder caloriser adultiner berlurer enképissé harnacher abricotier bazardier cambrésien hugolien amadouvier agiotage calorisation barreaudage faflard bijouterie boyauderie lamaserie gargantualement hiphipourrassement atlastique cambrésine brindille 440 Chapitre 6 – De la base de données au corpus de travail - 34 œ 21 ø 14 -' 9 y 6 w 6 &' 3 o 3 t 3 +' + 1 1 422 l n r t l n d b g r t d t d n z t k l t d k d l t z z t d l z s z t l 1 1 1 16 7 6 2 1 1 1 20 1 10 2 1 1 6 2 1 5 1 2 1 1 1 1 2 1 1 1 1 2 1 1 1 422 abrutiliser médiumnique ghettoriser cacatesque ceaucesculesque amiganesque canulardesque alibababesque mangagesque aspergeraie agioteur bazardeur cafeteux cafardeux biscotonneux émeriseuse amalfitain pierrefeucain gosselin cuirture noirdure clamecycois spadois graylois cacatoire pouillysois loftstorysant glougloutant faisandeau gosselot queusot cochonceté faucuseté piéton masselotte De même que pour le rapport entre le son final de la base et la nature de la consonne épenthésée, on ne peut rien conclure de la mise en parallèle de l'initiale du suffixe et de la consonne sous intérêt. Là encore, on trouve dans tous les cas une majorité de [t] quel que soit le son suivant l'épenthèse, aussi peut-on supposer à ce stade de l'élaboration du corpus que la nature de la consonne épenthésée est indépendante des sons qui l'entoure. 1.9.2.5. Tri en fonction de la consonne épenthésée La consonne la plus épenthésée en français comme dans de nombreuses autres langues est [t], consonne coronale prototypique. Le tableau suivant (détail en annexe 1g) confirme ceci dans le contexte spécifique de la frontière morphologique entre radical et suffixe. De plus, c'est la classe entière des coronales qui est plébiscitée puisque seuls 7 termes sur 422 441 Chapitre 6 – De la base de données au corpus de travail présentent une épenthèse autre, dont 5 de vélaires, qui est considérée comme le second lieu d'articulation le moins marqué après les coronales (et les glottales, cf. partie I [5]). (75) Consonne épenthésée t d z l n k s r 1 b A v Nombre de termes 304 42 35 16 10 4 4 3 1 1 1 1 422 Termes abriter ; abricotier ; agiotage ; bijouterie ; agioteur ; cacatesque ; atlastique... barreaudage ; bedeaudaille ; biberondasse ; barreaudé ; faisandeau ; bazarder... caloriser ; calorisation ; cambrésien ; lamaserie ; cambrésine ; emporchézé... tissulaire ; congolais ; gargantualement ; ceaucesculesque ; hugolien... javanais ; vinçanais ; adultiner ; amiganesque ; barbinette ; biscotonneux... pierrefeucain ; valéricain ; clamecycois ; souriquois cochonceté ; conceté ; enképissé ; hipipourassement aspergeraie ; berlurer ; ghettoriser harnacher alibababesque mangagesque amadouvier Un autre critère, morphologique cette fois, peut encore être envisagé : la catégorie lexicale, de la base comme du dérivé. 1.9.2.6. Tri en fonction de la catégorie lexicale 1.9.2.6.1. De la base puis de celle du dérivé Le relevé de chacun des termes figure en annexe 1h, il ne sera fait mention ici que de l'évaluation quantitative de ce tri. Du fait que plusieurs catégories de bases, et parfois de dérivés, sont possibles (cf. section 2 de ce même chapitre), chacune a été distinguée par une entrée différente. Le nombre de dérivés n'est donc pas ici de 422 mais de 453. Par ailleurs, les sigles de type ONU ou SIDA ont été répertoriés parmi les substantifs (l'Onu, le sida) et certains termes (méga, lambda, etc.) n'ont pas d'indication de base, celle-ci n'étant pas aisément identifiable. En outre ne seront considérées comme bases en noms propres que les séquences non attestées en tant que substantifs ; escobar ou figaro sont certes issus de noms de personnes mais ils sont attestés en tant que substantifs et seront donc préférentiellement considérés comme tels, au contraire de Marivaux par exemple pour lequel le substantif *marivaux n'existe pas. Enfin, tous les participes (présents et passés) ont été classés en adjectifs car c'est précisément ce classement en dehors de la classe verbale qui leur a valu d'être maintenus en entrées indépendantes (cf. section 2 de ce même chapitre pour une réévaluation de ces termes). 442 Chapitre 6 – De la base de données au corpus de travail Ont été maintenues comme catégories pour la base non pas celles proposées par les dictionnaires mais celles supposées par défaut. Ainsi pour agioteur, ce n'est pas agioter qui a été considéré comme base mais agio, tant que l'étude des suffixes (section 2 de ce chapitre) n'aura pas déterminé précisément la base. Je rappelle les réserves quant au classement proposé, du fait qu'il porte sur une étape intermédiaire de création du corpus et non sur le corpus final. (76) Cat lex base incertaine incertaine Nb termes 4 1 Cat lex dérivé ADJ V N N NP 360 Nb termes 4 1 190 C épenthésée t t t d z l s n r v t d z n r 1 l t z d n l b A k s t l Nb termes 4 1 148 17 15 5 2 1 1 1 86 12 6 2 2 1 1 40 6 4 4 2 1 1 1 1 10 7 V 110 ADJ 60 ADJ 28 k n 3 3 24 z d t z d 3 2 8 5 4 55 N Exemple lambdatique psychoter abritement barreaudage bambouseraie faflard cochonceté barbinette aspergeraie amadouvier dépiauter barreaudé caloriser adultiner berlurer harnacher abrutiliser abricoté catégorisable biberondasse amiganesque sofalesque alibababesque mangagesque souriquois enképissé broutain ceaucesculesq ue clamecycois gargantuanes que cambrésien canulardesque amalfitain cambrésien marivaudage 443 Chapitre 6 – De la base de données au corpus de travail ADJ V 2 k l n d t ADV 1 l 1 t z d s t l n z n t t d t 14 2 1 1 5 1 1 1 1 1 2 2 1 N 18 V 8 ADJ 2 28 V 4 N 4 ADV 1 453 N 1 3 2 2 1 1 clamecycois congolais javanais marivauder othellotiser (s') gargantualem ent bleuterie bleusaille noirdure conceté bleuter abrutiliser adultiner beausir médiumnique crapoteux fermeture buandier combientième Les dérivés présentant des épenthèses sont majoritairement formés à partir de substantifs : 360 mots construits sur 453, soit 79.47 % pour cette seule classe. Si on la regroupe avec les noms propres, on arrive même à 415 dérivés, soit plus de 91 %. Ceci ne laisse que peu de place aux constructions à base adjectivale (28 dérivés, 6.18 %), verbale (4 termes, 0.88 %) ou adverbiale (un seul dérivé, 0.22 %). 1.9.2.6.2. Du dérivé puis de celle de la base Le détail du classement pour chaque dérivé se trouve en annexe 1i. Le tableau cidessous en récapitule les résultats. (77) Cat lex dérivé N Nb termes 235 Cat lex base Nb termes N 189 NP 23 C épenthésée t d z l s n r v t Nb termes 147 17 15 5 2 1 1 1 8 Exemple abritement barreaudage bambouseraie faflard cochonceté barbinette aspergeraie amadouvier amalfitain 444 Chapitre 6 – De la base de données au corpus de travail V ADJ 18 V 4 ADV 1 N 111 ADJ 8 NP 2 122 1 ADJ ADV NP N 60 NP 28 ADJ 2 NP NP 4 1 1 94 1 1 453 d z k l n t z d s t d t t d z n r 1 l t l n z d t t t z d n l b A k s t l k n z d n t t l z 4 4 3 2 2 14 2 1 1 2 2 1 87 12 6 2 2 1 1 5 1 1 1 1 1 1 40 6 4 4 2 1 1 1 1 10 7 3 3 3 2 1 1 4 1 1 dinanderie cambrésien clamecycois congolais javanais bleuterie bleusaille noirdure conceté fermeture buandier combientième abriter barreaudé caloriser adultiner berlurer harnacher abrutiliser bleuter abrutiliser adultiner beausir marivauder othellotiser (s') psychoter abricoté catégorisable biberondasse amiganesque sofalesque alibababesque mangagesque souriquois enképissé broutain ceaucesculesque clamecycois gargantuanesque cambrésien canulardesque médiumnique crapoteux lambdatique gargantualement papousie 445 Chapitre 6 – De la base de données au corpus de travail Ce sont là encore les substantifs qui tirent leur épingle du jeu, mais en tant que dérivés cette fois, et de façon plus modérée qu'en tant que base : le corpus contient 235 substantifs (51.87 %), 122 verbes (26.93 %), 94 adjectifs (20.75 %), un adverbe et un nom propre (0.22 %). Ces résultats doivent toutefois être mis en relation avec la proportion de substantifs, verbes et adjectifs dans l'ensemble du vocabulaire français. Un autre critère possible de déclenchement de l'épenthèse est la taille du radical : les épenthèses sont-elles liées à des radicaux courts, de façon à atteindre une taille minimum de dérivé requise par la langue ? 1.9.2.7. Tri en fonction de la taille du radical La taille du radical sera corrélée tout d'abord avec la base, puis avec la consonne épenthésée. 1.9.2.7.1. Puis de la base En annexe 1j figure le tri détaillé des termes en fonction de la taille du radical et de la base associée à chacun. Le tableau suivant en donne un aperçu par base ; il est classé par ordre décroissant du nombre de termes par taille de radical. 446 Chapitre 6 – De la base de données au corpus de travail Nb termes par base Nombre de bases Nombre de termes Taille du radical (78) 6 5 4 3 2 2 245 145 1 1 104 58 7 5 4 3 2 1 3 64 41 5 4 3 2 1 4 7 5 5 2 422 2 254 3 1 1 Base noyau bazar ; bijou ; glouglou ; hugo ; miroi(r) biseau ; boyau ; caillou ; faisan ; piano ; tuyau agio ; cauchemar ; chalut ; émeri ; fayot ; fer-blanc ; filou ; manga ; maquereau ; marlou ; média ; recrue ; tableau ; tissu abri ; bahut ; bambou ; barreau ; blaireau ; brelan ; cafard ; calor ; caca ; Cambrai ; caviar ; chichi ; Dinant ; drapeau ; gaga ; gilet ; glaviot ; gogo; Janot ; pinceau ; poireau ; radio ; sida ; silo ; sirop ; terreau adulte ; al(l)eu ; alfa ; arpent ; arrou ; atlas ; banlieue ; Barbie ; bedeau ; berlue ; biberon ; bilan ; bisou ; blabla ; bobo ; boucau ; bourreau ; bureau ; cadeau ; cambouis ; canot ; chaos ; chapeau ; chipie ; clamecy ; cochon ; coco ; combien ; congo ; déchet ; écho ; folio ; froufrou ; génie ; ghetto ; glagla ; goujat ; goya ; gravats ; grigou ; grisou ; gruau ; Halloy ; harnais ; hobereau ; homard ; java ; kafka ; képi ; kola ; lama ; lambda ; lingot ; lolo ; maou ; médium ; méga ; miro ; morue ; moscou ; museau ; musel(er) ; myro ; panneau ; papou ; piapia ; pierrefeu ; pipeau ; pogo ; pouilly ; psycho ; ripou ; ronéo ; saba ; sagou ; shunga ; sofa ; souris ; sursis ; tabac ; tafia ; tango ; taraud ; taxus ; tennis ; têtu ; texto ; togo ; trotski ; tutu ; vinça ; vravra ; yoyo ; zéro ; zola pied ; cul coq ; (z)yeux brique ; queue bleu ; caf(ard) ; jus ; souche ; verge caf(é) ; clou ; gosse ; graine ; peau ; piau ; pieu ; rein ; table ; taxe beau ; brin ; brou ; bu(er) ; buffle ; chaîne ; coin ; con ; cra(sseux) ; cran ; cuir ; dieu ; faffe ; ferm(er) ; feuille ; flou ; glou ; gray ; grue ; lune ; masse ; noir ; noix ; pain ; pap(ier) ; pelle ; piou ; pluie ; porche ; puits ; roi ; rue ; spa ; taill(er) ; tan ; vice ; you caoutchouc escargot ; indigo ; numéro abricot ; cacao ; Gargantua domino ; eczéma ; escobar ; Marivaux abruti ; amadou ; amalfi ; Amiga ; biscoto ; cachiman ; canular ; Ceaucescu ; centauresse ; chicago ; coloris ; crapahut ; dégourdi ; Del duca ; échafaud ; épopée ; esquimau ; figaro ; loft story ; macadam ; massicot ; MRP ; névralgie ; ONU ; Othello ; pyjama ; rococo ; samarie ; stabilo ; valéry catégorie alibaba ; hip hip hourra ; hurluberlu ; mélimélo inapproprié ; phraséologie Contrairement à l'hypothèse précédemment formulée, ce ne sont pas les radicaux les plus courts qui font appel à l'épenthèse lors de la dérivation. Ce sont les bisyllabes qui sortent grands vainqueurs : 245 termes sont formés à partir de radicaux de deux syllabes, soit 58 % du corpus, ce qui se retrouve au niveau des bases concernées : 145 sur 254 au total, soit 57 %. Viennent ensuite les monosyllabes, qui ne représentent qu'un peu moins d'un quart des radicaux impliqués dans le phénomène de l'épenthèse à la dérivation suffixale. 447 Chapitre 6 – De la base de données au corpus de travail Les radicaux de trois syllabes et plus sont également représentés : 17.3 % du corpus leur sont dévolus. Ces résultats devront faire l'objet d'un double contrôle : d'une part à l'issue du traitement complet du corpus, c'est-à-dire après le deuxième filtre, d'autre part en fonction de la composition du lexique français en termes de taille des radicaux, si tant est qu'une telle estimation soit possible. Etant donné qu'aucun critère n'a encore pu être corrélé à la nature de la consonne épenthésée, pourquoi ne pas tester si la taille du radical aurait une quelconque influence ? 1.9.2.7.2. Puis de la consonne épenthésée Le détail de ce traitement se trouve en annexe 1k, le tableau suivant permet d'en apprécier les résultats au moyen d'un exemple pour chacun. 448 Chapitre 6 – De la base de données au corpus de travail (79) Taille du radical Nombre de termes 2 245 1 104 3 64 4 7 5 2 Consonne épenthésée t d z l n k r s 1 A t z l d s t d z l n k v z t b s t z Nombre de termes 174 31 19 6 6 3 3 2 1 1 84 7 6 5 1 43 6 5 4 4 1 1 3 2 1 1 1 1 Exemple abritement barreaudage bambouseraie congolais adultiner clamecycois berlurer cochonceté harnacher mangagesque bleuter beausir faflard brindille conceté abricoté canulardesque colorisation abrutiliser amiganesque valéricain amadouvier catégorisable hurluberluterie alibababesque hipipourassement inappropriétisme phraséologisé 422 Il ne s'agit de toute évidence pas encore du bon critère de détermination de la qualité de la consonne épenthétique : [t] est toujours majoritaire, quelle que soit la taille du radical auquel il est adjoint. Seule exception : les radicaux de quatre syllabes semblent préférer [z] à [t], mais la différence entre les deux est minimale et sera peut-être gommée, voire inversée, à l'issue du traitement complet du corpus. Le dernier critère envisagé est le suffixe lui-même : certains suffixes sont-ils aptes à déclencher une épenthèse au contraire de certains autres, ou tous sont-ils égaux face à l'épenthèse ? 449 Chapitre 6 – De la base de données au corpus de travail 1.9.2.8. Tri par suffixe Ainsi que l'illustre le tableau ci-dessous, certains suffixes sont particulièrement associés au phénomène de l'épenthèse consonantique, au contraire d'autres. On trouvera en annexe 1l ces suffixes classés par ordre alphabétique avec la liste exhaustive des dérivés concernés, et en annexe 1m, pour chaque suffixe, un tri en fonction de la nature de la consonne épenthésée. (80) Suffixe er ier age erie esque eur é eux ique ement ière ain ure iser ois isme aille ais ard ation ien ine aire ant in té elet ir ot able al asse eau ée éen eraie esse ette euse ie ième if ille Nombre termes 108 49 36 32 24 21 13 13 13 11 8 6 5 6 5 5 4 4 4 4 4 4 3 3 3 3 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Exemples de termes abriter ; bazarder ; caloriser ; adultiner ; berlurer ; harnacher abricotier ; al(l)eutier ; bazardier ; boyaudier ; amadouvier ; marlousier dépiautage ; barreaudage ; émerisage bijouterie ; bleuterie ; boyauderie ; dinanderie ; lamaserie ; marlouserie cacatesque ; ceaucesculesque ; amiganesque ; canulardesque ; alibababesque agioteur ; biseauteur ; blaireauteur ; bazardeur abricoté ; bijouté ; phraséologisé ; emporchézé ; barreaudé ; enképissé cafeteux ; caillouteux ; cafardeux ; cauchemardeux ; biscotonneux atlastique ; bureautique ; caoutchoutique ; médiumnique abritement ; glougloutement ; bazardement ; gargantualement ; hipipourassement cacaotière ; cafetière ; coquetière ; escargotière ; giletière ; lolotière ; rutière amalfitain ; arroutain ; broutain ; samaritain ; pierrefeucain ; valéricain cuirture ; fermeture ; vergeture ; yeuture ; noirdure eczématiser (s') ; médiatiser ; othellotiser (s') ; radiotiser ; abrutiliser ; ghettoriser clamecycois ; souriquois ; spadois ; graylois ; pouillyzois gagatisme ; gogotisme ; inappropriétisme ; janotisme ; médiatisme bijoutaille ; bedeaudaille ; bleusaille congolais ; togolais ; javanais ; vinçanais queutard ; banlieusard ; faflard ; vicelard calorisation ; catégorisation ; colorisation ; numérotation cambrésien ; lunaisien ; onusienne ; hugolien abricotine ; indigotine ; cambrésine ; myrosine moscoutaire ; sursitaire ; tissulaire loftstorysant ; trotskisant ; glougloutant piétin ; tableautin ; gosselin cochonceté ; conceté ; faucuseté dieutelet ; roitelet glougloutir ; beausir gosselot ; queusot catégorisable soucutal biberondasse faisandeau yeutée sabatéen bambouseraie têtutesse barbinette émeriseuse papousie combientième taxatif brindille 450 Chapitre 6 – De la base de données au corpus de travail iner is ite oire on otte ude 50 suffixes 1 1 1 1 1 1 1 422 piétiner cailloutis halloysite cacatoire piéton masselotte dégourditude Le suffixe -er est de loin le plus représenté avec 108 termes sur 422 (soit 25.59 %), suivi des suffixes -ier (49 mots, 11.61 %), -age (36 dérivés, 8.53 %), -erie (32 éléments, 7.58 %) et -esque (24 mots, 5.69 %). Ces résultats sont cependant en partie biaisés par les méthodes de recueil, notamment la recherche directe par certains de ces suffixes et l'exploitation d'un article de Plénat & al (2002) sur les néologismes en -esque. Il conviendra donc de reconsidérer ces résultats une fois le deuxième filtre effectué, et en gardant à l'esprit cette réserve. Par ailleurs, le nombre de terminaisons s'est réduit drastiquement : de 89 dans les 859 termes ne restent que 50 suffixes dans le corpus de 422 dérivés. 1.10. Conclusion de la section Le passage des 859 séquences de la base de données brute aux 422 séquences retenues à l'issue de ce premier filtre, faisant intervenir l'étymologie des dérivés comme celle des bases, permet d'entrevoir certaines tendances : la nature des segments immédiatement adjacents à la consonne sous intérêt semble pertinente ; la catégorie lexicale des bases comme des dérivés peut également jouer un rôle ; en revanche, la taille du radical n'a apparemment pas de rôle à jouer, contrairement à ce que l'intuition aurait indiqué, dans l'apparition d'une épenthèse (cf. chapitre 7 de cette partie II pour des résultats à partir d'un questionnaire) ; enfin, la nature de la consonne épenthésée apparaît réfractaire à tout conditionnement. Comme il l'a été plusieurs fois indiqué dans cette dernière section, les résultats qui semblent se dégager à l'issue de ce premier filtre doivent être vérifiés dans le corpus définitif. Celui-ci ne sera obtenu qu'après un examen attentif des suffixes impliqués dans la dérivation, ce qui sera l'objet de la seconde étape de traitement des dérivés, explicitée dans la section suivante. 451 Chapitre 6 – De la base de données au corpus de travail 2. Deuxième filtre : les écueils de la morphologie dérivationnelle française qu'est-ce qui est dérivé de quoi ? Ce deuxième filtre porte sur l'examen de chacun des 50 suffixes identifiés dans les dérivés à l'issue du premier filtre. Il s'agira d'établir s'il s'agit bien du suffixe supposé, en fonction du type de base auquel celui-ci est réputé s'adjoindre et surtout des signifiés, celui du suffixe comme celui du dérivé considéré (cf. chapitre 4 section 3.6 pour une brève discussion concernant la compositionalité du sens des dérivés par rapport aux signifiés de leurs composants). Cette section s'appuiera sur les données de plusieurs références en matière de lexicologie du français, du fait que je ne suis pas spécialisée dans ce domaine et n'ai donc pas les compétences pour évaluer les différentes propositions offertes pour chaque suffixe. Je ne prétendrai donc ici nullement prendre parti pour une analyse plutôt qu'une autre et ne me positionnerai qu'en tant qu'usagère des analyses proposées. S'il existe ne serait-ce qu'une analyse mettant en doute la formation d'un dérivé à l'aide d'une épenthèse consonantique, j'exclurai ce dérivé de l'ensemble des termes maintenus. Cette position sera illustrée tout au long de la section et se traduira par le rejet de 260 séquences du corpus, ne laissant après le deuxième filtre que 259 dérivés dont la fiabilité sera renforcée. Les termes qui auront changé de catégorie à l'issue de leur passage par ce second filtre seront identifiés dans le corpus final par une encoche dans une colonne particulière baptisée "2ème tour". Pour faciliter le cheminement du lecteur dans le dédale des suffixes abordés, un regroupement est proposé en 7 rubriques, les premières axées sur le sens et les secondes sur la catégorie lexicale : les suffixes diminutifs seront abordés en premier, suivis par les suffixes ethniques et les suffixes scientifiques ; seront ensuite présentés les suffixes purement adjectivaux, nominaux, "mixtes" et verbaux, étant entendu que ce classement ne tient compte que de leur emploi dans les dérivés du corpus. 452 Chapitre 6 – De la base de données au corpus de travail 2.1. Suffixes diminutifs 2.1.1. -eau Le suffixe -eau permet de former des substantifs diminutifs à partir de substantifs17 (Apothéloz 2002 : 78, Corbin 1987 : 239 ; 662, Dubois & Dubois-Charlier 1999 : 191 ; 194 ; 198-199) : renardeau sur renard, sapineau sur sapin. L'unité lexicale faisandeau du corpus correspond à ce paradigme et comporte donc bien une épenthèse de [d] ; elle est donc maintenue dans le corpus à l'issue de ce second filtre. 2.1.2. -(el)et(te) Deux termes dans le corpus se terminent par -elet (dieutelet, roitelet). Corbin (1987 : 239) présente le suffixe -elet comme la concaténation des deux suffixes diminutifs -eau et -et. Apothéloz (2002 : 78) préfère considérer un seul suffixe en -elet. Dubois & Dubois-Charlier analysent -et et -elet comme les variantes d'un même morphème à valeur atténuative, sans se prononcer quant à leur distribution. Quelle que soit l'hypothèse de formation retenue, elle n'affecte en rien l'initiale du suffixe -eau ou -elet, ce qui signifie que le [t] présent dans dieutelet et roitelet est bien épenthétique et que ces deux termes doivent donc figurer dans le corpus. Considérons maintenant le terme barbinette, seule trace dans le corpus du suffixe au féminin. La consonne éventuellement épenthétique est [n] et non [l], et le suffixe -et(te) n'est pas réputé comporter un allomorphe en -net(te). Aussi barbinette doit-il continuer à faire partie de l'aventure. 2.1.3. -in Ne sera mentionné ici que le suffixe diminutif -in et non le suffixe ethnique, attendu que des trois termes en -in du corpus (gosselin, piétin, tableautin), aucun n'est dérivé à partir d'un nom de lieu. 17 Corbin (1987 : 108) mentionne le cas de renouveau comme formation de substantif à partir d'un adjectif, mais il s'agit d'une dérivation sans ajout d'affixe ; Dubois & Dubois-Charlier (1999 : 184) citent le cas des agents en eau de type damoiseau/damoiselle, pastoureau/pastourelle, maquereau/maquerelle, peu nombreux et non représentés dans notre corpus. 453 Chapitre 6 – De la base de données au corpus de travail Aucun non plus n'est formé à partir d'un adjectif. Aussi ne pousserai-je pas plus loin l'étude des paires de type blond / blondin ou roux / rouquin (cf. Dubois & Dubois-Charlier 1999 : 164 ; Corbin 1987 : 484). Corbin s'intéresse également aux formations nominales indiquant l'agent, à partir d'un verbe (1987 : 71), de type plaisantin sur plaisanter, mais aucun des trois termes du corpus n'est agent. Le suffixe que l'on retrouve dans le corpus est en réalité le suffixe -in à valeur diminutive ou dépréciative (cf. TLFi, suffixe -in, -ine II18) : gosselin "petit gosse, petit garçon" est formé à partir du substantif gosse et présente donc une épenthèse de [l] ; de même, tableautin "petit tableau" est un mot construit sur le nom tableau, avec une épenthèse de [t]. Seule la formation de piétin reste obscure ; le TLFi rapproche le suffixe -in de la terminaison d'une autre maladie animale, le farcin formé sur le latin farcinem, sans que l'on trouve trace de ce suffixe ailleurs dans la littérature. Néanmoins, la base pied est attestée par le sens (cf. également Corbin 1987 : 745 qui le cite en exemple pour l'alternance d~t) et par le fait que la seule suffixation de -in sur un verbe produit un signifié de type agentif, ce qui n'est pas le cas de piétin. Aussi le maintiendrai-je dans le corpus, bien que le suffixe à partir duquel il est formé ne semble pas attesté par ailleurs. Le signifié du terme jusqu'alors indécis fagotin "petit fagot" indique que ce dernier est bien formé à partir du suffixe diminutif mais ne le réhabilite pas pour autant, attendu qu'il avait été écarté pour des raisons d'obscurité de la base et non de suffixe. 2.2. Suffixes ethniques On verra à l'occasion de l'étude du suffixe -ier qu'il peut permettre de former des adjectifs référant à un nom de lieu : chaudefonnier sur Chaux-de-fond. Il ne s'agit cependant là que d'un cas particulier du sens général "relatif à N". D'autres suffixes en revanche sont clairement consacrés à former des substantifs ou des adjectifs à partir de noms de lieux, du moins dans la limite du corpus : un suffixe comme -ain n'est pas limité à la fonction locative dans l'absolu, mais c'est le cas dans le corpus, ce qui justifie son classement dans cette section. 18 Ce suffixe n'est cité ni par Corbin (1987), ni par Apothéloz (2002), ni par Dubois & Dubois-Charlier (1999), ces derniers faisant au mieux état du suffixe -in "relatif à N" dont le dérivé peut être substantivé s'il s'agit d'un "humain qui appartient à telle communauté, telle institution politique, économique, etc.". Ce qui peut expliquer la formation de gosselin mais ne rend pas compte de la dimension diminutive du terme, et ne permet pas d'analyser tableautin. 454 Chapitre 6 – De la base de données au corpus de travail Ne seront par ailleurs abordés ici que les suffixes ayant permis de former des dérivés présents dans le corpus, le but de cette étude n'étant pas une classification précise et exhaustive des suffixes mais l'évacuation des mots construits ne présentant pas d'épenthèse consonantique du corpus de travail. 2.2.1. -ain(e) En tant que suffixe "entrant dans la formation des adjectifs ethniques" (Dubois & Dubois-Charlier 1999 : 152), le suffixe -ain n'est pas parmi les plus productifs mais il entre tout de même dans la composition de napolitain sur Naples, romaine sur Rome ou africain sur Afrique. Il a pour signifié "(celui) qui vient de N" et permet de former des substantifs aussi bien que des adjectifs (Corbin 1987 : 106-107, Dubois & Dubois-Charlier 1999 : 152-153, Apothéloz 2002 : 77). Aucune variante suffixale n'est relevée, aussi peut-on considérer que les six termes se terminant par -ain dans notre corpus - amalfitain, arroutain, broutain, samaritain, pierrefeucain et valéricain - comportent bien une consonne épenthétique entre le nom propre radical et ledit suffixe. Rappelons pour mémoire que ce suffixe s'applique également aux noms propres de personne pour former des adjectifs de signifié "relatif à NP" (élisabéthain sur Elisabeth, Dubois & Dubois-Charlier 1999 : 159) ; aux substantifs de façon à construire des adjectifs de sens "qui est de la forme, de la couleur, de la nature de N" (républicain sur république, Dubois & Dubois-Charlier 1999 : 144-145) ; à certains adverbes ou adjectifs nominalisés (hautain sur l'adverbe haut et non sur l'adjectif homophone, Dubois & Dubois-Charlier 1999 : 145) ; à des substantifs enfin, ou plus exactement à des "groupes nominaux comportant un nom de nombre dans un domaine précis" (Dubois & Dubois-Charlier 1999 : 214) pour former des substantifs (quatrains sur quatre, cf. également Corbin 1987 : 94-95). En outre, s'il est suivi d'un autre suffixe, -ain prend la forme -an- (mondanité sur mondain, cf. Corbin 1987 : 316 ; 517 note 6 ; 544 note 66 ; 759). 2.2.2. -ais(e) Le suffixe -ais est d'acceptions et de distribution moins diversifiées, dans le sens où il ne s'applique qu'à un type de bases, les noms propres, pour ne former que des adjectifs ethniques (Apothéloz 2002 : 77, Dubois & Dubois-Charlier 1999 : 152-153, Corbin 1987 : 455 Chapitre 6 – De la base de données au corpus de travail 544) : marseillais sur Marseille, lyonnaise sur Lyon, français sur France. Ces adjectifs peuvent ensuite être substantivés : un Marseillais, une Lyonnaise, un Français. Ce suffixe est très productif et tendrait à s'appliquer aux noms de villes plutôt qu'à ceux d'agglomérations plus petites (Dubois & Dubois-Charlier 1999 : 152). Le suffixe ne présente pas d'alternance, aussi peut-on conclure que les [l] et [n] présents à sa frontière gauche dans les quatre termes du corpus relèvent du phénomène épenthétique : congolais, togolais, javanais et vinçanais sont ainsi maintenus dans le corpus. 2.2.3. -ois(e) Ce suffixe ethnique, comme -ais, est à la fois très productif et d'utilisation très ciblée puisqu'il n'est employé que dans cet aspect spécifique. Comme il l'a été mentionné dans le paragraphe précédent (2.2.2.), il s'appliquerait surtout aux noms d'agglomérations quelle que soit leur taille, au contraire du suffixe -ais qui se spécialiserait davantage dans les villes (Dubois & Dubois-Charlier 1999 : 152). On le trouve par exemple dans aixois sur Aix, bruxellois sur Bruxelles ou brestoise sur Brest, les adjectifs pouvant également être substantivés (un Aixois, un Bruxellois, une Brestoise) mais également dans villageois sur le substantif village, toujours avec le sens de "(celui) qui est originaire de N(P)". Ce suffixe ne manifestant pas d'alternance, les cinq termes du corpus le comportant clamecycois, souriquois, spadois, graylois et pouillyzois - seront donc maintenus à l'issue de ce second filtre puisque la consonne qu'ils contiennent à la gauche du suffixe est ainsi épenthétique. 2.2.4. -ie Un seul terme est réputé comporter ce suffixe dans le corpus de 420 unités lexicales ayant passé le premier filtre : Papousie, qui réfère à la Nouvelle Calédonie. La littérature consultée ne fait pas mention du suffixe -ie en tant que formateur de noms de pays. Corbin (1987 : 108) et Dubois & Dubois-Charlier (1999 : 204-205) l'abordent par le signifié "état d'être Adj" : la jalousie est l'état d'être jaloux, la diplomatie d'être diplomate, la bigamie d'être bigame. Si l'on ne trouve pas trace du suffixe -ie avec l'acception que l'on distingue dans Papousie, le suffixe *-sie quant à lui n'est pas attesté du tout, ce qui exclut le [z] de Papousie du suffixe. 456 Chapitre 6 – De la base de données au corpus de travail Par ailleurs, le suffixe -ie est parfois envisagé comme variante ou partie du suffixe erie (cf. section 2.6.1.4.), qui aurait sens "lieu où N exerce son activité" (le boulanger travaille dans une boulangerie, le cordonnier dans une cordonnerie). Cette formation se faisant sur le substantif et le signifié impliquant la notion de lieu, il est possible de rattacher Papousie à ce suffixe -ie à condition d'adapter le signifié "lieu en relation avec N". Si Papousie avait été substantif et non nom propre, il aurait été possible de dresser la liste de ses semblables à partir de la base de données initiale utilisée pour la recherche automatique de termes (origine A.) puisque l'on peut interroger celle-ci à partir de séquences de lettres finales. Cette option n'étant pas ouverte, tâchons de réunir tout de même un petit corpus de noms de pays en -ie : Abyssinie, Algérie, Amazonie, Arménie, Australie, Austronésie, Bolivie, Calédonie, Californie, Colombie, Estonie, Ethiopie, Haïti, Indonésie, Italie, Jordanie, Lithuanie, Mauritanie, Mésopotamie, Mongolie, Océanie, Pennsylvanie, Polynésie, Sibérie, Syrie, Tahiti. En dehors de Australie formé sur l'adjectif austral, tous ces termes sont rattachés à des noms d'habitants et adjectifs en -ien : algérien, amazonien, arménien, etc. (cf section T pour l'étude des dérivés en -ien). Papousie n'est pas lié à un adjectif ou substantif *papousien mais au substantif papou, aussi ne peut-on le rattacher à cette série en supposant un dérivé régressif, pas plus qu'on ne peut le considérer formé sur un adjectif comme l'est Australie. Il semblerait donc que l'explication de formation pour ce terme la plus plausible serait à l'aide du suffixe -ie "lieu en relation avec N", avec une influence possible des noms propres de pays se terminant en -ie. Cette influence ne peut toutefois pas rendre compte du [z] puisque l'on relève quantité de noms propres en -ie précédés d'une autre consonne (23 sur 26 dans le petit corpus ci-dessus). Aussi peut-on maintenir Papousie dans le corpus. 2.3. Suffixes scientifiques Un statut particulier doit être accordé aux suffixes scientifiques, du fait qu'ils "n'entrent pas dans le système des adjectivisations ou nominalisations suffixales ; ils jouent un rôle différent par leurs propriétés lexicales et syntaxiques, dépassant en général le seul cadre du français" (Dubois & Dubois-Charlier 1999 : 262). 457 Chapitre 6 – De la base de données au corpus de travail 2.3.1. -ine Ce suffixe peut être utilisé pour former le féminin de noms propres : Christine sur Christian, Pauline sur Paule (Dubois & Dubois-Charlier 1999 : 187). Son acception principale est cependant d'ordre scientifique, dans le domaine particulier de la chimie organique (Dubois & Dubois-Charlier 1999 : 265-266). Les quatre termes du corpus ne relèvent pas tous de la chimie pour autant ; seul myrosine "diastase présente dans la graine de moutarde noire" semble correspondre à ce suffixe. Cependant, l'absence de suffixe -tine d'une part, et la détermination aisée de la base des trois termes restants d'autre part, permettent d'identifier les consonnes à la jointure comme épenthétiques, même en l'absence de signifié pour abricotine. L'indigotine est un "principe colorant" pour lequel on peut éventuellement établir un lien avec la chimie générale à défaut de la chimie organique. La cambrésine enfin, du nom propre Cambrai, désigne une "fine toile de lin fabriquée dans le nord de la France". Abricotine, cambrésine, indigotine et myrosine sont donc maintenus dans le corpus. 2.3.2. -ite Le suffixe -ite a dans la langue "courante" la faculté de former des adjectifs ethniques à partir de noms propres : yéménite sur Yémen, moscovite sur Moscou (Dubois & DuboisCharlier 1999 : 154). Cependant, le seul terme en -ite du corpus ne renvoie pas à ce suffixe mais à l'un de ses homonymes scientifiques. -ite est connu dans son sens médical d'"inflammation" : appendicite "inflammation de l'appendice", trachéite "inflammation de la trachée" (Apothéloz 2002 : 78, Dubois & Dubois-Charlier 1999 : 273-274) et est dans ce sens formateur de substantifs à partir de substantifs. Ici c'est l'affixe minéralogique et géologique permettant de dériver un type de roche qui concerne halloysite "silicate hydraté d'aluminium", le terme du corpus. Plusieurs types de bases nominales sont possibles (Dubois & Dubois-Charlier 1999 : 269) parmi lesquelles les noms propres, comme c'est le cas ici puisque la base d'halloysite est le nom du géologue Halloy. A cette étape de traitement du corpus, halloysite est donc maintenu puisque le [z] ne provient ni du suffixe, ni du radical. 458 Chapitre 6 – De la base de données au corpus de travail 2.4. Suffixes purement adjectivaux 2.4.1. -al(e) Le suffixe -al permet de former des adjectifs sur des bases substantives avec un signifié très large de type "relatif à N" : automnal sur automne, théâtral sur théâtre, génial sur génie (Dubois & Dubois-Charlier 1999 : 137, Apothéloz 2002 : 77, Corbin 1987 : 64). Aucune variation concernant la frontière gauche du suffixe n'est attestée dans la littérature. Dans ce cadre, le mot construit soucutal "placé sous le fessier" est maintenu dans le corpus en tant que terme porteur d'une épenthèse consonantique à l'endroit sous intérêt. 2.4.2. -(at)aire Deux bases sont possibles en ce qui concerne ce suffixe : - la base nominale, qui permet de créer des adjectifs ayant pour signifié "relatif à N" (Corbin 1987 : 64, Apothéloz 2002 : 77, Dubois & Dubois-Charlier 1999 : 134-136) comme dans alimentaire formé sur aliment ou bénéficiaire sur bénéfice, ou des substantifs dont le sens correspond à "agent en relation avec N" (Apothéloz 2002 : 78, Dubois & Dubois-Charlier 1999 : 135), que l'on trouve ainsi dans disquaire sur disque ou dans littéraire sur lettre ; - la base verbale à partir de laquelle sont dérivés des substantifs ayant pour valeur sémantique "agent qui V" (Corbin 1987 : 377, Dubois & Dubois-Charlier 1999 : 121-122, Apothéloz 2002 : 76) comme dans incendiaire sur incendier et protestataire sur protester, ou "bénéficiaire de l'action de V" (Corbin 1987 : 377-378, Dubois & Dubois-Charlier 121-122 ; 47, Apothéloz 2002 : 76) que l'on trouve dans donataire sur donner et destinataire sur destiner par exemple. Le tableau suivant récapitule les catégories de dérivés possibles à l'aide du suffixe (at)aire : (81) dérivé base verbale substantive substantif masculin ou féminin "agent qui V" : incendiaire "bénéficiaire de V" : donataire "agent en relation avec N" : disquaire adjectif / "relatif à N" : alimentaire 459 Chapitre 6 – De la base de données au corpus de travail Seuls trois termes sont dérivés à partir du suffixe -aire dans le corpus : moscoutaire, sursitaire et tissulaire. Pour aucun d'entre eux ne se pose le problème de l'allongement en -at-. Moscoutaire "qui reçoit ses directives de Moscou" est un terme péjoratif qui présuppose un verbe °moscouter "donner des directives depuis Moscou" (vs. moscovite) de façon à se rattacher au signifié "bénéficiaire de V". Une autre hypothèse serait de supposer sa formation à partir du substantif °moscou "siège central de l'administration soviétique" issu du nom propre Moscou, ce qui permettrait d'une part de résoudre le problème de la concurrence entre moscoutaire et moscovite, d'autre part d'expliquer le type de relation entre la ville et la personne, relation qui est particulière et non générale : moscoutaire ne réfère pas à une relation simple entre Moscou et un de ses habitants mais entre Moscou et un fonctionnaire subalterne à l'administration centrale dont le siège est à Moscou. L'avantage de la formation à partir du verbe °moscouter est la justesse du signifié attribué à moscoutaire par rapport au signifié général du suffixe -aire "bénéficiaire de V". L'inconvénient est la catégorie lexicale du terme : moscoutaire est dans ce sens adjectif et non substantif. D'un autre côté, supposer la dérivation de moscoutaire à partir de la base °moscou permet certes de justifier la catégorie lexicale, mais oblige à perdre la notion de "hiérarchie" entre °moscou qui donne les ordres, et moscoutaire qui les reçoit. Il n'est pas possible de choisir une hypothèse de formation de façon certaine, aussi classerai-je moscoutaire parmi les indécis. Le traitement de sursitaire est plus directement appréhensif. Le signifié de ce dérivé, "bénéficiaire d'un sursis", présuppose le verbe °sursiter "donner un sursis" et ne peut être simplement formé sur sursis, "relatif à un sursis" n'étant pas le sens attesté de sursitaire. Seule l'unité lexicale tissulaire "relatif aux tissus d'un organisme vivant" est donc maintenue dans le corpus : puisqu'il s'agit d'un adjectif formé sur la base tissu, le -l- est bien épenthétique. Le bilan des dérivés en -aire est le suivant : un rejeté (sursitaire), un dont le traitement n'est pas suffisamment clair pour prendre une décision définitive (moscoutaire), un maintenu (tissulaire). 460 Chapitre 6 – De la base de données au corpus de travail 2.4.3. -esque Le suffixe -esque permet de construire des adjectifs à valeur augmentative ou méliorative (cf. Dubois & Dubois-Charlier 1999 : 160-161, Apothéloz 2002 : 78) sur des bases nominales : hugolesque sur hugo (qui aurait par rapport à hugolien "une valeur emphatique ou littéraire"), éléphantesque sur éléphant. On peut paraphraser le signifié de esque par "de la nature de N" (carnavalesque "de la nature du carnaval", gaguesque "de la nature du gag") ou, lorsque la base est un nom propre, par "propre à NP" ou "digne de, comparable à NP" : moliéresque "propre à Molière" ou "comparable à (celui ou celle de) Molière". Dubois & Dubois-Charlier relèvent de "rares ethniques en -esque", et uniquement des emprunts : barbaresque sur Barbarie. Le corpus compte vingt-quatre termes en -esque à l'issue du premier filtre : alibababesque dont le contexte d'emploi permet de déterminer le signifié "comparable à alibaba", amiganesque, l'impression d'un cacatesque, cauchemar", canulardesque, ceaucesculesque, cauchemardesque chicagotesque, "qui produit delducatesque, escargotesque, ferblantesque, gargantualesque "qui évoque Gargantua" (vs. gargantuesque, attesté), gargantuanesque, gogotesque, goyatesque, hugolesque, hugotesque, kafkatesque, mangagesque, manganesque, mangatesque, mégatesque, shungatesque, sofalesque "qui rappelle l'abandon et la nonchalance auxquels invite un sofa" d'où "relatif au sofa", zolatesque. L'absence de signifié pour certains termes n'occasionne pas leur mise à l'écart étant donné que le suffixe -esque ne recèle pas d'ambiguïté de formation : un seul type de base (les noms propres étant assimilables aux substantifs en tant que catégorie majeure) pour une seule catégorie de dérivés (les rares substantifs en -esque étant soit des emprunts comme arabesque ou soldatesque, soit des substantivations d'adjectifs tel que le romanesque). C'est pourquoi tous seront maintenus à l'issue de cette étape de filtre. Le tableau suivant établit cette décision en même temps qu'il rappelle les deux autres termes en -esque présents dans la base de données initiale. Les lignes indiquent le traitement à l'issue du premier filtre, les colonnes le résultat après la deuxième étape de filtre : 461 Chapitre 6 – De la base de données au corpus de travail (82) Indécis escoubellesque / / Indécis Rejeté Rejeté / pioupesque / Maintenu Maintenu / / alibababesque ; amiganesque ; cacatesque ; canulardesque ; cauchemardesque ; ceaucesculesque ; chicagotesque ; delducatesque ; escargotesque ; ferblantesque ; gargantualesque ; gargantuanesque ; gogotesque ; goyatesque ; hugolesque ; hugotesque ; kafkatesque ; mangagesque ; manganesque ; mangatesque ; mégatesque ; shungatesque ; sofalesque ; zolatesque Ce qui en termes quantitatifs donne le tableau suivant : (83) Indécis Rejeté Maintenu Total Indécis 1 / / 1 Rejeté / 1 / 1 Maintenu / / 24 24 Total 1 1 24 26 2.4.4. -ième Le suffixe -ième permet de former des adjectifs numéraux ordinaux à partir d'adjectifs numéraux cardinaux (Apothéloz 2002 : 78, Dubois & Dubois-Charlier 1999 : 165-166) : deuxième, vingtième, millième. Ces adjectifs peuvent être nominalisés : le deuxième, etc. Combien n'est pas un adjectif numéral cardinal mais un adverbe ou un substantif. Pour autant, il est bien la base du dérivé combientième (variante de quantième) présent dans le corpus, qui présente donc bien une épenthèse. Pour l'anecdote, le TLFi atteste d'une construction parallèle combien-nième. 2.4.5. -ien et -éen Le suffixe -ien permet de former des adjectifs, éventuellement substantivés, à partir de substantifs. Ces adjectifs peuvent être ethniques (Corbin 1987 : 71-72 ; 451, Dubois & Dubois-Charlier 1999 : 152) ou plus généraux (Apothéloz 2002 : 77, Dubois & DuboisCharlier 1999 : 144-146, Corbin 1987 : 544) : corrézien sur Corrèze, parisien sur Paris ; aoûtien sur août, informaticien sur informatique. Dans son sens ethnique, il alterne avec -(é)en, variante "utilisée pour conserver le radical de la base" (Dubois & Dubois-Charlier 1999 : 152) : guinéen sur Guinée, européen sur Europe. 462 Chapitre 6 – De la base de données au corpus de travail Aucun allomorphe à initiale consonantique n'est enregistré, si bien que si un terme est formé à partir d'une base à finale vocalique et de ce suffixe, toute consonne intermédiaire doit être considérée comme une épenthèse. Le corpus de 422 termes rassemble quatre termes en -ien et un en -éen. Ce dernier, recueilli à l'oral, n'a malheureusement pas de signifié associé, si bien que l'on ne peut établir avec certitude qu'il est bien une variante de sabéen sur la base du nom de pays Saba et non sur sabbat, comportant une consonne sous-jacente puisqu'issu du latin sabbatum, le suffixe n'ayant pas seulement la valeur d'ethnique. Sabatéen est donc classé parmi les indécis. Hugolien "relatif à Victor Hugo", cambrésien "de Cambrai", et onusien "relatif à l'ONU" sont maintenus dans le corpus puisque la consonne qu'ils présentent à la frontière gauche du suffixe ne provient ni du suffixe lui-même, ni du radical. Le dernier terme relevé dans le corpus, lunaisien, n'a pas de signifié attesté mais le contexte permet de déterminer qu'il s'agirait des "habitants de la Lune", donc de la substantivation d'un adjectif lunaisien "relatif à la lune". Cependant, la base de cet adjectif reste obscure : il ne peut s'agir directement de lune puisque la forme serait alors °lunien ; force est donc de supposer lunaison19 comme base, qui permet de rendre compte également de la présence du [-] mais qui disqualifie le [z] de lunaisien de la classe des épenthèses. Des cinq termes en -éen et -ien, seuls hugolien, cambrésien et onusien poursuivent donc leur chemin dans l'analyse. 2.4.6. -if (-ive) Deux types de bases sont possiblement concaténables au suffixe -if : les bases verbales et les bases nominales. Suffixé à une base nominale, -if ajoute le signifié "qui relève de N" : instinctif sur instinct, excessif sur excès (Dubois & Dubois-Charlier 1999 : 146, Corbin 1987 : 544, Apothéloz 2002 : 77). Apothéloz (2002 : 85-86) note que ce suffixe "sélectionne des bases se terminant par les consonnes [t], [z], [s] et [d]", avec une grande majorité pour [t] (plus de deux cents adjectifs), et seulement deux adjectifs pour [d] (maladif et tardif), les finales [zif] (abusif) et [sif] (défensif) concernant chacune une vingtaine d'adjectifs. Cependant, les dérivés 19 Lunaison lui-même est issu du latin lunatio par resuffixation avec -aison. 463 Chapitre 6 – De la base de données au corpus de travail les plus fréquents avec ce suffixe ne se font pas sur ce type de radicaux mais à partir d'un terme en -ion. S'il est adjoint à une base en -ion, -if ne se concatène pas au suffixe mais s'y substitue : exclamative sur exclamation, conclusif sur conclusion (Dubois & Dubois-Charlier 1999 : 147, Apothéloz 2002 : 85). Pour Apothéloz (2002 : 86), il a fini par se forger un suffixe -atif par coalescence du fait du grand nombre de dérivés en -if sur des bases en -ation, "puisqu'il n'existe en principe pas de noms bourration, lucration, optation, palliation, performation". Sans prendre parti quant à l'existence ou non de ce morphème, je ne peux cependant exclure l'hypothèse de son existence dans l'analyse du terme en -if du corpus. Pour conclure ce panorama des dérivés en -if sur des bases nominales, précisons que si -if est à son tour suivi d'un morphème, il apparaît sous la forme -iv- : sportivité, excessivité. La base verbale est également possible selon Corbin (1987 : 65 ; 492), Apothéloz (2002 : 86) ou Dubois & Dubois-Charlier (1999 : 116), le suffixe y ajoutant le sens "qui V" : directif sur diriger, vomitif sur vomir, cumulatif sur cumuler. Cependant, pour nombre de ces dérivés il est difficile de déterminer si la base est verbale ou nominale (cf. Apothéloz 2002 : 87, Dubois & Dubois-Charlier : 139) : décisif est-il formé s