Pour une analyse multimodale des interactions orales: l`expression
Transcription
Pour une analyse multimodale des interactions orales: l`expression
Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 17 Pour une analyse multimodale des interactions orales: L’expression des émotions dans les débats politiques télévisuels Catherine Kerbrat-Orecchioni RESUMO Considerando que durante as interações os participantes utilizam recursos de diferentes naturezas (verbal, paraverbal, mimogestual), este artigo busca, a partir da observação de duas sequências televisivas, descrever as formas de interação adotadas pelas partes, estabelecendo relações entre os procedimentos adotados pelos participantes, seus propósitos e os efeitos (positivos ou negativos) por eles obtidos. Em se tratando de momentos conflituosos, carregados de tensão e de emoção, procura-se salientar a força que adquirem os diferentes sinais pertencentes ao plano do dizer e ao plano do mostrar no processo de construção de uma imagem de/para si. PALAVRAS-CHAVE: multimodalidade, sequência televisiva, ethos 1. Introduction 1.1. Le caractère multimodal du discours oral L a communication orale est multimodale : elle est d’une part multicanale (exploitant à la fois les canaux auditif, visuel et éventuellement tactile) et d’autre part plurisémiotique, c’est-à-dire que les énoncés 18 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 qui s’échangent à l’oral empruntent leurs unités à deux systèmes de signes hétérogènes: le système de la « langue », constitué d’unités verbales (lexicales et morpho-syntaxiques), auxquelles il faut adjoindre les unités paraverbales (prosodiques et vocales, qui tout en empruntant le canal auditif comme les unités verbales ont des caractéristiques propres); et le système des signes non verbaux (unités mimo-gestuelles qui empruntent le canal visuel et peuvent se réaliser de façon autonome). Par rapport à la communication écrite, la communication orale se caractérise donc d’abord par le fait qu’elle exploite deux « langages » de nature radicalement hétérogène — les signes verbaux sont auditifs et fondamentalement arbitraires, quand les signes non verbaux sont visuels et plus ou moins motivés (présentant un degré variable d’iconicité) — mais qui se trouvent fonctionner de façon syncrétique dès lors que ces deux systèmes sémiotiques sont mobilisés par des locuteurs engagés dans un échange communicatif particulier. 1.2. Le cas des débats télévisuels La question de la multimodalité est au cœur des recherches actuelles de notre équipe lyonnaise1, dont l’objectif est de décrire le fonctionnement des divers types d’interactions attestés dans notre univers quotidien (conversations familières, réunions de travail, échanges dans les commerces et les services, échanges en milieu scolaire ou dans divers contextes institutionnels…). L’approche multimodale nécessite de travailler à partir d’enregistrements non seulement audios mais vidéos, ce qui pose un certain nombre de problèmes techniques et méthodologiques que certains membres du laboratoire (comme Véronique Traverso ou Lorenza Mondada) s’emploient à affronter vaillamment. Pour ma part, j’ai opté pour la solution de facilité consistant à travailler sur des données immédiatement disponibles sous forme vidéo, à savoir les émissions télévisées, et plus précisément les débats à caractère politique. C’est ainsi qu’avec mon collègue Hugues de Chanay nous nous sommes intéressés à la façon dont certains débatteurs, et plus particulièrement Nicolas Sarkozy, mettent à profit le caractère multimodal de la communication télévi1 Laboratoire ICAR (Interactions, Corpus, Apprentissages, Représentations), CNRS-ENSUniversité Lyon 2. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 19 suelle pour construire d’eux-mêmes une certaine image (ou ethos) autant que possible positive, tout en construisant de leur adversaire une image négative (voir Constantin de Chanay & Kerbrat-Orecchioni, 2007)2. Plus récemment, notre réflexion s’est focalisée sur un aspect plus particulier de ces débats, qui mobilise lui aussi abondamment le matériel paraverbal et non verbal, à savoir l’expression et la gestion interactive des émotions ; cela à partir de l’analyse de certains épisodes de la campagne pour les dernières élections présidentielles qui se sont déroulées en France en 2007. 1.3. La composante émotionnelle dans les débats : la campagne présidentielle de 2007 Dans une campagne [électorale], la parole mobilise les passions. […] Aux torrents de signes répondent des vagues d’affects et d’émotions qui circulent parmi les électeurs, créant le climat passionnel des grandes campagnes, quand l’enjeu est considéré comme sérieux par chacun. (Bertrand et al. 2007 : 7-8)3 Toute communication politique mobilise non seulement des opinions mais aussi des « passions », ce qui s’exacerbe en contexte électoral et singulièrement lorsque l’enjeu est la fonction suprême, celle de Président de la République. Toute campagne présidentielle baigne dans un « climat passionnel », et cela de plus en plus du fait de la spectacularisation croissante de ces affrontements via le média télévisuel. Cela ne signifie évidemment pas que les candidats en campagne doivent eux-mêmes s’exhiber dans un état passionnel : on attend d’eux au contraire qu’ils fassent preuve de maîtrise et de pondération dans la gestion de leur campagne, et les débats sont censés se dérouler dans un climat relativement serein, les « modérateurs » de ces débats ayant pour 2 3 Kerbrat-Orecchioni, Catherine et Constantin de Chanay, Hugues (2007), « 100 minutes pour convaincre : l’éthos en action de Nicolas Sarkozy», dans Mathias BROTH et al., Le français parlé des médias. Stockholm : Acta Universitatis Stokholmiensis, p. 309-329. Bertrand, Denis, Dezé, Alexandre et Jean-Louis Missika (2007), Parler pour gagner. Sémiotique des discours de campagne présidentielle de 2007, Paris, Presses de la Fondation Nationale des Sciences Politiques. 20 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 mission d’y veiller. Mais durant cette longue séquence que constitue une campagne présidentielle il est bien rare que l’on n’ait pas droit à quelques épisodes « éruptifs », à des explosions soudaines d’affects (généralement la colère ou une émotion apparentée) qui vont faire « incident » et avoir des effets interactionnels d’autant plus forts qu’ils ne sont pas vraiment prévus par le script de ce type d’événement communicatif, même s’ils sont plus ou moins espérés par le public des téléspectateurs. Dans la mesure où ils font « saillance dans le flux codifié et routinier de la campagne » (Bertrand et al. 2007 : 9-10)4, ces épisodes vont s’inscrire dans les mémoires, de façon plus ou moins nette ou floue. C’est ainsi le cas de la séquence dite de la « saine colère » de Ségolène Royal face à Nicolas Sarkozy au cours du débat de l’entre-deux-tours des dernières présidentielles (France 2/TF1, 2 mai 2007), que nous comparerons avec un autre épisode moins mémorable mais néanmoins fort intéressant, survenu lors d’un entretien avec Philippe de Villiers, président du Mouvement pour la France, dans l’émission Le temps de choisir précédant le premier tour (LCP, 4 avril 2007). Ces deux corpus présentent à la fois des similitudes (le « coup de colère » qui frappe l’un(e), et l’un(e) seulement, des membres du groupe conversationnel) et des différences, qui tiennent d’abord au genre interactionnel (un débat avec modérateur d’un côté et un entretien de l’autre, où la personnalité interviewée se trouve sous le feu croisé de plusieurs journalistes et experts) mais aussi à d’autres facteurs que l’on tentera de mettre en évidence. L’analyse fera appel aux outils de l’analyse interactionnelle (avec une approche multimodale, particulièrement indispensable lorsque l’on s’intéresse à la composante émotionnelle) mais on s’appuiera aussi sur la réflexion développée depuis une dizaine d’années sur la place des émotions dans l’interaction. En ce qui concerne en particulier la colère, rappelons ces points soulignés entre autres par Plantin (1998, 2000)5 : (1) Selon Aristote, « on se met toujours en colère contre un individu déterminé ». 4 5 Idem. Plantin, Christian (1998), « Les raisons des émotions », dans Marina BONDI, Forms of Argumentative Discourse, Bologne, CLUEB, p. 3-50. Plantin, Christian (2000), « Se mettre en colère en justifiant sa colère », dans C. Plantin, M. Doury et V. Traverso, Les émotions dans l’interaction, Lyon, PUL (article sur cédérom). Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 21 En l’occurrence, dans le premier corpus Royal se fâche contre son codébatteur Nicolas Sarkozy alors que dans le second Philippe de Villers se fâche contre l’animatrice-présentatrice, Émilie Aubry. (2) Le déroulement prototypique d’un épisode émotionnel (« parcours passionnel » pour les sémioticiens précédemment cités) a la configuration suivante : déclenchement, puis montée de la colère, apogée et enfin retour au calme. (3) En contexte interactionnel les émotions sont co-construites et négociées tout au long du déroulement de l’échange. Elles sont aussi « argumentables » (Plantin 1998 parlant à ce sujet de « raisons des émotions » ; voir aussi Micheli 2008 et 2009)6. (4) Il convient de distinguer deux modes d’affichage de l’émotion — et c’est sur cette base que va se structurer l’analyse : le mode du dire (l’émotion est assertée, nommée, dénotée) et celui du montrer (l’émotion est simplement connotée, c’est-à-dire manifestée de façon plus ou moins claire ou discrète par un certain nombre d’indices). L’opposition « dire » vs « montrer » ne recoupe pas exactement l’opposition « langage verbal » vs « non verbal », car si l’on ne peut « dire » que par des moyens verbaux, le verbal peut également intervenir au niveau du « montrer ». Il n’en reste pas moins qu’à ce deuxième niveau le rôle principal revient, comme on le verra, aux unités paraverbales et non verbales. 2. L’émotion dite 2.1. La séquence de la « saine colère » dans le débat « Sarkolène » L’épisode survient aux deux tiers environ du long débat (2h40) entre Ségolène Royal et Nicolas Sarkozy (dorénavant débat « Sarkolène ») au sein duquel il constitue une sorte de pièce détachée par son thème (cette séquence est entièrement focalisée sur l’état émotionnel de Ségolène Royal) mais aussi par la présence en son début et en sa fin d’énoncés à fonction clairement 6 Micheli, Raphaël (2008), « La construction argumentative des émotions dans les débats parlementaires français sur l’abolition de la peine de mort », Thèse de doctorat, Lausanne, Université de Lausanne. Micheli, Raphaël (2009), « Un processus argumentatif en contexte : la construction de la honte et de la fierté dans le genre du débat parlementaire », Studies in Communication Sciences vol. 9, n° 2, p. 31-42. 22 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 démarcative. Pour ce qui concerne l’ouverture : alors qu’est censée s’achever la séquence sur la politique économique et sociale, Sarkozy vient de vanter le dispositif du « droit opposable », et pour contrer les sarcasmes de Royal il prend l’exemple (un « exemple qui va peut-être vous toucher », annonce-t-il — il ne croit pas si bien dire…) des enfants handicapés qui se voient refuser l’accès dans les écoles, dont il conclut (et l’intonation comme la mimique viennent souligner la valeur conclusive de cette sorte de péroraison) que c’est ce genre de mesure « qui fait la différence entre la vieille politique et la politique moderne ». Les animateurs (Poivre d’Arvor et Arlette Chabot) félicitent alors les débatteurs d’avoir « réussi la prouesse de… », mais on ne saura jamais exactement de quoi car Royal les interrompt avec un solennel « attendez j’ai quelque chose à dire » qui sonne comme un coup de théâtre. Ce qu’elle a à dire, c’est qu’elle est « scandalisée » par l’« immoralité politique » dont fait preuve Sarkozy en tenant un discours « larmoyant » sur les handicapés alors que c’est justement lui qui a « cassé le plan handiscole » qu’elle avait elle-même mis en place lorsqu’elle était ministre de l’enseignement scolaire. Elle l’accuse donc d’un « écart entre le discours et les actes » et conclut son réquisitoire en se déclarant « très en colère » (auto-attribution explicite d’un état émotionnel assumé et même revendiqué). Après l’avoir laissé parler pendant plus de deux minutes, Sarkozy l’interrompt pour lui demander de se calmer, ce à quoi SR rétorque qu’elle ne se calmera pas (« non je ne me calmerai pas » répété quatre fois : elle persiste et signe) car il y a des colères qui sont saines « parce qu’elles correspondent à la souffrance des gens » :7 SR […] je suis très en colère\ (.) et les parents et les familles qui vous [ent- et ]& NS SR [calmez-vous] &les parents [non je ne me calmerai pas] NS [calmez-vous et ne m’montrez] pas du doigt a[vec ce: c-]& SR [non (.) si] NS SR 7 &-et inde[x pointé]& [non: ] Sauf indication particulière, nos transcriptions sont faites conformément aux conventions ICOR, voir http://icar.univ-lyon2.fr/projets/corinte/bandeau_droit/convention_icor.htm. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 NS 23 &parce que franchement& (0.2) NS SR &[et je je voudrais vous di- je vou-] [non je n’me calmerai pa:s (.) non:] je n’me calmerai pa:s (.) NS ben [pour SR ]&& &[je n’me] calmer[ai pa:s NS ] &&[pour être] président d’[la république i faut êt’ calme] SR [parce que: l’exploit] non: (0.3) pas quand il y a des injustices\ (.) il y a des colères qui sont parfaitement sai:nes NS bon SR parce qu’elles correspondent [à la souffrance des gens\ (.) il y a des colères que j’aurai même ]& NS [madame Royal (.) est-ce que vous me permettez de vous dire un mot] SR &quand je serai présidente de la république\ [(.) parce que je (.) parce que je& [eh ben ça sera gai NS (.) ça sera gai […] NS SR je je je ne (.) je ne sais pas pourquoi euh madame Royal euh d’habitude calme a perdu [ses nerfs (.) parce que (.) parce que j’ai [non je ne perds pas mes nerfs je suis en colère (.) ce n’est pas pareil pas de mépris monsieur Sarkozy (.) pas de mépris Ce passage est particulièrement fascinant d’un point de vue interactionnel car on y assiste en direct à la construction conflictuelle de deux microsystèmes lexicaux partiellement divergents : SR opère au sein de la notion de « colère » une dissociation entre la colère « saine » et les autres formes de colère (dont il ne sera pas question), mettant en place la notion de « saine colère » qu’elle définit (les saines colères sont celles qui procèdent d’un sentiment de révolte devant le spectacle de la souffrance), qui est pour elle chargée d’une valeur axiologique positive, et qui s’oppose en tout point à la notion d’énervement : « non je ne perds pas mes nerfs je suis en colère (.) ce n’est pas pareil pas de mépris monsieur Sarkozy » — le mépris consistant en l’occurrence dans le fait de ravaler une émotion noble et réfléchie au rang d’un vulgaire coup de sang incontrôlé. C’est en effet ce à quoi s’emploie de 24 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 son côté Sarkozy tout au long de la séquence : il assimile colère et énervement, utilisant successivement comme de simples variantes les expressions « perdre ses nerfs », « s’énerver », « sortir de ses gonds », « se mettre en colère » et « perdre son sang-froid » : toutes ces expressions sont pour lui synonymes et également chargées dans ce contexte d’une connotation négative. Cette négociation sur le sens des mots est corrélative d’une négociation sur le référent auquel ils s’appliquent, à savoir l’état émotionnel de SR : faut-il le catégoriser comme un état de colère ainsi que le revendique SR elle-même, ou comme un état d’énervement ainsi que le prétend Sarkozy, pour qui les deux états reviennent au même, et sont de toute façon contraires à l’éthos d’un bon président de la République ? Car tel est finalement l’enjeu de ce débat : la « présidentiabilité » de SR ; point crucial qui lui aussi donne lieu à un désaccord entre les deux protagonistes, NS répétant que « pour être président de la République il faut être calme [or vous ne l’êtes pas, donc…] » alors que SR proclame de son côté qu’un bon président doit être capable de temps en temps de piquer des colères, saines bien sûr (« il y a des colères que j’aurai même quand je serai présidente de la République »). Cet enjeu est lourdement souligné par Sarkozy, vers le milieu de la séquence, en ces termes : NS au moins ça a eu une utilité madame (.) c’est que vous vous mettez bien facilement en colère (.) vous sortez de vos gonds avec beaucoup de facilité madame (.) président de la république (.) c’est quelqu’un qui a des responsabilités lourdes (.) très lourdes — autrement dit : cet épisode apparemment vain a au moins permis de vous démasquer comme colérique (vous avez été prise en flagrant délit de « non-calmitude »), donc de vous disqualifier dans votre prétention à la fonction suprême. Ce que SR ne peut évidemment pas laisser passer : l’importance de l’enjeu explique l’exceptionnelle durée de la séquence (qui s’étale sur plus de huit minutes alors que la modératrice a accordé à Royal « un mot puis on enchaîne »). La négociation piétine et s’éternise, offrant diverses variations sur le thème : « Ne vous énervez pas — Je ne suis pas énervée je suis en colère ». Les animateurs tentent par trois fois, mais sans grand succès, de fermer cette parenthèse et de lancer le thème de l’Europe. Au moment même où il semble qu’ils y soient enfin parvenus, Sarkozy revient machiavéliquement à la charge : Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 NS 25 non: (.) pis je (.) et je vais même vous dire quelque chose [...] je vous en veux pas parce que ça peut arriver à tout le monde de s’énerver\ et c’est reparti pour un dernier petit tour, car SR ne peut une fois encore que protester « je ne m’énerve pas je me révolte car j’ai gardé ma capacité de révolte intacte », mais ce définitif « mot de la fin » se trouve noyé dans un brouhaha général. En un tournemain, elle change alors à la fois de ton, de thème et de posture pour se lancer, après une sorte de petit rire qui marque ce radical changement de footing, dans un discours sur l’Europe car n’est-ce pas, l’Europe « c’est important » : SR PPDA NS AC SR AC PPDA SR PPDA AC SR AC SR non [je je ne m’énerve je ne m’énerve pas je me révolte\ ]& [alors comment vous allez faire l’un et l’autre pour relancer] [la machine] (.) [européenne (.) [[s’il]] vous plaît ]] [alors sur l’Europe] [[s’il]] &[car j’ai gardé (.) ma capacité]] (.) de révolte (.) inta[[:cte\ ] [[madame ] Royal (.) l’Europe ]] [[pardonnez]-nous de ne poser que des ques]]tions mais (.) l’Europe c’est [vraiment] [XXXX ] important [voilà ] [l’Europe] c’est important (.) [comment relance-t-on la machine eu-] [(rires) c’est très important ] &-ropéenne euh [la France&& [hm hm L’émotion de Ségolène Royal est donc « dite » (qualifiée, dénommée, catégorisée…) différemment par le sujet affecté et par son interlocuteur, qui ne se réfèrent ni au même système lexical ni à la même analyse du référent, et vont donc « négocier » les termes qu’ils utilisent sans jamais parvenir à un accord. Les « négociations sur les signes » sont fréquentes dans les interactions8, venant investir de préférence les zones de flou des systèmes lexicaux. De par sa remarquable plasticité le vocabulaire émotionnel se prête particulièrement bien à de 8 Voir KERBRAT-ORECCHIONI, Catherine (2005), Le discours en interaction, Paris, A. Colin, p. : 131-136. 26 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 telles négociations, chaque locuteur pouvant reconfigurer à sa manière le microsystème mobilisé (« colère », énervement », « indignation », etc.) en fonction de ses intérêts stratégiques du moment, comme on le voit dans cet autre extrait de la campagne présidentielle de Sarkozy, tel que nous le rapporte Yasmina Reza : Une femme demande [à Sarkozy] : — Pourquoi vous vous emportez comme ça à chaque fois qu’on vous pose une question ? — La vie politique française souffre d’un déficit de sincérité Brigitte… — On peut être calme et sincère. — Il faut garder une capacité d’indignation Brigitte. — On peut s’indigner sans s’énerver. Il répond en s’adoucissant, remettant un ou deux Brigitte complètement inopérants car Brigitte le hait. (L’aube, le soir ou la nuit, Paris, Gallimard, 2007, 141-2) De façon assez cocasse, Sarkozy assume ici une « schématisation » qu’il combattra quelque temps plus tard face à Ségolène Royal… C’est à dessein que nous reprenons ici ce terme proposé naguère par Grize (1974)9 car il souligne que les choix lexicaux peuvent avoir en eux-mêmes une fonction argumentative, comme c’est le cas dans cette manipulation divergente du vocabulaire émotionnel à laquelle se livrent les deux protagonistes de notre débat. Nous ajouterons à la suite de Micheli (2009 : 35)10 que le recours à des qualifications émotionnelles engage deux types au moins de processus argumentatifs : D’une part, le fait que SR se dise « en colère » / soit accusée par NS d’être « énervée » va être utilisé des deux côtés comme argument pour deux conclusions opposées, et qui correspondent au « macro-but » de l’ensemble du discours tenu par les deux candidats : « je peux faire un bon Président » vs « vous ne pouvez pas faire un bon Président » — la qualification émotionnelle est mise au service d’un objectif argumentatif externe. Mais d’autre part, le problème se pose en amont de savoir comment sont 9 10 GRIZE, Jean-Blaise (1974), « Argumentation, schématisation et logique naturelle », Revue européenne des sciences sociales, t. XII, n° 32, p. 183-200. Op. cit. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 27 argumentées ces qualifications elles-mêmes, en ce qui concerne la nature, la source, et la légitimité de l’émotion correspondante. On constate par exemple que dans notre séquence : – NS utilise le fait que SR a utilisé le mot « immoral », qui est un mot « fort », comme preuve du fait qu’elle a perdu ses nerfs (« il faut savoir garder son calme et ses nerfs et utiliser des mots qui ne sont pas des mots qui blessent ») : voir infra (3.1.1.) – SR fait de son côté appel à deux types d’arguments pour étayer sa « colère », à savoir d’abord l’argument par la « source » de l’émotion : le fait que NS fasse preuve d’immoralité politique en tenant un discours en contradiction flagrante avec ses actes est présenté comme la cause et la justification de cette colère (car face à un tel scandale on ne peut être que « en colère » et non simplement « énervé »), comme ce qui la déclenche et la légitime à la fois. Elle convoque d’autre part un argument d’une tout autre nature, celui du « tempérament » : « je ne suis jamais énervée j’ai beaucoup de sang-froid » (cette émotion « chaude » qu’est l’énervement est incompatible avec le tempérament « froid » que j’ai reçu en partage), argument que Sarkozy balaye d’un ironique : « ben écoutez vous venez de le perdre alors c’est pas de chance ». Si les émotions sont donc argumentables, elles ne sont évidemment pas démontrables. Ségolène Royal est-elle plutôt « énervée » ou plutôt « en colère » ? Au niveau de ce qu’elle « dit », tout au plus peut-on rappeler que la séquence émotionnelle est soigneusement encadrée, et remarquer que si la tirade accusatrice qui l’ouvre se caractérise par une incontestable violence verbale (« scandaleux », « le summum de l’immoralité politique », « je suis très en colère »), cette violence a ensuite plutôt tendance à décroître avec la disparition des superlatifs. Mais au-delà de ce que dit Ségolène Royal, il y a ce qu’elle « montre ». Allons auparavant faire un tour du côté de Philippe de Villiers. 2.2. Corpus PhdeV La négociation sur les signes ne porte pas, comme dans le cas précédent, sur la nature de l’état émotionnel du sujet affecté mais sur la « définition » de celui-ci dans la séquence de présentation, qui va déclencher la fureur de l’intéressé. C’est en effet un ensemble de traits définitoires, notamment certaines propriétés attribuées à son parti (de droite, catholique, intégriste, conser- 28 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 vateur, bourgeois) d’abord, puis l’énonciation de son titre de noblesse, qui déclenchent la colère de PhdeV. Sur une durée globale d’une heure de l’émission Le temps de choisir, la séquence de la colère de PhdeV survient au cours de la 27e minute — après deux mini-reportages et les questions de trois journalistes — au sein de la rubrique « Itinéraire » (censée brosser le portrait de l’invité), entre la mention, de la part de l’animatrice Emilie Aubry, des « lettres de noblesse » de l’interviewé et le début des commentaires sur les photos. La séquence, d’une durée de trois minutes environ, constitue le moment culminant de la colère (déjà annoncée par quelques remarques sarcastiques de PhdeV sur la nature de l’émission, comme « ah bon est-ce que vous avez fini d’tailler l’short là/ » et suivie de quelques résurgences colériques éparses sur le caractère insultant de celle-ci) peut être analysée en quatre moments : une première phase agonale riche en interruptions et chevauchements, un bref monologue où PhdeV exprime son indignation, une deuxième phase agonale et une phase de « bouderie laconique ». Voici comment s’enclenche l’incident : EA alors Philippe de Villiers peut-être avant de regarder avec vous euh ces photos qu’on a choisies je rappelle que si l’on respecte vos lettres de noblesse on doit vous appeler vicomte Philippe Le Joli [de Villiers de Saint]& PhdV [non: non écoutez: ] EA &ignon je l’ai mal prononcé/ PhdV non: attendez là: là ç’que vous faites euh c’est in:- insultant […] vous n’avez pas le droit\ de me qualifier à à partir de caractéristiques [périphériques qui n’ont strictement rien à voir PhdeV s’emploie d’abord à dénoncer le comportement de l’animatrice, en l’occurrence la façon dont elle catégorise l’interviewé dans cette présentation, en qualifiant ce comportement d’« insultant », puis en parlant de « caractéristiques périphériques » qui deviennent ensuite des « quolibets extérieurs ». Cette condamnation aboutit à la qualification de son état émotionnel en termes de « blessure » par la victime de ces attaques supposées11 : 11 Il n’est en effet pas du tout évident que l’animatrice ait été malintentionnée dans cette présentation ni que sa réaction « je l’ai mal prononcé » soit de mauvaise foi. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 PhdeV 29 & vous n’avez pas le droit\ de me faire porter un signe distinctif\ je suis citoyen français\ et je vais vous dire pourquoi\ je suis blessé par ce que vous venez de faire\ Si le comportement d’EA provoque une « blessure » explicitement affirmée, cela implique la présence (implicite au niveau du dire, mais évidente au niveau du montrer) d’une colère qui, découlant d’une injustice (amplifiée par le parallèle avec l’« étoile jaune »), est, comme pour SR, une « saine » colère : PhdeV &et et vous vous feriez le le musulman Untel/ le juif Untel/ et caetera/ s vous trouvez/ (.) i faut que j’porte une étoile jaune/ (.) qu’est-ce que ça veut dire ça vicomte (.) Ce « signe distinctif », cette « étoile jaune » est une sorte de stigmate qui relève d’un abus (« vous n’avez pas le droit ») dénoncé a plusieurs reprises : l’attribution d’une marque identitaire aristocratique et élitaire éloigne en effet PhdeV de l’éthos citoyen qu’il revendique au cours de la campagne électorale pour la présidentielle et qu’il va renforcer à plusieurs reprises par l’affirmation de l’appartenance de sa famille à une tradition républicaine et résistante. 3. L’émotion montrée Deuxième temps de l’analyse de ces mêmes épisodes : ce que les participants disent doit être confronté à ce qu’ils montrent, c’est-à-dire à ce qui s’affiche dans des indices matériellement incorporés au discours, et qui peuvent être lus comme des symptômes. Ces symptômes corroborent les signes dits, lorsque ce qu’ils véhiculent est convergent, ou les démentent, lorsqu’il y a divergence : à ce titre ils peuvent servir aux co-participants, lorsqu’ils les relèvent avec plus ou moins de rigueur et de bonne foi, comme arguments pour justifier ce qu’ils disent (le montré a en effet tendance à l’emporter sur le dit) ; et ils sont précieux pour l’analyste, dont l’ultime tâche est peut-être de proposer un diagnostic. Les symptômes émotionnels associés à la parole sont présents dans le matériel linguistique lui-même, dans le co-verbal associé (paraverbal et non verbal : supports voco-prosodiques et mimo-gestuels de la manifestation des émotions), et enfin dans le comportement interactif, tout particulièrement dans les perturbations affectant le système d’alternance des tours de parole. Envisageons successivement ces trois entrées. 30 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 3.1. L’émotion montrée par le matériel linguistique 3.1.1. Corpus Sarkolène À s’en tenir aux indices linguistiques, ni NS ni SR ne parlent sous le coup de l’émotion : pas de bafouillages (même chez SR avec le passage à un régime vocal plus soutenu et plus « heurté »), pas d’hésitations, pas d’accélération : rien ne singularise la séquence par rapport au reste du débat, ni ne signale chez l’un ou chez l’autre de perte de contrôle. Les altérations du discours sont pour la plupart dues à la lutte pour la parole (que nous envisagerons en 3.3), les chevauchements pouvant entraîner chez les deux débatteurs des reprises en cours de tour, ou des départs reportés lors d’une tentative de prise de tour : SR je sais les efforts qu’ont faits les familles et qu’ont faits les écoles (.) pour accueillir ces enfants qui aujourd’hui (.) [ne les ne l- l- ne le sont plus ]& PPDA [on va laisser: [[(.) répondre Nicolas Sarkozy]] AC SR NS [[Nicolas Sarkozy répondre ]] &[[[et sur ce point-là je ne laisserai pas]]]& [[[je je je ne (.) ch::::: (.) je ]]] SR &l’immoralité du discours politique [reprendre le dessus] NS [je je je ne (.) je ] ne sais pas pourquoi euh madame Royal euh d’habitude calme a perdu ses nerfs L’extrait illustre aussi le « calme syntaxique » de SR : à proximité immédiate de l’accusation qui lui est portée, elle déploie des constructions plutôt complexes (relatives en cascades, inversion des sujets, anaphores) dans lesquelles elle ne s’empêtre pas. Quant aux répétitions, elles ont des raisons rhétoriques et pragmatiques, comme en témoignent le réquisitoire initial de SR : SR non monsieur Sarkozy tout n’est pas possible (.) dans la vie politique (.) tout n’est pas possible ou les « calmez-vous — je ne me calmerai pas » réitérés évoqués plus haut. De part et d’autre c’est bien plutôt un contrôle qui est affiché qu’un débordement émotionnel. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 31 NS pourtant tire argument d’un fait qu’il érige en indice d’énervement, explicitant ce qu’il tient pour de l’émotion montrée, à savoir l’emploi par SR de mots excessivement « forts », comme « immoral », « mensonge », ou « larme à l’œil » : NS [je ne vois pas pourquoi: (.) madame Royal (.) ose (.) employer le mot (.) immoral (.) c’est un mot fo[:rt (.)& SR NS [oui: (.) c’est &madame Royal se permet d’employer ce mot (.) parce que j’ai dit (.) que je souhaitais que tous les enfants (.) ayant un handicap soient scolarisés en milieu scolaire (.) entre guillemets normal (.) madame Royal a qualifié mon propos de larme à l’œil (.) sous-entendant par là (.) que la sincérité n’était que de son côté et que de mon côté il ne devait y avoir que du mensonge c’est même le terme qu’elle a employé (.) c’est pas/ une façon d’respecter son: concurrent (.) ou un autre candidat Qu’il faille ou non voir là des excès de langage, leur mention relève assurément de la part de NS d’une tentative pour rassembler, malgré une relative pénurie de symptômes, des preuves qui attestent ce qu’il prétend par ailleurs : que SR a bel et bien perdu ses nerfs. 3.1.2. Corpus PhdeV Bien plus nombreuses sont les altérations de la parole dans le corpus PhdeV, chez qui la colère entraîne au contraire une perte de contrôle qui se manifeste à travers de nombreux indices verbaux — bafouillages, lapsus, mauvaise compréhension des questions posées, extrême brièveté des réponses — ainsi que co-verbaux : regard fuyant, mouvements nerveux, etc. La colère se montre dans le matériau linguistique par l’accumulation des négations, des conjonctions adversatives et des interrupteurs (« non », « mais », « attendez »), par la violence verbale (« c’est une émission règlement de comptes », « c’est un parlement soviétique »), par l’abaissement du niveau de langue (« c’est quoi ») ainsi que par un manque de contrôle de l’accent parisien. Nous verrons plus loin que certaines altérations caractérisent également la phase de bouderie et d’abattement consécutive à l’explosion de la colère. 32 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 3.2. L’émotion montrée par le paraverbal et non verbal 3.2.1. Corpus Sarkolène Commençons par quelques remarques voco-prosodiques. On peut observer chez SR au début de cette séquence un léger changement de régime. Une petite augmentation du volume sonore (sans changement de fréquence), des attaques consonantiques plus tranchées, des fins d’émission plus abruptes, le tout rythmé par une gestuelle de scansion jusque-là beaucoup plus sporadique, composent une évolution vers l’ « indignation » : émotion puissante, mais rationnelle. Ce changement n’est pas radical : tout au long du débat, SR a manifesté une attitude à la fois offensive et contrôlée qui n’est pas abolie par le nouveau ton. NS quant à lui opère un changement de régime inverse et beaucoup plus net, qui mérite qu’on s’y arrête. Selon de nombreux commentateurs, la voix de Sarkozy aurait connu fin 2006 une transformation brutale, avec pour effet (voulu) de donner un « style calme » à un candidat qui avait la réputation d’être trop nerveux. L’émission Arrêt sur images (France 5, 11/02/07) a par exemple commandé une étude à Philippe Martin, du laboratoire LISA (Laboratoire d’Informatique et des Systèmes Avancés), lequel en comparant des extraits de septembre 2006 et janvier 2007 observe une spectaculaire baisse de la fréquence vocale : aux pics « élevés » (170180 Hz) couramment relevés en 2006 s’opposeraient des plafonds « bas » (110115 Hz) à partir de janvier 2007. Même évolution en ce qui concerne les sauts de fréquence, bien plus marqués avant le « changement » qu’après. Notre corpus ne confirme absolument pas cette évolution ; en revanche, il laisse supposer que NS dispose désormais de deux « styles vocaux » dans sa palette, dont il use avec discernement. Juste avant la scène de la colère, lors de l’événement déclencheur de la défense (assez fervente) du « droit opposable », NS évolue entre 75 Hz à 250 Hz, ce qui est bien au-dessus des mesures du LISA, avec des sauts de fréquence récurrents et rapprochés : NS […] la preuve (218 Hz) de ma bonne foi (75 Hz)(.) et la certitude (250 Hz) de la réalisation (90 Hz) de cette promesse (160 Hz) (.) ça sera le (82 Hz) droit opposable (245 Hz) (.) et (92 Hz) la capacité (230 Hz) (.) d’aller devant un (85 Hz) tribunal (216 Hz) pour faire valoir (100 Hz) ses droits (105 Hz) (.) vous voyez (180 Hz) madame (90 Hz) (.) c’est ni ridicule (190 Hz) (.) ni accessoire (75 Hz) (.) Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 33 Pendant la saine colère au contraire, on observe de longues zones « plates » autour de 90 Hz : NS je ne sais pas pourquoi euh madame Royal euh d’habitude calme a perdu (90 Hz à peu près stable) [ses nerfs::: (85 Hz -> 190 Hz -> chute finale à 175 Hz pendant la fin de l’allongement)` Cela produit un contraste ostensible entre les deux débatteurs, susceptible d’être sémantiquement porteur des valeurs /calme/ (du côté de NS) vs /noncalme/ (du côté de SR), cette dernière valeur ne surgissant vraiment qu’à la faveur de la très forte baisse de régime par laquelle NS se dissocie de sa rivale. Assez comparable est la manœuvre consistant à relever chez SR des symptômes gestuels de perte de contrôle et notamment l’index pointé (ce qui est cocasse si l’on songe qu’il s’agit d’un geste habituellement plutôt sarkozien). Lors de sa phase de réquisitoire, SR fait une série de gestes de l’index qui naviguent entre deux formes, le battement (« Ü » : index alternativement levé puis abaissé — c’est la « leçon ») et le pointage sagittal (« A » : désignation accusatrice de l’interlocuteur) : SR […] vous étiez Aau gouvernement (.) laissez/ (285Hz) cela de côté (.) parce que la façon: Ü (309Hz) (.) là A (.) dont vous venez faire de l’immoralité A (277Hz) politique par rapport à une politique (287Hz) qui a été détruite AÜÜ (.) et à laquelle je tenais particulièrement AÜ (286 Hz) (.) parce que je sais (299 Hz) à quel point cela soulageait AÜÜ […] Or de ces deux valeurs, NS sélectionne la plus violente — l’accusatrice : « et ne me montrez pas du doigt avec cet index pointé parce que franchement… », et il en tire les mêmes leçons que de l’emploi du mot immoral : SR a dépassé les bornes. Lui s’est au contraire durant tout le débat abstenu de ses deux gestes favoris (l’index pointé et l’abattement des poings, potentiellement trop brutaux dans ce contexte de confrontation à une adversaire féminine) : tout se passe comme si, par ce double moyen, il essayait de faire coller son interlocutrice au profil mimo-gestuel d’une énervée typique, dont lui se tient au contraire très à distance. 3.2.2. Corpus PhdeV Dans le corpus PhdeV, les indices paraverbaux de la colère se ramènent 34 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 essentiellement à une augmentation du volume et à un haussement du ton de la voix. Face à EA, dont la voix se maintient sur une ampleur de fréquence assez importante mais stable, l’interviewé passe d’une fréquence de base comprise entre 98 et 110 Hz à des pics qui atteignent les 500 Hz et se présentent de plus en plus souvent, surtout après la mention des « caractéristiques périphériques ». Le graphique de la fréquence signale à un certain moment que la voix de PhdeV s’aligne sur les mêmes fréquences que celles d’EA, alors que, dans des conditions non marquées, la différence est nette. À la fin de la séquence, PhdeV revient vers les fréquences basses qui le caractérisent habituellement. De leur côté, les indices mimogestuels ne sont évidemment descriptibles que dans la mesure où ils sont visibles à l’écran. Or, au cours de cette émission, la caméra cadre souvent la journaliste alors que c’est PhdeV qui parle (ou qu’il y a chevauchement de parole, ce qui est fréquent dans cette séquence). Cela veut dire que de nombreux gestes et mimiques faciales nous ont probablement échappé. Quoi qu’il en soit, il est quand même visible que la gestuelle de PhdeV s’accélère dans cette séquence : le pointage sagittal est utilisé comme un acte d’accusation contre la modératrice, la pince ongulaire et le battement ponctuent l’évidence des propos, la rotation de l’index accompagne un mouvement de remontée du temps (évocation des figures patriotiques de la famille), le buste se penche en avant. Tous ces indices de malaise, voire d’agressivité s’accompagnent de changements fréquents de posture ainsi que d’un regard généralement très mobile. 3.3. L’émotion montrée par les perturbations du système des tours Les épisodes de dérapage émotionnel peuvent enfin avoir des répercussions sur l’interaction elle-même. Lorsqu’ils sont conflictuels, comme dans nos deux corpus, on peut les repérer dans le lieu par excellence de la lutte pour la parole : l’alternance des tours. Celle-ci tend à ne plus se faire dans une coopération harmonieuse, mais dans une sorte de bras de fer qui passe à la fois par des interruptions (prises de tour plus ou moins « illicites ») et des refus de céder le tour (conservations plus ou moins illicites). Pour en rendre compte nous avons été conduits naguère (Kerbrat- Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 35 Orecchioni & Constantin de Chanay 2007)12 à proposer la notion de « segment de tour interrompu » (STI), pour décrire le fait que les tours de parole peuvent se poursuivre (parfois assez longtemps) par delà les ruptures que créent des interventions destinées à ravir la parole, et sans forcément réagir à ces ruptures. Fondé sur la séquentialité des interventions, ce critère de l’absence de réaction est le critère décisif qui permet d’opposer les tours maintenus (et donc les stratégies de résistance à l’interruption) aux changements de tour. En conséquence, le nombre des STI produits par un participant est révélateur à la fois de sa ténacité (conservation du tour malgré les obstacles qui lui sont opposés) et de sa faible interactivité à ce moment-là (il reste « sur sa lancée », en une sorte de monologue sourd aux autres interventions), cette faible interactivité pouvant être la conséquence de l’emprise émotionnelle. Observons ce qui se passe dans nos deux corpus. 3.3.1. Corpus Sarkolène Le maniement de la notion de STI est assez délicat (décider qu’un tour continue ou non dépend d’un faisceau de critères hétérogènes) et ses résultats sont inéluctablement grossiers (on binarise ce qui est en fait un continuum). Malgré cela on peut grâce à elle repérer des tendances interactionnelles contrastées très significatives. Observons de près le début de l’extrait cité plus haut, en y marquant les STI : 1aSR je suis très en colère (.h 0.4) et les parents et les familles qui [vous ent- et] 2aNS [calmez-vou:s] 1bSR : les parents ≠3[non je ne me calmerai pas 2bNS a[vec ce] 4SR 2cNS 5SR 2dNS ] [calmez-vou:s et ne m’montrez] pas du doigt [non: [: (0.3) c-] ] ≠5[(0.2) si: ] -et inde[x pointé] [non: ] parce que franchement (0.2) 12 Kerbrat-Orecchioni, Catherine et Constantin de Chanay, Hugues (2007), « 100 minutes pour convaincre : l’éthos en action de Nicolas Sarkozy », dans Mathias BROTH et al., Le français parlé des médias. Stockholm : Acta Universitatis Stokholmiensis, p. 309-329. 36 Rocha, Décio; Deusdará, Bruno Contribuições da Análise Institucional para uma abordagem das práticas linguageiras: a noção de implicação na pesquisa de campo 2eNS [et je je voudrais vous di- je vou-] 6aSR [non je n’me calmerai pa:s (.) non:] je n’me calmerai pa:s (.) 7aNS 6bSR ben [pour ] [je n’me] calmer[ai pa:s 7bNS êt’ calme 6cSR ] [pour être] président d’[la république i faut ] [parce que: l’exploit-] ≠8non: (0.3) pas quand il y a des injustices Les esperluettes (&) signalent la continuité du tour : elles joignent ainsi deux segments qui sont ipso facto considérés comme des STI, c’est-à-dire deux fragments du même tour. L’identité du tour est signalée dans la numérotation par la conservation du chiffre, et le changement de STI par une lettre de l’alphabet, qui renseigne du même coup sur le nombre de STI composant un tour. Le changement de tour est quant à lui signalé par un changement de chiffre, ainsi que par le signe « ≠ » lorsque ce changement se produit au cours d’une même prise de parole. La considération de ce simple extrait permet de constater que la corrélation n’est pas immédiate entre le (non-)calme prétendu et le nombre des STI : c’est ici SR qui est la plus réactive (6 tours sur les 8 de l’extrait, pour 5 STI), et NS, sinon le moins « à l’écoute », du moins le plus rivé à sa propre parole (2 tours seulement, qui s’étendent sur 7 STI). L’effet produit est très ambivalent : difficile de trancher si c’est SR qui, à interrompre NS à plusieurs reprises, ne le laisse pas parler, ou si c’est plutôt lui qui, à ne pas lui répondre, monopolise la parole — ce sont assurément deux aspects du même comportement, dans un équilibre variable selon que les interruptions sont produites au voisinage de « points pertinents pour la transition » projetables (places auxquelles on peut anticiper une fin de tour pour prendre la parole), ou non. Néanmoins, le nombre des STI produits par chaque interlocuteur, en évolution constante, dans ce corpus, semble y correspondre à des phases interactives distinctes. À gros traits : - phase 1 : tirade de SR (le « réquisitoire ») : un seul tour, aucun STI (NS l’écoute patiemment) ; - phase 2 : après une courte transition plus offensive, l’échange devient plus dialogal avec la majorité des STI attribuables à SR (attitude défensive de NS) ; - phase 3 : la proportion s’inverse (NS passe à l’attaque — c’est au début Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 47-73, 2010 37 de cette phase qu’est portée l’accusation sur le mot « immoral ») ; - phase 4 : équilibre entre les STI (désaccord sur la nature de l’émotion qu’a montrée SR). Cette variation des STI tend à refléter des stratégies d’argumentation en interaction que l’on peut imaginer maîtrisées plutôt que des débordements imputables à l’émotion ; le grand nombre de STI n’est par ailleurs l’apanage d’aucun des deux débatteurs, ni dans cette scène ni tout au long du débat. Mais cela ne veut pas dire que NS ne cherche pas à faire passer ceux de SR pour des symptômes d’énervement — comme si, ne voulant pas lui laisser prendre la parole, SR manifestait qu’elle ne voulait pas entendre raison : SR il y a des colères qui sont parfaitement saines& NS bon SR &parce qu’elles correspondent [à la souffrance des gens\ (.) il y a des colères que j’aurai même ]& NS [madame Royal (.) est-ce que me permettez de vous dire un mot] SR &quand je serai présidente de la république 3.3.2. Corpus PhdeV Du côté de PhdeV, après deux phases très agonales avec un grand nombre de STI encadrant un monologue éruptif au cours duquel l’homme politique exprime sa colère, celui-ci s’enferme dans une sorte de « bouderie » laconique en dépit des sollicitations de la journaliste. Voici un exemple d’échange dont le découpage en STI fait apparaître l’existence de deux discours parallèles qui n’interagissent que partiellement et où le chevauchement est presque complet : PhdeV non non attendez (.)] non ‘tendez là là ç’que vous faites euh c’est euh insultant& EA (.) en quoi de euh PhdeV hein et euh EA [d’où vient l’insulte] &[parce que parce que ] j’ai un état-civil (.) c’est mentionné dans tous les portraits qui [vous sont euh ] PhdeV l’Canard Enchaîné non non& EA PhdV [non je j’pourrais vous citer [non non non ça] c’est ]&& &[vous pouvez pas vous pouvez pas faire ça] 38 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 EA &&L’Express Le [Point Libération et tous les tous les portraits qui ont pu vous être consacrés] PhdeV [non j’ai j’ai un état-civil non écoutezÜÜ j’ai un état-civil/ ] Au cours de la séquence de la colère, il est possible d’identifier 14 interruptions, dont 8 par PhdeV, et surtout de longues interventions qui se chevauchent entièrement (47 secondes) : cette simple analyse quantitative semble montrer le caractère fortement agonal de cette séquence, à l’exception de la phase laconique, dans laquelle PhdeV cesse de réagir selon les règles du débat, en produisant des tours de parole très brefs malgré les sollicitations répétées de la modératrice : PhdeV (.) rien (.) ça me regarde (.) EA [voilà rien ben rien hein] [ça a le mérite d’être court (.)] PhdeV oui bon he he EA aucun souvenir de cette période/ PhdeV un bon souvenir EA ça marque quelque ch- quand même [un homme politique]& PhdeV EA &de passer par un gouvernement PhdeV un bon souvenir (.) EA ce sera votre seul commentaire\ PhdeV voilà [un bon souvenir (.)] Cet état d’abattement et de quasi-prostration se reproduit plus loin, entraînant un malentendu sur le mot « étau », décodé comme « ghetto » — élément qui s’inscrit dans l’isotopie de la discrimination contre les Juifs en filant la métaphore de l’« étoile jaune » (voir supra), et où l’on peut voir l’indice d’une certaine perte de contrôle langagier : PhdeV et donc quand vous dites y a pas comment vous avez parlé de ghetto idéologique c’est ça/ BS non d’étau PhdeV hein/ EA d’étau [d’étau] BS [d’étau] (inaud.) PhdeV bon ben écoutez euh ::: euh ::: y a mon espace c’est la France EA merci [merci Philippe de Villiers]13 13 BS: Bernard Sananès; EA: Emilie Aubry. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 39 Une fois son erreur comprise, PhdeV produit une série de « petits mots » ayant pour seule fonction d’occuper le tour de parole (« bon ben écoutez eu:::h eu:::h ») et enchaîne aussitôt avec un introducteur (« y a ») dont la construction est immédiatement interrompue par un de ses slogans préférés (« mon espace c’est la France »), sur lequel EA greffe une formule de clôture. Tout se passe comme si face à cette perte de contrôle le locuteur en difficulté tentait de se raccrocher aux rails du discours « préconstruit ». On voit que les modalités de sortie de l’épisode colérique sont très différentes dans nos deux corpus : alors que Royal se montre capable de changer en un tour de main de thème et de tonalité, il semble que Villiers, épuisé par son explosion de colère, se trouve en quelque sorte dépossédé de ses capacités argumentatives — ce qui va dans le sens de l’ensemble de nos observations : on aurait d’un côté une colère non pas forcément « feinte », mais délibérée et contrôlée, et de l’autre un véritable bouleversement émotionnel que le sujet ne parvient jamais à surmonter. Tentons à présent de récapituler ce qui ressort de la combinaison du dire et du montrer dans la manifestation des émotions. Ces deux modalités énonciatives sont complémentaires à plus d’un titre. D’abord, le dire peut concerner les émotions du locuteur aussi bien que celles d’autrui (auto- / allo-attribution : de l’ « énervement » de SR débattent aussi bien l’intéressée que son rival), tandis qu’il est impossible, avec pour seuls « supports symptomaux » son propre corps et ses comportements, de montrer directement les émotions des autres (auto-attribution seule) ; en revanche on peut éventuellement avoir une action indirecte, comme le fait NS en affichant un calme ostensible (auto-attribution directe) qui fait ressortir par contraste la virulence, et donc peut-être l’énervement, de SR (alloattribution indirecte). Ensuite, ces deux modalités n’ont pas la même fiabilité, du moins en première approche : ce qui est dit l’est sans garantie de vérité (la faculté d’asserter une émotion n’implique pas forcément l’existence du dénoté correspondant), tandis que ce qui est montré est supposé, puisque les symptômes livrent en même temps les signes et leurs référents, donner à lire des états « réels ». Même si on peut à la limite jouer la comédie et « duper » son public, le montrer bénéficie donc par rapport au dire d’un caractère probant qui pousse les participants (et l’analyste) à y rechercher, pour reprendre l’expression de Charaudeau 40 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 (2000 : 135)14, « les preuves de correspondance entre l’exprimé et l’éprouvé » et à les expliciter verbalement (NS invoquant l’index pointé comme preuve de la justesse de son allo-attribution dite). Que peut tenter l’analyste pour débrouiller cet écheveau ? Il semblerait qu’on ait affaire à quatre cas de figure principaux : – ce qui n’est ni dit ni montré : l’émotion n’est tout simplement pas manifestée (soit elle n’existe pas, soit elle est « cachée ») et l’analyste ne peut rien en dire ; – ce qui est montré, mais pas dit : c’est le cas de tout ce qui affleure dans l’interaction sans être thématisé par les participants — par exemple, pour PhdeV, qu’il soit désemparé, ou vexé. Le rôle de l’analyste est ici plus important puisque c’est de sa propre initiative qu’il réunit les indices et qu’il les interprète en nommant ; – ce qui est dit, mais pas montré : le cas le plus simple est celui où le montrer manifeste le contraire de ce qui est dit : en ce cas il l’emporte ; mais de cela nos corpus n’offrent pas d’exemple. La plupart du temps se pose en effet plus subtilement le problème de savoir ce qui est ou non montré : c’est dans cette plage d’incertitude à propos de ce qui est « réellement » montré que s’engouffre la négociation (verbale) entre NS et SR — on peut être en désaccord avec le contenu du dit, mais les signes dits sont des signes pour tout le monde ; il n’en va pas de même pour les signes montrés dont la détection et l’existence même dépendent d’interprétations plus « personnelles », et c’est ce qui fait que ce cas recouvre la plupart du temps le suivant, à savoir – ce qui est dit et montré : le montrer corrobore les attributions émanant du dire d’un des participants, et dans le cas le plus simple on peut alors raisonnablement supposer que l’émotion manifestée correspond à une émotion réelle (PhdeV : « je suis blessé ») — mais la situation est souvent bien plus complexe : les participants sont en désaccord sur le montré (c’est-à-dire que l’un des participants n’est pas d’accord avec l’auto-attribution montrée qui lui a été allo-attribuée sur le mode du dire) et ont de ce fait des dires divergents (NS et SR). L’analyste peut néanmoins s’efforcer d’expliciter les mécanismes qui rendent possibles les différentes interprétations et, s’il le souhaite, évaluer leur vraisemblance. 14 Charaudeau, Patrick (2000), « Une problématisation discursive de l’émotion. À propos des effets de pathémisation à la télévision », dans C. Plantin, M. Doury et V. Traverso, Les émotions dans l’interaction, Lyon, PUL, p. 125-156. Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 41 4. Conclusion On se demandera d’abord dans quelle mesure l’affichage d’un état émotionnel intense peut être, dans ce type particulier d’événement communicatif, approprié ou au contraire « contre-productif » — que gagne-ton, que risque-t-on de perdre en perdant son calme au cours d’un débat médiatique à caractère politique ? Pour être en mesure de répondre à cette question il faudrait évidemment disposer d’un échantillon plus large d’exemples. Les deux cas précédemment analysés suggèrent toutefois que les effets produits par ce type de comportement dépendent de différents facteurs tels que : – la nature de l’émotion affichée : si nos deux exemples mettent en jeu une certaine forme de colère (laquelle ne constitue apparemment pas, dans un tel contexte, un péché capital), c’est le fait d’être « blessé » que revendique ouvertement de Villiers alors que cet état est précisément dénié par Sarkozy à la fin de notre séquence : SR NS SR [vous êtes blessé euh monsieur (.) vous [êtes blessé] [non: pas moi] (.) pis [vous savez moi j’ai] [bon alors tout va] très bien – le fait que cette émotion s’exprime sur le mode du « dire » ou du « montré » : si le montrer est en principe plus crédible (c’est-à-dire moins suspect d’être « mensonger »), le dire peut sembler plus conforme à la « dignité du débat » (pour reprendre l’expression sarkozienne), car il implique une certaine mise à distance de l’état émotionnel ; – la nature de l’événement déclenchant l’émotion, dont dépend le degré de légitimité de cette émotion : à cet égard la réaction de PhdeV (s’offusquant du rappel de ses titres de noblesse, et allant jusqu’à comparer à une étoile jaune l’emploi du terme de « vicomte ») peut sembler plus injustifiée et disproportionnée que celle de SR ; – le fait que l’émotion soit présentée comme purement individuelle (comme c’est le cas chez de Villiers, qui se dit atteint dans son identité personnelle) ou susceptible d’être partagée : même si Royal parle en son nom propre (« je suis en colère »), la colère qu’elle éprouve est censée affecter toute 42 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 personne que choque également le spectacle de l’« immoralité politique » — où l’on rencontre le problème des relations qui peuvent s’établir entre l’émotion affichée par le locuteur et celle qu’il est censé communiquer à son destinataire, car l’émotion manifestée doit être mise au service non seulement de l’éthos de l’orateur mais aussi du pathos de son auditoire. Peuvent enfin intervenir toutes sortes de facteurs liés aux caractéristiques particulières du locuteur. Par exemple, sur la candidate Royal plane le topos de la « femme hystérique », dont elle doit avant tout se prémunir quand Sarkozy s’emploie sans vergogne à l’exploiter — situation que l’on peut rapprocher de celle de Barak Obama, sur lequel plane le topos du « noir colérique », ce qui entraîne pour lui des contraintes un peu différentes (il peut afficher l’indignation mais non point la colère, alors que Royal peut afficher et l’indignation et la colère, mais surtout pas l’énervement) : Barack Obama n’a pas mâché son indignation face aux mensonges distillés par ses adversaires. Et il l’a fait sans laisser apparaître sa colère, ce qui est essentiel aux États-Unis, où le mythe du « Noir colérique » est largement répandu. On ne permettrait pas au candidat démocrate de perdre son calme. (Télérama 3006, 15-10-2008) Il semble que les différents facteurs énumérés précédemment jouent plus en faveur de Royal (malgré le handicap que constitue le fait qu’elle soit une femme) qu’en faveur de Villiers dans l’acceptabilité finale de cet affichage émotionnel. Ce qui ne veut pas dire que le comportement de Royal durant cet épisode ait suscité l’adhésion générale, bien loin de là : les appréciations à cet égard ont fortement divergé, ce qui pose le problème de l’interprétation d’un même événement communicatif par les différents acteurs qui s’y trouvent engagés, analyste compris, problème sur lequel nous allons pour terminer faire quelques remarques. On ne peut qu’être d’accord avec le principe maintes fois énoncé en analyse conversationnelle selon lequel la description doit adopter le « point de vue des membres » — encore faut-il savoir ce que signifie « décrire » et ce qu’il faut entendre par « membres ». Décrire, c’est toujours interpréter : s’agissant par exemple de la séquence Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 43 de la « saine colère », on ne peut évidemment pas se contenter d’une paraphrase du genre « elle dit qu’elle est en colère, il prétend qu’elle est énervée… ». Il faut aller voir en scrutant tous les détails du texte de l’interaction ce qui se cache sous le faisceau de marqueurs et d’indices produits de part et d’autre, or s’il en est dont l’interprétation ne pose pas de problèmes il en est d’autres qui sont, on l’a vu tout au long de cette étude, beaucoup plus subtils et ambigus, et en particulier les signes de nature non verbale dont le codage est d’une manière générale plus flou que celui des signes verbaux — en ce qui concerne par exemple le jeu des regards, que penser de cette déclaration de Poivre d’Arvor selon laquelle Sarkozy lui avait paru « déstabilisé » durant cette séquence, la preuve : il regardait les animateurs, comme s’il cherchait auprès d’eux un appui ? – Ce qui nous renvoie à cette autre question : que faut-il entendre par « membres » ? Les débatteurs bien sûr, qui manifestent tout au long du déroulement de l’interaction, à l’aide d’indices qu’il revient à l’analyste d’interpréter, leur interprétation parfois divergente de ce qui s’y passe ; ainsi que les animateurs du débat, mais aussi le vaste ensemble des téléspectateurs, qui pose à l’analyste un double problème : celui de leur hétérogénéité, et celui de l’impossibilité où l’on se trouve d’accéder à chaud à leur « point de vue ». L’existence de cette couche de récepteurs, que l’on ne peut pourtant pas exclure de la communauté des « membres » sous prétexte qu’ils ne participent pas activement au débat, met en déroute le postulat qui fonde le travail descriptif en analyse conversationnelle, à savoir que les membres rendent « publiquement disponible » par leur comportement la façon dont ils interprètent ce qui se passe. Car on ne peut avoir accès que de façon très partielle, indirecte, et différée (par le biais de sondages, d’interviews, de commentaires dans la presse ou sur Internet…) aux réactions extrêmement contrastées de ces millions de récepteurs qui sont en réalité les principaux destinataires du petit drame qui se joue sur le plateau de la télévision. La tâche de l’analyste apparaît donc comme double : il doit d’une part décrire minutieusement tout ce qui se passe au cours de l’événement communicatif soumis à examen, et sur cette base, établir ce que Plantin (1998)15 15 Plantin, Christian (1998), « Les raisons des émotions », dans Marina BONDI, Forms of Argumentative Discourse, Bologne, CLUEB, p. 3-50. 44 Kerbrat-Orecchioni, Catherine. ICAR, Université Lumière Lyon 2 appelle un diagnostic argumenté, c’est-à-dire fondé sur l’interprétation raisonnée des données empiriques. C’est ainsi que d’après nous, dans le cas de Philippe de Villiers comme dans celui de Ségolène Royal l’émotion dite est corroborée par l’émotion montrée : le premier est manifestement « blessé » et ulcéré ; quant à la deuxième, il est permis de penser (si tant est que l’on puisse distinguer clairement les indices caractéristiques de la colère et de l’énervement) que contrairement à ce que prétend Sarkozy, à aucun moment elle ne « sort de ses gonds ». Pourtant, nombreux sont les commentateurs de cet épisode, qu’ils soient profanes ou experts ès discours politiques, qui à l’encontre de ce diagnostic ont parlé et parlent encore du « moment où Ségolène Royal s’est énervée », épousant sans état d’âme l’interprétation sarkozienne, quel que soit au demeurant leur penchant politique. Or il est permis de penser que l’analyste n’a pas à traiter par le mépris ces interprétations « erronées » (à partir du moment où elles ne sont pas isolées) et que le texte interactionnel, en relation avec certaines données contextuelles, doit bien être dans une certaine mesure responsable de ces effets de sens. On peut en l’occurrence alléguer divers facteurs favorisant cette interprétation. Il y a d’abord le fait qu’à force de marteler « Ne vous énervez pas », Sarkozy a fini par convaincre la masse des spectateurs-auditeurs que SR était effectivement énervée (c’est du moins ce qui s’est inscrit dans les mémoires). Il y a aussi le fait que le distinguo, légitime sans doute, que tente d’établir Royal entre deux affects qui sont tout de même proches est sans doute trop subtil dans un tel contexte (il ne s’agit pas d’un débat philosophique de France Culture) : la langue ordinaire admet bien une sorte de synonymie entre le fait d’être « en colère » et celui d’être « énervé » ; la position de NS est donc plus conforme au sens commun que celle de SR, plus conforme aussi à la représentation prototypique de la colère qui est plutôt vue comme un affect violent où l’on casse tout (à l’instar de Moïse ou d’Achille), où l’on déchire ses vêtements et dénude sa poitrine comme dans les allégories médiévales de la colère. Il y a enfin l’excessive durée de la séquence : Royal s’acharne, répétant ad nauseam « je ne m’énerve pas je suis en colère » — et l’on a vu pourquoi elle refusait de lâcher le morceau : c’est que c’est son éthos présidentiel qui est en jeu. Mais en s’obstinant de la sorte elle suscite l’exaspération du public qui a vraiment envie que l’on passe à autre chose (l’Europe par exemple), et que s’achève cette parenthèse qui donne l’impression de se faire au détriment des problèmes de fond, comme si ce numéro quelque peu factice et théâtral dans lequel Royal joue les pasionarias Cadernos de Letras da UFF – Dossiê: Letras, linguística e suas interfaces no 40, p. 17-45, 2010 45 offusquées n’était qu’une sorte de cache-misère. Il semble donc qu’en se laissant entraîner dans cette trop longue digression psychologico-éthique Ségolène Royal soit bel et bien tombée dans le piège tendu par son adversaire. En tout état de cause, l’analyste est toujours un archi-interprétant qui a (idéalement) pour tâche de procéder à la description la plus objective possible de ce qui se passe tout au long du déroulement de l’échange, tout en se donnant les moyens de rendre compte de la subjectivité interprétative des différents participants impliqués à quelque titre que ce soit dans l’événement communicatif étudié — description objective et interprétation subjective qui s’ancrent également sur l’ensemble des unités sémiotiques (verbales, paraverbales et non verbales) qui composent de façon syncrétique le « texte » de l’interaction. RÉSUMÉ Étant donné que pendant les interactions les participants font appel à des ressources communicatives de nature différente (verbales, paraverbales, mimogestuelles), on se propose, dans cet article, à partir de l’observation de deux séquences télévisuelles, de décrire la façon dont ils font évoluer l’interaction, en faisant apparaître la relation existant entre les procédures adoptées par les parties, leurs propos et les effets (positifs ou négatifs) produits par leurs interventions. En s’agissant de moments de conflit, chargés de tension et d’émotion, on soulignera la force dont se chargent les différents signes appartenant aux niveaux du dire et du montrer dans le processus de construction d’une image de/pour soi. MOTS-CLÉS: multimodalité, séquence télévisuelle, ethos Recebido: 19/04/2010 Aprovado: 09/06/2010