méthodologie des essais cliniques dans le domaine de la douleur
Transcription
méthodologie des essais cliniques dans le domaine de la douleur
17/10/02 16:12 Page 1 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR UPSA couv Méthodologie MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR Upsa Méthodo essais 2002 18/10/02 15:57 Page 1 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR Upsa Méthodo essais 2002 18/10/02 15:57 Page 2 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR Dr Jacques Wrobel, Coordinateur INSTITUT UPSA DE LA DOULEUR 3, rue Joseph Monier - BP325 92506 Rueil-Malmaison Cedex Tél : 01 58 83 89 94 Fax : 01 58 83 89 01 E-mail : [email protected] Site : institut-upsa-douleur.org Les notions exposées dans ce livre sont destinées à compléter et non à remplacer les connaissances médicales des professionnels formés en la matière. Les auteurs et le coordinateur déclinent toute responsabilité directe ou indirecte dans l’usage pouvant être fait de cet ouvrage. ISBN : 2 - 910844 - 10 - 2 Conception A Éditorial Paris 01 42 40 23 00 Illustration de couverture d’après René Descartes Dépôt légal 4e trimestre 2002 Upsa Méthodo essais 2002 18/10/02 15:57 Page 3 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR “En médecine, ce qui n’est pas scientifique n’est pas éthique” Pr Jean Bernard Upsa Méthodo essais 2002 18/10/02 15:57 Page 4 LES AUTEURS Nadine ATTAL C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex Éric BOCCARD Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex François BOUREAU C.E.T.D., Hôpital Saint-Antoine, 75012 Paris Paul DESJARDINS SCIREX Corp. Austin,Texas, U.S.A. Jules DESMEULES Division de Pharmacologie Clinique, Hôpital Cantonal 1211 Genève, Suisse Claude DUBRAY Laboratoire de Pharmacologie, Faculté de médecine 63001 Clermont-Ferrand cedex Jocelyne FEINE Faculté de médecine dentaire, Université McGill, H3A2B2, Montréal PQ, Canada Dominique FLETCHER C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex Hervé GANRY Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex Annie GAUVAIN-PIQUARD Unité de Psychiatrie et d'Onco-Psychologie, Institut Gustave Roussy 94805 Villejuif cedex Michel LANTERI-MINET C.E.T.D., Hôpital Pasteur, 06002 Nice cedex Jacques WROBEL Institut UPSA de la Douleur, 92506 Rueil-Malmaison cedex Remerciements : au Dr François CHAST et à Dorothée WROBEL pour leur relecture “méthodique” concernant le fond et la forme. 4 Upsa Méthodo essais 2002 18/10/02 15:57 Page 5 SOMMAIRE ■ 1. Introduction ----------------------------------------------------------------------------------------------------------------------------------------------------- 7 Jean-Marie Besson ■ 2. Principes méthodologiques généraux des essais cliniques ----------------------------------------------------------------------------Claude Dubray 9 ■ 3. Évaluation de la douleur --------------------------------------------------------------------------------------- 29 • Évaluation de la douleur provoquée chez le volontaire sain Claude Dubray • Évaluation de la douleur clinique chez l'adulte - - - - - - - - - - - 43 François Boureau • Évaluation de la douleur clinique chez l'enfant - - - - - - - - - - - - 55 Annie Gauvain-Piquard • Le soulagement : indice de la douleur - - - - - - - - - - - - - - - - - - - - 63 ou de la qualité de vie Jocelyne Feine • Place de la pharmacocinétique dans les essais cliniques des antalgiques Jules Desmeules • Le développement clinique des antalgiques - - - - - - - - - - - - - - - - 73 Hervé Ganry • Les paramètres de quantification de l'efficacité - - - - - - - - - - - - - 85 clinique des antalgiques Paul Desjardins • Les standards de quantification de l'efficacité - - - - - - - - - - - - - - 91 clinique des antalgiques Claude Dubray • L'antalgique de secours dans les essais cliniques - - - - - - - - - - - - 97 Éric Boccard • Les contraintes des essais cliniques en pédiatrie - - - - - - - - - - - 109 Jacques Wrobel SOMMAIRE ■ 4. Essais cliniques des antalgiques -------------------------------------------------- 67 …/… 5 Upsa Méthodo essais 2002 18/10/02 15:57 Page 6 ■ 5. Essais cliniques dans les pathologies douloureuses ---------------------------------------- 115 • Évaluation de la douleur post-opératoire Dominique Fletcher • Exigences méthodologiques pour les essais - - - - - - - - - - - - - - 121 thérapeutiques dans les douleurs neuropathiques Nadine Attal • Méthodes de développement clinique - - - - - - - - - - - - - - - - - - 129 des anti-migraineux Michel Lantéri-Minet 6 Upsa Méthodo essais 2002 18/10/02 15:57 Page 7 1. INTRODUCTION Jean-Marie Besson Unité 161, INSERM, Paris Président du Conseil Scientifique, Institut UPSA de la Douleur De nouvelles méthodes ont permis d’améliorer sensiblement l’évaluation et le traitement de la douleur. Cependant, en raison des impératifs de maîtrise des dépenses de santé, les laboratoires pharmaceutiques doivent évaluer les substances antalgiques qu’ils commercialisent avec une rigueur croissante. Une rigueur identique est exigée pour l’évaluation des traitements non pharmacologiques, par exemple certaines techniques de neurostimulation. Dans ce domaine, les sanctions ne se font pas attendre puisque les compagnies d’assurances de certains États américains refusent d’ores et déjà de financer la neurostimulation. Par ailleurs, il faut savoir qu’au Royaume-Uni, les dépenses afférentes au traitement journalier d’un douloureux chronique sont chiffrées au dixième de livre près. Mon expérience m’a appris que le traitement de la douleur était un domaine thérapeutique très sensible aux phénomènes de mode. Régulièrement, de nouvelles substances connaissent leur heure de gloire dans toutes les publications et dans tous les pays. Mais ces produits miracles présentés dans les congrès ne se révèlent pas toujours aussi efficaces sur le terrain, ce qui explique que nous accordions une importance croissante à l’évaluation. Il faut tenir compte des différences entre les pathologies dans l’évaluation des substances et des techniques antidouleur. Par exemple, si l’on ne prend pas en considération le fait que la douleur neuropathique revêt des tableaux très différents selon les syndromes dont souffrent les patients, les données obtenues sont très hétérogènes. Dès lors, on comprend très bien pourquoi l’utilisation de certaines substances pharmacologiques dans les neuropathies est si controversée. Dans l’intérêt des patients, il faut espérer que nous saurons isoler les syndromes de la neuropathie pour lesquels des molécules spécifiques présenteront une action bénéfique. INTRODUCTION ■ LES PROGRÈS CONSTATÉS DANS L’ÉVALUATION DE LA DOULEUR 7 Upsa Méthodo essais 2002 8 18/10/02 15:57 Page 8 Upsa Méthodo essais 2002 18/10/02 15:57 Page 9 2. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX DES ESSAIS CLINIQUES Claude Dubray ■ LA MÉTHODOLOGIE ◗ Définition La méthodologie appliquée aux essais cliniques est un ensemble de règles qui a pour objectif d’en garantir la validité scientifique. La valeur des conclusions que l’on tire d’une étude dépend donc étroitement de la méthodologie qui a été mise en œuvre. Schématiquement, on distingue deux grandes catégories que sont les études descriptives et les études explicatives. Les études descriptives On classe dans cette catégorie les comptes rendus de cas, les séries de cas cliniques ou les enquêtes démographiques. Leur objectif vise essentiellement à révéler et à documenter des observations cliniques, de faire partager des idées nouvelles ou de générer des hypothèses. On ne doit pas leur en demander plus et, dès que l’on veut raisonner en termes de causalité, il faut avoir recours à des études explicatives. Les études explicatives Elles peuvent être fondées sur l’observation ou sur une expérimentation véritable. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX ◗ Choix d’un type d’étude adapté aux objectifs de la recherche 9 Upsa Méthodo essais 2002 18/10/02 15:57 Page 10 • Les études explicatives basées sur l’observation Elles recouvrent essentiellement le domaine de l’épidémiologie. Selon le mode de recueil des données, on parle d’études “cas-témoins”, d’études en cohorte ou d’analyses transversales. Dans tous les cas, les données sont recueillies et analysées sans intervenir sur la situation des sujets observés. Le plus souvent, on a recours à ces études pour faire apparaître une relation entre un facteur d’exposition, un indice biologique, un signe clinique… et la survenue d’une maladie. Le simple constat de cette relation ne signifie en aucune manière qu’il existe un lien de causalité entre les deux phénomènes observés ! PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Dans le cas des études d’observation “cas-témoins”, le mode d’entrée se fait par la maladie. On identifie des groupes de sujets qui présentent ou ne présentent pas une pathologie spécifique et, grâce à une enquête rétrospective, on recherche ensuite dans chacun de ces groupes la présence ou l’exposition à un facteur de risque particulier. 10 Dans les études d’observation en cohorte, encore appelées études d’incidence, le mode d’entrée est l’exposition à un facteur de risque qui est supposé intervenir dans la survenue d’une maladie spécifique. On va donc constituer des échantillons de la population, regroupés en cohortes (d’où le nom de ce type d’étude), qui seront suivies dans le temps pour mettre en évidence la survenue de la pathologie étudiée. On réalise simultanément ce suivi sur un groupe qui présente le facteur de risque et sur un autre groupe, en tous points identique au premier (autant que faire se peut), mais qui ne présente pas ce facteur de risque. Ce deuxième échantillon constitue le groupe témoin. Les études d’observation transversales ou études de prévalence ont comme mode d’entrée l’exposition à un facteur de risque supposé intervenir dans la survenue d’une maladie spécifique. Toutefois, à la différence des études en cohorte, le comptage des sujets présentant la pathologie étudiée se fait à un moment donné, à la fois dans le groupe à risque et dans un groupe témoin. Il n’y a pas ici de suivi des patients dans le temps. Upsa Méthodo essais 2002 18/10/02 15:57 Page 11 • Les études explicatives basées sur l’expérimentation À la différence des situations précédentes,il faut ici établir un plan expérimental qui, d’une manière ou d’une autre, interfère sur la situation des sujets observés. On inclut dans cette catégorie : les essais cliniques, les interventions éducatives, les stratégies de prise en charge médicale. - L’intervention pédagogique : elle permet d’étudier ici l’influence de différents types de recommandations adressées à un échantillon de population (par exemple : habitudes alimentaires, exercices physiques, hygiène bucco-dentaire…) sur la survenue ou l’évolution d’une pathologie spécifique. - Les essais sur les stratégies de soins ou modalités de prise en charge médicale : ces essais consistent à étudier l’influence d’un mode de prise en charge médicale (structure de soins,qualification des soignants, modalités de surveillance clinique…) sur la survenue ou sur l’évolution d’une pathologie spécifique. ◗ Les essais thérapeutiques Ils ont pour objectif de mettre en évidence les effets d’un traitement sur l’évolution d’une pathologie, sur un critère de substitution, voire sur un critère purement pharmacodynamique. Comme on l’a vu précédemment, si l’on veut pouvoir mesurer l’effet propre d’un médicament, il faut avoir recours à une étude explicative du type essai clinique. On PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX - Les essais cliniques : dans ce cas, le mode d’entrée est l’exposition à un facteur qui est supposé modifier l’évolution d’une maladie spécifique. Ce facteur peut, par exemple, être la prise d’un médicament. L’approche est ici très voisine de celle des études en cohorte, mais avec une différence essentielle qui tient à l’attribution aléatoire du facteur pouvant modifier l’évolution de la maladie étudiée. On passe donc d’une situation de simple observation à une situation d’intervention. Comme dans les études en cohorte, on suit dans chacun des deux groupes (exposés et non-exposés) l’évolution, soit de la maladie (en termes de morbidité ou de mortalité), soit d’un indice reflétant l’évolution de la maladie (à l’aide d’un ou plusieurs critères de substitution). Cette approche expérimentale permet d’établir s’il existe un lien de causalité entre le facteur étudié et l’évolution de la maladie. 11 Upsa Méthodo essais 2002 18/10/02 15:57 Page 12 devra donc constituer deux groupes de sujets, un recevant le traitement à étudier (groupe traité) et l’autre un médicament de référence ou un placebo (groupe témoin). À la fin de l’étude,il est vraisemblable que l’on montrera certaines différences entre le groupe traité et le groupe témoin et, très naturellement, on aura tendance à penser que les différences observées sont le résultat de l’action pharmacologique directe du médicament étudié. En fait, il ne s’agit que d’un effet apparent qui est la somme de l’effet pharmacologique du médicament et de multiples facteurs appelés facteurs confondants. Ceux-ci incluent l’état initial du patient,l’évolution spontanée de la maladie,des facteurs non spécifiques (généralement impossibles à identifier de façon exhaustive) et les variabilités individuelles aléatoires. La méthodologie, mise en œuvre dans les essais thérapeutiques, a pour objectif de supprimer ou d’atténuer ces facteurs “parasites”, de manière à ce que l’effet apparent, qui est le seul observable, reflète le plus fidèlement possible les propriétés pharmacologiques intrinsèques du médicament que l’on étudie. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les moyens pour supprimer les facteurs confondants 12 • Prise en compte de l’état initial et l’évolution spontanée de la maladie. On comprend intuitivement que ces deux facteurs peuvent avoir une influence considérable sur l’effet apparent du traitement. Le moyen le plus commode pour atténuer l’influence de ces facteurs est de faire en sorte que le groupe traité et le groupe témoin soient aussi comparables que possible. Pour cela, on sélectionne les patients inclus dans l’étude à l’aide de critères d’inclusion et d’exclusion qui permettent de constituer des groupes aussi comparables que possible. À l’issue de l’étude, au moment où on analyse les résultats, on vérifie soigneusement les caractéristiques physiologiques et physiopathologiques de chacun des groupes pour s’assurer qu’il n’y a pas de différence significative entre les deux populations. Si c’était le cas, ce constat pourrait remettre totalement en cause les conclusions de l’étude. • Prise en compte des facteurs non-spécifiques. Certains sont identifiables, d’autres sont soupçonnés, mais la plupart restent totalement méconnus. Bien que masqués, ces facteurs peuvent avoir parfois une influence considérable sur l’évolution d’une pathologie,que l’on impute à tort à l’effet du médicament. Ces facteurs étant pour la plupart nonidentifiables, on ne peut pas les éliminer à l’aide des critères d’inclusion Upsa Méthodo essais 2002 18/10/02 15:57 Page 13 qui sélectionnent les sujets admis dans une étude. Le moyen le plus efficace que l’on ait trouvé pour atténuer l’influence de ces facteurs est de faire en sorte que les deux groupes de sujets inclus dans l’essai thérapeutique se trouvent dans un environnement (au sens large du terme) aussi identique que possible. Pour répondre à cette exigence, il faut qu’au moment de leur inclusion dans l’essai thérapeutique, les patients soient tirés au sort pour être affectés dans le groupe traité ou dans le groupe témoin. La méthodologie que l’on utilise dans les essais cliniques doit mettre en œuvre les recommandations énumérées précédemment pour que la différence des effets apparents, observés entre le groupe témoin et le groupe traité, reflète le plus fidèlement possible l’effet propre du médicament étudié. ◗ Quelques autres principes qui guident la méthodologie appliquée aux essais thérapeutiques Lorsque l’on s’engage dans un essai thérapeutique, il faut accepter trois règles principales : • le principe de comparaison : le nouveau médicament que l’on teste est-il meilleur (du point de vue de l’efficacité, de la tolérance, de la commodité d’emploi…) que ceux qui existent déjà sur le marché ? • le principe de causalité : l’effet observé est-il bien lié aux propriétés pharmacologiques du médicament ou résulte-t-il des facteurs confondants dont nous avons parlé précédemment ? PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX • Prise en compte des facteurs de variabilité individuelle aléatoires. La variabilité est inhérente au monde biologique. Au sein d’une même espèce, aucun individu n’a le même patrimoine génétique et donc le même phénotype. Cette variabilité biologique, plus ou moins importante selon la nature du paramètre étudié, est à l’origine d’un “bruit de fond” qui parasite la mesure de nos critères d’évaluation. Le seul moyen de surpasser cette variabilité individuelle est de la prendre en compte en travaillant sur un échantillon de population qui ait une taille suffisante pour que le bruit de fond devienne négligeable par rapport à l’effet propre du produit que l’on étudie. 13 Upsa Méthodo essais 2002 18/10/02 15:57 Page 14 • le principe de signification : le résultat observé a-t-il bien été obtenu grâce au médicament étudié ou est-il le fruit du hasard ? La comparaison Dans le domaine des essais cliniques, on travaille toujours de façon comparative.On peut comparer la situation actuelle à une situation antérieure (c’est ce que l’on appelle un “essai rétrospectif”). Mais le plus souvent, on va comparer un nouveau traitement à une situation sans traitement (lorsque l’on donne un placebo, par exemple), ou à un autre traitement (traitement dit de “référence”). Mais pour qu’une comparaison puisse être extrapolée, il est essentiel qu’elle ait une valeur générale. Pour cela, il faut travailler sur un échantillon véritablement représentatif des patients auxquels s’adresse le traitement à l’étude. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX La causalité 14 Il est essentiel que les groupes comparés soient véritablement comparables. Ce principe est à la base de la démarche expérimentale qui vise à rattacher les différences observées à la fin de l’essai à l’effet du traitement. La seule solution est donc de constituer un groupe témoin et un groupe traité parfaitement identiques du point de vue de leurs caractéristiques physiologiques et physiopathologiques. Cette comparabilité entre les deux groupes est fondamentale. Elle n’est pas très difficile à obtenir au départ, pour peu que l’on prenne certaines précautions dans la présélection puis le tirage au sort des sujets. Toutefois, il est tout aussi important que cette comparabilité soit maintenue tout au long de l’essai. La meilleure solution, pour ne pas introduire de biais, consiste à travailler au minimum en simple aveugle (seul le patient ne connaît pas la nature du médicament administré) ou, de préférence, en double aveugle (ni le patient ni le médecin ne connaissent la nature du médicament administré). Il est nécessaire que cette règle soit maintenue jusqu’à la fin de l’analyse statistique. La signification On ne peut imputer un effet thérapeutique à un traitement que si la randomisation a été parfaitement respectée, sinon, on s’expose à des Upsa Méthodo essais 2002 18/10/02 15:57 Page 15 ■ LES QUESTIONS À SE POSER AVANT D’ENGAGER UN TRAVAIL DE RECHERCHE CLINIQUE ◗ Quels objectifs ? On s’aperçoit très souvent que les objectifs fixés lors de la mise en place d’un protocole ne sont pas assez clairement définis. Beaucoup de chercheurs cliniciens fixent plusieurs objectifs à une seule étude, dans l’espoir de recueillir un maximum d’informations. Ceci peut paraître tout à fait louable d’un point de vue éthique, mais est souvent désastreux au plan méthodologique. On peut dire aujourd’hui que, pour chaque essai, il faut se fixer un objectif prioritaire, sous peine de parvenir à des résultats totalement inexploitables car trop compliqués à analyser. Il faut également éviter de refaire des études qui ont déjà été réalisées. Il faut enfin pouvoir justifier le projet sur le plan scientifique. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX biais majeurs qui peuvent fausser totalement les résultats et leur enlever toute pertinence.Grâce à un test statistique qui est choisi en fonction du plan expérimental utilisé,des caractéristiques du critère de jugement,de la taille de l’échantillon, on conclut que les effets observés dans le groupe témoin et le groupe traité sont significativement différents ou qu’ils ne le sont pas. Compte tenu de la variabilité biologique et de l’interférence possible des facteurs confondants que nous avons évoqués précédemment, on ne peut jamais exclure que la différence observée soit le seul fait du hasard. Dans la communauté scientifique, il y a un consensus pour considérer que l’effet du médicament A est différent de celui du médicament B lorsque le test statistique sort le presque mythique “p ≤ 0,05”. En fait ce “p ≤ 0,05” signifie simplement qu’il y a 95 % de chances que la conclusion que l’on tire à partir de l’échantillon sur lequel on a travaillé corresponde bien à la “réalité”. On accepte aussi le risque de conclure à tort dans 5 % des cas. Si l’on est plus exigeant, on peut n’accepter qu’un risque à 1 % ou 0,1 % de se tromper dans les conclusions. Cette “barrière” du “p ≤ 0,05” est trop souvent érigée en dogme sans que les utilisateurs des tests statistiques ou les lecteurs des rapports d’études en comprennent correctement le sens. 15 Upsa Méthodo essais 2002 18/10/02 15:57 Page 16 ◗ Quelle population étudier ? La pathologie concernée PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Lorsque l’on réalise une étude sur un médicament, il faut savoir précisément à quelle pathologie on s’adresse et souvent même à quel stade d’évolution de cette pathologie. Par exemple, les médicaments utiles pour traiter une insuffisance cardiaque de stade I ne sont pas les mieux adaptés au traitement d’une insuffisance cardiaque au stade IV. Les efforts accomplis dans le domaine de la recherche thérapeutique ont d’ailleurs fait progresser de façon incontestable la nosologie. Nous en avons une excellente illustration dans le domaine des psychotropes. Pour étudier cette famille de médicaments, nous avions besoin d’avoir une classification très précise des maladies psychiques, notamment pour inclure des groupes de patients homogènes et pouvoir comparer les résultats d’études réalisées par différentes équipes. Ce travail nosographique a débouché sur la classification DSM III puis DSM IV qui est devenue un outil quasi indispensable, bien sûr dans le cadre des essais cliniques, mais aussi en pratique psychiatrique quotidienne. 16 Constitution de l’échantillon et critères d’inclusion Il faut sélectionner les malades sur des critères bien précis et définir la taille de l’échantillon. En effet, lorsque l’on réalise un essai clinique, il ne faut jamais perdre de vue, même si l’on doit inclure plusieurs centaines de patients, que l’on travaille sur un petit échantillon, si l’on se rapporte à l’ensemble de la population à laquelle s’adresse potentiellement le médicament. Pour que l’on puisse extrapoler les résultats obtenus à partir des patients inclus dans un essai à l’ensemble de la population cible, il est donc indispensable que cet échantillon soit véritablement représentatif de l’ensemble de la population à laquelle est destiné le traitement. Les caractéristiques physiologiques et physiopathologiques de cette population doivent donc se retrouver dans l’échantillon et vice versa. Ce problème est loin d’être simple. Dans le domaine des antihypertenseurs par exemple, on a découvert tardivement que la population noire répond moins bien aux inhibiteurs d’enzymes de conversion ou aux bêta-bloquants que la population blanche. On observe par ailleurs une sous-représentativité chronique des femmes dans les essais thérapeutiques. Cela tient au fait que l’on veut éviter, à juste titre, que Upsa Méthodo essais 2002 18/10/02 15:57 Page 17 Avant de commencer une étude, il faut clairement définir la procédure de sélection. Pour cela, on s’appuie sur des critères d’inclusion et d’exclusion qui sont spécifiés dans le protocole d’étude. Cette sélection a pour but de constituer des groupes homogènes, notamment par rapport au (x) critère(s) d’évaluation, ce qui en diminue la variabilité et permet de conclure sur un échantillon de plus petite taille. Mais il faut savoir que ce principe de sélection est un mal nécessaire. Certes, en sélectionnant, on constitue un échantillon homogène, mais cet échantillon risque de ne plus vraiment être représentatif de la population globale. C’est classiquement le cas des études réalisées sur des populations de malades très sélectionnées en milieu hospitalier. Il faut également avoir une approche réaliste du recrutement. Lorsque l’on souhaite lancer un essai thérapeutique, on demande généralement aux cliniciens d’estimer combien ils sont capables d’inclure de patients présentant une pathologie donnée. En règle générale, ces cliniciens affirment voir en consultation ou en hospitalisation un nombre considérable de patients répondant aux critères attendus et ils en concluent qu’il devrait être possible de recruter très rapidement le nombre de patients requis. Malheureusement, dans cette première approximation, ils oublient que certains de leurs patients n’accepteront pas de participer à l’essai, que d’autres ont des pathologies associées, prennent des traitements qui sont contre-indiqués, autant de facteurs qui ne permettent pas in fine de les inclure dans un protocole. C’est pour cela qu’il faut conserver une approche réaliste car les capacités réelles de recrutement ne représentent parfois que 10 % de l’estimation de départ. Enfin, il est important de respecter des principes éthiques quand on sélectionne des sujets, notamment lorsque l’on souhaite réaliser des PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX survienne une grossesse chez des femmes à qui l’on administre un nouveau médicament encore très imparfaitement évalué. Cela impose que la femme ait une contraception efficace, que l’on fasse des tests de grossesse répétés… Autant de facteurs qui font qu’il est plus simple de n’inclure que des hommes ! Cette commodité a son revers, car sauf si l’on étudie un médicament destiné au traitement de l’adénome de la prostate, peut-on extrapoler à l’ensemble de la population les résultats exclusivement obtenus sur un échantillon d’hommes ? La réponse est clairement non ! 17 Upsa Méthodo essais 2002 18/10/02 15:57 Page 18 essais médicamenteux. Le fait de participer à un essai clinique ne doit pas entraîner pour le malade “une perte de chance” en termes de guérison ou de survie par rapport aux possibilités thérapeutiques du moment. Nombre de sujets nécessaires Pour calculer le nombre de sujets nécessaires, en considérant que l’on a défini un plan expérimental et choisi un test statistique précis, quatre paramètres doivent être pris en considération. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX • Il faut tout d’abord se demander quelle sera,sur le critère d’évaluation, la différence que l’on considère comme cliniquement pertinente entre les deux groupes à l’issue du traitement. Sur une population en insuffisance cardiaque de stade IV par exemple, gagner 15 jours de survie a-t-il une signification sur le plan clinique ? On peut penser que non. On se fixe donc pour objectif de gagner au moins trois mois de survie. Contrairement à ce que croient la plupart des investigateurs, plus la différence recherchée est faible, plus il faut inclure de patients. 18 • Le deuxième paramètre est la variabilité du critère principal d’évaluation. Pour reprendre l’exemple de l’insuffisance cardiaque, le critère d’évaluation est le temps de survie exprimé en semaines.Mais ce temps de survie varie d’un sujet à l’autre, même lorsque les malades se trouvent au même stade. C’est pour cela que l’on parle de variabilité du critère d’évaluation. Or, plus la variabilité de ce critère est grande, plus il faut inclure de sujets pour pouvoir conclure du point de vue statistique. • Le troisième paramètre est le risque de “première espèce α”. Il s’agit du risque de conclure à une différence entre deux traitements alors qu’en réalité, elle n’existe pas. En général, on fixe ce risque à 5 %, mais on peut être plus exigeant et l’abaisser à 1 % ou 0,1 %. Naturellement, plus on est exigeant, plus il faut inclure de sujets dans l’échantillon. • Le quatrième paramètre est la puissance du test de comparaison qui est l’inverse du risque de “deuxième espèce β”. Ce risque β correspond au risque que l’on s’accorde de conclure à une absence de différence entre deux traitements lorsque celle-ci existe vraiment. Dans ce 18/10/02 15:57 Page 19 domaine, on accepte généralement un risque β de 0,20 à 0,05 (ce qui correspond à une puissance du test de 80 % à 95 %). Assez logiquement, plus on exige une forte puissance du test de comparaison, plus il faut de sujets. Ce risque β est essentiel lorsque l’on compare des traitements dont on pense a priori que leur efficacité est très voisine et que l’on cherche à démontrer l’équivalence des deux médicaments. On ne peut affirmer cette équivalence que si l’on dispose d’une puissance de test suffisante. Pour illustrer cette problématique du nombre de sujets, prenons l’exemple d’une comparaison entre deux hypnotiques. On retient pour critère d’évaluation principal la durée du sommeil, exprimée en heures. On considère qu’une différence peut être mise en évidence si l’un de ces deux traitements fait dormir deux heures de plus que l’autre. Si l’on se fixe par ailleurs un risque α à 5 %, une puissance de test à 95 % et si l’on considère que la variance de la durée du sommeil dans la population globale est de 3 heures, il faut, d’après nos calculs, inclure au minimum 39 sujets dans chaque groupe – soit 78 personnes au total – pour aboutir à des conclusions significatives sur le plan statistique. Mais, si l’on veut montrer que l’un de ces traitements ne fait dormir qu’une heure et demie de plus que l’autre, il faut porter le nombre de sujets à 52 par groupe, soit 104 au total. Le choix du plan expérimental et du test statistique a également une incidence sur le nombre de sujets nécessaires. Ainsi, au cours d’un essai croisé dans lequel chaque sujet est son propre témoin (il reçoit successivement les différents traitements testés), on gomme la variabilité intraindividuelle et on peut ainsi diminuer le nombre de sujets par un facteur trois à quatre (dans le meilleur des cas). De même, en reprenant l’exemple précédent relatif à l’essai d’un hypnotique, si l’on n’utilise plus un test de comparaison bilatéral (dans lequel on ne préjuge pas que le traitement A est supérieur à B ou l’inverse) mais un test unilatéral (où l’on se fixe pour hypothèse de départ que l’un des traitements est plus efficace que l’autre),les tests permettent d’observer des différences statistiquement intéressantes avec moins de sujets, à savoir 32 au lieu de 38. Enfin, le fait d’utiliser un test statistique paramétrique (lorsque les conditions l’y autorisent) permet habituellement d’avoir la même puissance statistique avec un peu moins de sujets. Mais, ici, le gain en effectifs n’est pas aussi important que le croient beaucoup de cliniciens. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Upsa Méthodo essais 2002 19 Upsa Méthodo essais 2002 18/10/02 15:57 Page 20 ◗ Quels traitements comparer ? Si nous nous plaçons dans le cas où nous avons à tester un nouveau médicament.Il faut savoir si on le compare à un placebo ou à un produit de référence. Le placebo présente un avantage incontestable : il permet de mettre en évidence l’efficacité intrinsèque du médicament. Dans le cas d’une comparaison avec un produit de référence, on ne peut que comparer l’efficacité relative des deux produits. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Le choix du produit de référence est souvent beaucoup plus complexe qu’il y paraît. Quand il s’agit d’un médicament que l’on souhaite faire enregistrer pour une mise sur le marché, on n’a pas vraiment le choix. En effet,pour que le dossier d’enregistrement soit analysé par la commission d’AMM (Autorisation de Mise sur le Marché), celle-ci exige que le nouveau médicament soit comparé à un produit récent, reconnu comme étant le plus efficace et le mieux toléré au sein de sa classe thérapeutique.Or,les médicaments très récents sont rarement commercialisés simultanément dans tous les pays où l’on avait prévu de faire les essais thérapeutiques, ce qui entraîne bien des complications. 20 Le deuxième problème est le choix de la posologie du produit de référence. On peut décider de l’administrer à une posologie relativement faible. Dans ce cas, lors de la comparaison, on favorise le produit testé au plan de l’efficacité, mais on risque de le défavoriser sur le plan de la tolérance. À l’inverse, si l’on administre le produit de référence à une posologie forte, on risque de pénaliser le produit testé sur le plan de l’efficacité, même si sa tolérance apparaît meilleure que celle du produit de référence. Ces choix qui engagent fortement l’avenir du produit, sont souvent difficiles à faire. L’usage d’un placebo n’est pas toujours possible.C’est notamment le cas dans les pathologies qui présentent un risque vital à court terme,où cela poserait des problèmes éthiques évidents. La comparaison à un placebo est particulièrement intéressante chaque fois que l’on cherche à mettre en évidence l’effet pharmacologique propre d’un produit, qui correspond à la différence entre l’effet observé et l’effet placebo. On néglige trop souvent que cet effet placebo peut atteindre 50 % à 60 % dans certains domaines thérapeutiques, notamment dans les traitements antimigraineux.Ne pas le prendre en compte pose donc de réels problèmes Upsa Méthodo essais 2002 18/10/02 15:57 Page 21 d’interprétation.Par ailleurs,cet effet placebo peut varier en fonction du centre d’essai,de l’investigateur,de la couleur de la gélule,etc.Il est donc toujours souhaitable de pouvoir le quantifier. ◗ Quel plan expérimental ? Ils peuvent être très nombreux et le choix dépend d’un ensemble d’éléments tels que : les objectifs d’études, la durée du traitement, l’évolution spontanée de la maladie, sa prévalence dans la population, etc. Ces essais ont été beaucoup utilisés pour rechercher les posologies qui apportent le meilleur rapport efficacité/tolérance. Ils ne posent pas de problèmes particuliers lorsqu’on les utilise pour évaluer l’effet d’un traitement administré à dose unique mais leur usage est beaucoup plus périlleux lorsqu’ils s’appliquent à un traitement en prises répétées. Le principe des essais de titration est fondé sur une augmentation individuelle des doses (à intervalles réguliers s’il s’agit d’un traitement prolongé) et selon des paliers prédéfinis. Si le sujet réagit comme attendu au traitement, on le laisse poursuivre l’essai à la même posologie ; s’il ne réagit pas suffisamment, on lui administre une posologie plus forte. On répète la même procédure pour différents paliers de doses prédéfinis et, à la fin de l’étude, on peut déterminer la ou les posologie(s) efficace(s) à laquelle ou auxquelles le plus grand nombre de sujets a répondu au traitement. Ces plans ont été très largement utilisés dans les années soi, notamment pour étudier l’efficacité des anti-hypertenseurs. À l’époque, on évaluait l’efficacité des différentes posologies toutes les deux semaines. L’application à large échelle de ces essais de titration a fait que la plupart des anti-hypertenseurs qui ont été mis sur le marché dans les années soixante-dix et au début des années quatre-vingt étaient surdosés. L’explication de cette dérive est venue tardivement. Il a fallu en effet de très nombreuses études pour que l’on découvre que lorsque l’on institue un traitement anti-hypertenseur, il faut attendre en moyenne entre six et huit semaines (et non quelques jours comme on le pensait !) pour en obtenir le plein effet. On voit donc immédiatement le biais que pouvaient présenter les évaluations sur deux semaines : PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les essais de “titration” 21 Upsa Méthodo essais 2002 18/10/02 15:57 Page 22 certains patients, loin d’avoir le plein effet de leur traitement au bout de cette période, étaient, à tort, passés à une posologie plus forte ce qui tirait artificiellement vers le haut les doses d’anti-hypertenseurs considérées comme efficaces. La difficulté de connaître, pour beaucoup de traitements, la durée nécessaire pour obtenir le plein effet justifie qu’aujourd’hui ces plans soient utilisés avec beaucoup de prudence. Les plans expérimentaux en groupes parallèles PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Ces plans expérimentaux sont certainement les plus utilisés actuellement. Leur principe est extrêmement simple. On commence par prendre un échantillon représentatif de la population et on le divise en autant de groupes que de traitements à comparer.Puis,par tirage au sort, on affecte un traitement déterminé à chaque groupe, l’un d’entre eux pouvant éventuellement recevoir un placebo. Au bout d’une période définie, on évalue l’effet thérapeutique obtenu sur chacun de ces groupes. 22 Au cours des études de ce type, on prévoit parfois une période dite de “run-in” durant laquelle les patients reçoivent un placebo. Certains la mettent à profit pour éliminer les “placebo-répondeurs”, en arguant du fait que ces sujets génèrent un “bruit de fond” qui diminue la puissance des comparaisons statistiques. Mais en éliminant ces patients, il faut savoir que l’échantillon devient moins représentatif de la population globale. Par conséquent, tout le monde n’adhère pas à cette solution. Nous pensons qu’il faut arrêter le choix en fonction des objectifs de chaque étude. Au cours d’un essai en groupes parallèles, on peut comparer entre eux plusieurs traitements, on peut aussi comparer les effets de différentes posologies d’un même médicament avec un traitement de référence ou un placebo. Les plans expérimentaux en groupes parallèles présentent de nombreux avantages. Si on les utilise beaucoup, c’est essentiellement parce qu’ils sont simples à organiser ou à analyser et parce qu’ils présentent peu de risques de biais. Ils ont aussi quelques inconvénients. Notamment, compte tenu que chaque sujet ne reçoit qu’un seul type de traitement, la mesure du critère d’évaluation est entachée de la variabilité interindividuelle. Si cette variabilité est forte, cela peut affaiblir considéra- Upsa Méthodo essais 2002 18/10/02 15:57 Page 23 blement la puissance des tests statistiques, que l’on devra compenser en augmentant le nombre de patients dans chaque groupe.Un risque de biais peut venir de ce que les différents groupes ne sont pas comparables du point de vue de leurs caractéristiques physiologiques, physiopathologiques ou d’autres facteurs individuels pouvant interférer avec l’effet du traitement étudié. Ce risque est en principe évité si l’on a pris soin d’inclure les patients après tirage au sort et si l’on dispose d’un échantillon suffisamment grand. Il n’en reste pas moins que, parfois, le hasard fait mal les choses… et que cela ne se révèle malheureusement qu’après le dépouillement des résultats. Dans ces plans expérimentaux, les sujets sont leur propre témoin car ils reçoivent, successivement et dans un ordre aléatoire, les différents traitements ou les différentes posologies qui sont à l’étude. Lorsque l’on répète les comparaisons chez un même patient,on parle alors de “carrés latins”, de “blocs incomplets” ou “d’essais croisés répétés intensifs”. Comment se déroulent ces essais croisés ? Prenons un cas simple, dans lequel on compare deux traitements. Le principe général est le même que pour les plans en groupes parallèles. La différence est que 50 % des sujets vont d’abord recevoir le traitement A, puis le traitement B, alors que les 50 % restants vont d’abord recevoir le traitement B, puis le traitement A. Le fait que, dans ce type de plan expérimental, chaque sujet soit son propre témoin élimine la variabilité inter-individuelle dont nous avons parlé précédemment. Cette approche permet d’avoir la même puissance de comparaison statistique avec, dans le meilleur des cas, quatre fois moins de patients. Mais les plans expérimentaux de ce type présentent également des faiblesses. Ainsi, l’effet du premier traitement peut retentir sur les effets du deuxième (c’est ce que l’on appelle la “rémanence de l’effet thérapeutique”). On peut remédier partiellement à ce problème en introduisant, entre les deux périodes de traitement, une “fenêtre thérapeutique” ou “période de wash-out” durant laquelle les sujets reçoivent un placebo. Le principe est simple, mais on est alors confronté au même problème que dans les essais de titration : quelle doit être la durée de la fenêtre thérapeutique pour être sûr que les sujets sont PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les plans expérimentaux croisés ou par comparaisons intra-individuelles 23 Upsa Méthodo essais 2002 18/10/02 15:57 Page 24 effectivement revenus à leur niveau basal ? C’est une question à laquelle il est malheureusement souvent difficile de répondre précisément, en particulier lorsque l’on étudie des molécules vraiment nouvelles. À l’extrême,on peut réaliser ce que l’on appelle un “essai intensif”avec deux ou trois patients voire un seul, en répétant plusieurs fois et dans un ordre aléatoire, les traitements étudiés. Le champ d’application de ce type d’essais reste toutefois extrêmement limité. On le réserve habituellement aux pathologies rares pour lesquelles on ne peut recruter que quelques sujets. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX D’une manière générale, les études en permutation croisée présentent un certain nombre d’avantages. Elles permettent de gommer la variabilité interindividuelle car chaque sujet est son propre témoin. Avec le même effectif,on gagne donc beaucoup de puissance statistique pour la comparaison. Cela peut s’avérer intéressant d’un point de vue éthique, mais aussi au plan pratique, lorsque l’on a affaire à une pathologie pour laquelle les malades sont particulièrement difficiles à recruter. 24 Mais les essais croisés présentent aussi quelques inconvénients : • Leur organisation est plus complexe. • Ils durent plus longtemps car chaque sujet reçoit successivement les différents médicaments à tester. Dans ces conditions, les durées de chacun des traitements et des fenêtres thérapeutiques s’additionnent dans le temps. • Le risque de biais est important et ils sont parfois difficiles à déceler. • Ces essais ne peuvent pas s’appliquer aux pathologies spontanément évolutives. Par exemple, les rhinites aiguës qui guérissent spontanément en quatre jours. • Ils ne peuvent pas s’appliquer aux traitements curatifs. Les plans factoriels Le plan factoriel est le plan expérimental de référence lorsque l’on souhaite étudier l’effet de l’association de deux traitements, ou évaluer l’influence du stade évolutif d’une maladie, d’une pathologie associée, de caractéristiques physiologiques particulières… sur l’efficacité d’un traitement. Upsa Méthodo essais 2002 18/10/02 15:57 Page 25 Les courbes de survie L’utilisation des comparaisons basées sur les “courbes de survie”ne peut s’adresser qu’à certaines pathologies pour lesquelles on peut caractériser de façon simple un événement précis. C’est le cas, par exemple, pour la survenue d’un accident vasculaire cérébral, d’un infarctus, d’une fracture du col du fémur… Souvent, mais il y a des exceptions, on utilise cette méthode pour l’évaluation de traitements sur des périodes relativement longues, de plusieurs mois, voire plusieurs années. Le terme de “courbes de survie” vient du fait que ces approches étaient initialement destinées à étudier l’efficacité des traitements anti-néoplasiques en suivant effectivement la survie des patients dans les différents groupes traités et en comparant ces courbes à l’aide de tests statistiques appropriés. Leur usage s’est aujourd’hui étendu à bien d’autres domaines de la thérapeutique. Ces plans constituent une des avancées méthodologiques les plus intéressantes de ces dernières années. Il existe différentes méthodes pour travailler en plans séquentiels, mais elles sont toutes basées sur le même principe relativement simple. On fixe a priori des limites au-delà desquelles on peut conclure que l’un des traitements est supérieur à l’autre et une zone dans laquelle on considère que l’on ne peut pas conclure à une différence entre les traitements. Après chaque observation, ou chaque paire d’observations, on en analyse soigneusement les résultats et, selon que la réponse au traitement est considérée satisfaisante ou non,le statisticien attaché à l’essai indique au clinicien la marche à suivre pour les observations suivantes. Comme dans les autres types de plans expérimentaux, le clinicien doit travailler en “aveugle” pour ce qui concerne la nature ou la posologie du produit administré. Cette approche a bien des avantages,notamment sur le plan éthique,car elle permet d’inclure le minimum de patients requis pour comparer les traitements. Contrairement aux autres plans expérimentaux que nous avons vus précédemment,on ne définit plus a priori le nombre de sujets à inclure, mais on inclut de nouveaux patients jusqu’au moment où l’on peut apporter des conclusions statistiquement significatives. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les plans séquentiels 25 Upsa Méthodo essais 2002 18/10/02 15:57 Page 26 Les plans séquentiels étant basés sur une analyse “en temps réel” des résultats, ils ne peuvent raisonnablement s’appliquer qu’à l’étude de traitements dont l’efficacité peut être jugée en quelques heures ou quelques jours. Ils sont beaucoup utilisés en pédiatrie, notamment pour évaluer des antibiotiques, car les délais de réponse à ces traitements sont courts. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX ◗ Quels critères de jugement ? 26 Les traitements sont avant tout destinés à améliorer la qualité de vie des patients ou à prolonger leur durée de vie. Sur cette base, il serait logique d’évaluer et de comparer tous les traitements en mesurant les bénéfices qu’ils apportent en termes de morbidité et de mortalité. Dans la pratique, il est assez peu fréquent que l’efficacité d’un traitement soit évaluée directement sur ces critères. Ceci tient à plusieurs facteurs : • fort heureusement, toutes les pathologies ne mettent pas immédiatement en jeu la vie du patient ; • les indices de morbidité sont souvent difficiles à quantifier ; même si l’on fait aujourd’hui beaucoup d’efforts pour en synthétiser les multiples facettes dans des scores de qualité de vie ; • dans beaucoup de cas, la maladie constitue simplement un facteur de risque pour la survenue de complications qui sont directement responsables de la morbidité et de la mortalité. Un exemple classique est l’hypertension artérielle (HTA). Lorsqu’elle est légère à modérée, elle ne gène aucunement la personne qui est un malade qui s’ignore. Grâce à des études épidémiologiques lourdes, on a pourtant pu établir que l’HTA augmente significativement le risque de mortalité par accidents vasculaires cérébraux. Cette affection est également à l’origine de nombreuses autres complications (qui sont autant de causes directes de morbidité et de mortalité). Ce risque de complications est la seule justification de la normalisation d’une pression artérielle trop élevée. À partir de ce constat, la logique voudrait que l’on évalue l’efficacité des traitements antihypertenseurs sur leur aptitude à diminuer l’incidence de telle ou telle de ces complications ou sur le taux de mortalité.Le problème est que la réalisation de telles études demande d’inclure plusieurs dizaines de milliers de patients et de les suivre pendant 5 ou 10 ans ! Pour des raisons de faisabilité, on doit se rabattre sur ce que l’on appelle un critère de substitution. Le chiffre de la pression artérielle est un critère de substitution très largement Upsa Méthodo essais 2002 18/10/02 15:57 Page 27 utilisé. C’est même un des rares critères de substitution validé par la démonstration d’une relation directe entre l’élévation de la pression artérielle et le risque de survenue d’un accident vasculaire cérébral. La première qualité requise pour un critère de jugement est d’être médicalement pertinent. Il revient aux experts de juger de cette pertinence et les critères retenus font souvent l’objet d’un consensus international. Il faut bien sûr s’assurer des qualités métrologiques du critère que l’on utilise, que celui-ci repose sur des échelles d’évaluation, des questionnaires ou des mesures recueillies à partir d’appareils plus ou moins sophistiqués. Cette standardisation des méthodes de mesures par la définition de normes est indispensable pour que des résultats puissent être comparés d’un centre d’étude à l’autre. Naturellement, les mesures doivent s’inscrire dans un calendrier extrêmement précis et identique chez tous les patients, sous peine de ne pouvoir réaliser aucune comparaison valable. Enfin, il est indispensable de hiérarchiser les critères de jugement et, si possible, de définir pour chaque protocole un critère d’évaluation principal qui reflète le plus fidèlement l’effet thérapeutique étudié et présente les qualités métrologiques requises. C’est autour de ce critère d’évaluation principal que l’on doit bâtir un protocole d’étude,choisir le PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX D’autres exemples nous rappellent les limites des critères de substitution.C’est le cas des antiarythmiques que l’on a longtemps évalués sur leur aptitude à normaliser un tracé ECG, jusqu’au jour où l’on s’est aperçu qu’il y avait plus de décès chez les patients traités que chez ceux recevant un placebo ! Depuis cette étude, l’ECG n’est plus accepté comme critère de substitution pour évaluer un antiarythmique et, dans cette classe de médicaments, les agences d’enregistrement exigent des essais comportant un suivi au long cours de la survie des patients. Face à ces exigences, bien peu de laboratoires pharmaceutiques se sont lancés dans le développement de nouveaux antiarythmiques. À côté de ces deux exemples,l’un blanc,l’autre noir,combien de zones grisées qui concernent des pathologies pour lesquelles on s’interroge sur la validité des critères de substitution ! Ceci n’empêche pas qu’on les utilise quotidiennement dans les essais thérapeutiques mais, au minimum, il faut essayer de n’avoir recours qu’à ceux qui sont acceptés (sinon validés) par la communauté scientifique et médicale. 27 Upsa Méthodo essais 2002 18/10/02 15:57 Page 28 plan expérimental, calculer le nombre de sujets nécessaires… et que l’on peut véritablement conclure sur l’efficacité du traitement étudié. Ceci n’interdit pas d’observer les effets du nouveau médicament sur d’autres critères, que l’on qualifie de secondaires. ■ CONCLUSION PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX La rigueur méthodologique est un élément essentiel pour donner du crédit aux conclusions que l’on tire d’un essai thérapeutique.Toutefois, une méthodologie irréprochable ne suffit pas à faire un bon essai clinique. Pour atteindre cet objectif, il faut aussi garantir une parfaite fiabilité des données recueillies et c’est là tout le domaine des Bonnes Pratiques Cliniques. 28 Upsa Méthodo essais 2002 18/10/02 3. ÉVALUATION 15:57 Page 29 DE LA DOULEUR Évaluation de la douleur provoquée chez le volontaire sain Les tests basés sur une douleur provoquée sont utilisés chez le volontaire sain dans deux contextes assez différents qui sont, d’une part, les recherches fondamentales sur la physiologie de la douleur, d’autre part, l’évaluation pharmacodynamique des médicaments antalgiques. Les tests utilisables sont extrêmement nombreux, mais leur mise en œuvre est souvent beaucoup plus délicate qu’il n’y paraît et peu ont fait l’objet d’un travail de validation approfondi. Ce constat explique que leur place en pharmacologie clinique reste encore largement débattue et qu’à la différence d’autres domaines thérapeutiques, le développement des antalgiques ne bénéficie pas aujourd’hui d’outils d’évaluation aussi performants que nous le souhaiterions pour étudier de nouvelles molécules dès les premiers essais chez l’homme (études de phase I). À un moment où les connaissances fondamentales sur les mécanismes de la douleur ont fait des progrès considérables, ouvrant ainsi des perspectives nombreuses pour le développement de molécules nouvelles, les difficultés rencontrées ne doivent pas faire baisser les bras mais, au contraire, inciter chercheurs et cliniciens à poursuivre un travail de validation minutieux pour mieux définir les modalités optimales d’utilisation et améliorer leur sensibilité. ÉVALUATION DE LA DOULEUR Claude Dubray 29 Upsa Méthodo essais 2002 18/10/02 15:57 Page 30 ■ LES PRINCIPALES TECHNIQUES DE STIMULATIONS NOCICEPTIVES APPLICABLES À L’HOMME ◗ Induction d’une douleur aiguë ou ponctuelle Stimulus mécanique Les méthodes utilisées consistent le plus souvent à exercer une pression sur une surface cutanée, plus ou moins étendue, en regard de tissus mous ou de crêtes osseuses. D’autres techniques permettent d’obtenir un pincement des téguments ou une pression plus ponctuelle à type de piqûre. Dans tous les cas, il est indispensable de disposer d’appareils qui indiquent précisément la pression exercée, exprimée en newtons ou kilopascals. Ces appareils doivent aussi permettre d’augmenter la pression d’une manière régulière et parfaitement calibrée, seul moyen de déterminer précisément les seuils de douleur et de tolérance au stimulus mécanique. Ces tests sont habituellement assez faciles à mettre en œuvre mais leur répétition rapprochée dans le temps peut poser quelques problèmes, dans la mesure où ils peuvent entraîner des microtraumatismes cutanés provoquant une inflammation locale. ÉVALUATION DE LA DOULEUR Stimulus thermique 30 Les tests basés sur la stimulation thermique sont parmi les plus utilisés dans le domaine de la douleur provoquée. Ils reposent essentiellement sur l’utilisation de petites plaques dont on fait varier la température (thermodes) lorsqu’elles sont appliquées sur la peau ou les muqueuses. On peut élever la température de ces thermodes (stimulus chaud) ou,au contraire, la faire baisser (stimulus froid). Les autres techniques sont essentiellement basées sur la chaleur radiante (lampe au xénon) ou le faisceau laser CO2. Les stimulations à l’aide de thermodes sont certainement les plus utilisées,du fait de leur facilité de mise en œuvre.Ces thermodes fondées sur le système Pelletier sont en effet très faciles à piloter à l’aide d’un ordinateur.L’ajustement thermique se fait au 10e de degré et elles permettent d’obtenir pratiquement tous les schémas de stimulation que l’on souhaite : pente régulièrement croissante ou décroissante, plateau thermique, pulses thermiques de forme pyramidale ou sinusoïde, etc. Ces Upsa Méthodo essais 2002 18/10/02 15:57 Page 31 thermodes ont toutefois l’inconvénient d’une certaine inertie. Ce n’est pas le cas du laser CO2 qui permet de délivrer un stimulus thermique sur une zone très ponctuelle et surtout pendant des durées très brèves. Beaucoup d’auteurs privilégient les stimulations thermiques dans le domaine des douleurs provoquées, considérant qu’aux seuils nociceptifs, on stimule sélectivement les fibres C. Leur application en pharmacologie clinique pose toutefois un problème de sensibilité, car il est difficile de faire varier significativement les seuils de douleur ou de tolérance à ces stimuli après administration de médicaments antalgiques. Stimulus électrique ◗ Induction d’une douleur tonique ou soutenue (de quelques minutes à quelques heures) La plupart des méthodes reposent sur l’injection sous-cutanée ou intramusculaire d’une solution : soit acide, soit hypertonique, soit contenant des substances qui activent les nocicepteurs, telles que la bradykinine, la sérotonine… Elles permettent de provoquer une douleur qui persiste pendant quelques minutes ou quelques heures. D’autres techniques sont capables d’induire une douleur prolongée telles que le “tourniquet” qui consiste à créer une douleur ischémique au niveau d’un membre, en appliquant un brassard tensionnel gonflé au-dessus de la pression artérielle systolique. Dans le domaine des douleurs toniques, il faut réserver une place à part aux modèles de douleur viscérale expérimentale applicables à l’homme sain. Ces techniques reposent ÉVALUATION DE LA DOULEUR Les méthodes de douleur provoquée reposant sur ce type de stimulus consistent essentiellement à appliquer des électrodes cutanées sur le trajet d’un nerf périphérique et faire passer un courant de faible intensité. Une technique plus sophistiquée s’appuie sur une stimulation électrique de la pulpe dentaire. Ces stimulations électriques offrent l’avantage d’être très facilement modulables et de délivrer un stimulus de durée brève. Leur principal inconvénient est lié au fait qu’il s’agit d’un stimulus “non naturel” qui provoque souvent plus une sensation désagréable,voire anxiogène,qu’une véritable douleur.En conséquence, il est particulièrement important de prévoir des séances d’entraînement durant lesquelles le sujet se familiarisera progressivement avec ce type de stimulus. 31 Upsa Méthodo essais 2002 18/10/02 15:57 Page 32 essentiellement sur des dilatations gastriques, coliques ou rectales à l’aide de ballonnets gonflables, combinées éventuellement avec l’instillation locale de substances irritantes pour les muqueuses digestives. ◗ Induction d’une hyperalgésie ou d’une allodynie transitoire ÉVALUATION DE LA DOULEUR La technique la plus utilisée pour induire une hyperalgésie ou/et une allodynie transitoire est l’application cutanée de capsaïcine. Cette substance irritante (extraite du paprika) est facile à utiliser mais son action est relativement brève (2 à 3 heures). Ceci présente un inconvénient majeur lorsque l’on veut étudier des médicaments dont la durée d’action dépasse celle de l’hyperalgésie induite par la capsaïcine. C’est une des principales raisons pour lesquelles on a de plus en plus recours à des stimulations thermiques (chaudes ou froides) ou à une exposition à des U.V. pour provoquer une brûlure du premier degré. On observe alors une inflammation locale qui s’accompagne d’une libération locale de médiateurs pro-nociceptifs qui induisent une hyperalgésie et/ou une allodynie transitoire. L’avantage ici est que cette hyperalgésie ou allodynie induite va persister pendant plusieurs jours, ce qui permet de tester plusieurs antalgiques ou différentes doses d’un produit chez un même sujet qui devient ainsi son propre témoin. 32 D’un point de vue pratique, nous avons une préférence pour la stimulation par le froid qui nous semble beaucoup plus confortable pour les volontaires que la stimulation par le chaud. En effet, il est moins désagréable de se voir appliquer sur le bras une petite barre de cuivre à –28 °C pendant 8 secondes que de supporter pendant 8 à 10 minutes une thermode chauffée à 47 °C ! Quelle que soit la méthode,on observe dans les heures qui suivent l’exposition au chaud ou au froid, une rougeur cutanée dans la zone d’application et une hyperalgésie qui déborde largement cette zone. L’hyperalgésie reste stable dans la zone “lésionnelle”, pendant plusieurs jours, mais la zone d’hyperalgésie “périlésionnelle” tend à se rétrécir progressivement. Peu de travaux publiés utilisent cette technique pour évaluer l’effet antalgique des médicaments, mais l’expérience récente que nous en avons semble indiquer que cette approche est nettement plus sensible que les tests psychophysiques sur peau saine pour mettre en évidence un effet antalgique chez le sujet sain. Upsa Méthodo essais 2002 18/10/02 15:57 Page 33 ◗ Modalités d’utilisation de ces techniques de stimulation nociceptive Les différentes techniques de stimulation nociceptive que nous venons de voir peuvent être utilisées de manière isolée ou combinée. Dans le cadre de l’évaluation des médicaments analgésiques, de nombreuses équipes ont donné leur préférence à l’utilisation de batteries de tests relativement lourdes. Cette approche est motivée par deux principales raisons. Premièrement, il n’existe pas de relation évidente entre les réponses obtenues avec les différents types de stimuli. Deuxièmement, on a observé que certains antalgiques modifient préférentiellement les seuils de douleur en réponse à tel type de stimulus plutôt qu’à tel autre. Dans ces conditions, surtout lorsque l’on doit tester un nouvel antalgique, beaucoup ont estimé que seules des batteries de tests combinant plusieurs types de stimulation nociceptive permettent d’analyser correctement le profil de la nouvelle molécule. Cette approche a cependant ses limites dans la mesure où la répétition de nombreux tests exige un effort de concentration considérable de la part des volontaires. Dans ces conditions, on risque de privilégier la quantité d’information au détriment de la qualité. Sur la base de notre propre expérience, nous avons tendance actuellement à réduire le nombre de tests. En 1985, Gracely a défini les critères auxquels devrait répondre un tel stimulus nociceptif : • déclenchement et fin rapides ; • caractère naturel (ce qui n’est pas le cas du stimulus électrique) ; • aptitude à se renouveler avec un effet temps négligeable afin de pouvoir répéter les tests de manière rapprochée, sans hyposensibilité ou hypersensibilité des réponses ; • caractère “objectif”, ce qui implique que les réponses au stimulus soient similaires chez l’ensemble des sujets participant aux tests ; • mise en jeu d’un nombre restreint de neurones afférents primaires. ÉVALUATION DE LA DOULEUR ◗ Existe-t-il un stimulus idéal pour induire une douleur expérimentale ? 33 Upsa Méthodo essais 2002 18/10/02 15:57 Page 34 Aucune des techniques de stimulation nociceptive aujourd’hui disponibles et applicables aux sujets sains ou aux patients ne répond à l’ensemble de ces critères. Nous pensons, comme beaucoup de cliniciens ou chercheurs qui travaillent dans ce domaine, que les tests utilisés sont trop nombreux. Cette variété a un intérêt incontestable dans les recherches fondamentales portant sur les mécanismes de la nociception.En revanche,pour ce qui concerne leur utilisation en pharmacologie clinique, un travail de standardisation serait nécessaire pour sélectionner les méthodes les plus pertinentes en termes de sensibilité et de spécificité.Il faut aussi noter que beaucoup de ces techniques,délicates à mettre en œuvre, exposent à des biais méthodologiques importants et il est regrettable que peu d’entre elles aient fait l’objet d’un véritable travail de validation. En définitive, on est obligé de constater que nous ne disposons aujourd’hui d’aucun type de stimulus qui puisse être pris comme référence pour évaluer les antalgiques. ■ MÉTHODES D’ÉVALUATION DE LA DOULEUR PROVOQUÉE ÉVALUATION DE LA DOULEUR ◗ Les tests subjectifs basés sur l’approche psycho-physique 34 La psycho-physique consiste à étudier les relations entre une sensation consciente et les caractéristiques d’un stimulus. A priori, cette approche semble particulièrement bien adaptée pour étudier, chez l’homme, la sensation douloureuse en réponse à des stimuli nociceptifs précalibrés. La plupart des travaux fondamentaux conduits dans le domaine de la psycho-physique ont été appliqués aux domaines de l’audition, de la vision, voire du goût mais, malheureusement, assez peu concernent la nociception. L’application des méthodes psycho-physiques dans le domaine de la nociception répond à trois objectifs : • l’identification des seuils de détection, de douleur et de tolérance à un stimulus spécifique représente l’approche liminaire ; • la discrimination entre deux stimuli d’intensité différente ; • la quantification des sensations pour des stimulations supra-liminaires (c’est-à-dire dans le domaine qui nous intéresse, des stimulations supérieures au seuil d’apparition d’une sensation douloureuse). Upsa Méthodo essais 2002 18/10/02 15:57 Page 35 Pour chaque type de stimulus, les mesures liminaires visent à déterminer, pour un individu, son seuil de douleur (correspondant à un niveau d’intensité du stimulus qui devient désagréable) et son seuil de tolérance (qui correspond à un niveau où l’intensité du stimulus devient intolérable). Prenons l’exemple d’une stimulation réalisée à l’aide d’une thermode, dont la température s’élève progressivement,qui est appliquée sur l’éminence thénar de la main. Pour les mesures liminaires, on demande au sujet de bloquer la montée de température en appuyant sur un bouton dès que la chaleur de la thermode devient désagréable. Il fixe ainsi son seuil de douleur. On procède de la même façon pour déterminer son seuil de tolérance. L’intervalle de température se situant entre ces deux seuils constitue une plage thermique sur lequel nous pourrons appliquer des stimuli supra-liminaires (c’est-à-dire au dessus du seuil de douleur). Dans cette gamme de températures, on demande au sujet de coter l’intensité de la sensation douloureuse qu’il ressent à l’aide d’une échelle visuelle analogique, en réponse à un stimulus thermique d’amplitude variable se trouvant dans l’intervalle prédéfini. Une autre approche un peu différente consiste à fixer la température de la thermode à 1 degré ou à 1/2 degré en dessous du seuil de tolérance et d’enregistrer le temps pendant lequel le sujet peut maintenir la main sur la thermode à cette température. Au cours d’une expérimentation de ce type, on peut même demander au sujet d’évaluer en continu la sensation douloureuse qu’il ressent à l’aide d’une échelle visuelle analogique électronique. L’utilisation de ces stimuli thermiques supra-liminaires permet d’obtenir une très bonne corrélation entre l’intensité du stimulus appliqué et la sensation douloureuse ressentie par le sujet. Sous l’influence des médicaments antalgiques, on pourrait s’attendre à observer un aplatissement de la droite de régression ou son décalage vers la droite. En fait, cette approche s’avère décevante car très peu sensible à l’action des médicaments antalgiques. Les stimuli supra-liminaires sont également facilement utilisables avec un stimulus laser ou avec un stimulus électrique. Leurs mises en œuvre avec les stimuli mécaniques sont beaucoup plus délicates. ÉVALUATION DE LA DOULEUR Les mesures liminaires et supra-liminaires 35 Upsa Méthodo essais 2002 18/10/02 15:57 Page 36 Importance de l’entraînement aux tests Dans le domaine des tests psycho-physiques, on observe chez un sujet naïf une grande variabilité dans les réponses qui correspond à une phase d’adaptation aux tests, d’apprentissage. Ceci justifie plusieurs séances d’entraînement lorsque l’on veut les utiliser dans le domaine de la pharmacologie clinique. Avec les stimuli nociceptifs, il est naturel que, lors des premières expositions, les sujets aient tendance à réagir à des niveaux assez bas. Puis, lorsque l’on répète les tests, les réponses deviennent plus stables. Si on n’effectuait pas ces séances d’entraînement, ce phénomène d’adaptation interférerait avec l’effet propre des médicaments que l’on voudrait étudier et ceci apporterait un biais majeur dans l’interprétation des résultats. Dans le domaine des tests psycho-physiques nociceptifs, en dépit d’un entraînement bien suivi, les seuils de douleur présentent une grande variabilité inter-individuelle (d’un sujet à l’autre) et même intra-individuelle (d’un jour à l’autre chez un même sujet). Cette variabilité dans les seuils de douleur et de tolérance constitue indéniablement un handicap pour évaluer l’effet des médicaments antalgiques. Les statisticiens savent bien, en effet, que cette variabilité génère un “bruit de fond” qui a pour conséquence de nécessiter plus de sujets pour mettre en évidence l’effet pharmacologique du produit que l’on étudie. ÉVALUATION DE LA DOULEUR La nécessité d’un groupe placebo 36 Des études, peu nombreuses mais assez convaincantes, ont montré que les seuils de sensibilité à la douleur ne sont pas stables au cours du nycthémère. Ce constat a deux conséquences. D’une part, lorsque l’on veut faire des comparaisons chez un même sujet, il est important que les tests soient réalisés à la même heure de la journée s’ils doivent être réalisés à des jours différents. D’autre part, lorsque l’on suit l’évolution d’un seuil de douleur ou un seuil de tolérance sur une période relativement longue, il est indispensable d’avoir un groupe placebo qui reflète les variations circadiennes afin de les prendre en compte pour évaluer l’effet propre d’un médicament antalgique sur ces seuils. Un autre facteur à prendre en compte est le rôle de l’imprégnation hormonale œstro-progestative, et donc du cycle menstruel chez la Upsa Méthodo essais 2002 18/10/02 15:57 Page 37 femme qui modifie les seuils de sensibilité à la douleur.Cette donnée fait que l’on évite d’inclure des personnes de sexe féminin dans des études au cours desquelles on va devoir répéter les tests psycho-physiques à quelques jours d’intervalle. La place des tests psycho-physiques dans l’étude des médicaments antalgiques chez le sujet sain La plupart des tests psycho-physiques sont relativement faciles à mettre en œuvre, d’où leur utilisation assez large en pharmacologie clinique. Derrière leur apparente facilité de réalisation, il faut savoir que de nombreux facteurs autres que le médicament (ce que l’on appelle les facteurs confondants) peuvent interférer sur les réponses observées. De plus, ces tests sont essentiellement pénalisés par leur grande variabilité. Cette variabilité peut être atténuée en étant très attentif à l’environnement dans lequel se déroulent ces tests, au conditionnement psychologique des sujets, à leur effort de concentration et à la sélection d’une population aussi homogène que possible pour ses seuils de réponse à un type de stimulus particulier. Cette dernière condition n’est toutefois pas réalisable lorsque l’on utilise une batterie de tests combinant plusieurs types de tests. Dans la pratique, on applique au volontaire sain une série de stimuli douloureux d’amplitude variable et on mesure l’intensité de la douleur ressentie, à l’aide d’une mesure de l’EVA qui est relevée après chaque stimulus.Une autre approche consiste à augmenter de manière continue le stimulus jusqu’à un palier, puis à enregistrer le temps pendant lequel le sujet tolère ce stimulus. On peut également demander au sujet de coter en continu sur une EVA la sensation douloureuse provoquée par un stimulus d’intensité croissante. L’utilisation d’échelles visuelles électroniques facilite grandement l’évaluation dans ce contexte expérimental. Lors de l’application de stimuli douloureux d’intensité variable au moyen d’une thermode (par exemple entre 43 °C et 51 °C), on observe une très bonne corrélation entre l’intensité de la température et celle ÉVALUATION DE LA DOULEUR La cotation de la sensation douloureuse en réponse à des stimuli dont l’intensité se situe entre le seuil de douleur et le seuil de tolérance 37 Upsa Méthodo essais 2002 18/10/02 15:57 Page 38 de la douleur. A priori, ce type d’évaluation constitue donc une méthode intéressante pour mesurer l’effet d’un antalgique. Mais les résultats sont très décevants puisque les réponses ne varient pas de manière significative après l’administration de morphine. Des résultats intéressants et pertinents ont pu être obtenus avec une autre approche qui consiste à pratiquer, à plusieurs reprises, trois niveaux de stimulation (haut/intermédiaire/bas) de manière individualisée en fonction des seuils de tolérance de chaque sujet. Cette méthode permet de moyenner la cotation. 10 8 Avant-bras 6 4 2 Masseter 0 43 45 47 49 51°C Log Intensité de la douleur (EVA) Intensité de la douleur (EVA) Relation entre l’intensité de la stimulation thermique et la sensation douloureuse 2,5 2,0 1,5 1,0 0 Stimulus thermique 43 45 47 49 51°C Stimulus thermique ÉVALUATION DE LA DOULEUR D’après Price et al, Clin. J. Pain, 1987 : 3,1-8 38 Certains auteurs ont montré que la répétition des stimulations thermiques pouvait induire une désensibilisation assez nette vis-à-vis de la première douleur (douleur aiguë). En revanche, on observe le phénomène inverse pour la deuxième (douleur lancinante qui apparaît 1,5 seconde après la première douleur). Lorsque l’on pratique des stimulations répétées dans un faible intervalle de temps, il n’est pas possible de demander au sujet de distinguer la première douleur de la deuxième douleur. Par conséquent, le sujet donne une cotation globale intégrant probablement les deux douleurs. En pratique, nous avons constaté que les stimulations répétées à des intervalles de moins de 10 secondes n’entraînaient pas de sensibilisation importante. Upsa Méthodo essais 2002 18/10/02 15:57 Page 39 Conclusion sur les études subjectives Les études subjectives présentent l’avantage d’être faciles à mettre en œuvre.En revanche,elles ne permettent pas vraiment de dissocier,d’une part, la douleur primaire et la douleur secondaire, et, d’autre part, l’effet nociceptif et l’effet désagréable ou anxiogène (ce dernier étant particulièrement important pour les stimuli électriques). Enfin, les études subjectives sont fortement pénalisées par les phénomènes de variabilité interindividuelle et intra-individuelle. ◗ Les tests objectifs Les mesures électrophysiologiques Les réponses neurovégétatives Elles constituent un moyen indirect de mesurer la réponse d’un individu à une stimulation nociceptive supra-liminaire, en enregistrant les variations de la fréquence cardiaque, de la pression artérielle, du diamètre pupillaire et de la conductance cutanée. Le réflexe nociceptif de flexion Le principe consiste à appliquer une stimulation électrique de faible intensité (moins de 30 mA) sur le trajet d’un nerf périphérique. Pour le membre inférieur, on stimule habituellement le nerf sural, au niveau de son trajet rétro malléolaire externe. Cette stimulation déclenche ÉVALUATION DE LA DOULEUR Les techniques utilisées pour explorer les réponses à des stimuli douloureux sont pour la plupart fondées, soit sur le réflexe nociceptif de flexion (RIII), soit sur des potentiels évoqués somesthésiques. Dans les deux cas, elles permettent d’opérer une distinction entre un antalgique à effet central et un antalgique périphérique. Les techniques d’imagerie cérébrale,qui ont fait l’objet d’un grand nombre de publications ces dernières années, sont très intéressantes pour comprendre les mécanismes de la douleur. Pour l’instant, leur complexité de mise en œuvre et leur coût font qu’elles ont été réservées à des recherches fondamentales (en particulier sur les zones corticales impliquées dans la sensation douloureuse) plutôt qu’à l’étude de médicaments antalgiques. 39 Upsa Méthodo essais 2002 18/10/02 15:57 Page 40 un arc réflexe qui passe par la moelle épinière pour déclencher un mouvement de flexion ipsilatéral. Avec les courants de faible intensité que nous utilisons, ce réflexe ne déclenche pas de flexion visible cliniquement, mais il peut être enregistré à l’aide d’un électromyogramme. La technique du réflexe nociceptif de flexion a fait l’objet de plusieurs travaux de validations qui ont montré l’existence d’une relation étroite entre l’amplitude du réflexe RIII et la cotation de douleur (par EVA) ressentie à la suite de la stimulation électrique. Plusieurs études réalisées avec cette technique ont permis d’objectiver l’effet de différents antalgiques administrés par voie IV. Les méthodes “objectives” permettent généralement, mais pas systématiquement, d’établir une relation entre le paramètre mesuré et la sensation douloureuse. Lorsque cette relation n’est pas établie, la technique choisie peut être remise en cause. Les études objectives présentent l’inconvénient d’être lourdes à mettre en œuvre et d’être difficiles à répéter à court terme. ÉVALUATION DE LA DOULEUR ◗ Les techniques de stimulation nociceptives fondées sur l’hyperalgésie et l’allodynie induites 40 Après avoir induit une allodynie ou une hyperalgésie, on les quantifie, soit à l’aide de stimulations thermiques, soit avec le filament de Von Frey (classique ou électronique). En cas d’hyperalgésie induite, on peut mettre en évidence l’effet de substances antalgiques de palier I telles que le paracétamol ou l’ibuprofène dans la zone d’hyper-algésie alors qu’aucun effet n’est objectivable, lorsqu’on applique les mêmes stimuli sur une zone cutanée saine. ■ LES APPLICATIONS MÉDICAMENTEUSES L’évaluation de la douleur chez le sujet sain permet de standardiser les conditions expérimentales et d’évaluer l’effet des antalgiques dès la phase I. Le fait de recourir à des sujets sains plutôt qu’à des patients facilite grandement la répétition des mesures, ce qui est nécessaire pour obtenir des données pharmacocinétiques et pharmacodynamiques. Upsa Méthodo essais 2002 18/10/02 15:57 Page 41 ■ LES LIMITES Tout d’abord,les douleurs provoquées,même lorsqu’il s’agit de douleurs toniques, se situent dans un cadre différent selon que l’on se place sur un plan psycho-affectif ou sur un plan nociceptif pur. Ensuite, la sensibilité des volontaires sains à l’action des antalgiques est souvent insuffisante. Enfin, la mise en œuvre des techniques d’évaluation de la douleur provoquée est souvent délicate. L’évaluation de la douleur provoquée chez le sujet sain représente un outil d’exploration parfaitement adapté à certaines recherches fondamentales sur la physiologie de la douleur. De ce point de vue, des travaux récents ont d’ailleurs montré que la douleur provoquée, le plus souvent fondée sur une stimulation aiguë, met en jeu des mécanismes qui sont pour partie différents de ceux impliqués dans les douleurs spontanées, surtout si elles ont un caractère chronique ou subchronique. Ces considérations purement physiologiques ou physiopathologiques, ainsi que les problèmes de variabilité et de sensibilité parfois insuffisante à l’action des médicaments antalgiques, font que l’on doit s’interroger sur la place de cette approche pour l’évaluation des médicaments antalgiques. Mieux connaître les limites de ces tests, leurs modalités optimales d’utilisation, leurs critères de validation, devrait permettre de mieux les utiliser dans le développement de nouvelles molécules. Les difficultés que nous avons énumérées ne doivent pas nous faire renoncer à ces approches mais nous inciter à travailler activement sur ces tests de douleur provoquée pour que le développement des antalgiques puisse, comme d’autres domaines thérapeutiques, bénéficier de tests pharmacodynamiques applicables dès les premières étapes du développement chez l’homme. Nous n’avons pas abordé dans cette présentation l’utilisation des tests de douleur provoquée chez le malade. Il s’agit là d’un domaine insuffisamment exploré mais certainement très porteur, dans la mesure où ils permettraient probablement de mieux caractériser les processus physiopathologiques sous-jacents aux phénomènes douloureux chroniques, en particulier ceux liés à une neuropathie. ÉVALUATION DE LA DOULEUR ■ CONCLUSION 41 ÉVALUATION DE LA DOULEUR Upsa Méthodo essais 2002 42 18/10/02 15:57 Page 42 Upsa Méthodo essais 2002 18/10/02 15:57 Page 43 Évaluation de la douleur clinique chez l’adulte François Boureau ■ INTRODUCTION Cet article porte sur l’évaluation de la douleur dans le cadre de la réalisation d’un essai clinique et ne concerne donc pas la pratique quotidienne de son évaluation et de son traitement. Les spécialistes de la douleur qui gèrent des cas difficiles, rebelles, sont en général très réceptifs à toute information concernant une nouvelle stratégie thérapeutique. Il est essentiel de souligner la nécessité d’appuyer toute acquisition nouvelle sur des essais cliniques répondant à des critères de qualité. Ceux-ci constituent une étape incontournable dans le développement de nouveaux antalgiques. La valeur d’un résultat dépend du choix des instruments de mesure mais aussi, et surtout, de la méthodologie de l’ensemble de l’essai. Les principes généraux d’un essai clinique tels que randomisation, double aveugle, définitions de critères d’inclusion et d’exclusion, calcul des effectifs, etc. sont considérés comme acquis et nous nous focaliserons sur les paramètres d’évaluation de la douleur.Concernant la méthodologie des essais cliniques dans ce domaine, il est souhaitable de se référer à des recommandations qui font l’objet d’un consensus par les spécialistes du domaine.Citons,par exemple,les recommandations de la FDA :“Guidelines for the clinical evaluation of analgesics drugs”. Lorsqu’un résultat est acquis avec une méthodologie quelque peu inhabituelle, on doit s’interroger sur les biais possibles introduits. Ceci incite à la standardisation des méthodes d’évaluation utilisées. Cette standardisation est d’autant plus nécessaire que les résultats des études portant sur une même problématique peuvent être repris dans des métaanalyses. Il devient délicat de faire des revues lorsque les variables étudiées ne sont pas homogènes. ÉVALUATION DE LA DOULEUR ■ QUALITÉ DE L’ESSAI CLINIQUE 43 Upsa Méthodo essais 2002 18/10/02 15:57 Page 44 Pour chaque modèle d’évaluation de la douleur, nous disposons d’une littérature spécifique qu’il est important de consulter. Par exemple, l’International Headache Society a proposé une liste de critères à respecter dans les études sur les migraines et sur les céphalées de tension. Des ouvrages généraux comme “Design of analgesics trials” (Max, 1991) ou “An evidence base resource for pain relief” (Mc Quay, 1998) peuvent également être utilement consultés. ■ LES PROBLÈMES POSÉS ÉVALUATION DE LA DOULEUR La douleur est, par définition, un vécu. Malgré la nature subjective de la douleur, sa mesure reste possible. Le problème posé consiste à standardiser au mieux les conditions de recueil de l’évaluation de ce phénomène subjectif. D’une certaine manière, les spécialistes sont confrontés aux mêmes difficultés que les psychiatres ou psychologues lorsque ceux-ci doivent mesurer la dépression ou l’anxiété.L’objectif est alors de disposer d’outils validés permettant de standardiser, c’est-à-dire d’objectiver, une information par nature subjective. On comprend dès lors que les échelles d’évaluation de la douleur rejoignent celles utilisées en psychométrie. 44 La méthode envisagée pour évaluer la douleur dépend en partie de la définition ou de la délimitation qu’on lui donne. À côté de l’aspect sensation proprement dit, on peut être amené à considérer la dimension affectivo-émotionnelle qui est intégrée à la perception, à s’intéresser au retentissement sur les capacités fonctionnelles… Dans le cas des lombalgies, par exemple, il paraît important de documenter les capacités fonctionnelles. Le retentissement sur le sommeil et plus généralement sur la qualité de vie est un autre niveau à considérer pour décrire la symptomatologie des pathologies douloureuses. L’appréciation des mécanismes générateurs d’une douleur est un autre objectif possible. Des outils permettant de préciser, par exemple, sa composante neuropathique seraient très utiles pour la réalisation d’une étude dans ce domaine. Lors d’un essai clinique, il faut définir un critère principal permettant d’évaluer l’efficacité de la substance antalgique testée. Pour évaluer un phénomène multidimensionnel, on peut être amené à chercher à Upsa Méthodo essais 2002 18/10/02 15:57 Page 45 multiplier les critères.Toutefois, on doit alors connaître le risque d’introduire un biais dû à la chance de faire apparaître une différence significative. Modèle multidimensionnel de la douleur MÉCANISMES GÉNÉRATEURS P A T H O L O G I E ➨ DOULEUR PERCEPTION COMPORTEMENT ➨ ENVIRONNEMENT NOCICEPTIF SENSATION ➨ NEUROGÈNE PSYCHOGÈNE ➨ IDIOPATHIQUE DÉFICIENCE COGNITION FAMILIAL MOTEUR ➨ ➨ VERBAL ÉMOTION PROFESSIONNEL SOCIAL ➨ INCAPACITÉ ➨ DÉSAVANTAGE Aujourd’hui, la validation d’un outil d’évaluation de la douleur suppose une réflexion appréciant l’ensemble des caractéristiques métrologiques de cet outil.Le terme de validité rassemble en fait plusieurs types de validité : la validité de contenu (l’outil mesure-t-il véritablement ce qu’il est censé mesurer ?), d’apparence (comment l’outil est-il perçu par le patient ?), de construit (l’outil peut-il prendre en compte l’ensemble des dimensions ?) et la validité concourante (l’outil proposé est-il cohérent avec le “Gold Standard”éventuel ?).La validation d’un outil suppose aussi de s’assurer de sa fidélité (test/retest/cohérence interne) et de sa sensibilité au changement. Aujourd’hui, force est de reconnaître que peu d’outils d’évaluation de la douleur clinique ont fait l’objet de publications réexaminant l’ensemble de leurs caractéristiques métrologiques. ÉVALUATION DE LA DOULEUR ■ LA VALIDATION DES OUTILS D’ÉVALUATION DE LA DOULEUR 45 Upsa Méthodo essais 2002 18/10/02 15:57 Page 46 ■ LE DÉROULEMENT DE L’ESSAI CLINIQUE ◗ Quelques questions fréquentes •Faut-il éliminer les placebo-répondeurs ? La réponse à cette question souvent posée est simple : les placeborépondeurs ne doivent pas être éliminés. Il ne faut, en effet, pas confondre les notions de placebo-répondeur et de placebo-discriminateur. Un patient qui répond au placebo peut malgré tout faire la différence avec le verum. •Le placebo est-il éthique ? ÉVALUATION DE LA DOULEUR Il n’est pas facile de répondre à cette question. On peut décider de faire l’économie d’un placebo en basant l’étude sur une molécule de référence, ce qui suppose souvent de faire l’hypothèse que la molécule étudiée sera plus efficace que la molécule de référence.Cependant,pour des raisons méthodologiques, il est rarement satisfaisant de se passer d’un placebo. C’est pourquoi, il est souvent nécessaire de faire un compromis entre ce qui est acceptable sur un plan scientifique et ce qui est acceptable sur un plan éthique. Une autre question importante est celle de l’information du patient sur le placebo. Il ne semble pas que les bonnes pratiques, avec notamment l’information et le consentement, aient modifié la survenue de l’effet placebo. 46 ◗ La comparabilité des groupes Lorsque l’on procède à des études sur des groupes parallèles, il est essentiel de s’assurer que les groupes sont comparables. Dans cette perspective, on retient bien évidemment les critères diagnostiques habituels. Mais il faut aussi prendre en compte les variables de la douleur susceptibles de créer une hétérogénéité comme l’ancienneté de la douleur, son intensité ou le degré de handicap. Par exemple, il ne serait pas logique d’inclure dans la même étude des patients au stade aigu et chronique d’un zona. Upsa Méthodo essais 2002 18/10/02 15:57 Page 47 ◗ La sélection des malades sur l’aptitude à s’évaluer Si une grande rigueur est souvent observée en termes de critères d’inclusion et d’exclusion, on peut regretter qu’il ne soit pas toujours vérifié que les sujets participant aux essais sachent utiliser correctement un outil d’évaluation. Il faut savoir que dans une population non-sélectionnée, environ 18 % à 25 % des sujets ne savent pas utiliser une échelle visuelle analogique (EVA). Une mauvaise appréhension de l’aptitude des patients à s’auto-évaluer se traduit donc par un manque de fiabilité des réponses qui se répercute directement sur la pertinence de l’étude. Pour remédier à ce type de problème, il faut donc sélectionner les patients sur leur aptitude à répondre, intégrer dans les critères d’inclusion des tests permettant de contrôler cette aptitude et standardiser les explications. Il est certain que ce type de raisonnement peut conduire à écarter, par exemple, les enfants et les personnes très âgées des essais cliniques, ce qui pose des problèmes pour documenter les possibilités thérapeutiques pour cette catégorie de malades. Si les essais cliniques sont souvent très rigoureux en termes d’échelle, on s’aperçoit que la définition claire de la douleur à évaluer n’est pas suffisamment explicite dans la question posée. Par exemple, la question de l’intensité de la douleur ne précise pas toujours s’il s’agit de la douleur ressentie au moment présent, depuis une heure ou depuis une journée. Les douleurs provoquées par l’activité peuvent être difficiles à évaluer. En effet, il faut que le patient accepte de réaliser une performance qui le fasse souffrir. Le plus souvent, le patient forme son jugement par anticipation du niveau possible de douleur. Pour des raisons méthodologiques, les essais cliniques se basent donc plus souvent sur les douleurs spontanées que sur les douleurs provoquées par une activité qu’il faudrait standardiser. Enfin, la douleur à l’inclusion doit avoir un niveau suffisant pour permettre la mise en évidence des variations des scores sous l’effet du traitement. ÉVALUATION DE LA DOULEUR ◗ Définir la douleur à étudier 47 Upsa Méthodo essais 2002 18/10/02 15:57 Page 48 ■ LES ÉCHELLES ◗ L’échelle verbale simple (EVS) L’échelle verbale simple est une échelle ordinale qui fonctionne par catégorie (douleur absente/faible/modérée/intense) et à laquelle un score est imputé (0, 1, 2 ou 3). Dans les essais internationaux, cette échelle pose des problèmes sémantiques car il n’est pas facile de traduire des termes comme “severe pain”. L’échelle verbale simple présente l’avantage d’être facile à comprendre, de permettre une réponse rapide et de pouvoir se prévaloir d’une certaine validité descriptive. En revanche, le nombre limité de catégories peut être responsable de choix forcés. En effet, supposons qu’un patient qui souffrait d’une douleur intense se sente un peu mieux, il n’aura d’autre choix que de qualifier sa douleur de modérée. Or, il aurait peutêtre traduit l’évolution de sa douleur d’une manière moins radicale s’il avait disposé d’une échelle de type visuelle analogique ou numérique. En définitive, le faible nombre de catégories de l’échelle verbale simple pénalise cet instrument qui a, par ailleurs, l’avantage d’être facilement compris. ÉVALUATION DE LA DOULEUR ◗ L’échelle numérique (EN) 48 Le patient indique sur une échelle de 0 (pas de douleur) à 10 (douleur maximale) le niveau de sa douleur au moment présent ou le niveau de la douleur ressentie de manière générale au cours des dernières 24 heures. L’échelle numérique, qui est un bon instrument pour la routine clinique, a été peu utilisée pour les essais contrôlés. ◗ L’échelle visuelle analogique (EVA) Cet instrument est aujourd’hui devenu un standard dans les essais cliniques portant sur la perception de la douleur.L’échelle visuelle analogique est une échelle ordinale bien que certains auteurs, comme Price, la désignent comme une échelle de rapport en raison de sa capacité descriptive. Upsa Méthodo essais 2002 18/10/02 15:57 Page 49 Aujourd’hui, il n’existe pas de réel consensus sur la définition de l’extrémité supérieure de l’échelle visuelle analogique.Selon les réglettes,cette extrémité sera désignée comme une “douleur extrême”, une “douleur insupportable”.“Douleur maximale imaginable” est toutefois la terminologie la plus fréquente qu’il faut recommander. Évaluer une douleur, entre l’absence de douleur et la douleur insupportable,place les patients dans le registre de la tolérance,c’est-à-dire dans une dimension affective. Par conséquent, il faut garder à l’esprit que l’échelle visuelle analogique intègre un ensemble de composantes de la douleur : affective et sensorielle. Le traitement des données issues des échelles visuelles analogiques s’effectue en termes de moyennes et de médianes. Ces échelles sont simples à utiliser et présentent une bonne sensibilité. Néanmoins, il convient d’accepter que certains patients ne sont pas aptes à les utiliser, et ce malgré les explications fournies. Enfin, il faut se rappeler que l’utilisation de l’échelle visuelle analogique réclame une coordination motrice qui n’est pas toujours évidente à obtenir en période post-opératoire. La littérature ne permet pas de préciser à partir de quelle ampleur une variation sur l’échelle est pertinente sur le plan clinique. Souvent, on estime que la variation est pertinente à partir de 10 millimètres. Échelles globales : forces et faiblesses • Validité . . . . . . . . . . . . . . . . . . . . . . . . . .EVA=EVS=EN • Sensibilité . . . . . . . . . . . . . . . . . . . . . . . . .EVA>EVS, EN ? • Facilité de compréhension . . . . . . . . . . . . . .EVA<EN<EVS • Facilité de passation . . . . . . . . . . . . . . . . .EVA=EVS=EN • Adhésion du malade . . . . . . . . . . . . . . . . .EVA<EN<EVS • Risque d'erreur de score . . . . . . . . . . . . . . .EVA>EVS=EN D’après Jensen, 1992 ÉVALUATION DE LA DOULEUR ◗ Les forces et les faiblesses des échelles globales 49 Upsa Méthodo essais 2002 18/10/02 15:57 Page 50 L’EVA possède une sensibilité supérieure à l’EVS. Elle présente également un avantage certain en termes de risques d’erreurs de score. Pour limiter ces risques, il est préférable que l’EVA soit remplie directement dans le cahier d’observation. Lorsque ce cahier est photocopié, il est important de s’assurer que l’échelle est respectée sur la copie.En termes de validité et de facilité d’utilisation,les trois échelles sont réputées équivalentes. Enfin, l’EVS permet d’obtenir de meilleurs résultats en ce qui concerne la facilité de compréhension et l’adhésion du malade. ◗ Les relations entre l’EVA et l’EVS Nous savons qu’il existe une bonne corrélation entre les résultats obtenus avec l’EVA et l’EVS. Des travaux réalisés par Collins en 1997 ont montré que les patients souffrant d’une douleur modérée plaçaient en moyenne cette douleur à 49 mm sur une EVA et que 90 % d’entre eux la plaçaient à plus de 26 mm. Ces auteurs ont également montré que les patients souffrant d’une douleur intense plaçaient en moyenne cette douleur à 75 mm sur une EVA et que 90 % d’entre eux la plaçaient à plus de 49 mm. Il n’est pas certain que ces relations soient identiques dans des modèles de douleur chronique. Parfois un douloureux chronique se dit moins gêné par l’intensité de sa douleur que par son caractère continu, quotidien depuis de nombreuses années. ÉVALUATION DE LA DOULEUR ◗ Mesure d’intensité et de soulagement 50 L’EVA, l’EVS et l’EN peuvent être utilisées pour mesurer l’intensité de la douleur mais aussi pour mesurer l’ampleur du soulagement. Lorsqu’il évalue son soulagement, le patient doit faire référence à une douleur antérieure, ce qui peut introduire un biais dû à la mémoire de la douleur initiale. Mais nous ne savons pas en fait si ce biais conduit à surestimer ou à sous-estimer la douleur. Les échelles d’intensité permettent très rapidement de s’assurer que les groupes testés sont homogènes à l’inclusion, ce qui n’est pas le cas des échelles de soulagement. En effet, il faut savoir que la description en critère principal des différences d’intensité douloureuse peut masquer une hétérogénéité initiale, ce qui est un facteur de biais. Upsa Méthodo essais 2002 18/10/02 15:57 Page 51 Pour mesurer le critère principal de la douleur, il est préférable d’avoir recours à l’EVA. Une EVS ou une échelle numérique de soulagement peuvent être utilisées pour mesurer le critère secondaire. Dans les études sur la douleur chronique, il faut associer l’analyse de la perception de la douleur à celles des capacités fonctionnelles et de la qualité de vie. ◗ Refléter la dynamique de l’effet La dynamique de l’effet est d’autant plus simple à dégager que les études portent sur un temps court. Des indices tels que SPID (Sum of Pain Intensity Differences) ou TOTPAR (Total Pain Relief) nous aident à résumer cette dynamique. ◗ Critère de succès ◗ La nécessité d’une évaluation globale En fin d’essai, il est intéressant de conduire une évaluation globale intégrant les paramètres d’efficacité du traitement ainsi que les effets indésirables. L’une des échelles globales couramment utilisées est l’échelle CGI (Clinical Global Impression). Les descriptions synthétiques de l’effet d’une substance qui permettent de résumer,avec un seul marqueur,l’ensemble des résultats d’une étude sur six heures (SPID,TOTPAR) sont très intéressantes, notamment pour réaliser des comparaisons. ÉVALUATION DE LA DOULEUR Souvent, nous sommes amenés à choisir un critère de succès en complément d’un critère sensible mais insuffisamment descriptif. En 1957, Beecher a introduit un critère très significatif sur le plan clinique en demandant aux patients s’ils se sentaient, ou non, soulagés de 50 %. Mc Quay a repris cet indice dans ses méta-analyses. Un critère comparable a été défini pour les migraines : la disparition de la douleur à deux heures. Ce type de critère est très parlant pour le praticien. Il est aussi exigeant, ce qui a conduit à le modifier en admettant une douleur absente et/ou faible au bout de deux heures. 51 Upsa Méthodo essais 2002 18/10/02 15:57 Page 52 ◗ La dimension sensorielle et la dimension affective Les équipes de Price et Gracely ont travaillé sur la discrimination de la dimension sensorielle et de la dimension affective. Dans cette perspective, ils ont demandé aux patients d’évaluer sur des échelles (EVA ou EVS),l’intensité de leur sensation,d’une part,et le caractère désagréable de la sensation, d’autre part. Avant de conduire une telle étude, il est important d’expliquer au patient que, comme en musique, l’intensité ne présente pas nécessairement de lien avec son caractère agréable ou désagréable. En situation clinique, il semble que le questionnaire de Mc Gill soit le plus approprié pour opérer une distinction entre la dimension sensorielle et la dimension affective de la douleur. Certains résultats observés avec le fentanyl sont intéressants. Ils montrent une diminution de l’intensité de la douleur mais pas son caractère désagréable. Cette absence d’effet observé sur la composante affective s’explique peut-être par les effets secondaires associés dans cette étude (nausées notamment). ■ LES QUESTIONNAIRES DE VOCABULAIRE ÉVALUATION DE LA DOULEUR La littérature considère que le questionnaire de Mc Gill est validé. Toutefois, ce questionnaire relativement long puisqu’il comporte 82 items, gagnerait à faire l’objet d’une simplification et d’une révision de sa structure factorielle. 52 À notre avis, le questionnaire de Mc Gill présente deux potentialités irremplaçables : premièrement, il permet d’isoler la description neurogène de la douleur ; deuxièmement, il permet d’évaluer la dimension affective de la douleur, qui est différente de la dimension anxieuse ou dépressive. Les malades désignés comme non-communicants sont principalement les jeunes enfants et les personnes âgées pour lesquelles des échelles d’évaluation sont en cours de validation. Ils ne peuvent pas, bien entendu, être évalués par ce type d’instruments, ni par les échelles globales (EVA, EVS, EN). Upsa Méthodo essais 2002 18/10/02 15:57 Page 53 ■ RETENTISSEMENT ET QUALITÉ DE VIE Pour les cliniciens, il est important de pouvoir s’appuyer sur des outils valides permettant de décrire la symptomatologie douloureuse chronique. De nombreux questionnaires existent. Il paraît important de citer le questionnaire MPI (Multidimensional Pain Inventory) qui existe en plusieurs langues. La première partie de ce questionnaire comporte 28 items et 5 sous-échelles permettant d’analyser l’intensité de la douleur, l’interférence, le niveau de contrôle de la personne sur son état, la détresse affective et le retentissement sur l’environnement. Bien que le MPI soit plutôt destiné à un travail exploratoire sur la douleur, il présente une valeur descriptive intéressante. La qualité de vie s’évalue au travers de la perception du patient de son état de santé dans quatre domaines : le fonctionnement physique, l’état psychologique, les interactions sociales et les sensations physiques. Aujourd’hui, il apparaît clairement que l’évaluation de la douleur chronique doit prendre en compte ce concept pluridimensionnel. Travail Loisirs Émotion Affect Vie à la maison Sommeil Repos Alimentation Déambulation Mobilité Communication Interaction sociale Énergie NHP (36 items) SF-36 (36 items) Douleur Douleur Émotion Émotion Santé mentale Sommeil Mobilité physique Isolement social Énergie Prob. physiques Fonct. physique Fonct. social Santé en général ÉVALUATION DE LA DOULEUR SIP (136 items) 53 Upsa Méthodo essais 2002 18/10/02 15:57 Page 54 Pour évaluer la qualité de vie, nous avons à notre disposition des échelles génériques, c’est-à-dire des échelles utilisables pour toutes les catégories de patients, et des échelles spécifiques, c’est-à-dire des échelles adaptées à une population donnée (par exemple, les malades souffrant de lombalgies). Les questionnaires les plus utilisés pour évaluer la qualité de vie sont le SIP (Sickness Impact Profile) qui comporte 136 items, ce qui requiert une forte adhésion de la part des patients, le NHP (Nottingham Health Profile) et le SF 36 qui comportent tous deux 36 items (voir tableau page 53). Mais, quel que soit le questionnaire utilisé, l’essentiel pour le praticien est surtout de savoir définir les dimensions de la douleur qu’il cherche à évaluer. ■ CONCLUSION ÉVALUATION DE LA DOULEUR Les essais cliniques exigent qualité et rigueur dans leur mise en œuvre. Si nous voulons parvenir à faire évoluer les conceptions dans le domaine de la douleur, il nous faut adopter les mêmes exigences. Ceci laisse une place limitée aux rapports anecdotiques sur quelques cas. Il est sans doute déterminant que les experts motivés qui travaillent sur la douleur puissent échanger leur savoir-faire dans un groupe d’intérêt qu’il est important de mettre en place. 54 Upsa Méthodo essais 2002 18/10/02 15:57 Page 55 Évaluation de la douleur clinique chez l’enfant Annie Gauvain-Piquard ■ LA NOTION DE CONSTRUIT ◗ Définition Lorsque l’on observe de fortes corrélations entre des données, on peut émettre l’hypothèse qu’elles correspondent à un seul phénomène que l’on appellera le construit. Par définition, la douleur est un construit puisqu’elle correspond à des phénomènes divers observés en clinique qui peuvent être regroupés sous cette notion. Il faut bien prendre conscience que c’est initialement une théorie (aujourd’hui confortée par la physio-pathologie) qui a amené à supposer que des phénomènes qui affectent des parties du corps humain aussi différentes que la colonne vertébrale ou une dent relevaient d’une même notion. Pour relier les phénomènes observés au construit lui-même, les cliniciens établissent des mesures qui jouent le rôle d’intermédiaires entre la théorie formulée et les observations. Il faut, d’une part, vérifier que les mesures mises en œuvre sont fiables, et, d’autre part, s’assurer que l’objet des mesures correspond véritablement à un construit. ÉVALUATION DE LA DOULEUR En France, les recherches sur la douleur ne se sont pas suffisamment placées dans le registre des variables subjectives. Pourtant, ces variables ont fait l’objet de recherches importantes, notamment dans les années cinquante et soixante. En particulier, l’American Psychology Association a édité des recommandations sur la validation des échelles qui sont malheureusement peu connues en France. Ces recommandations reposent essentiellement sur la notion de construit (d’après le terme anglais “construct”), une notion couramment utilisée dans la littérature américaine relevant de la psychométrie. 55 Upsa Méthodo essais 2002 18/10/02 15:57 Page 56 ◗ La validation La validation du construit Pour valider un construit, il faut respecter les étapes suivantes : • spécifier le domaine des observables : il s’agit de dresser la liste des variables utilisables pour évaluer le construit. • évaluer la cohérence interne des observations : il s’agit d’étudier le degré de corrélation entre les différents outils disponibles. Cela permet de déterminer si le construit sur lequel repose la théorie est indivisible ou s’il doit, au contraire, être subdivisé en plusieurs construits. La douleur chez l’adulte peut être scindée en au moins deux sous-construits : l’auto-évaluation et l’évaluation comportementale. En effet, on obtient de très fortes corrélations entre les différents outils qui permettent d’auto-évaluer la douleur chez l’adulte, mais, en revanche, la corrélation entre l’auto-évaluation et l’évaluation comportementale est relativement faible (1). ÉVALUATION DE LA DOULEUR La validation des échelles 56 La validation d’une échelle ne consiste pas à énumérer un certain nombre de qualités mais à respecter un processus.Tout d’abord, il faut s’assurer de la validité de contenu, ce qui suppose de vérifier que l’on n’a pas omis certaines composantes. Ensuite, il convient de savoir si l’on se trouve ou non dans une situation où il existe un “Gold Standard”. Lorsque c’est le cas, comme pour le construit de la douleur chez l’adulte, on peut se contenter d’utiliser l’échelle à valider conjointement au “Gold Standard” (ici l’EVA). Lorsque ce n’est pas le cas, comme pour le construit de la douleur chez l’enfant, il est nécessaire de vérifier que ce que l’on évalue correspond bien à la théorie qui sous-tend les recherches (validité du construit). Par exemple, on peut émettre l’hypothèse qu’un enfant opéré pour une hernie inguinale n’aura pas mal le jour de l’hospitalisation, aura mal après l’intervention et que cette douleur ira en décroissant. Si l’échelle à valider fournit des données confirmant l’hypothèse, un argument de validité de construit est apporté. Upsa Méthodo essais 2002 18/10/02 15:57 Page 57 ■ L’AUTO-ÉVALUATION DE LA DOULEUR ◗ L’Échelle Visuelle Analogique L’EVA reste l’outil standard de l’auto-évaluation de la douleur chez l’enfant de plus de six ans. En pédiatrie, cet outil est utilisé de manière verticale car le jeune enfant possède un sens de la verticalité développé. Le sens de l’horizontalité viendra plus tard, avec la maîtrise de l’écriture. L’expérience montre que la forme de l’EVA ne joue pas un rôle fondamental. En effet, des études qui se sont fondées sur plusieurs formes d’EVA présentent de très forts taux de corrélations (2). Par conséquent, il ne semble pas nécessaire de poursuivre les recherches sur l’adaptation des EVA à l’enfant. L’essentiel est de savoir développer une échelle d’évaluation adaptée à l’enfant sur un plan cognitif et d’éviter un certain nombre d'erreurs. Nous savons notamment que les gradients de couleur (du bleu au rouge) peuvent fausser les résultats. C’est, par exemple, le cas si les petites filles choisissent la couleur rose tout simplement parce qu’elles aiment intrinsèquement cette couleur. ◗ Les outils basés sur l’expression faciale de la douleur L’expression faciale universelle de la douleur Ces outils reposent sur le principe que l’on peut décrire chez l’être humain une expression faciale universelle de la douleur se caractérisant notamment par l’accentuation du sillon naso-labial et par le froncement des sourcils. Reste alors à savoir si le jeune enfant est en mesure d’identifier un niveau de douleur à partir d’expressions faciales. Nous savons que dès l’âge de trois mois un nouveau-né dispose d’une certaine aptitude à distinguer plusieurs expressions faciales. En revanche, nous ne savons pas à partir de quel âge l’enfant est apte à reconnaître l’expression faciale de la douleur. En outre, chez l’adulte, ÉVALUATION DE LA DOULEUR Une étude, financée notamment par l’Institut Upsa de la Douleur, a permis de tester un outil dérivé des échelles analogiques : l’algocube. Nous savons d’ores et déjà que cet outil présente, au-delà de six ans, un très fort taux de corrélation avec les autres outils d’auto-évaluation de la douleur. 57 Upsa Méthodo essais 2002 18/10/02 15:57 Page 58 cette aptitude est assez inconstante et hétérogène. Par ailleurs, il est connu qu’un enfant de moins de cinq ans n’est pas capable d’effectuer un choix parmi plus de cinq options. Les visages dessinés Par le passé, nous avons observé une très mauvaise corrélation entre certains outils d’expression faciale de la douleur et les EVA. Mais il faut préciser que ces outils présentaient des défauts majeurs. Premièrement, ils associaient l’absence de douleur à un visage souriant en se basant sur une théorie psychologique inexacte supposant que la douleur s’opposait au plaisir. Or, des études postérieures ont montré que l’être humain n’associe pas l’absence de douleur à un visage qui sourit mais plutôt à un visage neutre. Deuxièmement, ces outils commettaient l’erreur d’associer la douleur intense aux larmes, ce qui peut entraîner un biais dans les réponses des petits garçons à qui l’on défend de pleurer sous prétexte qu’ils sont des hommes. Si l’on décidait de travailler sérieusement sur des échelles de visages dessinés, il serait préférable de concevoir de nouveaux outils sur la base des connaissances dont nous disposons désormais. ÉVALUATION DE LA DOULEUR Les visages photographiés 58 Des infirmières ont développé une échelle de visages photographiés, connue sous le nom d’échelle Oucher. La première photographie est celle d’un visage neutre et les suivantes font apparaître de manière progressive l’expression faciale de la douleur. Une nouvelle version de l’échelle Oucher, actuellement en cours d’élaboration, a été présentée lors du congrès sur la douleur de l’enfant qui s’est tenu en l’an 2000 au Royaume-Uni. Précisons que l’échelle Oucher présente une bonne validité ainsi qu’une très forte corrélation avec l’EVA. Notons aussi que cette échelle a été adaptée à différentes populations ethniques. ◗ Autres outils Pour l’instant, les échelles verbales n’ont pas été étudiées chez l’enfant et nous sommes d’ailleurs incapables de savoir à partir de quel âge elles pourront être utilisées.En tout état de cause,il n’existe aucun consensus sur l’idée que peut se faire un enfant d’une douleur faible, modérée ou Upsa Méthodo essais 2002 18/10/02 15:57 Page 59 intense. En revanche, la localisation de la douleur sur un schéma présente une fiabilité assez bonne chez l’enfant. ◗ Corrélations Il existe, dans la littérature, au moins 48 comparaisons entre deux autoévaluations qui font apparaître une corrélation systématiquement supérieure à 0,60 dans les études d’auto-évaluation de la douleur chez les enfants de plus de six ans. Pour cette population, nous disposons donc d’un construit d’auto-évaluation solide et homogène. Les études d’auto-évaluation réalisées chez les enfants de plus de 6 ans ont permis de constater que les 6/11 ans et les 12/17 ans n’évaluaient pas leur douleur de la même manière. Une étude sur la douleur liée à la polyarthrite juvénile a ainsi montré que le groupe le plus jeune donnait des scores plus étalés que les plus âgés et que son score moyen était plus bas. Pour expliquer ce phénomène, qui a été observé pour plusieurs pathologies chroniques, nous avons avancé l’hypothèse que les jeunes enfants avaient des difficultés à exprimer une plainte vis-à-vis de douleurs permanentes ou chroniques d’origine interne et à se situer par rapport à la normalité. En fait, pour un enfant de six à huit ans qui souffre en permanence,la normalité ne correspond probablement plus à un état sans douleur. En revanche, le phénomène inverse se produit pour les douleurs aiguës qui seront évaluées avec des scores plus élevés par le groupe des 6/11 ans que par le groupe des 12/17 ans. Une étude (qui demande encore à être confirmée) a indiqué que cet écart se manifestait principalement dans la composante sensorielle de la douleur. ■ L’HÉTÉRO-ÉVALUATION Actuellement, environ neuf échelles permettent de procéder à une hétéro-évaluation de la douleur chez l’enfant et huit échelles permettent de procéder à une hétéro-évaluation de la douleur chez le nouveau-né et le prématuré. Elles reposent sur : ÉVALUATION DE LA DOULEUR ◗ L’influence de l’âge 59 Upsa Méthodo essais 2002 18/10/02 15:57 Page 60 ◗ Les réactions à la douleur Un consensus s’est établi sur le fait que la douleur provoque deux types de réactions : • une réaction immédiate : elle est à la fois comportementale (agitation/cris) et physiologique (stress). • une réaction d’adaptation et d’évitement : cette réaction conduit à des positions antalgiques de plus en plus nettes et à une inertie psychomotrice. Concrètement, elle pousse l’enfant à devenir immobile. ÉVALUATION DE LA DOULEUR ◗ Les comportements 60 Trois grandes catégories de comportements ont été recensées : • les comportements émotionnels : les chercheurs américains les décrivent comme une réaction à la douleur aiguë, à laquelle s’associent des phénomènes physiologiques tels que tachycardie ou élévation de la tension artérielle. L’accent est aujourd’hui porté sur l’expression faciale de la douleur aiguë, d’autant plus que nous disposons d’un corpus de données nous permettant de nous assurer de la validité de cet outil. L’accentuation du sillon naso-labial et du froncement des sourcils sont désormais considérés comme des signes flagrants de l’expression de la douleur chez l’enfant comme chez le nouveau-né. • l’adaptation défensive du corps : cette adaptation, qui se traduit par des positions antalgiques et des contractures, apparaît en phase de douleur aiguë et se poursuit en cas de douleur prolongée. • l’inertie psychomotrice :elle apparaît en quelques heures et conduit au tableau d’un enfant immobile et indifférent, dont les activités de base sont perturbées (boire, manger, jouer, dormir…). ◗ Les échelles comportementales Aujourd’hui, nous nous retrouvons face à une pléthore d’outils, ce qui peut entraîner une certaine confusion.Le moment est venu de prendre du recul et de revoir la question du construit du comportement face à la douleur. Pour l’instant, les corrélations entre les différents outils d’hétéro-évaluation restent très mauvaises. Une revue de la littérature a fait apparaître seulement cinq corrélations entre les outils d’hétéro-évaluation et les outils d’auto-évaluation utilisés en hétéro-évaluation. Pour les parents, ces corrélations sont toutes Upsa Méthodo essais 2002 18/10/02 15:57 Page 61 inférieures à 0,5. Pour les trois corrélations observées lorsque l’outil est utilisé par une infirmière, les corrélations sont meilleures puisqu’elles sont supérieures à 0,75. Par ailleurs, l’étude de la corrélation entre un outil utilisé par un parent et un outil utilisé par une infirmière fait apparaître une grande dispersion de score (5 données). Contrairement à ce que certains espéraient, l’hétéro-évaluation par les parents ne résout pas le problème de l’évaluation de la douleur chez l’enfant. ■ L’ABSENCE DE VÉRITABLES CORRÉLATIONS ENTRE AUTO ET HÉTÉRO-ÉVALUATION La revue de la littérature fait apparaître 22 corrélations entre les outils d’auto-évaluation et les échelles de comportement dont 14 sont inférieures à 0,60. Jusqu’à présent, nous n’avons pas été en mesure de trouver par quelles lois ces corrélations étaient régies. Précisons que sur les 22 corrélations recensées dans la littérature,18 portent sur la douleur aiguë et seulement 3 sur la douleur chronique. Sur quatre études utilisant l’échelle Chéops en post-opératoire, seule une peut se prévaloir d’une bonne corrélation avec les outils d’auto-évaluation. De manière générale, il semble que nous progressons peu dans l’évaluation des plus jeunes. ÉVALUATION DE LA DOULEUR Lorsque l’on étudie la corrélation entre les outils d’auto-évaluation utilisés en auto-évaluation par les enfants et en hétéro-évaluation par les parents (9 comparaisons),les corrélations sont faibles (6 sont inférieures à 0,60) et présentent une grande dispersion. Lorsque cette corrélation est pratiquée avec des infirmières (11 corrélations), la corrélation n’est pas non plus satisfaisante (9 sont inférieures à 0,60). Les corrélations entre l’hétéro-évaluation par un adulte et l’auto-évaluation par un enfant sur le même outil sont meilleures pour les enfants de plus de huit ou dix ans. 61 Upsa Méthodo essais 2002 18/10/02 15:57 Page 62 ÉVALUATION DE LA DOULEUR ■ CONCLUSION 62 Les échelles existantes sont satisfaisantes en termes psychométriques. En revanche, des progrès doivent être réalisés sur la validation du construit.Ils devraient nous permettre de mieux comprendre ce que ces échelles évaluent véritablement. Précisons que si ces études ont été largement développées au Royaume-Uni et aux États-Unis, cela n’a pas encore été le cas en France. Pour évaluer la validité du construit, plusieurs types d’études sont possibles : • l’étude de la structure factorielle ; • l’étude de la validité de trait grâce à des échelles permettant d’évaluer des phénomènes connexes comme le stress ou l’anxiété. Il faudra alors émettre des hypothèses sur le degré de corrélation entre la douleur et le stress ou entre la douleur et l’anxiété ; • la validité nomologique dont l’évaluation repose notamment sur le design des groupes extrêmes.Ce design consiste à séparer deux groupes de patients très distincts sur la base d’un critère extérieur à la douleur en prenant l’hypothèse qu’un groupe ressent une douleur quasi inexistante alors que l’autre ressent une douleur importante. Par exemple, une étude française a porté sur l’évaluation de la douleur prolongée chez cent nouveau-nés en maternité (3). Sur la base du dossier obstétrical, ces nouveau-nés ont été classés en deux catégories : les nouveau-nés qui avaient eu une naissance facile et les nouveau-nés qui avaient eu une naissance plus difficile. Cette étude a permis de montrer que les scores de douleur étaient beaucoup plus bas pour les bébés qui avaient bénéficié d’une naissance facile. L’essai thérapeutique donne également des arguments de validité nomologique qui méritent d’être étudiés pour évaluer la validité de construit. De manière générale, il faut savoir faire preuve de créativité pour avancer dans l’évaluation de la douleur chez l’enfant. Bibliographie 1. Jensen M.P. : Validity of self-report and observation measures - In : proceedings of the 8th world congress on pain, progress in pain research and management vol 8, Ed : T.S. Jensen, J.A Turner, IASP Press, 1997. 2. Mc Grath : a new analogue scale fot assessing children’s pain : an initial validation study - Pain 64 (1996) 435-443. 3. Lassauge F., Gauvain-Piquard A., Paris I : validité de construit de l’Échelle de Douleur et d’Inconfort du Nouveau-né (EDIN) - Douleur et analgésie, 1998, 4, 173-177. Upsa Méthodo essais 2002 18/10/02 15:57 Page 63 Le soulagement : indice de la douleur ou de la qualité de la vie ? Jocelyne Feine Pour évaluer le succès d’un traitement donné, il faut d’abord savoir quel est l’objectif visé. Pour la douleur, il convient de distinguer entre pathologie aiguë et pathologie chronique. Dans le premier cas, il est possible de soulager la douleur rapidement tandis que dans le deuxième, le nombre de thérapeutiques envisageables est plus large. Le soulagement de la douleur aiguë peut être mesuré selon des rapports sur la douleur ou des rapports sur le soulagement. Il peut également être estimé en fonction de la réponse du malade à une stimulation ou à un médicament. Les mêmes indices peuvent être utilisés lorsqu’il s’agit de douleur chronique, mais il faut y ajouter la capacité d’accomplir des tâches de la vie quotidienne, le désir de recevoir des soins supplémentaires et la qualité de vie. L’évaluation du soulagement suppose que le malade se souvienne précisément de la douleur avant la mise en place du traitement et puisse la comparer à celle après le traitement. Nous proposons l’équation suivante : soulagement perçu = douleur avant traitement – douleur actuelle. Ne disposant pas de données sur la douleur aiguë, nous nous sommes appuyés sur les études de McQuay et al.Le rapport négatif entre le changement chez le patient et l’indice de soulagement indique que cette équation peut s’appliquer à la douleur aiguë (voir figure p 64). Quant au soulagement de la douleur chronique, nous avons mené une étude pour connaître l’efficacité d’un appareil dentaire type gouttière sur la douleur myofasciale des muscles manducateurs. Le groupe expérimental a porté l’appareil 24 heures par jour. Le premier Groupe de contrôle a porté un appareil placebo 24 heures par jour tandis que le deuxième Groupe de contrôle n’a porté l’appareil placebo que lors des ÉVALUATION DE LA DOULEUR ■ COMMENT MESURER LA DOULEUR ? 63 Upsa Méthodo essais 2002 18/10/02 15:57 Page 64 Évaluation du soulagement dans la douleur aiguë Somme de la différence de l’intensité de la douleur (VAS-SPID) 200 100 0 100 200 300 Soulagement total (VAS-TOTPAR) ÉVALUATION DE LA DOULEUR D’après McQuay et al, 1985, 1987, 1990 64 visites. Parallèlement à l’évaluation de la douleur, nous nous sommes intéressés à la mémoire de la douleur chez les malades ainsi qu’à leur perception du soulagement. L'intensité de la douleur et l'inconfort ont diminué avec le temps pour chacun des trois groupes. Néanmoins, il n'y a pas eu de différences entre eux. Malgré tout, le groupe qui portait l'appareil pendant les visites a présenté significativement moins de soulagement que les deux autres groupes, qui portaient l'appareil 24 heures sur 24. De plus, tous les patients ont rapporté un soulagement, même quand la douleur a augmenté.Le soulagement perçu est donc significativement plus élevé que le soulagement réel. Ceci suggère que d'autres facteurs peuvent influencer la cotation des patients vis-à-vis du soulagement qu'ils perçoivent après traitement. Nous avons donc conclu que l’équation proposée n’était pas valable et avons décidé d’étudier de plus près la mémoire des patients. D’autres études s’étaient déjà intéressées à ce sujet et avaient abouti à la conclusion suivante : les patients ne conservent pas un souvenir précis de leur douleur. Nous avons pu constater également que les malades dont la douleur était moins intense (moins de 50 millimètres sur une échelle visuelle analogique de 100 millimètres) avaient tendance à exagérer la douleur initiale. À l’inverse, les patients dont la douleur était plus forte avaient tendance à en diminuer l’intensité rétrospectivement. Les erreurs de mémoire augmentent donc avec le temps. Upsa Méthodo essais 2002 18/10/02 15:57 Page 65 En utilisant l’ensemble des variables définies, nous avons tenté de créer un modèle pour l’évaluation du soulagement. Le temps écoulé, le souvenir de la douleur, la douleur actuelle et les différents traitements ont fortement influé sur les indices finaux. Seul le soulagement réel n’a pas joué un rôle important. La perception du soulagement est particulièrement peu fiable comme indice de changement de la douleur puisqu’elle est quasiment imprévisible. McQuay affirme que les indices de soulagement sont plus sensibles aux traitements que les indices d’intensité de la douleur, mais il n’explique malheureusement pas son raisonnement. Nos études ayant démontré que les indices de soulagement ne sont pas une représentation juste du changement opéré, nous étions perplexes et avons décidé de nous référer à McQuay une fois de plus. Il indique à ce sujet que « le soulagement renferme peut-être des éléments annexes que n’inclut pas la notion d’intensité. En effet, tout effet secondaire, comme la nausée, peut être pris en compte par le malade ». Notre hypothèse est la suivante : l’indice de soulagement de la douleur chronique présente une corrélation positive et significative avec l’indice de qualité de vie. La qualité de vie en matière de santé renferme l’effet d’une pathologie et de la thérapeutique sur le patient,tel qu’il est perçu par ce patient.Les études sur la qualité de vie portent sur quatre grands domaines : la mobilité physique, l’état émotionnel, l’interaction sociale et la sensation somatique et viscérale. La qualité de vie sera d’autant plus importante au XXIe siècle que la grande majorité des maladies seront chroniques et de longue durée. La médecine propose peu de solutions à ces problèmes.Les malades,quant à eux, souhaitent savoir comment leur maladie et le traitement proposé les affecteront dans leur vie quotidienne. La biochimie les intéresse peu. Si un nouveau traitement pouvait garantir une meilleure qualité de vie, il serait préféré aux traitements existants. En 1990, Fries et Spitz avaient déjà émis cette idée, indiquant que le principe de l’évaluation du traitement représente un changement de mentalité implicite : au lieu de se baser sur les données médicales, il privilégie les éléments qui préoccupent les patients eux-mêmes. ÉVALUATION DE LA DOULEUR ■ LA QUALITÉ DE VIE 65 Upsa Méthodo essais 2002 18/10/02 15:57 Page 66 ÉVALUATION DE LA DOULEUR Il existe aujourd’hui plusieurs outils de mesure pour la qualité de vie,qui sont soit génériques, soit spécifiques. Parmi les premiers, citons le Nottingham Health Profile (Hunt et al, 1981) et le Sickness Impact Profile (Bergner et al, 1981). Les outils spécifiques comprennent par exemple l’EORTC QLQ-C30 (Aaronson et al, 1993),The Arthritis Impact Measurement Scale (Meenan, 1984), l’Inflammatory Bowel Disease Questionnaire (Guyatt et al, 1989) et le Chronic Heart Failure Questionnaire (Guyatt et al, 1989). Ceux portant sur des maladies spécifiques sont plus précis dans certaines situations mais ne permettent pas de comparer les effets de maladies différentes, comme le font les outils génériques. Ces informations peuvent être très utiles pour les décideurs politiques qui doivent répartir les fonds publics entre des pathologies différentes. L’outil EORTC QLQ-C30 (European Organisation for Research on Treatment of Cancer) fait relativement exception puisqu’il compare différents types de cancer. Les outils spécifiques peuvent également indiquer quels aspects de la qualité de vie sont altérés par la maladie ou par le traitement. Une étude sur les douleurs dorsales a par exemple révélé que la qualité de vie dépend essentiellement de la qualité du matelas du malade. Enfin, ces outils peuvent mettre en évidence les divergences entre les différentes expériences des malades. 66 Upsa Méthodo essais 2002 4. ESSAIS 18/10/02 15:57 Page 67 CLINIQUES DES ANTALGIQUES Place de la pharmacocinétique dans les essais cliniques des antalgiques Jules Desmeules ■ INTRODUCTION Dans les études pharmacocinétiques en phase I, on recherche une concentration maximale, le temps maximal où cette concentration est atteinte et une chronologie qui permettra de prédire celle des événements analgésiques. Ces études portent sur les paramètres suivants et leur évolution : le volume de distribution, qui permet de déterminer la dose de charge, la clairance, qui permet de savoir à quelle fréquence il faut administrer les doses, la linéarité de l’élimination, en fonction de la dose prévue en administration clinique et la biodisponibilité, en fonction de la voie d’administration qui correspond à la fraction de la dose administrée parvenant dans le volume sanguin. En phase II, les études pharmacocinétiques viseront à mettre en évidence une relation entre la concentration et l’action, d’une part, et entre la concentration et les effets indésirables du médicament, d’autre part. Actuellement, pour les études de phase III, nous avons de plus en plus recours à la pharmacocinétique dite de population afin d’étudier des variables comme l’âge ou le sexe, l’insuffisance rénale ou hépatique. ESSAIS CLINIQUES DES ANTALGIQUES L’objet principal de la pharmacocinétique dans les essais cliniques des antalgiques est d’évaluer la relation dose/effet dans l’optique de proposer un régime thérapeutique optimal. La pharmacocinétique permet de rationaliser le développement clinique des analgésiques. Les instances réglementaires exigent l’étude d’un certain nombre de paramètres pharmacocinétiques pour toutes les molécules : paramètres liés à l’absorption, au métabolisme, à la distribution et à l’élimination. 67 Upsa Méthodo essais 2002 18/10/02 15:57 Page 68 Pharmacocinétique des antalgiques Phase I Cmax - Tmax - Volume de distribution - Clairance Linéarité de l'élimination en fonction de la dose Biodisponibilité et modifications des paramètres PK selon le mode d'application projeté Phase II Relation concentration - effet /effets secondaires Phase III Pharmacocinétique de population Évaluation du rôle des co-variables sur la PK (âge - sexe - fonctions rénale et hépatique) ■ L’IMPORTANCE DE LA PHARMACOCINÉTIQUE DANS LE DÉVELOPPEMENT DES ANALGÉSIQUES ESSAIS CLINIQUES DES ANTALGIQUES ◗ L’exemple du tramadol : utilisation chez les populations à risques 68 Cet exemple est destiné à souligner l’importance des études de pharmacocinétique pour les populations à risque. Le tramadol est considéré comme un analgésique de deuxième palier qui agit aussi bien sur le système mono-aminergique que sur le système opioénergique.Sa biodisponibilité après administration orale est de 50 % à 60 % et il est éliminé par le foie et le rein. Le rôle de l’âge, de l’insuffisance rénale et de l’insuffisance hépatocellulaire Une étude a comparé les effets de 100 milligrammes de tramadol par voie orale dans deux groupes de volontaires sains :le premier regroupait des personnes de plus de 75 ans alors que le second regroupait des jeunes adultes. Elle a permis d’observer une augmentation très nette de la demi-vie du tramadol chez le sujet âgé liée à une diminution de sa capacité d’élimination. En clinique, il faut donc réduire les doses administrées aux patients âgés lors d’une administration répétée. En revanche, la concentration maximale obtenue après prise d’une dose unique est identique pour les deux groupes. Une étude portant sur la Upsa Méthodo essais 2002 18/10/02 15:57 Page 69 pharmacocinétique du tramadol chez les patients souffrant d’une insuffisance rénale a permis d’aboutir à la même conclusion que pour les patients âgés : il faut réduire la dose administrée en cas d’administration répétée. Une étude portant sur des patients atteints d’insuffisance hépatocellulaire (patients cirrhotiques) a montré que la demi-vie du tramadol, ainsi que la concentration maximale après prise d’une dose unique, étaient augmentées chez ces patients. Par conséquent, il faut à la fois réduire la dose initiale et les doses répétées chez cette catégorie de patients. En résumé, il faut ajuster la posologie du tramadol chez les patients de plus de 75 ans et lorsque la clairance est inférieure à 50 ml/mn. En outre,il convient de diminuer la posologie initiale en cas d’insuffisance hépatocellulaire et réduire la dose d’entretien. Le tramadol est transformé au niveau hépatique en différents métabolites actifs. Si le degré d’affinité du tramadol pour les récepteurs opioïdes est très faible, celui des métabolites actifs est beaucoup plus important. Or, à ce jour, nous ne connaissons pas l’évolution pharmacocinétique de ce type de métabolite dans les conditions pathologiques (insuffisance rénale, insuffisance hépatique). En outre, après une prise unique, la demi-vie d’un métabolite actif du tramadol est deux fois plus longue que celle de la substance mère. Compte tenu de ces résultats, on peut s’attendre à ce qu’une administration répétée de tramadol soit responsable d’une accumulation du métabolite actif et d’une augmentation de l’effet opioïde global. ◗ L’exemple du fentanyl : les problèmes de distribution et les conséquences sur la durée d’action La plupart des analgésiques n’agissent pas sur le compartiment plasmatique mais sur le système nerveux central. La pharmacocinétique des molécules très lipophiles comme le fentanyl est mieux modélisée par des modèles pluricompartimentaux. Le degré d’élimination de ces molécules varie selon que l’on administre une ESSAIS CLINIQUES DES ANTALGIQUES Limites de ces études pharmacocinétiques liées à l’étude de la substance mère - Les métabolites actifs 69 Upsa Méthodo essais 2002 18/10/02 15:57 Page 70 Variabilité pharmacocinétique en fonction de la durée d’administration Context- Sensitive Half-Time (minutes) 300 250 Fentanyl 200 Thiopental 150 100 Midazolam 50 Alfentanil Sufentanil Propofol 0 1 2 3 4 5 6 7 8 9 Infusion duration (hours) ESSAIS CLINIQUES DES ANTALGIQUES D’après Hughes et al, Anesthesiology, 1992 : 76, 334 70 dose unique ou une dose répétée. En effet, la modélisation pharmacocinétique a très clairement montré que la demi-vie du fentanyl augmente en fonction de la durée de perfusion. Chez un groupe de dix patients cancéreux, il a été montré que la demivie apparente du fentanyl après une application transdermique s’élevait à quelques jours, contre une à trois heures après une dose unique. Cette augmentation très significative de la demi-vie apparente est responsable de l’augmentation de la durée des effets. Ainsi, on peut s’attendre à des modifications pharmacocinétiques considérables selon le mode d’administration (dose unique,répétée) en particulier pour les analgésiques qui possèdent un grand volume de distribution. ◗ L’exemple du paracétamol : l’importance des modèles pharmacocinétiques et pharmacodynamiques dans le développement des analgésiques Une étude réalisée en 1988 par Carisson montre très clairement que le paracétamol agit au sein même du système nerveux central.Une relation dose/effet a pu être démontrée après l’administration de 5, 10 et 25 mg par kg chez l’animal. Upsa Méthodo essais 2002 18/10/02 15:57 Page 71 Nous avons utilisé le modèle du réflexe RIII afin de montrer l’effet central du paracétamol chez l’être humain. Ce modèle donne la possibilité de contourner les récepteurs périphériques et permet d’évaluer l’effet central des analgésiques. Dans le modèle RIII, nous avons utilisé comme comparateur l’aspirine, dont le coefficient de partage est très bas, et qui traverse mal la barrière hémato-encéphalique. Nous pensons que cette substance n’a pas d’action sur le système nerveux central, contrairement au paracétamol qui traverse bien la barrière hémato-encéphalique. Une étude pharmacocinétique de population réalisée par Bannwarth portant sur des sujets qui ont reçu du paracétamol par voie intraveineuse confirme que le pic de concentration de cette substance dans le LCR est atteint entre deux et trois heures après l’administration. Nous avons modélisé la vitesse d’absorption du paracétamol dans le système nerveux central et les concentrations obtenues dans le plasma pour une administration d’un gramme de paracétamol toutes les 6 heures, en les comparant à une administration de 4 grammes en perfusion continue pendant 24 heures. Cette comparaison montre que la distribution joue un rôle important. En effet, on obtient des concentrations beaucoup plus élevées dans le système nerveux central en ayant recours à une administration répétée que par une administration continue. Une étude contre placebo réalisée en double aveugle chez des volontaires sains a confirmé l’impact de la vitesse de perfusion sur l’effet analgésique du paracétamol. Il est apparu que si les doses répétées présentent un effet analgésique chez le volontaire sain, ce n’est pas le cas de la perfusion continue. Cette étude montre, par exemple, que le développement d’une galénique retard n’aurait aucun sens en termes d’efficacité. ESSAIS CLINIQUES DES ANTALGIQUES Une étude contre placebo réalisée en double-aveugle chez des volontaires sains a montré que l’effet analgésique du paracétamol se distingue très nettement du placebo et de l’aspirine. Cet effet analgésique atteint son maximum deux heures après l’administration intraveineuse. L’analyse pharmacocinétique/pharmacodynamique fait apparaître une hystérèse qui reflète le temps nécessaire au paracétamol pour atteindre son organe cible : le système nerveux central. 71 Upsa Méthodo essais 2002 18/10/02 15:57 Page 72 ESSAIS CLINIQUES DES ANTALGIQUES ■ CONCLUSION 72 La pharmacocinétique des antalgiques constitue une étape indispensable dans le développement de ces substances car elle permet d’apprécier leur absorption, leur distribution, leur élimination dans les conditions normales (chez l’enfant,l’adulte et la personne âgée) et dans les conditions pathologiques. La pharmacocinétique des antalgiques permet également d’établir un lien entre la dose et la concentration et un lien entre la dose et l’effet dans l’optique de rationaliser les régimes de prescription. Les limites de la pharmacocinétique sont liées aux difficultés de dosage, à la présence d’énantiomères et de métabolites actifs qui compliquent sensiblement l’évaluation pharmacocinétique de médicaments comme le tramadol, l’ibuprofène ou la morphine. Par ailleurs, on peut noter une grande variabilité des profils pharmacocinétiques liée à la pharmacogénétique. Par exemple, il faut savoir que certaines populations ne disposent pas des enzymes permettant d’activer l’efficacité analgésique de certains médicaments. La modélisation pharmacocinétique et pharmacodynamique des antalgiques autorise une description quantitative de la réponse à un médicament, ce qui permet d’effectuer un certain nombre de simulations qui peuvent intervenir dans la stratégie de développement d’un analgésique. Celles-ci devront bien évidemment être validées par des essais cliniques. Pour les spécialistes de la pharmacocinétique et de la pharmacodynamique, le principal enjeu sera d’utiliser un modèle valide. Upsa Méthodo essais 2002 18/10/02 15:57 Page 73 Le développement clinique des antalgiques Hervé Ganry ■ INTRODUCTION Le développement clinique d’un médicament ne constitue qu’une partie de la vie de ce médicament. Il peut cependant se prolonger pendant toute sa durée de vie. • le développement d’une nouvelle molécule,qui peut à elle seule représenter une nouvelle classe thérapeutique ou appartenir à une classe thérapeutique existante ; • l’extension d’indication à une autre pathologie ou une autre population ; • la mise à disposition d’une nouvelle formulation galénique ; • la mise à disposition d’une association ; • la mise en évidence de propriétés spécifiques telles que la durée d’action, le début d’activité, la définition de patients répondeurs… ■ LE DÉVELOPPEMENT D’UNE NOUVELLE ENTITÉ CHIMIQUE Aujourd’hui, sur 100 000 nouvelles molécules synthétisées par la chimie, 1 000 font l’objet d’essais en pharmacologie animale, 50 à 100 arrivent au stade de la phase I, 10 à 15 arrivent au stade de la phase III et 3 (dont 1 molécule innovante) sont mises sur le marché. ◗ La genèse d’un médicament Elle comprend de nombreuses étapes.Tout d’abord, il faut définir un cahier des charges et synthétiser les molécules semblant correspondre ESSAIS CLINIQUES DES ANTALGIQUES Différents types de développement clinique peuvent être distingués : 73 Upsa Méthodo essais 2002 18/10/02 15:57 Page 74 à son contenu.Viennent ensuite les tests de pharmacologie et de pharmacocinétique animales. Lorsque ces tests se révèlent concluants, le laboratoire peut passer à la formulation galénique qui est limitée par des contraintes physico-chimiques. Ces contraintes peuvent empêcher la réalisation de formes injectables, de solutions, de formes effervescentes, etc. ◗ Les pré requis en toxicologie pour passer chez l’homme ESSAIS CLINIQUES DES ANTALGIQUES Avant de passer chez l’homme, il faut conduire des essais de toxicologie très spécifiques et procéder à des tests de mutagenèse. Récemment, des recommandations ont permis d’harmoniser les pré-requis de ces essais avant l’administration chez l’homme. Pour une administration en prise unique, les essais préalables de toxicologie portent sur deux espèces animales et durent entre deux et quatre semaines selon l’espèce concernée. Avant d’administrer pendant un mois un médicament chez l’homme, la réglementation européenne exige trois mois d’essais de toxicologie alors que les réglementations américaines et japonaises ne réclament qu’une durée d’un mois. 74 ■ LA PHASE I La phase I correspond à la première administration d’une molécule chez l’homme, en l’occurrence un volontaire sain. L’objet de cette phase est de déterminer la dose maximale tolérée (DMT), d’obtenir un profil pharmacocinétique (ADME : absorption/distribution/métabolisme/élimination) et de rechercher, lorsque cela est possible, une relation pharmacodynamique et pharmacocinétique. Les résultats des essais de la phase I permettent d’établir des comparaisons avec les données obtenues chez l’animal et de vérifier la pertinence de leur extrapolation à l’homme. ◗ La dose unique Généralement, la dose de départ administrée à l’homme correspond à 1/50e de la première dose pharmacologiquement active dans l’espèce animale la plus sensible. La dose maximale doit être inférieure à la Upsa Méthodo essais 2002 18/10/02 15:57 Page 75 dernière dose sans effet qui a été obtenue pour l’espèce animale la plus sensible au cours des quatre semaines d’essais de toxicologie. ◗ La progression des doses Ainsi,par mesure de sécurité,la première dose est très faible.Pour passer à la dose supérieure, deux conditions doivent être réunies : d’une part, tous les volontaires prévus doivent avoir reçu la dose précédente (sauf si des effets indésirables sont apparus et ont entraîné une interruption des administrations) ; d’autre part, toutes les données cliniques et paracliniques de la dose précédente doivent avoir été analysées. À l’issue de la phase I, le laboratoire définit une dose maximale tolérée. Cette DMT dépend également du profil de tolérance souhaité par le laboratoire. Par exemple, si le cahier des charges a prévu le développement d’un opioïde non sédatif, la DMT peut être diminuée et ramenée à la dose entraînant une sédation. Il faut également définir la dose maximale tolérée rapportée à l’exposition réelle. En effet, si la dose maximale tolérée est de 100 mg et que l’absorption de la molécule n’est que de 70 %,l’exposition réelle n’est que de 70 mg.Ainsi,70 mg est la DMT envisageable pour une forme injectable. La démarche classique consiste à déterminer deux doses :une dose pour laquelle la molécule présente une efficacité antalgique chez 50 % des patients et une dose pour laquelle elle présente un effet indésirable chez 50 % des patients. À partir de ces doses, le laboratoire est en mesure de calculer un ratio tolérance/efficacité qui doit être très élevé dans le cas des antalgiques. ■ LA PHASE II ◗ Les contraintes liées aux essais de phase II La sélection des patients Les laboratoires qui développent des antalgiques s’intéressent à une population cible la plus large possible. Cependant les essais cliniques ESSAIS CLINIQUES DES ANTALGIQUES ◗ L’exploitation des résultats 75 Upsa Méthodo essais 2002 18/10/02 15:57 Page 76 sont fondés sur une population source que l’on trouve dans les centres capables de réaliser ces essais, ce qui introduit une première sélection. En effet, le patient qui fait le choix de l’automédication est différent du patient qui consulte un médecin, lui-même différent du patient qui s’adresse à un spécialiste ou qui est suivi dans un centre de la douleur. Au sein de cette population source, les laboratoires imposeront une deuxième sélection en isolant un échantillon de patients correspondant aux critères d’exclusion et d’inclusion du protocole clinique.Au final, ne seront retenus que les patients du protocole clinique qui auront suivi avec exactitude le protocole imposé. L’objectif d’un développement clinique vise à pouvoir extrapoler à la population cible les données issues d’une population source très sélective. Les caractéristiques modifiant la réponse aux antalgiques ESSAIS CLINIQUES DES ANTALGIQUES La définition de critères d’inclusion/exclusion rigoureux est liée au fait que de nombreux paramètres peuvent modifier la réponse des patients aux antalgiques. Ainsi, un essai qui a consisté à administrer des doses de 8 mg et de 16 mg de morphine à des populations très différentes a montré que l’efficacité antalgique de la morphine variait considérablement selon l’âge, la race et les caractéristiques de la douleur traitée (localisation, ancienneté et intensité). 76 Le problème du recueil de l’information La douleur étant un symptôme subjectif, le recueil de l’information est biaisé par la propre subjectivité de l’investigateur. En effet, la perception de la douleur et les réactions face à cette même douleur sont différentes d’une équipe médicale à une autre. Ainsi, plus le nombre d’intervenants sera important et plus la variabilité dans le recueil des données sera forte. Or, le nombre d’intervenants est fonction du nombre de centres mais également de la durée du suivi des patients. Ainsi, l’efficacité d’une prise unique peut être évaluée par un seul investigateur pendant quelques heures alors que l’évaluation de prises répétées sur plusieurs jours nécessitera l’intervention de plusieurs investigateurs pour un même patient. L’expression de la douleur étant différente selon les cultures, il est souvent difficile mais parfois nécessaire de procéder à des essais multicentriques et multi-états. Par ailleurs, les informations obtenues seront différentes selon que l’on recueille l’intensité doulou- Upsa Méthodo essais 2002 18/10/02 15:57 Page 77 reuse du patient (photographie à un temps donné) ou son soulagement (nécessitant le souvenir de l’intensité douloureuse initiale avant traitement). Généralement, les essais classiques utilisent le mode des groupes parallèles. Mais on peut également recourir aux techniques du “cross over” et du carré latin qui permettent de diminuer le nombre de patients inclus ainsi que la variabilité interindividuelle, chaque patient étant son propre témoin. Cependant, ces deux techniques sont rarement mises en œuvre pour plusieurs raisons. Premièrement, elles exigent une stabilité des critères d’inclusion et d’exclusion difficile à obtenir dans le domaine de la douleur. Deuxièmement, elles requièrent des essais plus longs, ce qui augmente le risque de “perdu de vue”. Par exemple, pour une étude en carré latin chez des femmes souffrant de dysménorrhée, il est nécessaire d’effectuer un suivi sur plusieurs cycles.Troisièmement, les techniques du “cross over” et du carré latin peuvent être biaisées par des phénomènes de “carry over”. Si un opioïde agoniste-antagoniste est administré à un patient avant un traitement à base de morphine, son effet rémanent peut réduire l’effet thérapeutique de la morphine à moins que l’on ne mette en place un “wash out” (période sans traitement) d’une durée suffisante, méthodologiquement nécessaire mais souvent éthiquement irréalisable. La démonstration L’objet d’un essai est de montrer que l’efficacité du produit à l’essai est supérieure à celle d’un placebo et/ou à celle d’un produit de référence. Pour effectuer cette démonstration, on définit un critère principal qui est par exemple le TOTPAR, qui correspond à la qualité de soulagement sur une période de temps donnée. Différents modèles d’essais peuvent alors être envisagés selon le type de réponse attendue : • comparaison du produit X avec un placebo : si le produit X, avec une dose x, fournit une efficacité maximale, il n’est pas possible de déter- ESSAIS CLINIQUES DES ANTALGIQUES Le protocole de l’essai 77 Upsa Méthodo essais 2002 18/10/02 15:57 Page 78 miner s’il s’agit d’un effet plafond du produit ou d’un effet plafond du modèle. En outre, un tel résultat ne permet pas de savoir si le même résultat aurait pu être atteint avec une dose x/2. Si, au contraire, le produit X, avec une dose x, se révèle totalement inefficace par rapport au placebo, deux options sont possibles : soit le produit n’a pas d’action, soit une erreur sur le modèle a été commise (par exemple,expérimentation d’un futur antimigraineux sur un modèle de douleur post-opératoire). ESSAIS CLINIQUES DES ANTALGIQUES • comparaison du produit X avec un placebo et un produit de référence R : le produit de référence R est destiné à valider le modèle. Si le produit R utilisé à une dose thérapeutique plus efficace n’est pas meilleur que le placebo, il y a erreur méthodologique. Si le produit X, avec une dose x, et le produit R,avec une dose r,atteignent tous deux une efficacité maximale, on ne peut ni isoler le produit le plus efficace ni savoir si la même efficacité aurait pu être atteinte avec la dose x/2. À l’inverse, si le produit R, avec une dose r, est plus efficace que le produit X, avec une dose x, lui-même plus efficace que le placebo, il n’est pas possible d’anticiper l’efficacité d’une dose 2x. 78 • l’émergence de modèles plus sophistiqués :les limites décrites avec les modèles précédents incitent à utiliser des modèles plus sophistiqués. Ces modèles consistent,par exemple,à comparer l’efficacité du placebo, celle d’un produit de référence (aux doses r et 2r) et celle du produit X (aux doses x et 2 x). Supposons que l’efficacité de la dose 2r soit maximale et qu’elle soit largement supérieure à l’efficacité de la dose r, ellemême supérieure à l’efficacité du placebo. Dans ce cas, si le produit X fait apparaître pour la dose x une efficacité similaire au produit R pour la dose r et que son efficacité n’est pas améliorée par l’administration d’une dose 2x, on peut identifier un effet seuil propre au produit X, qui n’est pas dû au modèle. Ces différents exemples rappellent qu’il est indispensable de garder en permanence à l’esprit l’objectif recherché lorsque l’on met en œuvre un essai clinique. Upsa Méthodo essais 2002 18/10/02 15:57 Page 79 Contraintes liées aux études chez le patient Choix des groupes de traitement 12_ 6_ 6_ 4_ 4_ Soulagement (TOTPAR) 12_ placebo X 2X R placebo X 2X R 2R X : produit étudié R : produit de référence Les modèles précédents mettent en jeu des essais comparatifs puisqu’ils ont pour objet de valider l’hypothèse selon laquelle le produit X est plus efficace que le placebo et, éventuellement, le produit de référence. Dans les exemples précédents, si les produits X et R font apparaître une efficacité similaire, on ne peut pas pour autant conclure à une équivalence entre ces deux produits puisque l’essai était construit pour mettre en évidence une différence. Lorsque l’on cherche à démontrer une équivalence entre deux produits, il est nécessaire de procéder à des essais d’équivalence. Il s’agira alors de valider l’hypothèse selon laquelle le produit X est ni plus efficace, ni moins efficace que le produit Y. On peut également conduire des essais de non-infériorité destinés à montrer que le produit X n’est pas moins efficace que le produit Y. Dans les essais d’équivalence ou de non-infériorité, il faut décider, avant de commencer l’essai, la perte d’efficacité acceptable en deçà de laquelle on peut considérer que l’équivalence ou la non-infériorité existent. Bien évidemment, cette perte concédée devra rester relativement ESSAIS CLINIQUES DES ANTALGIQUES Le choix du type d’étude 79 Upsa Méthodo essais 2002 18/10/02 15:57 Page 80 faible et demeurer en deçà de la pertinence clinique. Mais, pour que les essais d’équivalence et de non-infériorité soient pertinents, il faut également s’assurer qu’ils portent sur un grand nombre de patients et que les critères d’inclusion et d’exclusion retenus soient très sélectifs, d’où une grande difficulté de réalisation. Le modèle de douleur ESSAIS CLINIQUES DES ANTALGIQUES • Les critères : pour qu’un modèle de douleur soit pertinent, il faut tout d’abord qu’il corresponde au futur positionnement du produit et qu’il permette de démontrer l’efficacité antalgique de la molécule testée. Ensuite, il faut s’assurer que le modèle est simple, reproductible et qu’il autorise un recrutement facile. Le modèle de douleur retenu doit également posséder une bonne sensibilité afin de pouvoir différencier les traitements. Enfin, il doit permettre de définir un effet seuil différent d’un effet modèle et de mettre en évidence un début et une durée d’action. 80 • Les modèles de douleur : - douleur aiguë : aujourd’hui, le modèle le plus utilisé en douleur postopératoire est celui de la chirurgie dentaire après extraction de la 3e molaire. Les autres modèles couramment utilisés sont ceux des migraines/céphalées, des dysménorrhées, de l’épisiotomie et du postpartum, de la chirurgie orthopédique et viscérale, de la reconstruction mammaire et de la traumatologie. - douleur chronique : les modèles utilisés sont ceux des douleurs cancéreuses et rhumatologiques. En conclusion, les meilleurs essais de développement clinique des antalgiques en phase II sont les essais monocentriques mis en œuvre par une équipe dévolue à cet effet. ◗ Les différents types de phase II La phase II a La phase IIa impose des critères d’inclusion et d’exclusion extrêmement stricts. Les essais réalisés au cours de cette phase sont des essais pilotes contre placebo dont le but est de cerner la zone d’efficacité Upsa Méthodo essais 2002 18/10/02 15:57 Page 81 thérapeutique. Dans cette perspective, on administre aux patients une dose proche de la dose maximum tolérée, une dose intermédiaire et une dose faible. En parallèle, on poursuit les essais de phase I avec des prises répétées (sur 7 ou 10 jours) en essayant de respecter le rythme des administrations. Il faut alors définir une dose maximale tolérée, qui peut être très différente de celle obtenue pour la prise unique, étudier la cinétique des événements indésirables (apparition, disparition), définir l’état d’équilibre des taux plasmatiques, rechercher l’accumulation des métabolites, l’apparition de nouveaux métabolites et l’induction enzymatique. Puis, lorsque les résultats d’efficacité sont disponibles, essayer d’établir une relation pharmacocinétique/pharmacodynamique. La phase II b, qui impose également de prendre des critères d’inclusion et d’exclusion stricts, a pour objet de définir la dose minimum efficace (DME) grâce à des essais contre placebo mettant en jeu plusieurs doses et des produits de référence. Le choix du modèle en prises répétées dépend du futur profil du traitement, mais également de l’évolution naturelle de la douleur. En effet, la douleur n’évolue pas de la même manière selon les affections. Par exemple,la douleur du post-partum diminue beaucoup plus rapidement que la douleur due à la chirurgie dentaire qui, elle-même, diminue beaucoup plus rapidement que la douleur causée par la chirurgie orthopédique. À la fin de la phase II b, la dose minimum efficace et la durée d’activité antalgique de la molécule doivent être connues, ce qui permet de déterminer la fréquence des prises sur 24 heures.On doit pouvoir également situer le début d’activité du médicament,repérer un éventuel effet plafond, déterminer son profil de tolérance et le positionner parmi d’autres antalgiques en termes d’efficacité ou de tolérance. ■ LA PHASE III L’objet de la phase III consiste à élargir les résultats de la phase II à des patients plus représentatifs (sujets âgés, sujets à risques) et d’étudier ESSAIS CLINIQUES DES ANTALGIQUES La phase II b 81 Upsa Méthodo essais 2002 18/10/02 15:57 Page 82 les interactions médicamenteuses avec d’autres antalgiques et avec les médicaments spécifiques des pathologies douloureuses devant être traitées. Pour des antalgiques utilisés en douleur post-opératoire, on étudie, par exemple, les interactions entre les nouveaux médicaments antalgiques et les anticoagulants.C’est également en début de phase III que l’on détermine la formulation galénique définitive. La phase III permet de confirmer les résultats d’efficacité de la phase II sur de plus grands échantillons de patients et d’augmenter le nombre de patients recevant le traitement étudié. Les doses utilisées dans cette phase seront celles retenues pour l’enregistrement du nouveau médicament. ESSAIS CLINIQUES DES ANTALGIQUES La phase III fait appel à différents modèles de douleur, autorise les traitements associés, sélectionne les traitements de référence en vue d’un positionnement futur parmi les autres antalgiques. Enfin, la phase III est l’occasion de commencer les essais au long cours (300 à 600 patients traités pendant six mois et 100 à 300 patients traités pendant un an). Si elle est concluante, la phase III donne lieu à un dépôt de dossier en vue d’obtenir une AMM. 82 ■ LES AUTRES TYPES DE DÉVELOPPEMENT Après la phase III, on peut procéder à des essais de phase IV et V (pharmaco-épidémiologie) ou mettre en œuvre des essais d’extension d’indication concernant des sous-populations spécifiques. Ces derniers essais sont généralement difficiles à réaliser en raison d’un manque d’outils d’évaluation adaptés à ces sous-populations et du caractère rare de certaines pathologies concernées. ◗ Nouvelle formulation galénique Travailler sur une nouvelle formule galénique suppose de s’assurer qu’il existe une bioéquivalence (paramètres de pharmacocinétique compris entre – 20 % et + 25 % par rapport à ceux de la molécule principale). À cet égard, il est important de souligner que, dans le domaine de l’antalgie, il y a nécessairement des différences d’efficacité et/ou de tolérance entre les génériques dont les paramètres de pharmaco- Upsa Méthodo essais 2002 18/10/02 15:57 Page 83 cinétique se situent à – 20 % et ceux dont les paramètres de pharmacocinétique sont de + 25 %. Si on constate une absence de bioéquivalence, il faudra redémontrer l’efficacité et définir une dose minimum efficace, d’une part, et réévaluer la tolérance, d’autre part (par exemple, une forme IV par rapport à une forme orale). ◗ Association à visée antalgique Ce type d’association présente de nombreux intérêts théoriques : • augmenter l’efficacité antalgique ; • réduire les effets indésirables (si deux produits présentent des effets indésirables à une dose d’1 gramme, on peut choisir de les associer avec une dose de 500 milligrammes chacun) ; • associer un antalgique à des modificateurs de l’humeur (stimulants ou sédatifs) ; • créer une association revendiquant des indications spécifiques ; • modifier l’absorption ou l’élimination des traitements avec des excipients spécifiques ; • réduire le risque d’utilisation détournée par les toxicomanes. On peut étudier des propriétés spécifiques qui n’ont pas été évaluées au cours du développement pré-AMM :début d’activité,profil de tolérance, sous-groupe de patients répondeurs, positionnement par rapport à d’autres produits. ■ CONCLUSION Le développement d’un nouveau médicament fait intervenir tous les secteurs d’un laboratoire et nécessite une coordination parfaite des différents intervenants. Le développement clinique des antalgiques doit prendre en compte le positionnement futur du produit que l’on souhaite développer. Il faut garder à l’esprit qu’il est nécessaire de pouvoir extrapoler les données obtenues lors des essais spécifiques à un grand nombre de pathologies douloureuses. Les modèles de douleur retenus pour les essais devront être discriminants, pertinents, sensibles, validés, réalistes, reproductibles et ESSAIS CLINIQUES DES ANTALGIQUES ◗ Après l’AMM 83 Upsa Méthodo essais 2002 18/10/02 15:57 Page 84 ESSAIS CLINIQUES DES ANTALGIQUES standardisables. Sachant que la douleur n’est pas directement accessible à autrui, le recueil des données devra être rigoureux, standardisé et réalisé à partir d’outils validés. Ce recueil devra faire appel à un minimum d’intervenants afin de réduire au maximum l’hétérogénéité et de fait la variabilité. Finalement, il faut comprendre que, si la plus belle molécule ne peut donner que ce qu’elle a, il faut savoir l’aider à exprimer toutes ses potentialités. 84 Upsa Méthodo essais 2002 18/10/02 15:57 Page 85 Les paramètres de quantification de l’efficacité clinique des antalgiques Paul Desjardins ■ INTRODUCTION L’objectif des essais thérapeutiques est de répondre à une question fondamentale : la substance étudiée a-t-elle une action analgésique chez l’homme ? Il s’agit de démontrer qu’une substance dont l’effet analgésique a été étudié dans les modèles animaux, dont les propriétés pharmacologiques sont patentes et dont la durée d’action est suffisante, est efficace pour traiter les pathologies douloureuses chez l’homme. Bien évidemment, il faut aussi démontrer la non-toxicité de la substance. En 1977, le Journal of the American Dental Association a publié une communication publicitaire qui ne serait plus autorisée aujourd’hui. Cette communication affirmait que, d’après une étude ouverte portant sur cent patients souffrant de douleurs dentaires post-opératoires, 91 % d’entre eux voyaient leur douleur disparaître après une prise de fiorinal. Cette étude comportait deux biais. Le premier était lié au protocole de l’étude. En effet, il faut savoir que le protocole d’une étude ouverte s’oppose en tout point à celui d’une étude en “double aveugle” : le praticien sait quel produit est administré à chaque patient et le patient sait quel produit il consomme. Le deuxième biais venait du fait qu’il n’était pas possible de distinguer l’action de la substance active et celle d’un placebo. Aujourd’hui, la FDA, les agences réglementaires européennes et japonaises sont beaucoup plus sévères sur les protocoles des études et exigent qu’un certain nombre de critères soient respectés pour que l’utilisation d’une substance puisse être validée chez l’homme. ESSAIS CLINIQUES DES ANTALGIQUES ■ LES PROGRÈS DANS LE PROTOCOLE DES ÉTUDES 85 Upsa Méthodo essais 2002 18/10/02 15:57 Page 86 • l’étude en “double aveugle”. • la prescription randomisée de la substance étudiée : cela implique que chaque patient du groupe participant aux essais ait la même chance de se voir prescrire la substance étudiée que le placebo ou la substance de référence. Par ailleurs, la prescription aléatoire suppose un nombre équivalent d’hommes et de femmes dans le groupe testé. • une présentation similaire des comprimés : une étude comparant les effets d’un médicament présenté sous la forme d’un gros comprimé à ceux d’un médicament présenté sous la forme d’un petit comprimé fera généralement apparaître une meilleure efficacité pour le premier médicament. ESSAIS CLINIQUES DES ANTALGIQUES • un échantillon de patients d’une taille suffisante : pour montrer qu’un analgésique calme les douleurs subies à la suite d’une chirurgie dentaire et présente une efficacité supérieure de 20 % à celle d’un autre analgésique, il faut entre 40 et 50 patients par groupe. 86 • la présence d’une douleur continue et d’intensité suffisante : les études mesurant les effets des antalgiques chez les migraineux sont particulièrement complexes dans la mesure où un certain nombre de migraineux voient leur douleur disparaître naturellement en deux ou trois heures alors que d’autres ne seront pas soulagés après de longues heures. Compte tenu de ces différences, les études sur les effets des antalgiques chez les migraineux doivent porter sur un grand nombre de patients. • un échantillon composé d’une population homogène et ne présentant pas de pathologie majeure associée. ■ LA MÉTHODOLOGIE Avant de lancer une étude, il faut établir un protocole qui définit la manière dont cette étude sera conduite. En général, ce protocole précise que l’étude est conduite en “double aveugle”, qu’elle fait l’objet d’une randomisation et qu’elle teste des groupes parallèles. Pour les patients souffrant d’une douleur forte ou modérée, l’analgésique sera Upsa Méthodo essais 2002 18/10/02 15:57 Page 87 donné directement au patient par une infirmière. Les infirmières qui ont accumulé un certain nombre d’années d’expérience savent à quel rythme il faut donner un analgésique aux patients souffrant d’une douleur post-opératoire. Pour les extractions sans chirurgie osseuse, la réponse au placebo est excellente et 30 à 50 % des patients ne ressentent pas de douleur. Pour les chirurgies osseuses, la réponse au placebo est faible et seulement 5 % des patients ne ressentent pas de douleur. Dans les études sur la douleur après extraction simple, il est par conséquent très difficile d’établir une différence entre le placebo et le produit actif. Dans les études sur la douleur après une chirurgie osseuse, la réponse est nettement meilleure. ■ L’ANALOGIE ENTRE LE SAUT À LA PERCHE ET LES ESSAIS CLINIQUES Comme les athlètes lors d’une compétition, les nouvelles molécules soumises aux essais cliniques doivent toutes parcourir le même chemin afin de réussir ou d’échouer. Supposons que quatre athlètes ESSAIS CLINIQUES DES ANTALGIQUES Le critère du “double aveugle” pose parfois des problèmes de mise en œuvre. Dans une étude en double aveugle comparant les effets d’une prescription par voie orale, par voie intraveineuse et par voie intramusculaire, chaque patient recevait une dose active par l’une de ces trois voies et deux placebos par les deux autres voies. L’étude sur 24 heures suppose la rédaction de rapports réguliers sur les caractéristiques de la douleur 15 minutes et 30 minutes après la prise du médicament et toutes les heures pendant six heures. Elle porte sur des patients opérés d’une à quatre dents de sagesse. Peter Black de l’Université de Rochester a développé l’utilisation des chronomètres dans les essais cliniques sur la douleur. Les patients doivent appuyer sur le chronomètre lorsqu’ils prennent le médicament, lorsqu’ils ressentent un premier soulagement et lorsqu’ils ressentent un soulagement significatif. La FDA a approuvé cette technique. Dans les études sur les analgésiques, il faut surtout éviter de demander toutes les cinq minutes aux patients comment ils se sentent car cela biaise fortement les résultats. 87 Upsa Méthodo essais 2002 18/10/02 15:57 Page 88 dont les capacités sont très différentes participent à une compétition de saut à la perche. Si la barre est placée à un mètre du sol, tous les athlètes la franchiront, ce qui ne permettra pas de les différencier. La seule manière de repérer le meilleur sauteur sera d’élever la barre. Dans les essais cliniques sur la douleur, l’enjeu est le même que dans le saut à la perche. Si la barre est placée trop haut, c’est-à-dire si les patients sélectionnés sont extrêmement difficiles à traiter (par exemple, les patients souffrant de fortes migraines accompagnées de vomissements), aucun traitement analgésique ne se distinguera par son efficacité. Inversement, si la barre est placée trop bas, c’est-à-dire si les patients sélectionnés ont un simple mal de tête dû à la tension nerveuse, des placebos pourront sembler aussi actifs que des traitements réputés efficaces. ESSAIS CLINIQUES DES ANTALGIQUES ■ LES MODÈLES DE LA DOULEUR 88 Jusqu’à présent, les modèles de douleur les plus utilisés sont les modèles de douleur aiguë. Les premières études sur ces modèles sont apparues dans la littérature vers les années trente. Harry Beecher, médecin anesthésiste à l’Université de Harvard, a révolutionné les études sur la douleur en avançant pour la première fois l’idée que les essais cliniques sur les analgésiques devraient impliquer des groupes témoins. Auparavant, la plupart des évaluations s’effectuaient dans le cadre d’études ouvertes. À partir des années trente, les modèles de douleur post-opératoire sont apparus comme les modèles de douleur aiguë les plus adaptés pour faire apparaître une relation dose effet. Mais au cours des vingt dernières années, la pratique hospitalière a beaucoup changé : la chirurgie ambulatoire et la chirurgie peu invasive se sont beaucoup développées. Aujourd’hui, 24 heures après avoir subi une arthroscopie, la grande majorité des patients sont capables d’aller nager, ce qui était loin d’être le cas il y a vingt ans. Le modèle de la dysménorrhée a été largement utilisé pour l’évaluation des AINS et des inhibiteurs de la cyclo-oxygénase 2 et continuera de l’être. Les études utilisant ce modèle de douleur s’effectuent généralement en cross-over. Les femmes participant à ces études sont mobilisées pendant plusieurs mois et peuvent jouer à la fois le rôle de patient et de témoin. Upsa Méthodo essais 2002 18/10/02 15:57 Page 89 Dans la plupart des modèles de douleur, les patients doivent évaluer l’intensité de leur douleur en la désignant comme inexistante, faible, modérée ou forte. Puis, les patients doivent évaluer le soulagement que leur a procuré le traitement en le désignant comme inexistant, faible, fort ou complet. D’autres études préfèrent demander si la douleur a pu ou non être divisée de moitié. Les sujets participant aux essais pourront également être amenés à classer l’efficacité du traitement reçu (mauvaise/correcte/bonne/très bonne/excellente). Après l’évaluation de la douleur initiale, il peut être intéressant de demander aux patients de s’exprimer sur l’évolution de leur douleur. Supposons que la douleur initiale soit forte (degré 3) : le score différentiel sera de 1 si elle passe à un état modéré (degré 2) et sera de 3 si la douleur est totalement soulagée (degré 0). Inversement, le score peut être négatif si la douleur s’aggrave. Avant d’autoriser la mise sur le marché d’un nouveau médicament, les agences réglementaires cherchent tout d’abord à s’assurer que cette substance ne présente aucun danger. C’est d’ailleurs, ce qui justifie toutes les études de toxicité conduites en phase I.Puis,les agences réglementaires cherchent à évaluer l’effet analgésique d’ensemble.Enfin,elles s’attachent à déterminer l’effet maximal et l’évolution de l’effet avec le temps. Notons que pour l’ensemble des analgésiques, les patients affirment ressentir le premier soulagement 30 minutes après avoir pris un traitement. Le problème est que 60 % des patients qui prennent un placebo ressentent également un premier soulagement après 30 minutes. Pour différencier les traitements, la méthode la plus efficace semble donc d’évaluer à quel moment a lieu le véritable soulagement. Aujourd’hui, le modèle de douleur dentaire post-opératoire est le plus utilisé. Plusieurs raisons justifient ce phénomène : il se distingue par une bonne reproductibilité des résultats, il est très sensible et ne pose pas de problèmes de recrutement. Les autres essais cliniques post-opératoires se heurtent souvent à des difficultés de recrutement. En effet, il est très rare que les anesthésistes puissent s’appuyer sur la population d’un seul centre médical pour ESSAIS CLINIQUES DES ANTALGIQUES ■ LES EXIGENCES DES AGENCES RÉGLEMENTAIRES 89 Upsa Méthodo essais 2002 18/10/02 15:57 Page 90 réaliser un essai statistiquement significatif. Or, les résultats des études impliquant plusieurs centres ont l’inconvénient d’être hétérogènes. Hormis les modèles dentaires, les modèles post-opératoires fréquemment utilisés sont ceux de la chirurgie du genou et de la hanche. Les agences réglementaires n’autorisent pas la mise sur le marché d’un médicament analgésique au vu des résultats d’une seule étude contre placebo. Avant de s’engager, elles exigent que les laboratoires puissent se prévaloir de résultats reproductibles dans au moins deux études faisant appel à des modèles de douleur différents. Elles exigent des laboratoires de montrer que le médicament qu’ils souhaitent commercialiser a un effet sur les douleurs d’origine pathologique. Enfin, avant d’autoriser une association fixe (par exemple, produit A + produit B), la plupart des agences réglementaires exigent, à l’instar de la FDA, que les laboratoires démontrent que le produit A est efficace, que le produit B est efficace et que leur combinaison est plus efficace que les produits A et B pris isolément. Dans les années cinquante, les laboratoires n’avaient pas à effectuer de telles démonstrations. ESSAIS CLINIQUES DES ANTALGIQUES ■ CONCLUSION 90 Pour analyser les effets d’une substance médicamenteuse chez l’homme, les cliniciens repèrent un certain nombre d’événements clés : le soulagement maximum, le premier soulagement perceptible, le premier soulagement significatif et le temps mis par le patient avant de prendre un autre médicament. De telles mesures permettent la plupart du temps d’optimiser la posologie. Repérer l’effet seuil d’une substance constitue également une étape importante des essais cliniques. Dans les modèles de douleur post-opératoire, les résultats les plus significatifs sont obtenus juste après le réveil, lorsque la douleur est à son maximum. Mais il faut tenir compte du fait que la douleur décroît régulièrement dans les jours qui suivent l’opération,même en l’absence de traitement analgésique. Upsa Méthodo essais 2002 18/10/02 15:57 Page 91 Les standards de quantification de l’efficacité clinique des antalgiques Claude Dubray ■ LES INSTRUMENTS DE MESURE ◗ L’évaluation de la douleur L’échelle visuelle analogique (EVA), qui apparaît comme le “Gold Standard”dans l’évaluation de la douleur,est apparemment simple d’utilisation. Il s’agit de positionner un curseur entre deux extrêmes. Cependant, les différents modèles, surtout lorsqu’ils sont utilisés par la même équipe, peuvent créer une confusion chez le patient. Certains graphiques plus élaborés ou certaines indications en milieu d’échelle peuvent introduire des biais. Par ailleurs, il faut bien veiller à prendre une quantification en millimètre pour éviter la discontinuité. L’échelle peut être utilisée horizontalement ou verticalement (“thermomètre”) pour l’enfant. Ainsi, quelques problèmes techniques peuvent se poser. Des infirmières, dans certains services, bloquent l’échelle à 45. Il faut également veiller à ce que l’élément coulissant ne tombe pas trop bas pour les échelles verticales. Ces détails peuvent parfois apporter des erreurs considérables dans les évaluations, notamment lorsqu’il s’agit d’évaluer l’efficacité des médicaments. Les systèmes plus sophistiqués ont pour principal avantage de pouvoir être utilisés à domicile par les patients, ce qui permet d’assurer un suivi. Par exemple, des systèmes électroniques peuvent enregistrer les valeurs sur un ordinateur, ce qui est très commode pour les essais thérapeutiques. Mais il faut veiller à leur bonne utilisation. L’échelle verbale Pour l’échelle verbale, il est demandé au patient de situer sa douleur par un qualificatif : aucune, légère, moyenne, intense. L’idéal est que les échelles soient les mêmes. Malheureusement, ce n’est pas toujours le ESSAIS CLINIQUES DES ANTALGIQUES L’échelle visuelle analogique 91 Upsa Méthodo essais 2002 18/10/02 15:57 Page 92 cas. Parfois, le patient a du mal à choisir entre “moyenne” et “intense”. Il faut donc essayer de situer sa douleur à partir de ces informations. Mais il n’est pas forcément mauvais de lui demander de faire un choix. Les études montrent une très bonne corrélation entre les résultats donnés par les deux échelles, lorsque les mêmes patients les utilisent. Il ne faut donc pas rejeter a priori l’une ou l’autre. L’échelle numérique L’échelle numérique, qui se rapproche de l’échelle analogique, peut aussi être utilisée. Elle est discontinue et il est demandé aux patients de coter la douleur de 0 à 10 de manière croissante. ESSAIS CLINIQUES DES ANTALGIQUES ■ L’ÉVALUATION DU SOULAGEMENT 92 Les échelles pour évaluer le soulagement obéissent aux mêmes principes, sachant qu’elles ne sont pas utilisées au même moment et que les qualificatifs sont différents. Il faut aussi éviter les biais dus à la conception de l’échelle. Pour autant, il semble qu’un consensus se soit dégagé concernant les échelles verbales et leurs cinq degrés. Comme pour l’évaluation de la douleur, les études montrent une bonne corrélation entre les résultats des EVA et ceux des échelles verbales. La distribution des réponses des patients à qui il était demandé de coter leur douleur avec l’EVA et l’échelle verbale le montre avec une zone de chevauchement qui paraît logique. ■ L’UTILISATION DE CES ÉCHELLES Toutes ces échelles peuvent être utilisées dans divers cas. Il peut s’agir, par exemple, de mesurer le soulagement après une prise médicamenteuse et de suivre son évolution au cours du temps. Il est également possible de mesurer une sensation douloureuse au cours d’une période donnée, pendant six heures, après une opération. Il peut être demandé l’intensité de la douleur moyenne au cours des dernières 24 heures, sachant que l’appel à la mémoire peut biaiser quelque peu l’analyse. Upsa Méthodo essais 2002 18/10/02 15:57 Page 93 ◗ La relation avec l’intensité Il faut se méfier de certaines réponses qui sont le résultat d’une gymnastique intellectuelle un peu compliquée. Par exemple, l’évaluation par le patient du niveau maximum et minimum de douleur au cours des dernières 24 heures conduit souvent à des résultats curieux. Dans ce type d’analyse, il convient de passer du temps auprès du patient pour lui expliquer. La question de l’amélioration de l’évaluation de la douleur et du soulagement est une question importante. Dans ce domaine, il faut éviter d’avoir recours aux deux types d’évaluation en même temps. Les patients ont tendance à confondre les deux. Ces échelles visuelles ou numériques ont une fausse apparence de simplicité. Outre les problèmes techniques évoqués ci-dessus, il semble qu’elles sont inadaptées à l’état des patients. Selon les études, 18 à 25 % des patients utilisent mal l’EVA, ce qui provoque un biais considérable dans les essais. Il est donc nécessaire d’être sûr que le patient a bien compris. Récemment encore, nous avons pu faire l’expérience de patients qui répondent à tort et à travers concernant les niveaux de grille. En période post-opératoire, il faut déconseiller d’utiliser les EVA. Les échelles verbales sont plus faciles d’accès. En particulier, les sujets âgés éprouvent des difficultés à utiliser la règle de l’EVA, sans parler des outils électroniques. Les patients qui ont un handicap moteur (Parkinson, pathologies rhumatismales) ne positionnent pas nécessairement le curseur au bon endroit. ■ L’INTÉGRATION DES VALEURS ◗ Les différentes méthodes Pour surmonter le problème de variabilité considérable de la douleur, les séries de mesures peuvent être intégrées à plusieurs moments de la journée. Un certain nombre de critères sont étudiés dans la littérature : SUMVAS, PRIX, PID & SPID, PAR & TOTPAR. Le SUMVAS consiste à faire la somme des scores d’intensité d’une ESSAIS CLINIQUES DES ANTALGIQUES ◗ Les défauts 93 ESSAIS CLINIQUES DES ANTALGIQUES Upsa Méthodo essais 2002 94 18/10/02 15:57 Page 94 douleur recueillis sur un intervalle de temps donné. Il est demandé au patient de coter, à différents intervalles de temps, l’intensité de sa douleur. Ces différentes cotations sont additionnées, sachant qu’il est possible de faire la moyenne des cotations de plusieurs sujets traités. Le produit est d’autant plus efficace que la somme des cotations est basse. Le PID qui est plus largement utilisé conduit à un calcul sur des données primaires (intensité de la douleur à un instant T). Le différentiel de l’intensité de la douleur à l’instant T, par rapport à celle identifiée au moment où le produit a été administré, doit être calculé. Ensuite, il est nécessaire de calculer l’aire sous la courbe de ce PID avec la méthode des trapèzes sur un intervalle de temps donné. L’antalgique est d’autant plus efficace que le SPID moyen est élevé. Le PRIX dont la formule est un peu compliquée n’apporte pas grandchose par rapport au PID. Une étude montre l’évolution des scores mesurés en EVA pendant huit heures du paracétamol, d’une part, et du paracétamol + codéine, d’autre part. Le calcul du SPID ou de la SUMVAS montre l’efficacité comparée de chaque produit avec un avantage en faveur de la combinaison paracétamol + codéine. L’analyse des scores basés sur le soulagement en PAR obéit aux mêmes principes que le PID avec un calcul du différentiel entre le niveau de soulagement à un moment T et celui au départ. Le TOTPAR consiste à intégrer ces variables en mesurant l’aire sous la courbe par la méthode des trapèzes. Ce critère va permettre d’avoir une vision globale du soulagement de la personne et, partant, de l’efficacité du produit. ◗ Les limites Il n’est pas possible de faire reposer l’analyse uniquement sur ces valeurs intégrées. En effet, ces dernières ne tiennent pas compte du délai d’action ou de l’amplitude de la réponse, ce qui est un peu dommage. Il est également difficile de comparer entre eux les résultats calculés à partir de plusieurs TOTPAR compte tenu des différences en termes de temps de mesure ou de nombre de mesures. Le passage au qualitatif est, dans ce cas, nécessaire en distinguant les patients répondeurs et non-répondeurs. Upsa Méthodo essais 2002 18/10/02 15:57 Page 95 ■ LE PASSAGE AUX CRITÈRES QUALITATIFS ◗ La notion de répondeur La notion de répondeur permet de s’affranchir des temps de mesure.Un patient est considéré par la littérature comme répondeur lorsque sa réponse est supérieure de 50 % au maximum TOTPAR. Le pourcentage maximum TOTPAR est calculé en faisant le rapport de deux surfaces représentant le score du patient et le score d’efficacité maximale. Les avantages de la distinction entre répondeurs et non-répondeurs sont de pouvoir comparer des séries d’essais et de les intégrer. ◗ Le diagramme de l’Abbe Le diagramme de l’Abbe permet de visualiser facilement l’efficacité d’un produit comme le paracétamol avec la mesure de l’effet placebo. Il est possible de faire des graphiques correspondant à différentes doses de paracétamol. Une autre approche consiste à classer les patients répondeurs et non-répondeurs par rapport aux traitements actifs et aux effets placebos. Il est également possible d’avoir recours au calcul du bénéfice relatif (équivalent du risque relatif). Généralement, les études prises individuellement se situent dans des intervalles acceptables. Par ailleurs, compte tenu de ce critère qualitatif commun, il est possible de toutes les fusionner et d’en tirer des enseignements intéressants. Étant donné la variabilité de la douleur, il est cependant illusoire de compter sur des résultats statistiquement significatifs avec moins de 500 patients, ce qui est fréquent pour une étude isolée. ◗ Le NNT L’Odds ratio peut également être employé pour intégrer un certain nombre de données. L’évaluation des antalgiques par le NNT (nombre de patients nécessaires à traiter), très utilisé, peut s’effectuer sur la base de données brutes. Mais il est aussi possible de transformer les valeurs de bénéfice relatif et de l’Odds ratio en NNT. Ainsi, toutes les données ESSAIS CLINIQUES DES ANTALGIQUES ◗ Le bénéfice relatif 95 Upsa Méthodo essais 2002 18/10/02 15:57 Page 96 fusionnées donnent un paramètre général. Lorsque le NNT s’élève à 1, cela signifie que le produit est efficace à 100 %.Un NNT à 5 signifie qu’il faut faire appel à au moins cinq patients pour être sûr d’avoir un patient qui réponde. ■ CONCLUSION ESSAIS CLINIQUES DES ANTALGIQUES Sans instruments de mesures fiables, les critères ne servent plus à rien. C’est pourquoi il faut souligner la simplicité trompeuse des instruments. Le principal problème de la douleur étant la variabilité, il convient de l’atténuer le plus possible. Les paramètres intégrés permettent de tenir compte de ce facteur. Il faut aussi compter sur l’effet placebo qui est considérable. L’évaluation de la douleur n’étant pas normale, il est nécessaire d’utiliser des tests paramétriques autres comme la médiane et il est utile d’intégrer les résultats de plusieurs études pour avoir une image claire de ce qui se passe. 96 Upsa Méthodo essais 2002 18/10/02 15:57 Page 97 L'antalgique de secours dans les essais cliniques Éric Boccard Les raisons de se pencher spécifiquement, dans le cadre de la méthodologie des essais cliniques, sur l’antalgique de secours sont multiples. L’une d’entre elles est une modification des attitudes thérapeutiques dans le cadre de la douleur. En effet, en particulier dans le traitement de la douleur post-opératoire, il est maintenant courant d’employer des techniques conjointes dites “d’analgésie multimodale”,afin de tirer profit des sites et mécanismes d’action complémentaires de plusieurs antalgiques. Il est ainsi courant de voir associer un morphinique avec un non-morphinique. De même, en douleur chronique d’origine rhumatologique, on peut voir associer un AINS avec un antalgique pur. Cette tendance se retrouve dans les essais cliniques menés dans un but pragmatique. Mais, on peut parfois négliger le fait qu’une démonstration au sein d’un essai clinique diffère souvent, d’une façon ou d’une autre, de la pratique quotidienne. Une autre raison d’aborder ce thème est l’amalgame retrouvé dans certains essais entre différents critères de jugement, dont les scores de douleurs et le recours à un antalgique de secours. Dans la littérature et la terminologie anglo-saxonne, le distinguo n’est pas fait clairement entre les deux concepts que nous allons développer plus loin. Le seul terme constamment employé est le “rescue analgesic”, que l’on peut traduire par antalgique de secours. Et pourtant la prise d’un antalgique différent de celui à l’essai et qui ESSAIS CLINIQUES DES ANTALGIQUES Les dernières recommandations officielles de la FDA quant aux essais cliniques d’antalgiques n’ont pas été actualisées depuis 1992 (1) et comportent essentiellement trois types de critères de jugement : les critères classiques basés sur l’évolution des scores de douleur (PID, pain intensity differences) ou de soulagement (PR, pain relief), la durée de l’analgésie et le délai d’apparition de l’analgésie. En revanche, il n’est aucunement fait mention de façon explicite de l’antalgique de secours que ce soit dans son choix ou dans les rôles qu’il peut jouer. 97 Upsa Méthodo essais 2002 18/10/02 15:57 Page 98 vient signer l’échec de celui-ci diffère quelque peu de l’antalgique qui vient compléter, sur tout ou partie de l’essai, le produit étudié. Nous allons donc distinguer l’antalgique de recours et l’antalgique de complément. ESSAIS CLINIQUES DES ANTALGIQUES ■ L’ANTALGIQUE DE RECOURS 98 L’antalgique de recours, c’est l’antalgique qu’il est prévu d’administrer dans le protocole, en cas de soulagement insuffisant. Ce soulagement insuffisant, qui doit répondre à des critères précis, signe l’échec thérapeutique et également le temps de la sortie d’essai. Cet antalgique de recours répond donc à la nécessité éthique de prévoir dans un protocole une solution alternative pour les patients. Sa nature n’a a priori aucune relation avec les résultats, il doit simplement offrir un soulagement potentiellement plus important que le ou les produits à l’essai et ne pas risquer de produire des interactions médicamenteuses avec ceux-ci. Lors de cette sortie d’essai, le critère qui compte est le temps d’administration de l’antalgique de recours qui va déterminer un délai après la prise initiale ou délai écoulé depuis le début du traitement (T0). Il est courant de définir un délai minimal de recours possible (une heure en douleur aiguë post-opératoire, ou 2/3 jours en chronique). Ce délai minimal correspond à la durée pendant laquelle on considère qu’un patient est “protégé” par l’effet placebo d’une part, au délai raisonnable d’apparition d’un soulagement net d’autre part. Il est bien entendu à adapter aux conditions de l’essai, à l’indication et à la sévérité attendue de la douleur. Dans cette définition d’un antalgique de recours, on voit que le problème d’interaction médicamenteuse ne se pose pas alors qu’il en va tout autrement pour un antalgique de complément. En effet, la période pendant laquelle le traitement à l’essai et l’antalgique de recours sont pris simultanément est postérieure à la période retenue dans l’analyse. La méthode d’analyse statistique à appliquer dans ce cas s’appuie sur le fait que seul le temps de recours à cet antalgique compte, et elle doit être prédéfinie dans l’analyse statistique.La méthode de la courbe de survie (analyse dite de Kaplan-Meyer) est la plus recommandable étant donné que l’on a à faire à un événement bien identifiable, à une seule variable, le temps. Upsa Méthodo essais 2002 18/10/02 15:57 Page 99 Pourcentage de patients Durée d’action des produits étudiés 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Propacetamol Paracetamol Placebo Durée en minutes 0 30 60 90 120 150 180 210 240 270 300 330 360 On peut aussi analyser sous l’angle du temps médian de recours. Il s’agit plutôt d’une méthode complémentaire qui donnera une information sur la durée d’action du produit étudié dans chaque groupe (figure ci-dessus). Il est en tout cas indispensable, quant à l’analyse classique de l’évolution des scores de douleurs, de tenir compte de ces événements intercurrents. La méthode la plus consensuelle, pour ne pas introduire un biais et tenir compte de l’échec thérapeutique avéré, est le report du score tel qu’il a été enregistré au moment de la sortie, à chaque temps ultérieur jusqu’à la fin de l’essai. Le nombre de données analysables reste ainsi constant, même aux temps tardifs de l’essai, mais on se met dans la situation la pire du point de vue des résultats et donc dans la situation la moins critiquable du point de vue de la rigueur méthodologique. Dans l’hypothèse où des scores auraient été enregistrés à la suite de la prise de l’antalgique de recours, ceux-ci sont, bien entendu, sans valeur. Si la durée d’action est le critère essentiel recherché, il existe une méthode plus fine et spécifique (méthode des trois chronomètres). En définitive, ce concept est essentiellement applicable à la douleur aiguë car il offre un cadre d’analyse relativement simple à systématiser, ce qui est indispensable. ESSAIS CLINIQUES DES ANTALGIQUES 3 groupes parallèles de 108 patients, après chirurgie d’hallux valgus sous anesthésie locale, propacetamol vs paracetamol vs placebo. D’après Jarde et al (2) 99 Upsa Méthodo essais 2002 18/10/02 15:57 Page 100 ESSAIS CLINIQUES DES ANTALGIQUES En revanche, en matière de douleur chronique, les critères qui vont mener à la définition d’un échec thérapeutique sont moins simples et dès lors,ne se font pas la plupart du temps sous le contrôle direct de l’investigateur, mais grâce à des instructions remises au patient. Il plane toujours un doute sur les conditions exactes de survenue d’une sortie d’essai pour échec thérapeutique. Comment interpréter, par exemple, le cas du patient qui juge nécessaire de prendre à une ou plusieurs reprises, mais pas de façon constante et répétée, l’antalgique de recours autorisé, mais sans vouloir interrompre le traitement étudié ? À quel moment situer l’échec ? Est-il valide de le fixer dès la première prise d’un autre antalgique que celui étudié ? Et que décider si le patient a présenté,en cours d’étude,soit momentanément une douleur différente et supplémentaire, soit une poussée de la pathologie sous-jacente (ex. : céphalées ou poussée inflammatoire chez un patient arthrosique). 100 Du point de vue de l’analyse des données,la situation diffère également. Autant en aiguë, chaque heure comptant, l’analyse en courbe de survie a du sens, autant en chronique, l’événement à analyser étant moins précisément identifiable, des critères tels que la durée moyenne de participation à l’essai ou le pourcentage de patients interrompant l’essai pour échec pourraient être préférés. Cependant, s’il s’agit de patients hospitalisés, pour lesquels le recueil de données est plus fiable, on peut envisager de faire appel à une analyse de covariance, à condition d’être capable de fixer précisément la nature et la quantité d’antalgique de secours. En définitive, en douleur chronique, le maître mot devrait être de rester pragmatique et d’adapter la méthode d’analyse de l’échec thérapeutique à chaque cas. ■ L’ANTALGIQUE DE COMPLÉMENT L’antalgique de complément est l’antalgique,connu,qui vient compléter tout au long de l’essai, si nécessaire, l’effet antalgique du ou des produits testés. Les modalités de son administration sont clairement et précisément définies dans le protocole (nature, posologie [fixe ou poso/poids] et critères d’emploi) afin d’assurer une comparabilité inter-groupe et inter-patient, il peut être réclamé et/ou utilisé par le patient sans que cela ne signe un échec thérapeutique. Il peut-être ainsi être analysé de façon fiable et reproductible. Ce peut être un Upsa Méthodo essais 2002 18/10/02 15:57 Page 101 critère de jugement principal de l’efficacité antalgique lors de la comparaison de deux produits actifs ou versus placebo. Bien sûr, un tel antalgique de complément n’est exploitable que si les critères de recours sont parfaitement définis, et définissables à l’avance. Il peut arriver que ce pré requis ne soit pas réalisable. Pour que cet usage d’un antalgique de complément soit fiable et donc analysable, il faut en particulier que les conditions de recours soient identiques. Pour cela, il faut un nombre minimal d’étapes et d’intermédiaires, d’une part, et une fiabilité du critère de recours, d’autre part. Or, dès que cette administration fait appel à un personnel soignant comme intermédiaire, on introduit plusieurs variables difficiles à maîtriser et à homogénéiser dans le temps d’un patient à l’autre et d’un centre à l’autre. On peut faire intervenir le jugement de ce soignant quant au bien-fondé de la demande du patient (à moins qu’un score de douleur seuil ait été déterminé à l’avance) et, dans tous les cas, on ajoute les délais variables de réponse à l’appel du patient et d’administration de l’antalgique. On voit bien là la différence qui se dessine entre les méthodes passant par l’hétéro-administration, de celles passant par l’auto-évaluation et l’auto-administration.Les premières entraînent ipso facto une cascade de sources de variabilité qui compromettent son utilisation rationnelle comme critère de jugement d’efficacité. Au contraire les secondes limitent, sans totalement les supprimer, ces facteurs de variabilité. Dans les premières, on peut regrouper les méthodes d’administration d’un antalgique à la demande du patient, y compris sous forme injectable. Dans les secondes, on peut regrouper les méthodes utilisant la PCA ou la PCEA comme méthode d’administration d’une antalgie complémentaire et celles mettant à disposition du patient un antalgique sous forme orale avec des consignes de prise. Cependant, il existe une différence importante entre ces techniques. Lors de l’usage de la PCA, où l’analgésique employé est délivré en micro-bolus (à volume fixe, et donc à dose fixe) à intervalles réguliers (avec une période réfractaire minimale, de l’ordre de la dizaine de minutes), on peut s’attendre à un effet rapide sur la douleur et donc à une adaptation relativement fine dans le temps entre les besoins du patient et la dose employée. ESSAIS CLINIQUES DES ANTALGIQUES ◗ L’antalgique de complément dans la douleur aiguë 101 Upsa Méthodo essais 2002 18/10/02 15:57 Page 102 ESSAIS CLINIQUES DES ANTALGIQUES L’efficacité de l’administration répétée de faibles doses de morphine a été démontrée (3).Au contraire, lors de l’usage d’un antalgique oral, on emploie en général la dose optimale, qui est nettement plus longue à agir qu’un micro-bolus intraveineux ou intra-épidural a fortiori, et qui ne peut être répétée qu’après plusieurs heures, quelle que soit la molécule. Dans ce dernier cas, on ne peut pas considérer que la consommation de cet antalgique de complément reflète l’évolution et les fluctuations de la douleur, car on obtient un résultat en tout ou rien. En définitive, on voit donc que la seule technique qui permet de réellement utiliser l’antalgique de complément de façon satisfaisante sur le plan méthodologique,comme critère de jugement principal d’efficacité, est une technique permettant une incrémentation la plus fine possible de la dose d’antalgique de complément, c’est-à-dire la PCA ou la PCEA. Mais, même cette technique d’administration possède des limites et impose des choix corollaires. 102 La PCA a pour intérêt de répondre au problème de la variabilité interindividuelle de la sensation douloureuse et de la sensibilité aux morphiniques, mais présente néanmoins des taux de variabilité encore importants. Il faut donc tenir compte de cette variabilité de la consommation de morphine en fonction de l’indication, en général dans la littérature, et plus particulièrement dans le ou les centres concernés, afin de calculer le nombre minimal nécessaire de patients. La caractéristique la plus intéressante de la PCA, dans le cadre de notre réflexion, est que le patient peut déclencher l’administration dès qu’il ressent une douleur, rentrant dans un système de boucle de rétrocontrôle. Le patient va donc s’administrer l’antalgique jusqu’à obtenir un effet qu’il juge satisfaisant sur l’intensité de la douleur. La plupart des études publiées, lorsqu’elles fournissent les données de scores de douleur, montrent que les patients se stabilisent aux environs de 30 mm sur une échelle EVA de 100 mm, c’est-à-dire qu’ils ne recherchent pas le zéro douleur. En revanche on peut faire l’assertion que, quelle que soit l’efficacité intrinsèque du traitement étudié et de l’antalgique de complément, il n’y a aucune raison pour que d’un groupe à l’autre les patients (et aussi, dans un même centre, d’une étude à l’autre, mais la rigueur méthodologique interdit les comparaisons historiques) ne cherchent pas en moyenne un soulagement équivalent et donc à ramener leur score de douleur dans des plages comparables. Ce constat prend toute son importance quant aux conclusions que l’on est en droit de Upsa Méthodo essais 2002 18/10/02 15:57 Page 103 tirer d’un essai où le critère de jugement principal est la consommation de morphine. En effet, un pré requis indispensable au moment de l’analyse des résultats est que les scores de douleurs dans les groupes étudiés doivent être comparables, c’est-à-dire non différents significativement. Dans le cas contraire une différence signerait un biais dans l’étude. Prenons, à titre d’exemples, plusieurs essais utilisant la PCA avec morphine dans des comparaisons entre le propacetamol et un placebo ou le ketorolac, en post-opératoire. Essai 1 mg 50 Propacetamol Placebo p= 0,03 40 30 20 10 0 1 2 3 4 6 8 10 12 14 16 18 20 22 24 heures cm 8 Propacetamol Placebo 7 6 5 4 3 2 0 1 2 3 4 6 8 10 12 14 16 18 20 22 24 heures SCORES DE DOULEUR SUR EVA 2 groupes parallèles de 30 patients, après ligamentoplastie du genou, propacetamol vs placebo. D’après Delbos et al (4) Bolus = 1 mg, flux continu 0,5 mg/h, période réfractaire 15 minutes. Déviation standard consommation de morphine = 14 mg sur 24 heures ESSAIS CLINIQUES DES ANTALGIQUES CONSOMMATION CUMULÉE DE MORPHINE 103 Upsa Méthodo essais 2002 18/10/02 15:57 Page 104 Essai 2 mg 20 Propacetamol Placebo p< 0,001 15 10 5 0 1 2 3 4 6 8 10 12 14 16 18 20 22 24 heures CONSOMMATION CUMULÉE DE MORPHINE cm 6 Propacetamol Placebo 5 4 3 2 1 0 0 1 2 3 4 6 8 10 12 14 16 18 20 22 24 heures ESSAIS CLINIQUES DES ANTALGIQUES SCORES DE DOULEUR SUR EVA 104 18 16 14 12 10 8 6 4 2 0 Propacetamol (n=39) Placebo (n=43) p= 0,01 Nulle Faible Modérée Bonne Très bonne SCORES DE SATISFACTION GLOBALE DES PATIENTS 2 groupes parallèles de 47 patients, après chirurgie orthopédique, propacetamol vs placebo. D’après Peduto et al (5). Bolus = 0,015 mg/kg, période réfractaire 15 min. Déviation standard de consommation de morphine sur 24 heures = 10 mg. Upsa Méthodo essais 2002 18/10/02 15:57 Page 105 Essai 3 mg 12 Propacetamol Ketorolac 10 8 6 4 2 0 1 2 3 4 6 8 10 12 heures CONSOMMATION CUMULÉE DE MORPHINE cm 10 Propacetamol Ketorolac 8 6 4 0 1 2 3 4 6 8 10 12 heures SCORES DE DOULEUR SUR EVA 2 groupes parallèles de 100 patientes, après chirurgie gynécologique, propacetamol vs ketorolac. D’après Varassi et al (6). Bolus = 0,02 mg/kg, période réfractaire 5 min, limite de 0,1 mg/kg les 4 premières heures. Déviation standard consommation de morphine sur 12 heures = 4.6 mg. On voit, dans les résultats de ces trois essais menés sur des indications différentes, que les scores de douleurs sont à chaque fois comparables, que ce soit entre un traitement actif et un placebo ou entre deux traitements actifs. Dans le même temps, les consommations de morphine évoluent de manières visiblement différentes (et significativement) entre l’actif et le placebo, et tout à fait superposables entre les deux actifs dans l’essai 3. ESSAIS CLINIQUES DES ANTALGIQUES 2 105 Upsa Méthodo essais 2002 18/10/02 15:57 Page 106 ESSAIS CLINIQUES DES ANTALGIQUES Il est donc antinomique de vouloir rechercher dans la même étude une différence significative sur la consommation de morphine et sur les scores de douleurs.D’une manière générale,cela reflète aussi le principe selon lequel il est préférable de s’en tenir à un seul critère de jugement principal. 106 En théorie, la seule exception à cette règle serait un antalgique tellement efficace qu’il réduirait le besoin de compléter l’antalgie par la morphine, avec une consommation quasiment nulle. Mais, dans le cas d’un tel antalgique, le bon sens ferait rechercher d’autres méthodes d’évaluation de son efficacité antalgique en monothérapie. Si l’on considère des critères de jugement accessoires tels que la satisfaction du patient, il est en revanche possible de constater des différences significatives, comme on peut le voir dans l’essai n°2, car on fait intervenir là des facteurs multiples et associés. En particulier, le profil d’effets indésirables des morphiniques étant dose dépendant, on peut faire l’hypothèse qu’une consommation moindre de morphine retentit sur le confort du patient et donc, au final, sur sa satisfaction globale quant à sa prise en charge. Cependant, Homs et collègues ont démontré dans une large enquête sur l’utilisation de la PCA en France (7), que la satisfaction du patient semblait ne pas être liée avec le soulagement de sa douleur. On entre là dans le sujet de la qualité de vie comme critère de jugement de l’intérêt d’une méthode ou d’une technique et qui nécessite d’employer d’autres critères de jugements bien spécifiques. Lorsqu’on emploie cette technique de l’antalgie de complément, il ne faut pas perdre de vue que l’on étudie en fait une association. Et c’est donc l’efficacité et la tolérance de cette association qui est observée. Sur le plan efficacité antalgique, l’effet de cette association peut être synergique (simplement additif, voire potentialisateur) ou même antagoniste. L’observation de la consommation de morphine ne permettra pas de distinguer entre effet additif et synergique, ni de préciser le meilleur ratio de doses. Seules les études associant cette fois des doses fixes permettent de répondre à cette question, comme il en a été fait de nombreuses au sujet de l’association paracetamol-codéine. (8,9) Sur le plan des effets indésirables, c’est l’imputabilité des effets indésirables à l’une ou l’autre molécule que l’on complique. Upsa Méthodo essais 2002 18/10/02 15:57 Page 107 Le principe de l’antalgie de complément via la PCA n’est guère applicable qu’à la douleur aiguë post-opératoire. Si l’on accepte le principe de contrôler au mieux les différents facteurs de variabilité, on peut concevoir qu’il est illusoire de considérer l’antalgie de complément, dans le cadre de la douleur chronique, comme un critère de jugement qui puisse refléter de façon fine l’effet antalgique d’un produit, ou une différence d’effet entre deux produits ou versus placebo. Au mieux ce peut-être un critère secondaire dans une analyse de type pragmatique. En effet, même si le protocole a défini précisément les critères de recours à cet antalgique, il est difficile de pouvoir s’assurer qu’ils ont été respectés en tout par les patients, et en particulier la prise du traitement étudié, par opposition avec une perfusion intraveineuse. Une des différences avec la méthode PCA en douleur aiguë est le recueil des scores de douleurs. Avec celle-ci, il est fait très régulièrement, et au moins aussi souvent que le recueil des consommations cumulées de morphine, soit toutes les heures ou toutes les deux heures. En revanche, en chronique, il n’est pas pensable de demander au patient plus d’un à deux scores par jour. De plus, la douleur chronique oscille dans la journée et d’un jour à l’autre, contrairement à la douleur post-opératoire que l’on peut, en première intention, considérer comme évoluant de manière assez régulière (que ce soit dans le sens de l’augmentation ou de la diminution). Il devient donc impossible de repérer une discordance entre la prise de l’antalgique et le score de douleur. ■ CONCLUSION L’antalgie de secours est souvent envisagée pour des raisons éthiques et il s’agit alors d’antalgie de recours, sa mise en œuvre n’est pas difficile, elle impose juste de prendre des précautions dans l’analyse des données subséquentes à l’intervention de cet antalgique de recours. Son utilisation préméditée comme critère de jugement, il s’agit alors d’antalgie de complément, est plus difficile sur le plan pratique. De nombreux biais méthodologiques sont à éviter, son emploi doit donc être très encadré ce qui le rend peu praticable en douleur chronique. ESSAIS CLINIQUES DES ANTALGIQUES ◗ L’antalgie de complément en douleur chronique 107 Upsa Méthodo essais 2002 18/10/02 15:57 Page 108 Enfin, il faut se rappeler qu’on étudie dans ce cas une association de deux principes actifs, mais qu’une seule étude ne pourra pas répondre à plusieurs objectifs, comme par exemple l’effet d’épargne et la nature de l’effet obtenu : additif ou potentialisateur. ESSAIS CLINIQUES DES ANTALGIQUES Bibliographie 108 1. Guideline for the clinical evaluation of analgesic drugs- FDA- 1992- docket 91D-0425 2. O. Jarde and E. Boccard Parenteral versus oral route increases paracetamol efficacy. Clinical Drug Investigation, 1997 ; 14 (6) : 474-481 3. Ballantyne JC, Carr DB, Chalmers TC et al.,Post-operative patient-controlled analgesia-meta-analyses of initial randomized controlled trials J Clin Anesth, 1 993, 5,182-193 4. Delbos A., Boccard E. The morphine-sparing effect of propacetamol in orthopedic postoperative pain. Journal of Pain and Symptom Management, 1995 ; 10 (4) : 279-286 5. Peduto V.A., Ballabio M. and Stefanini S. Efficacy of propacetamol in the treatment of postoperative pain - Morphine-sparing effect in orthopedic surgery Asta Anaesthesiol. Scand. 1998 ; 42 : 293-298 6.Varassi G, Marinangelli F,Agro F et al,A double-blinded evaluation of propacetamol versus ketorolac in combination with patient-controlled analgesia morphine : analgesic efficacy and tolerability after gynecologic surgery,Anest anlg 1999, 88,611-616 7. Homs JB, Loriferne JF, Bonnet F,ARAR Evaluation of patient satisfaction and pain relief with intravenous PCA, Br J Anaesth, 74, S1, 133,A436 8. Bentley KC, Head TW The additive analgesic efficacy of acetaminophen, 1 000 mg, and codeine, 60 mg, in dental pain. Clin Pharmacol Ther., 1987 ; 42 (6) : 634-640 9. Quiding H, Persson G, AhlstromU et al Paracetamol Plus Supplementary Doses of Codeine : An Analgesic Study of Repeated Doses. Eur. J. Clin. Parmacol., 1982 ; 23 : 315-319 Upsa Méthodo essais 2002 18/10/02 15:57 Page 109 Les contraintes des essais cliniques en pédiatrie Jacques Wrobel Les contraintes imposées aux promoteurs et aux investigateurs dans le cadre des essais cliniques propres au développement des nouveaux produits antalgiques en pédiatrie doivent être dissociées de celles imposées à l'adulte. Ainsi, dès les années soixante, le Dr Harry Shirkey estimait que les enfants sont des “orphelins thérapeutiques” (1,2). ■ LES CONTRAINTES D'ORDRE PRATIQUE Les contraintes liées aux essais cliniques comportent à la fois des aspects réglementaires, éthiques et techniques. Le développement des médicaments passe obligatoirement, après la phase de recherche, par la mise en place d'essais cliniques sur l'humain, afin de mesurer leur efficacité et leur tolérance dans les conditions les plus proches possibles de leur utilisation à venir. La déclaration d'Helsinki indique que le progrès de la médecine est fondé sur la recherche, qui doit elle-même s'appuyer sur les expérimentations. Ces essais cliniques, désignés par le terme “recherche biomédicale”, sont aujourd'hui relativement bien codifiés en France par des dispositions réglementaires du Code de santé publique (3) ayant pour objet de protéger au mieux les personnes, bien portantes ou malades, qui vont s'y soumettre (articles L 1121.1/10). Le non-respect de ces dispositions peut entraîner des amendes et des peines de prison pour le promoteur (le laboratoire) ainsi que pour l'investigateur, qui risque également d'être suspendu provisoirement de son droit d'exercer la médecine (articles L 1126.1/ 7). Chacun se doit de respecter ces contraintes réglementaires.Voici les principaux articles de loi les concernant. ESSAIS CLINIQUES DES ANTALGIQUES ◗ Au plan réglementaire 109 Upsa Méthodo essais 2002 18/10/02 15:57 Page 110 ESSAIS CLINIQUES DES ANTALGIQUES • L'article L 1122.2 du Code de santé publique donne des précisions sur le “consentement éclairé” qui doit être notifié par écrit par celui qui va faire l'objet d'un essai clinique. Il indique que « le consentement éclairé est donné par les titulaires de l'autorité parentale pour des mineurs nonémancipés, ou pour des majeurs qui sont protégés par la loi, mais le consentement du mineur doit également être recherché lorsqu'il est apte à exprimer sa volonté et il ne peut être passé outre son refus ou la révocation de son consentement ». Le moment à partir duquel on peut demander son avis au mineur est donc laissé à l'appréciation de chacun. Plus important est de préciser que l'avis favorable doit être émis par les deux parents qui sont “les titulaires de l'exercice de l'autorité parentale”. Il peut être toutefois compliqué d'obtenir ces deux avis, dans une situation d'urgence, ou lorsque les parents vivent séparés. 110 • L'article L 1124.1 porte sur la notion de “bénéfice individuel direct”. Il précise qu'il doit y avoir une absence de “risque prévisible sérieux pour la santé des personnes qui se prêtent à la recherche” et qu'elle doit être utile pour d'autres personnes d'un âge identique. Il est donc nécessaire de respecter le bénéfice direct de l'enfant,tout en ne perdant pas de vue que la législation française impose de ne pas commercialiser un nouveau médicament,destiné à l'enfant ou à l'adulte,sans apporter les preuves de son efficacité et de sa tolérance. La recherche de ces preuves est particulièrement complexe chez l'enfant car il est en maturation constante. Des organes comme le foie ou les reins voient leur taille et leur fonction se modifier en relation avec la croissance de l'enfant, ce qui rend plus délicate l’analyse des paramètres biologiques. Concevoir un protocole d’essai clinique chez l’enfant impose donc de prendre en compte ce facteur croissance en instituant des groupes d’individus d’âge et de poids évolutifs.Tout ceci alourdit notablement les effectifs nécessaires et les essais doivent donc être menés à différents âges, ce qui en multiplie le nombre. • L'article L 1124.2 précise qu'une “indemnité peut être versée en contrepartie des contraintes subies, sauf pour un mineur ou un majeur protégé”. Ceci veut dire qu'en aucun cas des parents ou des tuteurs ne peuvent entraîner des enfants à faire l'objet d'essais thérapeutiques pour des intérêts financiers. Upsa Méthodo essais 2002 18/10/02 15:57 Page 111 ◗ Au plan éthique Chaque protocole doit faire l'objet d'un examen approfondi par un Comité Consultatif de Protection des Personnes pour les Recherches Biomédicales (CCPPRB), qui juge de son bien-fondé scientifique et méthodologique et dont l'accord officiel est obligatoire en préalable à la mise en place de l'essai (articles L 1123.1/11).Les essais cliniques menés chez l'enfant posent souvent un problème dès cette étape de mise en place, à cause tout simplement de la jeunesse des sujets concernés. On note souvent des réticences du personnel soignant (le personnel paramédical et les médecins) vis-à-vis de l'expérimentation. Les soignants sont souvent très sensibles à la réalisation d'essais chez l'enfant. Ainsi, les essais comparatifs avec un placebo sont mal accueillis. En effet, comment imaginer que dans un protocole, un enfant sur deux ne recevra pas un produit actif alors qu’il présente une pathologie douloureuse réelle. Par ailleurs, l'essai clinique est un facteur de travail supplémentaire, compte tenu des contraintes liées au protocole qu'il induit. Citons le cas des prélèvements sanguins, pour lesquels le nombre de prélèvements et la quantité de sang à recueillir sont plus problématiques chez un enfant en bas âge que chez un adulte. Souvent, une relation affective se crée entre le soignant et l'enfant et peut entraîner une incitation à soustraire celui-ci de l'essai clinique, même lorsque le risque est limité. La famille est aussi facteur de réticence. L'enfant hospitalisé et sa famille sont à la recherche de certitudes et non de motifs d'inquiétude et l'essai d'un médicament ou d'un nouveau dosage n'est pas le bienvenu. Les parents d'un enfant hospitalisé vivent le plus souvent une situation angoissante. Ils ne sont alors pas dans les meilleures dispositions pour comprendre ce que l'on attend d'eux dans le contexte très particulier, tant administratif que clinique, d'un essai thérapeutique. L'enfant est inquiet lui aussi et peut poser la question “pourquoi moi ?” alors que son accord est nécessaire. ESSAIS CLINIQUES DES ANTALGIQUES ◗ Au plan technique 111 Upsa Méthodo essais 2002 18/10/02 15:57 Page 112 ■ LES CONTRAINTES D'ORDRE ÉCONOMIQUE Des contraintes d’ordre économique existent également. Ainsi, les essais cliniques, base du développement médical des produits, sont longs et coûteux, ainsi que toutes les études pharmacologiques préalables, indispensables et complexes. Le laboratoire pharmaceutique a pour contrainte supplémentaire de mettre à disposition des enfants malades des dosages et des présentations différentes. Cette spécificité, propre à la pédiatrie, multiplie également le nombre d’essais cliniques à réaliser. Parallèlement, le marché des produits antalgiques en pédiatrie est restreint en volume et en chiffre d’affaires, si on le compare à celui de l’adulte. En effet, le prix de vente proposé par les autorités de tutelle est calculé, en toute logique, au prorata du principe actif. Ceci diminue d’autant la rentabilité de chaque produit dans ses différentes formes. Un impact négatif sur le potentiel de mise en place des essais cliniques en pédiatrie est alors inévitable. ESSAIS CLINIQUES DES ANTALGIQUES ■ LES PERSPECTIVES D'AVENIR 112 D'un point de vue réglementaire, il est souhaitable de pouvoir autoriser le démarrage d'un essai clinique avec l'autorisation d'un seul parent, le deuxième signant plus tard. La présence d'un expert pédiatre dans chaque Comité d'Éthique devrait également favoriser l'évaluation des protocoles. La réduction du caractère agressif de certains prélèvements ou examens bénéficie dorénavant de l'existence de micro-méthodes de dosage et du recours systématique aux crèmes antalgiques. D'un point de vue scientifique, des nouveaux concepts se développent actuellement dans chaque domaine thérapeutique. La sensibilisation des pédiatres aux problèmes de l'antalgie chez l'enfant constitue un atout supplémentaire. La mise en place de réseaux de pédiatres pourrait favoriser l'organisation des essais cliniques. Enfin,“mieux prendre en charge la douleur de l'enfant” est une des trois priorités du deuxième programme de lutte contre la douleur 2002-2005 du Ministère de la Santé. Les pouvoirs publics et les laboratoires, stimulés par ces évolutions, semblent mieux s’impliquer pour que soient mises à disposition du corps médical des solutions thérapeutiques nouvelles et adaptées. D'un point de vue sociologique, les familles doivent faire de plus en plus Upsa Méthodo essais 2002 18/10/02 15:57 Page 113 l'objet d'une information détaillée. Leur rôle est central dans la mesure où ce sont elles qui connaissent le mieux leur enfant et qu'elles en ont la responsabilité (4). L’avenir est donc porteur d’optimisme. ■ CONCLUSION L'amélioration de la formation du corps médical et de l'information du grand public à la prise en charge de la douleur de l'enfant est fondamentale.Tous les moyens publics et privés doivent y contribuer. De cette évolution dépend une meilleure compréhension des contraintes liées aux essais thérapeutiques chez l'enfant, afin de pouvoir favoriser leur réalisation dans les meilleures conditions de confiance et de sécurité. Les contraintes réglementaires qui s’appliquent aux recherches biomédicales chez l’adulte peuvent, à l’instar des textes précédents concernant l’enfant, être consultées dans le même chapitre du Code de santé publique (articles L 1121.1 / L 1126.7). 1.“Why FDA is encouraging drug testing in children”, FDA Consumer, july/august 1991. 2. Shirkey H.,Therapeutic orphans, J. Pediatr, 1968 : 72, 1, 119-20. 3. Code de santé publique, Édition 2001, 6-15, Dalloz. 4. Cook J.,Tursz A., L'enfant et la douleur, familles et soignants, 1998, Ed Syros ESSAIS CLINIQUES DES ANTALGIQUES Bibliographie 113 Upsa Méthodo essais 2002 114 18/10/02 15:57 Page 114 Upsa Méthodo essais 2002 18/10/02 15:57 Page 115 5. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Évaluation de la douleur post-opératoire Dominique Fletcher Le nombre de patients constitue un premier point important dans le cadre de l’évaluation de la douleur post-opératoire compte tenu de la variabilité des phénomènes de douleur. Les consommations de morphine, par exemple, pour des douleurs post-opératoires, vont de un à cinq selon les patients. Pour réduire cette variabilité, il convient de se rapprocher le plus possible des situations de puissance intrinsèque. Pour ce faire, le risque alpha et le risque bêta doivent être déterminés, le risque alpha révélant à tort une différence et le risque bêta ne révélant pas une différence qui existe. Il paraît possible d’effectuer des recherches cliniques avec moins de 500 patients. Mais l’une des limites est la pertinence clinique de la différence statistique. L’analyse de technique analgésique en postopératoire revient à interroger la thérapeutique habituelle. C’est pourquoi il est important de combiner la pertinence statistique de l’étude et l’objectif clinique quant à la différence à mettre en évidence. Le calcul prédictif du nombre des patients est aussi un élément important. Il dépend de la variabilité du critère utilisé, de la différence à mettre en évidence et des critères statistiques concernant le risque. Rétrospectivement, il faut aussi savoir si l’étude a la sensibilité intrinsèque est suffisante pour mettre en évidence une différence. Une différence entre un traitement A et le placebo peut révéler une puissance suffisante de l’essai. Ce faisant, si la comparaison entre deux traitements A et B, potentiellement efficaces, ne fait apparaître aucune différence, c’est que la différence n’est pas importante. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ■ LE NOMBRE DE PATIENTS 115 Upsa Méthodo essais 2002 18/10/02 15:57 Page 116 Les calculs du nombre de patients sont parfois une limite à la pratique de la recherche clinique, sachant que l’information n’est pas toujours disponible quant aux critères analysés. Il faut engager des études ouvertes d’analyse de critère.Par ailleurs,les études multicentriques sont difficiles à gérer. Mais ces études, même si elles portent sur un nombre de patients réduit, peuvent présenter un intérêt à partir du moment où la différence à mettre en évidence est définie précisément. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ■ LES CRITÈRES DE QUALITÉ MÉTHODOLOGIQUE 116 La randomisation et le double aveugle permettent de “verrouiller” la majorité des biais. Sans la randomisation, l’effet analysé est surestimé. Cela étant, il convient de le définir de manière appropriée sur la base de critères qui essaient de limiter la connaissance de l’ordre de randomisation. La sélection peut être centralisée avec des listes préalablement établies. Le “double-aveugle” nécessaire pour éviter les biais peut être affiné, notamment en cas d’effets secondaires fréquents des produits à analyser. En particulier, l’utilisation d’un placebo actif limite le risque de perception par le patient et par l’équipe soignante du type de traitement qui a été administré. Le “double-dummy” correspond à une double administration de différents produits réalisée sur un patient placebo. Pourquoi continuer à analyser les patients exclus ? De fait, des études positives, en dépit de leur moindre qualité méthodologique, ont tendance à être davantage publiées que les études négatives. Cela a été l’une des critiques adressées aux études portant sur l’analyse postopératoire utilisant des techniques d’administration périphérique d’analgésie. La majorité des études positives avaient un niveau méthodologique faible, contrairement aux études négatives. Ce biais de publication doit être anticipé. ■ TYPE DE CHIRURGIE Il faut garder à l’esprit les facteurs de variabilité dans le cadre de l’analyse en post-opératoire. Dans le contexte de la nociception, les douleurs neurogènes et viscérales doivent être prises en compte. L’intensité de la douleur selon le type de chirurgie est également variable.L’évolution est Upsa Méthodo essais 2002 18/10/02 15:57 Page 117 aussi différente quant à la durée et aux facteurs déclenchants. En améliorant l’homogénéité, l’étude gagne en puissance et permet de mieux mettre en évidence la différence que l’on souhaite. Il faut donc absolument se restreindre à des populations bien ciblées en termes de type chirurgical. Les opérations doivent être également aussi standardisées que possible. Les études mêlant des patients aux origines chirurgicales variées sont fatalement moins puissantes. Les scores globaux de douleur figurent parmi les premiers critères d’évaluation. Les seuils douloureux sont sans doute plus pertinents pour raisonner en termes de mécanismes.Il est aussi possible d’adopter comme critère la consommation d’analgésiques. ◗ Les scores de douleur Sauf en post-opératoire immédiat,il ne faut pas se fonder sur une hétéroévaluation. L’auto-évaluation par échelle visuelle analogique (EVA), échelle verbale ou numérique reste la référence. L’EVA a l’avantage d’être continue et d’avoir été validée. Elle a une corrélation précise et une linéarité dans sa réponse par rapport au type de stimulation et à la douleur perçue par le patient. Des expériences standardisées de stimulation thermique montrent une bonne linéarité de la réponse du patient et de la description de la douleur. Cela étant, les résultats des échelles d’évaluation peu utilisées, comme l’échelle numérique ou l’échelle verbale, sont bien corrélés avec les scores d’EVA. Il est donc possible de réaliser des essais cliniques avec ces scores comme critère principal. L’EVA peut être sensibilisée au mouvement. Les techniques d’évaluation en post-opératoire ont récemment dérivé vers une évaluation de la douleur dans des conditions de mouvements standardisés, l’objectif étant d’évaluer les patients dans le cadre d’une réhabilitation,c’est-à-dire d’une reprise de l’activité précoce en post-opératoire. La notion de mouvement permet de quantifier la douleur provoquée (différente de la douleur spontanée) pour sensibiliser la mesure et en tirer des conséquences cliniques en termes de capacités de mobilisation. Mais, les techniques d’évaluation rétrospectives ont peu d’avantages. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ■ LES CRITÈRES D’ÉVALUATION 117 Upsa Méthodo essais 2002 18/10/02 15:57 Page 118 L’intervalle de confiance est aussi une notion importante. La comparaison d’études avec un contrôle à quatre heures et à vingt-quatre heures avec un niveau d’efficacité défini à 3 sur une EVA montre que la moyenne à quatre heures est proche du seuil d’efficacité. En revanche, la dispersion des valeurs ne permet pas de penser que le traitement est vraiment fiable. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ◗ Les seuils douloureux 118 Il n’a pas encore été démontré que les seuils douloureux sont vraiment utiles en termes d’analyse post-opératoire.Il s’agit plus d’un transfert de techniques réservées à la recherche animale ou humaine non clinique. L’objectif est de raisonner, non plus sur la douleur spontanée, mais sur la douleur provoquée dans un contexte clinique. Les cas susceptibles de réactiver les stimulus mécaniques doivent permettre de définir le seuil de douleur. L’allodynie mécanique sera diagnostiquée si le niveau douloureux est réduit par rapport à une situation de contrôle.Au-delà, l’hyperalgésie sera diagnostiquée. Les études utilisent des stimulations de large surface avec une pression sur la cicatrice ou avec des fils qui permettent de déterminer, de manière plus limitée dans l’espace, un seuil. Des stimulations thermiques et électriques ont aussi été testées, mais elles sont peu applicables dans le cadre post-opératoire. La détermination de ces seuils a pour objectif de raisonner sur des notions d’hyperalgésie renvoyant à l’allodynie primaire au niveau du site de la lésion et secondaire autour de la lésion. On s’intéresse à la réduction des seuils après la stimulation mécanique pour ce qui est de l’hyperalgésie secondaire. Il s’agit du seul phénomène détectable. Les stimulations statiques et dynamiques donnent des éléments différents de physiopathologie. Ainsi, la réalisation d’une inflammation par injection de capsaïcine, par pression, par fil ou au toucher peut être responsable d’une allodynie. En cas d’infiltration, seul le phénomène d’allodynie statique est interrompu, alors que l’allodynie dynamique ne franchit pas la barre d’infiltration. Il est donc possible, sur un registre expérimental, de raisonner de manière intéressante sur des physiopathologies différentes d’allodynies. Le transfert de ce type d’analyse sur un plan clinique peut aussi avoir des conséquences intéressantes en termes de mécanismes d’actions des analgésiques. 18/10/02 15:57 Page 119 L’étude de la prévention par la morphine de certains phénomènes douloureux peut être citée comme exemple.Les patients ayant subi une chirurgie gynécologique recevaient des morphiniques à différents temps de l’intervention dans le cadre d’un protocole d’analyse. Le premier groupe recevait 10 mg de morphine en pré-induction, le deuxième en intra-musculaire au début de l’induction et le troisième en fin d’intervention. Une augmentation de la différence de seuil entre une zone péri-cicatricielle et une zone contrôle a permis d’identifier une allodynie. En l’occurrence, seul le deuxième groupe connaissait ce phénomène de limitation de l’allodynie mécanique. Ainsi, il a été possible de mieux dissocier les effets à différents moments de l’administration de l’analgésique. Une expérience a aussi été menée concernant des patients ayant subi une chirurgie abdominale et chez qui une pression au niveau de la cicatrice a été exercée. Un groupe a reçu un traitement contrôle et l’autre groupe un traitement par de la kétamine en per-opératoire, l’évaluation de la réponse à la pression se faisant à distance de l’intervention. Ainsi, le seuil nociceptif à la pression augmentait dans le groupe ayant reçu de la kétamine, correspondant à une limitation de l’allodynie mécanique. Par ailleurs, la douleur décrite par le patient après une pression supra-liminaire était plus faible dans ce groupe.Autrement dit, l’hyperalgésie mécanique diminuait. ■ LES CONSOMMATIONS D’ANALGÉSIE Le standard dans le domaine des consommations d’analgésie renvoie aux consommations auto-contrôlées. C’est le meilleur moyen d’administrer aux patients de la morphine sans autre facteur que son bon vouloir. Dans ce cadre, il est possible de revoir les doses cumulées ou horaires, ce qui permet d’avoir une vision globale ou une vision des variations. Cependant, il faut savoir qu’aucune relation fine n’existe entre les concentrations de morphine trouvées dans le sang et le niveau d’efficacité analgésique observé chez chacun des patients. En outre, les critères de consommation du patient ne sont pas uniquement liés à la douleur. Néanmoins, c’est le meilleur moyen de permettre au patient de s’administrer un antalgique de façon standardisée et sans facteurs de confusion. L’analgésique à la demande est un pis-aller. Il peut être utilisé en ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Upsa Méthodo essais 2002 119 Upsa Méthodo essais 2002 18/10/02 15:57 Page 120 traitement de secours uniquement sur des critères stricts. Dans une étude où il n’est pas possible d’utiliser l’analgésie auto-contrôlée, on peut utiliser un traitement intermittent par antalgique. Mais le critère d’administration doit être aussi standardisé que possible avec le traitement connu. Il est aussi possible d’accroître les délais de demande. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ■ LES LIMITES 120 L’étude de la relation entre la concentration de l’analgésique dans le sang et le niveau de douleur montre une concentration maximale inefficace et minimale efficace. Pour une même chirurgie, les concentrations varient beaucoup selon les patients. Cette relation n’est pas mécanique. L’analyse auto-contrôlée permet seulement de s’adapter à la variabilité des patients qui peuvent fluctuer leur consommation de morphine aussi librement que possible. L’EVA, grâce au caractère continu de ses scores, permet un traitement statistique.Ainsi,une étude à partir de scores d’EVA a été réalisée auprès de femmes venant d’accoucher et à qui différents traitements avaient été administrés. Les auteurs ont tout d’abord cherché si la distribution était normale. Ensuite, ils ont procédé à une analyse de la puissance et de la fiabilité des tests effectués, qu’ils soient paramétriques ou non. La capacité à détecter les faux positifs était bonne pour tous les tests. Néanmoins, la puissance était supérieure pour les tests paramétriques. Des problèmes se sont également posés pour les EVA proches des valeurs extrêmes. Les auteurs en ont donc conclu que les bons tests concernant les scores de douleurs, même en l’absence de distribution normale, restaient les tests paramétriques (notamment Anova). ■ CONCLUSION Une technique de recherche bien menée est fondée sur la sélection optimale des types de chirurgie. Il n’est pas possible de réaliser des études très larges. Ainsi, il faut avoir des objectifs raisonnables de pertinence clinique. Il convient également de définir ses paramètres et utiliser une analyse statistique adaptée. Upsa Méthodo essais 2002 18/10/02 15:57 Page 121 Exigences méthodologiques pour les essais thérapeutiques dans les douleurs neuropathiques Ce n’est que depuis cinq ans environ que les grands groupes pharmaceutiques s’intéressent à la douleur neuropathique. Jusqu’à présent, les cliniciens étaient habitués à des essais méthodologiques portant sur des effectifs extrêmement réduits (15 à 20 patients), ce qui en diminuait d’autant la qualité. Cependant, l’évaluation des douleurs neuropathiques a beaucoup progressé. Le problème de la randomisation et des statistiques se pose moins aujourd’hui que celui de l’évaluation de la douleur. ■ ÉTAT DES LIEUX ◗ Historique Depuis quelques années, des laboratoires ont réalisé des essais à la méthodologie beaucoup plus avancée qu’auparavant avec des effectifs plus importants. Citons notamment un essai sur la gabapentine, un autre sur le tramadol et un dernier aux États-Unis sur l’oxycodone concernant les neuropathies douloureuses du diabète et les algies post-zostériennes. Ces essais ont une méthodologie très proche des essais initiaux. Le plus souvent, les patients sont classés selon l’étiologie de leur douleur. La plupart des essais thérapeutiques considèrent deux grandes étiologies comme étant des modèles d’études : les neuropathies du diabète et les algies post-zostériennes. Les lésions nerveuses traumatiques ou les douleurs centrales sont moins considérées. ◗ La méthode d’évaluation La douleur est considérée de façon assez globale. Généralement, les études utilisent des échelles visuelles analogiques (EVA). En consultation, il est demandé au patient de noter un score de ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Nadine Attal 121 ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Upsa Méthodo essais 2002 122 18/10/02 15:57 Page 122 douleur. À domicile, le patient remplit un carnet d’auto-évaluation le soir et note son score de douleur sur une échelle numérique allant de 0 à 10. Cette évaluation porte sur l’ensemble de la douleur de la journée. Les échelles catégorielles peuvent aussi être utilisées en plus des échelles visuelles. Un certain nombre d’études ont également utilisé la version abrégée du questionnaire de Mac Gill. Les études considèrent souvent la qualité de vie avec l’échelle SF 36 (voir p. 53). Mais celle-ci n’est peut-être pas la plus adéquate à la mesure du retentissement de la douleur neuropathique. Elle paraît un peu trop globale. Parmi les critères utilisés, les méta-analyses de Mc Kay indiquent que le critère le plus pertinent dans les essais classiques est une diminution de l’EVA d’au moins 50 %. Dans l’étude sur la gabapentine qui a porté sur un effectif important, les scores de douleurs spontanées étaient cotés à 6 sur 10 sur une EVA pour passer à 4 pour le placebo et à 3 pour la gabapentine.Très exactement, la différence entre le placebo et la gabapentine était de 1,5 point sur l’EVA. Cependant,la question de la pertinence clinique du score de l’EVA reste posée. C’est pourquoi certains auteurs proposent de se fonder sur le pourcentage de diminution du score de l’EVA. La plupart des études récentes n’ont pas considéré ce critère. Mais il a été largement utilisé à l’occasion d’études portant notamment sur les antidépresseurs avec des méta-analyses. ◗ Les limites de la méthodologie L’une des principales limites est peut-être que l’évaluation clinique n’est pas suffisamment adaptée aux spécificités des douleurs neuropathiques. Aucune des échelles ne traduit la richesse sémiologique de ces douleurs et permettrait d’affiner les critères d’évaluation d’un traitement. ■ LES ENJEUX ◗ Mise en perspective Une douleur neuropathique (liée à une lésion du système nerveux) est un syndrome douloureux qui peut être dû à de nombreuses étiologies, comme le diabète ou le zona, et qui associe un cortège de symptômes Upsa Méthodo essais 2002 18/10/02 15:57 Page 123 positifs ou négatifs comme la perte de la sensibilité, l’hypoesthésie ou l’hypoalgésie. Il peut y avoir d’autres symptômes : déficit moteur, troubles de la température cutanée, phénomènes vasomoteurs, etc. ◗ Comment évaluer globalement la douleur neuropathique ? L’interrogatoire L’évaluation passe par un interrogatoire concernant l’existence de la douleur au repos ou l’existence d’une douleur évoquée. Les caractéristiques de ces douleurs seront précisées par des échelles appropriées. La localisation de la douleur, l’évolution temporelle et l’intensité de douleur sont aussi des éléments importants. L’EVA ou l’échelle numérique est la plupart du temps utilisée pour mesurer l’intensité de la douleur. Concernant la douleur évoquée, on peut demander quelle est la douleur à l’effort, sachant que certains patients la ressentent fortement (allodynie du mouvement). Les douleurs au frottement sont également évoquées, sachant que les patients s’en plaignent spontanément, notamment ceux qui ont un zona. Cette douleur peut être cotée sur une EVA. Enfin, il est demandé au patient s’il est gêné par le froid. Les instruments de mesure Plusieurs échelles peuvent permettre de déterminer les caractéristiques de la douleur. Le questionnaire de Mc Gill traduit et validé par François Boureau a été largement utilisé en France, notamment pour les douleurs neuropathiques. En 1990, François Boureau a indiqué que certaines des variables utilisées dans le questionnaire étaient ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Le problème est que la mesure globale de la douleur ne traduit pas finement l’ensemble des phénomènes neuropathiques comme l’allodynie hyperalgésique ou les phénomènes de post-sensation, d’adaptation et d’habituation anormale. L’intérêt clinique de cette évaluation est évident. Certains patients atteints de zona sont bien plus gênés par leur allodynie au frottement que par leur douleur spontanée. Sans évaluation du traitement de cette composante, l’effet peut être minimisé, voire inexistant. 123 Upsa Méthodo essais 2002 18/10/02 15:57 Page 124 ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES discriminantes des douleurs neuropathiques par rapport à des douleurs chroniques d’autres étiologies comme l’arthrose. Parmi les variables discriminantes, on retrouve les caractéristiques de la douleur neuropathique : brûlures, décharges électriques, démangeaisons, fourmillements, picotements, crampes et impressions de froid. Ce questionnaire a une pertinence au cours de l’interrogatoire concernant l’estimation des différents types de douleur puisqu’il est possible de quantifier ces variables. 124 Plus récemment, Galer et Jensen ont proposé d’utiliser un questionnaire incluant dix variables qui se veut plus spécifique de la neuropathie appelé “Neuropathic Pain Scale”. Ce questionnaire n’a pas, jusqu’à présent, été traduit. Il n’est pas disponible et n’a pas été utilisé dans les essais cliniques en France, même pour tenter de comparer plusieurs catégories de patients. Il a seulement fait l’objet d’une validation interne par ses auteurs qui ont montré que des variables pouvaient discriminer certains types de douleurs neuropathiques par rapport à d’autres, par exemple la névralgie post-zostérienne où l’impression de brûlure et de froid était davantage observée par rapport à des douleurs postraumatiques ou à des douleurs centrales. L’examen clinique L’examen clinique d’une douleur neuropathique doit s’intéresser aux symptômes négatifs d’hypoesthésie. Il est important de mesurer une hypoesthésie au chaud et au froid par exemple, sachant qu’elle peut traduire l’existence ou l’atteinte des petites fibres. L’examen va aussi s’intéresser à la recherche d’une allodynie et d’une hyperalgésie. Cet examen clinique standardisé est nécessaire. Par exemple, la mesure d’une allodynie dynamique au frottement (allodynie dynamique mécanique) peut être effectuée au moyen d’un pinceau ou d’une brosse à dents électrique. Il ne s’agit donc pas véritablement d’une évaluation quantitative. En revanche, il est possible de demander au sujet de rapporter l’intensité de l’allodynie sur une EVA ou une échelle numérique. Depuis quelques années, des techniques d’évaluation quantitative des troubles de la sensibilité ont également été introduites dans la recherche Upsa Méthodo essais 2002 18/10/02 15:57 Page 125 L’évaluation thermique, très utilisée actuellement, autorise la mesure concernant les fibres de petits calibres qui ne sont pas explorées par l’électrophysiologie conventionnelle.Ainsi, on peut obtenir des résultats des seuils de détection et de douleur au chaud et au froid ainsi que mesurer la douleur évoquée par l’application de stimulations supraliminaires. L’appareil utilisé (thermotest) comprend une thermode posée sur la peau du sujet à une température initialement neutre. Il est demandé au sujet d’appuyer sur un bouton pour renverser la stimulation au chaud ou au froid,le même principe s’appliquant pour définir le seuil de douleur.Grâce à la méthode des limites,l’appareil fait la moyenne des stimulations successives, ce score étant reporté sur un graphique montrant les seuils de perception au chaud et au froid. Des stimulations mécaniques telles les poêles de Bollfrey peuvent compléter l’analyse. Au cours de ces tests, il est nécessaire de contrôler un certain nombre de facteurs de variabilité comme l’âge du sujet, la taille de la thermode, la rapidité d’élévation de la température, la température cutanée et les paramètres liés au sujet lui-même, puisqu’il s’agit de méthodes semiobjectives. En effet, la réponse dépend de la subjectivité du sujet et du temps de réaction. Les patients soumis à des fortes doses de psychotropes auront des temps de réaction plus élevés.Ces paramètres doivent être gardés à l’esprit dans le cadre d’études multicentriques avec des effectifs plus importants. ◗ Applications Ces méthodes permettent de mieux mesurer les phénomènes négatifs comme l’hypoesthésie, l’hypoalgésie et les phénomènes de douleurs évoquées comme l’allodynie ou l’hyperalgésie. Dans cette perspective, l’allodynie correspond à une diminution des seuils de douleurs, alors que l’hyperalgésie peut être mise en évidence lorsqu’on compare les ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES clinique. Le but est de fournir des informations sur les seuils de détection ou de douleurs somesthésiques en réponse à des stimulations dites supra-liminaires. Les tests sont effectués en zone de douleur maximale. Les résultats obtenus sont comparés à une zone homologue saine ou à des sujets de contrôle. Différentes modalités somesthésiques (thermique, mécanique et vibratoire) sont testées. Ces mesures peuvent permettre une utilisation reproductible et relativement fiable. 125 ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Upsa Méthodo essais 2002 126 18/10/02 15:57 Page 126 réponses obtenues lors de l’application de stimuli supra-liminaires en zone saine et en zone lésée. Le sujet malade aura une augmentation de la pente stimulus-sensation. Une deuxième application est une meilleure évaluation des traitements de la douleur neuropathique. Plusieurs équipes ont développé une certaine habitude de ces techniques pour évaluer les traitements, y compris en double aveugle versus placebo.Il s’avère que ces techniques sont particulièrement sensibles pour mettre en évidence les effets de traitement sur l’allodynie au frottement, l’allodynie au chaud et au froid et l’hyperalgésie. Depuis plusieurs années, de nombreuses études ont porté sur l’application de ces méthodes à l’évaluation de substances comme la betamine qui a un effet anti-NMDA. L’approche quantifiée a ainsi été utilisée pour les anti-épileptiques, les anesthésiques locaux, les antagonistes des récepteurs NMDA et les blocs sympathiques. Pour ces derniers versus placebo, une efficacité préférentielle des sympatholytiques sur une hyperalgésie ou une allodynie au froid a été mise en évidence. Une étude avec de la gabapentine concernant des patients victimes de lésions nerveuses périphériques ou centrales a aussi été réalisée. L’effet sur la douleur spontanée continue a été très modéré, alors qu’il a été plus significatif pour les paroxysmes douloureux et l’allodynie au frottement,ce qui montre l’intérêt de dissocier ces différents composants lors d’une étude contrôlée. L’Emla (anesthésique) et les gels de lidocaïne ont entraîné une efficacité globale sur la douleur de l’algie post-zostérienne. L’Emla était peu efficace sur la douleur spontanée, mais très efficace sur l’hyperalgésie mécanique. Par ailleurs, nous avons montré que la lidocaïne pour les douleurs centrales en intra-veineuse versus placebo avait une efficacité très significative sur l’allodynie et l’hyperalgésie mécanique,tandis que la douleur spontanée était peu améliorée. ■ POUR UNE NOUVELLE APPROCHE Ces études permettent de discriminer les différents types de douleurs (spontanées et évoquées) et l’effet des composants.Le problème est que les symptômes ne sont pas toujours équivalents aux mécanismes. Ainsi, nous nous sommes davantage attachés à essayer d’évaluer les mécanismes des douleurs neuropathiques. Upsa Méthodo essais 2002 18/10/02 15:57 Page 127 Récemment, Fields, Rowbotham et Baron ont entrepris une série d’études pour mettre en évidence chez des patients présentant tous une névralgie post-zostérienne une certaine hétérogénéité. En particulier, les patients présentaient une forte allodynie au frottement, mais pas au chaud avec une réponse très importante aux blocs anesthésiques et une augmentation de la douleur initiale à l’application de capsaïcine qui active les fibres C. Un autre groupe de patients ne présentait aucune allodynie au frottement, mais une sensibilité au chaud extrêmement prononcée. Par ailleurs, ils ne répondaient pas aux blocs anesthésiques et à la capsaïcine.Un troisième groupe présentait à la fois une allodynie au frottement et un important signe de déficit au chaud, ce qui suppose une atteinte des fibres de gros calibres. Ainsi, aucune réponse aux blocs anesthésiques et à la capsaïcine n’était enregistrée. ◗ Vers un nouveau classement Ces études nous conduisent à penser que les douleurs neuropathiques pourraient être classées autrement que selon des critères étiologiques. Il serait intéressant d’examiner les symptômes douloureux et les mécanismes des douleurs neuropathiques afin d’avoir une approche encore plus patho-physiologique. En cas d’algie post-zostérienne, on peut penser que les patients qui ont une allodynie classée dans le groupe des nocicepteurs irritables avec peu ou pas d’effets thermiques vont répondre à des médicaments qui agissent plus spécifiquement sur des phénomènes de sensibilisation périphérique comme les topics locaux. Au contraire, les patients présentant des signes de désafférentation importante (déficit thermique) pourraient répondre davantage à des produits d’action centrale, sachant que ceci n’a jamais été validé. ◗ Les limites L’une des limites inhérentes à l’évaluation tient à la coopération du sujet et à une certaine variabilité des tests, ce qui nécessite d’uniformiser les paramètres de stimulation. Nous ne connaissons pas non plus le mécanisme des douleurs neuropathiques et l’action des traitements. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ◗ Bilan des études 127 Upsa Méthodo essais 2002 18/10/02 15:57 Page 128 Ainsi, il est difficile de faire une adéquation entre les opiacés ou la gabapentine et le zona ou les phénomènes de désafférentation. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ◗ Application à la méthodologie des essais cliniques 128 Cette méthodologie doit permettre de mieux évaluer la douleur spontanée et de dissocier les deux types de douleur,comme s’y attachent des études récentes. L’efficacité des anti-épileptiques sur les douleurs paroxystiques a pu être montrée grâce à ce type d’études. Il est également possible d’évaluer la douleur maximale sur 24 heures et la douleur d’efforts grâce à un interrogatoire. Concernant la douleur évoquée, les techniques disponibles ont des limites, sachant qu’elle peut être quantifiée lors de l’interrogatoire. L’étude tramadol a essayé de mesurer les paramètres de la douleur au frottement. Cet interrogatoire peut avoir une certaine validité par rapport à d’autres mesures et peut permettre d’être un peu plus discriminant. Lors de l’examen clinique, une allodynie au frottement peut être recherchée. Dans ce contexte, le stimulus doit être contrôlé. Pour réaliser une étude multicentrique, tous les investigateurs doivent utiliser la même méthode et être formés à l’examen, même si ce dernier n’a rien de contraignant. Par ailleurs, on peut d’ores et déjà envisager d’utiliser ces tests quantifiés dans les essais thérapeutiques à grande échelle. Les laboratoires commencent à se poser la question. Ils ont compris l’intérêt d’avoir une approche un peu plus “mécanistique”. Une évaluation standardisée avec les mêmes paramètres de stimulation, des expérimentateurs formés et des patients préalablement entraînés, peut être menée à une plus grande échelle avec des thermotests notamment. Upsa Méthodo essais 2002 18/10/02 15:57 Page 129 Méthodes de développement clinique des anti-migraineux La méthode d’évaluation dans le domaine des migraines et des céphalées repose sur des bases assez solides du fait du consensus existant grâce à l’International Headache Society (IHS). Historiquement, la méthodologie du traitement de crise s’est nourrie du développement des triptans, notamment du sumatriptan. Les critères IHS et Glaxo pour évaluer l’efficacité des anti-migraineux ont eu tendance à se concurrencer, sachant que les critères Glaxo, avec leurs qualités et leurs inconvénients, sont encore largement utilisés. ■ LES PATIENTS ◗ Les critères diagnostiques IHS La distinction entre migraine sans aura et avec aura est exigée pour pouvoir inclure un patient dans un essai thérapeutique. La migraine sans aura La migraine sans aura (ou migraine commune) correspond à au moins cinq crises. Un patient n’est pas considéré comme migraineux s’il a eu seulement une crise ; de plus, il doit avoir des céphalées durant 4 à 72 heures.Par ailleurs,la migraine doit revêtir au moins deux des caractéristiques suivantes : unilatéralité, pulsatilité, intensité modérée ou sévère, aggravation par les activités physiques (par exemple, la montée des escaliers). Enfin, la migraine doit être associée à au moins l’un des signes suivants : nausées et/ou vomissements (composante digestive) et photophobie et phonophobie (hyperesthésie sensorielle). ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Michel Lanteri-Minet 129 Upsa Méthodo essais 2002 18/10/02 15:57 Page 130 La migraine avec aura ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Actuellement, nous butons sur le problème de la prise en charge de la migraine avec aura, sachant que la tendance aujourd’hui est de regrouper cette population avec celle de la migraine sans aura pour les études, ce qui est dommage. Mais il faut savoir que la migraine avec aura (ou migraine classique) est beaucoup moins fréquente (10 à 20 % des crises). Les critères IHS font référence et sont assez faciles à utiliser, contrairement à ce qui est dit. Ils permettent, de surcroît, une bonne homogénéité des patients et une bonne correspondance avec la réalité clinique. La correspondance des critères IHS avec la réalité clinique du praticien atteint près de 95 %. 130 ◗ Les autres critères Le problème des céphalées intercalaires Un certain nombre de critères reviennent systématiquement dans les essais migraineux. Tout d’abord, les céphalées intercalaires. qui concernent les patients qui allèguent des céphalées entre deux crises de migraine, ces céphalées étant prolongées et moins paroxystiques que les crises de migraine. Il est possible d’inclure des patients ayant des céphalées intercalaires, à condition qu’ils puissent les individualiser par rapport à la migraine. Ils ne doivent pas prendre l’anti-migraineux au moment de la céphalée intercalaire afin de ne pas biaiser l’étude. Mais, la question de la différence entre la céphalée intercalaire et la migraine d’un point de vue physiopathologique reste posée. Par ailleurs, ces céphalées intercalaires ne doivent pas être présentes plus de six jours par mois. Au-delà, il s’agit de patients sujets à des céphalées quotidiennes chroniques. Ces sujets, qui ont tendance à l’abus médicamenteux, ne sont pas les mieux placés pour faire partie des essais. Le nombre de crises Les migraineux ne doivent pas avoir plus de six crises par mois. Sinon, les patients sont considérés comme pouvant présenter des céphalées Upsa Méthodo essais 2002 18/10/02 15:57 Page 131 quotidiennes chroniques, avec un risque d’abus médicamenteux. Les patients ayant moins d’une crise par mois ne sont pas non plus considérés comme pouvant être inclus pour des raisons d’efficience de l’essai. L’ancienneté L’âge L’âge de début de crise ne doit pas excéder 50 ans. En effet, la fréquence des migraines dites “symptomatiques”est importante après 50 ans,ce qui constitue un biais de recrutement. Par ailleurs, le patient doit être âgé entre 18 et 65 ans. Ceci pose un problème du point de vue de l’utilisation pratique des triptans.La réglementation interdit l’utilisation des triptans avant 18 ans. Ainsi, actuellement, aucune donnée fiable n’est disponible concernant l’utilisation des triptans parmi cette population. Or, la prévalence de la migraine dans cette population peut être estimée à 3-5 %, ce qui n’est pas négligeable. Les migraineux sont généralement des sujets plutôt jeunes. Mais il arrive que des migraineux sévères aient cette maladie tout au long de leur vie. Ainsi, un patient âgé de 65 ans peut très bien demander s’il peut avoir recours au triptan. Aujourd’hui, le critère d’âge 18-65 ans est davantage utilisé par habitude que de manière justifiée. Il faut donc s’en méfier. L’adaptation de la méthodologie peut parfois s’avérer nécessaire. ■ LE CRITÈRE D’EFFICACITÉ ◗ Les critères IHS Le critère de l’IHS a l’avantage de la clarté :“headache free”.Autrement dit, un anti-migraineux efficace fait totalement disparaître la céphalée deux heures après la prise du traitement. ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Il est toujours exigé une ancienneté supérieure à un an. Les migraines qui viennent de se déclarer ont souvent un caractère très capricieux. Il est difficile de connaître leur évolution tant en termes de fréquence que de nature de crise. Une amélioration de l’état du patient peut très bien résulter de l’évolution spontanée de la migraine. 131 Upsa Méthodo essais 2002 18/10/02 15:57 Page 132 ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ◗ Les critères Glaxo 132 La majorité des essais utilisent le critère Glaxo de soulagement de la céphalée à la deuxième heure. La crise de migraine est classée selon l’intensité avec l’échelle verbale suivante :“absente”,“minime”,“modéré” et “sévère”. Le soulagement correspond au passage d’une crise “sévère” cotée à 3 à une crise “minime”cotée à 1 ou “absente”cotée 0 ou bien au passage d’une crise “modérée” cotée à 2 à une crise “minime” ou “absente”. L’utilisation de ce critère est allée de pair avec le développement du sumatriptan en recherche clinique.Cette tendance s’est poursuivie et les autres laboratoires ont reproduit ce critère d’efficacité en le considérant comme une référence.L’avantage de ce critère est d’enregistrer des taux de succès plus élevés. Au-delà du caractère “flatteur” du résultat, la sensibilité plus élevée de ce critère peut aussi présenter un intérêt du point de vue méthodologique. Le principal problème est la pertinence clinique du passage d’un niveau 2 à un niveau 1, 75 % des patients passant d’une crise modérée à une crise minime jugeant ce passage non pertinent sur le plan thérapeutique. Il faut aussi savoir qu’il est impossible de traiter tôt avec ce critère. Le traitement démarre à partir d’une crise de niveau 2, ce qui ne reflète pas vraiment la réalité clinique. Hormis les cas d’abus médicamenteux, les praticiens conseillent souvent aux patients de se traiter le plus tôt possible. ◗ L’évaluation à quatre heures L’une des critiques méthodologiques de certains essais est l’évaluation à quatre heures. En effet, il faut se méfier de l’effet du traitement de secours, la majorité des essais sur les traitements anti-migraineux autorisant ce type de traitement à la deuxième heure. L’évaluation à quatre heures conduit ainsi à associer un groupe de patients constitués de ceux qui n’ont pas pris le traitement de secours et ceux qui l’ont pris. Pour ces derniers, il est difficile de savoir quel traitement a agi. L’analyse en sous-groupes rendrait l’essai ingérable sur le plan pratique et financier, compte tenu de l’importance des effectifs nécessaires. Dans certaines études, le promoteur demande aux patients d’attendre quatre heures avant de pouvoir utiliser le traitement de secours. Mais c’est très Upsa Méthodo essais 2002 18/10/02 15:57 Page 133 difficile en pratique, le patient ayant l’habitude de prendre son traitement au bout de deux heures. Avec le développement du sumatriptan, le problème de la récurrence est apparu. La récurrence est le fait qu’un patient voit réapparaître ou se réaggraver sa crise dans les 24 heures après une disparition ou une nette amélioration initiale. Les taux de récurrence des triptans s’élèvent à 30 %, ce qui n’est pas négligeable. Actuellement, les laboratoires se livrent bataille pour présenter des taux de récurrence différents. Cependant, la comparaison de deux molécules en termes de taux de récurrence n’a aucun sens en l’absence de taux de succès initiaux. Il est évident que le taux de récurrence augmente avec le taux de succès d’une drogue. Une réflexion à l’IHS vise à mettre au point un score de succès total : “headache free” à la deuxième heure et non-réapparition de la douleur dans les 24 heures. Ce critère ne paraît pas suffisant par rapport à la réalité clinique.En effet, il conduit à se concentrer sur les 24 premières heures,alors que la durée de la migraine est de 4 à 72 heures. La perte d’information est importante. Les essais cliniques n’ont, par exemple, pas du tout appréhendé le problème de la récurrence multiple.Certains patients qui reprennent du produit entre la 24e et la 48e heure estiment que le produit n’est pas efficace pour cette raison. L’IHS va peut-être tenir compte de cet aspect, mais il ne faudrait pas que des critères trop sévères entravent la sortie de nouveaux médicaments. Pour chaque étude, il faudra bien mesurer les avantages et les limites de ces choix. ◗ Le gain thérapeutique L’effet placebo est encore plus important dans la migraine que dans la douleur, la migraine étant auto-limitée dans des délais très variables selon les patients. Les crises cessent au bout de quatre heures pour certains patients. Ce délai est sans doute encore plus faible pour les enfants. Il est possible de comparer les taux de réponse en termes de soulagement selon les critères Glaxo, les taux de succès en termes d’absence de céphalées à deux heures, mais aussi le taux de succès ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES ◗ La récurrence 133 ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Upsa Méthodo essais 2002 134 18/10/02 15:57 Page 134 en termes de gain thérapeutique (c’est-à-dire la différence entre le taux de succès du produit étudié et le placebo). Il faut savoir que la comparaison de deux molécules évaluées au cours de deux essais différents est dénuée de sens sans les taux de réponse au placebo. Un taux d’efficacité de 70 % avec un bras placebo de 40 % et de 10 % n’a pas la même signification. L’effet placebo ne doit pas non plus être systématiquement critiqué. Il est important pour les cliniciens que nous sommes au quotidien. Il faut se méfier du discours de type “jusqu’au-boutiste” de la méthodologie clinique. Cette distance par rapport à la réalité peut être une source de déception. Un médicament avec un gain thérapeutique de 20 à 30 % est considéré comme ayant une efficacité modérée. Entre 30 et 40 %, le médicament est considéré comme efficace et, au-delà de 50 %, comme très efficace. Le gain thérapeutique facilite la comparaison d’études réalisées dans des conditions très différentes. Souvent, l’industrie pharmaceutique a tendance à présenter des résultats isolés, ce qui n’est pas justifié. ◗ Les autres critères d’évaluation D’autres critères peuvent être utilisés comme objectifs secondaires. Ils concernent l’évaluation sur les nausées-vomissements et sur la photophobie-phonophobie. La gêne fonctionnelle est liée à ces composantes sémiologiques qui sont obligatoirement présentes chez les migraineux. Un autre critère est l’effet sur l’impact fonctionnel qu’il serait possible d’élargir à la qualité de vie. Mais on a du mal à appréhender la notion de qualité de vie chez les migraineux. Il paraît douteux de mesurer la qualité de vie à partir d’un anti-migraineux de crise. Il ne s’agit pas de la même échelle de temps. Ainsi, l’influence nord-américaine conduit de plus en plus à mesurer la rentabilité et les conséquences en termes de remboursement des produits.Il faut se méfier de cette pensée économique qui ne doit pas occulter les aspects médicaux. Un critère important est la reproductibilité de l’effet. Les patients souhaitent fortement que le médicament garde son efficacité. Généralement, un médicament qui calme la douleur migraineuse deux fois sur trois est considéré comme bon, d’où l’apparition d’études évaluant sur trois crises. Enfin, le dernier critère qui va peut-être devenir important est la rapidité de l’effet. Selon des enquêtes, cette attente est faite chez les patients souffrant de migraines avec celle de l’accessibilité en termes Upsa Méthodo essais 2002 18/10/02 15:57 Page 135 de galénique. Ce critère mériterait de faire l’objet d’essais spécifiques, sachant que les études ont, jusqu’à présent, évalué ce critère en seconde analyse. ■ GRANDS ESSAIS OUVERTS ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES Il faut mettre en garde contre les grands essais en ouvert, destinés à déterminer des indices de satisfaction. Il vaudrait mieux faire des essais trouvant une résonance dans la pratique réelle. Les taux de satisfaction de 90 ou 95 % sont dénués de sens dans la mesure où ils n’intègrent pas ceux sortis de l’essai. Il est donc nécessaire de connaître le nombre de patients sortis de l’étude et les raisons de leurs sorties. 135 Upsa Méthodo essais 2002 136 18/10/02 15:57 Page 136 17/10/02 16:12 Page 1 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR UPSA couv Méthodologie MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR