m´ethode d`estimation du seuil optimal pour un test diagnostique
Transcription
m´ethode d`estimation du seuil optimal pour un test diagnostique
MÉTHODE D’ESTIMATION DU SEUIL OPTIMAL POUR UN TEST DIAGNOSTIQUE AYANT UNE DISTRIBUTION GAMMA Caroline Truntzer Muriel Rabilloud René Ecochard Laboratoire de Biostatistique - Santé Centre Hospitalier Lyon Sud-Pavillon 1M 165 Chemin du Grand Revoyet 69495 PIERRE BENITE Résumé: Une formule explicite du seuil de positivité optimal ainsi qu’une méthode d’estimation ponctuelle et par intervalle de ce seuil pour un test diagnostique qui suit une distribution gamma est proposée. Le seuil optimal est celui qui maximise l’état de santé moyen de la popultation, mesuré par l’utilité ”populationnelle”. Des méthodes d’estimation du seuil ont été développées par Jund et Rabilloud (2005) pour les tests diagnostiques qui suivent une distribution normale ou lognormale. Nous proposons une extension de ces méthodes pour les tests diagnostiques qui suivent une distribution gamma chez les sujets sains et les sujets malades, avec un effet multiplicatif de la maladie. Cela correspond à un paramètre de forme de la distribution gamma constant entre sujets sains et sujets malades. Cette méthode a été appliquée à l’estimation du seuil optimal d’un marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1. Mots clé: Test diagnostique - Seuil de positivité - Estimation ponctuelle et par intervalle - Distribution gamma - Utilité populationnelle - Cancer des Voies Aéro-Digestives Supérieures. Abstract: The optimal threshold for a diagnostic test is the one that maximises the average state of health of a population as assessed by ’population’ utility. Jund and Rabilloud have already developed methods to estimate the optimal threshold for diagnostic tests whose results are normally or lognormally distributed among the diseased and the healthy subpopulations. We present here an explicit formula to calculate the optimal threshold as well as point and interval estimates of that threshold for a diagnostic test whose results are gamma-distributed in both diseased and healthy subpopulations for a disease that exerts a multiplicative effect; that is that has a constant shape parameter in both subpopulations. The methods are applied to estimate the optimal threshold for the antigen Cyfra21.1, a serum marker of cancers of the upper aerodigestive tract. Key Words: Diagnostic test - Optimal threshold - Point and interval estimates - Gamma distribution - Population utility - Cancers of the upper aerodigestive tract. 1 1 Introduction La détermination d’un seuil de positivité est une étape indispensable dans le développement d’un test diagnostique pour son utilisation dans la pratique clinique comme outil d’aide à la décision diagnostique et thérapeutique. Le seuil optimal est celui qui maximise l’état de santé moyen dans la population à laquelle le test est appliqué. Pour un test diagnostique donné, ce seuil optimal dépend de la prévalence de la maladie dans la population et du Ratio entre le Bénéfice Net à traiter à raison un sujet malade et le Coût Net à traiter à tort un sujet non malade. Plusieurs auteurs ont montré comment déterminer le seuil optimal à partir de la courbe ROC et certains ont proposé une méthode d’estimation ponctuelle (Egan 1975, England 1988, Greiner 2000, Hanley 1988, Sox 1988, Tosteson 1988). Une formule explicite du seuil optimal a été donnée par Robert et Vermont (1991) pour une caractéristique qui suit une distribution normale ou lognormale dans la population des sujets sains et des sujets malades, de même variance dans les 2 populations. Jund et Rabilloud (2005) ont proposé une méthode d’estimation ponctuelle et par intervalle du seuil optimal dans cette situation. Nous proposons un élargissement de la méthode au cas où la caractéristique mesurée suit une distribution gamma. 2 Préliminaires L’utilité (Krieg 1986, Swets 1992, DeNeef 1993, Boyko 1994), est une mesure de la préférence pour différents états de santé sur une même échelle de valeur. Selon le statut malade ou non malade d’un sujet et le résultat du test diagnostique, il est possible de définir quatre valeurs sur cette échelle, qui sont dans l’ordre croissant l’utilité chez les faux négatifs (UF N ), chez les vrais positifs (UV P ), chez les faux positifs (UF P ) et chez les vrais négatifs (UV N ). Déterminer le seuil qui maximise l’état de santé moyen de la population revient à chercher le seuil qui maximise l’utilité moyenne (Sox 1988). Pour un seuil de positivité fixé, celle-ci est une combinaison des quatre utilités pondérées par l’effectif de la situation qu’elles représentent dans la population à laquelle le test est appliqué. Nous appellerons cette utilité moyenne l’utilité ”populationnelle”, et nous la noterons U . Elle peut s’écrire comme une fonction linéaire de la sensibilité Se et deh la spécificité qui i Sp du test, CN 1−P dépendent toutes les deux du seuil de positivité : U = K ∗ Se + Sp ∗ P ∗ BN + C • La sensibilité correspond au complément de la fonction de répartition FM de la caractéristique mesurée chez les sujets malades, tandis que la spécificité correspond à la fonction de répartition FS de la caractéristique mesurée chez les sujets sains. • BN correspond au bénéfice net à traiter à raison un sujet malade (BN = UV P − UF N ) • CN correspond au coût net à traiter à tort un sujet sain (CN = UV N − UF P ) 2 • 1−P P correspond à l’inverse de l’odds de la maladie dans la population à laquelle le test est appliqué. CN • Le ratio 1−P , que nous noterons R, représente le ratio du coût net moyen ∗ BN P sur le bénéfice net moyen dans la population si tout le monde était traité. • K et C sont des constantes qui ne dépendent pas du seuil de positivité. En remplaçant la sensibilité et la spécificité hpar les fonctions de corresponi répartition C 1−P N dantes, la fonction d’utilité devient : U = K ∗ (1 − FM ) + FS ∗ P ∗ BN + C Déterminer le seuil qui maximise l’utilité ” populationnelle ” revient à déterminer le seuil dFM /dt fM dU T qui annule sa dérivée première : dt T = 0 ⇔ dFS /dt = fS = R T 3 T Loi gamma et effet de la maladie La loi gamma permet de modéliser un effet multiplicatif de la maladie sur la caractéristique mesurée qui est par nature positive. La valeur x de la caractéristique X mesurée chez un sujet sain est multipliée par un facteur m lorsqu’il devient malade : y = g (x) = mx avec m > 1 . La fonction de densité de la loi gamma pour la caractéristique X s’écrit: f (x) = c(α, β)xα−1 e −1 x β 0 < x < +∞; α, β > 0; c(α, β) = 1 Γ(α)β α En appliquant le théorème de dérivation des fonctions composées, la fonction de densité de Y peut s’écrire: f (y) = c(α, β)( −y −y −y 1 1 α−1 mβ 1 1 α−1 mβ α−1 mβ )y e = ( )( )y e = y e mα Γ(α)β α mα Γ(α)(βm)α C’est la fonction de densité d’une loi gamma de paramètres α et βm , de moyenne (αβ)m et de variance (αβ 2 )m2 . Un effet multiplicatif modélisé par la loi gamma correspond ainsi à la situation où seul le paramètre d’échelle varie d’un type de sujets à l’autre. La moyenne chez les sujets malades est égale à celle des sujets sains multipliée par la constante m. La variance des sujets malades correspond à celle des sujets sains multipliée par la constante m2 . Ceci se traduit par une augmentation de la variance avec la moyenne. 4 Estimation ponctuelle du seuil de positivité Pour une caractéristique qui suit une distribution gamma dans la population des sujets sains et des sujets malades, le seuil optimal est tel que : 1 −T T fM αM −1 = exp( )Γ(αS )βSαS T 1−αS exp( ) = R αM T fS Γ(αM )βM βM βS 3 Dans la situation où la maladie a un effet multiplicatif sur la caractéristique mesurée, nous pouvons poser αS = αM = α. Le seuil théorique est alors donné par la formule: βS βM βS T = ln (R) − α ln ( ) βM − βS βM L’estimation du logarithme des paramètres convergeant plus rapidement vers une loi normale, c’est celui-ci qui est estimé. La formule théorique du seuil devient alors : eln(βS ) eln(βM ) eln(βS ) ln(α) ln(R) − e ln( ln(β ) ) T = ln(β ) e M − eln(βS ) e M On peut montrer que ce seuil est unique. L’estimation ponctuelle du seuil a été obtenue par plug-in en remplaçant dans cette formule le logarithme des paramètres de la distribution chez les sujets sains et les sujets malades par leur estimation du maximum de vraisemblance. C’est la vraisemblance globale des trois paramètres α, βM et βS qui a été maximisée par l’algorithme de Newton-Raphson. 5 Estimation par intervalle du seuil de positivité Pour connaı̂tre la précision avec laquelle le seuil a été estimé, un intervalle de confiance a été construit en approximant la distribution du logarithme du seuil estimé par une loi normale. q q ln (T̂s ) = ln (T̂ ) + 1.96 var(ln (T̂ )) ln (T̂i ) = ln (T̂ ) − 1.96 var(ln (T̂ )) Dans cet espace l’intervalle de confiance est symétrique. L’intervalle de confiance de T̂ obtenu en prenant l’exponentielle des bornes ln(T̂i ) et ln(T̂s ) devient asymétrique et contraint à des valeurs positives. La méthode delta, proposées par Casella (1996) a été choisie pour approximer la variance du seuil estimé par un développement de Taylor au premier ordre. L’approximation de la variance s’écrit: !2 !2 !2 ∂ T̂ ∂ T̂ ∂ T̂ ˆ ˆ M )) + ˆ S )) var(ln(α)) + var(ln(β var(ln(β var(T̂ ) ≈ ∂ln(α) ∂ln(βM ) ∂ln(βS ) ! ! ! ! ∂ T̂ ∂ T̂ ∂ T̂ ∂ T̂ ˆ ˆ M )) + 2 ˆ ˆ S )) + 2 cov(ln(α), ln(β cov(ln(α), ln(β ∂ln(α) ∂ln(βM ) ∂ln(α) ∂ln(βS ) ! ! ∂ T̂ ∂ T̂ ˆ M )), ln(β ˆ S )) + 2 cov(ln(β ∂ln(βM )) ∂ln(βS ) Pour un paramètre θ quelconque : ∂ln∂θ(T̂ ) = T̂1 ∂∂θT̂ La variance du logarithme de seuil estimé peut alors s’écrire : var(ln (T̂ )) = 4 1 var(T̂ ). T̂ 2 6 Application Nous présentons une application de ces méthodes pour estimer le seuil de positivité d’un marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1. Il s’agit d’une technique de dosage permettant de mesurer la concentration sérique de la cytokératine 19. Les données sont issues d’une étude réalisée par le Docteur Philippe Céruse (Service d’ORL et de Chirurgie Cervico-faciale, Centre Hospitalier Lyon Sud, Hospices Civils de Lyon). L’objectif était d’estimer le seuil optimal pour diagnostiquer la maladie dans la population générale, à partir des données observées dans un groupe de 71 sujets sains et un groupe de 92 sujets atteints d’un cancer des VADS au stade 1 ou 2 de la maladie selon la classification TNM. Estimation des paramètres de la loi gamma: Le tableau ci-dessous donne les estimations du maximum de vraisemblance du paramètre de forme commun et des paramètres d’échelle dans la population des sujets sains et des sujets malades. Il existait une bonne adéquation entre les distributions observées et modélisées. Sujets sains Sujets malades Forme α 2,26 Echelle β 0,16 0,53 Estimation ponctuelle et par intervalle du seuil de positivité:: La prévalence dans la population générale est estimée à 8, 2/1000 (Colonna 2000). Le ratio bénéfice net/ coût net a été fixé à 50 par les cliniciens interrogés. Cela signifie que le médecin est prêt à réaliser des examens complémentaires à tort chez 50 sujets sains pour ne pas manquer l’investigation complémentaire d’un sujet malade. Avec ces valeurs R = 2, 42. Le seuil a été estimé à 0,84 ng/ml avec un intervalle de confiance à 95% compris entre 0,72 et 0,97. Ce seuil estimé correspond à une sensibilité de 71% et à une spécificité de 90%. A la borne inférieure de l’intervalle de confiance, la sensibilité était estimé à 79% et la spécificité à 87%. A la borne supérieure de l’intervalle de confiance, la sensibilité était estimée à 60% et la spécificité à 93%. 7 Conclusion Ce travail met ainsi à disposition une méthode d’estimation ponctuelle et par intervalle du seuil de positivité facile à mettre en oeuvre. La situation que nous avons explorée est celle d’un effet multiplicatif de la maladie correspondant à un paramètre de forme constant entre sujets sains et sujets malades. L’extension à la loi log-gamma est directe permettant la prise en compte d’un effet puissance de la maladie. L’utilisation de ces lois dans un cadre plus large ainsi que l’extension à d’autres lois reste à explorer. Par ailleurs, les conditions d’utilisation de la méthode restent à évaluer. 5 Bibliographie [1] Boyko E. (1994) Ruling out or ruling in disease with the most sensitive or specific diagnostic test: short cut or wrong turn? Medical Decision Making, 14, 175-9. [2] Casella G, Berger RL (2002) Statistical inference, Duxbury Press, Pacific Grove, CA. 2nd Ed, 240-5. [3] Colonna M, Hedelin G, Esteve J, Grosclaude P, Launoy G, Muemi A, et al. (2000) National cancer prevalence estimation in France, International Journal of Cancer, 87, 301-304 [4] DeNeef P, Kent DL (1993) Using treatment-tradeoff preferences to select diagnostic strategies: linking the ROC curve to threshold analysis. Medical Decision Making, 13, 126-32. [5] Egan J. (1975) Signal detection theory and ROC analysis, New York,Academic Press [6] England WL. (1988) An exponential model used for optimal threshold selection on ROC curves, Medical Decision Making, 8, 120-131. [7] Greiner M, Pfeiffer D, Smith RD. (2000) Principles and practical application of the receiver-operating characteristic analysis for diagnostic tests, Preventive Veterinary Medicine, 45, 23-41. [8] Hanley JA. (1988) The robustness of the ”binormal” assumptions used in fitting ROC curves, Medical Decision Making, 8, 197-203. [9] Jund J, Rabilloud M, Wallon M, Ecochard R (2005) Methods to estimate the optimal threshold for normally or log-normally distributed biological tests, Medical Decision Making, Accepted. [10] Krieg AF, Abendroth TW, Bongiovanni MB (1986). When is a diagnostic test result positive? Decision tree models based on net utility and threshold, Archives of pathology and laboratory medicine, 110, 787-91. [11] Robert C, Vermont J, Bosson JL (1991). Formulas for threshold computations. Computers and Biomedical Research, 24, 514-29. [12] Sox HC, Blatt MA, Higgins MC, Marton KI (1988) Medical Decision Making, Butterworth Publishers, Boston, 49-53. [13] Swets JA (1992) The science of choosing the right decision threshold in high-stakes diagnostics, American Psychologist, 47, 522-32. [14] Tosteson A, Begg CB. (1988) A general regression methodology for ROC curve estimation, Medical Decision Making, 8, 204-215. 6