m´ethode d`estimation du seuil optimal pour un test diagnostique

Transcription

m´ethode d`estimation du seuil optimal pour un test diagnostique
MÉTHODE D’ESTIMATION DU SEUIL OPTIMAL
POUR UN TEST DIAGNOSTIQUE AYANT UNE
DISTRIBUTION GAMMA
Caroline Truntzer Muriel Rabilloud René Ecochard
Laboratoire de Biostatistique - Santé
Centre Hospitalier Lyon Sud-Pavillon 1M
165 Chemin du Grand Revoyet
69495 PIERRE BENITE
Résumé: Une formule explicite du seuil de positivité optimal ainsi qu’une méthode
d’estimation ponctuelle et par intervalle de ce seuil pour un test diagnostique qui suit
une distribution gamma est proposée. Le seuil optimal est celui qui maximise l’état de
santé moyen de la popultation, mesuré par l’utilité ”populationnelle”. Des méthodes
d’estimation du seuil ont été développées par Jund et Rabilloud (2005) pour les tests
diagnostiques qui suivent une distribution normale ou lognormale. Nous proposons une
extension de ces méthodes pour les tests diagnostiques qui suivent une distribution gamma
chez les sujets sains et les sujets malades, avec un effet multiplicatif de la maladie. Cela
correspond à un paramètre de forme de la distribution gamma constant entre sujets sains
et sujets malades. Cette méthode a été appliquée à l’estimation du seuil optimal d’un
marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1.
Mots clé: Test diagnostique - Seuil de positivité - Estimation ponctuelle et par intervalle - Distribution gamma - Utilité populationnelle - Cancer des Voies Aéro-Digestives
Supérieures.
Abstract: The optimal threshold for a diagnostic test is the one that maximises the
average state of health of a population as assessed by ’population’ utility. Jund and Rabilloud have already developed methods to estimate the optimal threshold for diagnostic
tests whose results are normally or lognormally distributed among the diseased and the
healthy subpopulations. We present here an explicit formula to calculate the optimal
threshold as well as point and interval estimates of that threshold for a diagnostic test
whose results are gamma-distributed in both diseased and healthy subpopulations for a
disease that exerts a multiplicative effect; that is that has a constant shape parameter in
both subpopulations. The methods are applied to estimate the optimal threshold for the
antigen Cyfra21.1, a serum marker of cancers of the upper aerodigestive tract.
Key Words: Diagnostic test - Optimal threshold - Point and interval estimates - Gamma
distribution - Population utility - Cancers of the upper aerodigestive tract.
1
1
Introduction
La détermination d’un seuil de positivité est une étape indispensable dans le développement
d’un test diagnostique pour son utilisation dans la pratique clinique comme outil d’aide à
la décision diagnostique et thérapeutique. Le seuil optimal est celui qui maximise l’état de
santé moyen dans la population à laquelle le test est appliqué. Pour un test diagnostique
donné, ce seuil optimal dépend de la prévalence de la maladie dans la population et du
Ratio entre le Bénéfice Net à traiter à raison un sujet malade et le Coût Net à traiter à tort
un sujet non malade. Plusieurs auteurs ont montré comment déterminer le seuil optimal
à partir de la courbe ROC et certains ont proposé une méthode d’estimation ponctuelle
(Egan 1975, England 1988, Greiner 2000, Hanley 1988, Sox 1988, Tosteson 1988). Une
formule explicite du seuil optimal a été donnée par Robert et Vermont (1991) pour une
caractéristique qui suit une distribution normale ou lognormale dans la population des
sujets sains et des sujets malades, de même variance dans les 2 populations. Jund et
Rabilloud (2005) ont proposé une méthode d’estimation ponctuelle et par intervalle du
seuil optimal dans cette situation. Nous proposons un élargissement de la méthode au
cas où la caractéristique mesurée suit une distribution gamma.
2
Préliminaires
L’utilité (Krieg 1986, Swets 1992, DeNeef 1993, Boyko 1994), est une mesure de la
préférence pour différents états de santé sur une même échelle de valeur. Selon le statut
malade ou non malade d’un sujet et le résultat du test diagnostique, il est possible de
définir quatre valeurs sur cette échelle, qui sont dans l’ordre croissant l’utilité chez les faux
négatifs (UF N ), chez les vrais positifs (UV P ), chez les faux positifs (UF P ) et chez les vrais
négatifs (UV N ). Déterminer le seuil qui maximise l’état de santé moyen de la population
revient à chercher le seuil qui maximise l’utilité moyenne (Sox 1988). Pour un seuil de
positivité fixé, celle-ci est une combinaison des quatre utilités pondérées par l’effectif de la
situation qu’elles représentent dans la population à laquelle le test est appliqué. Nous appellerons cette utilité moyenne l’utilité ”populationnelle”, et nous la noterons U . Elle peut
s’écrire comme une fonction linéaire de la sensibilité Se et deh la spécificité
qui
i
Sp du test,
CN
1−P
dépendent toutes les deux du seuil de positivité : U = K ∗ Se + Sp ∗ P ∗ BN + C
• La sensibilité correspond au complément de la fonction de répartition FM de la
caractéristique mesurée chez les sujets malades, tandis que la spécificité correspond
à la fonction de répartition FS de la caractéristique mesurée chez les sujets sains.
• BN correspond au bénéfice net à traiter à raison un sujet malade (BN = UV P − UF N )
• CN correspond au coût net à traiter à tort un sujet sain (CN = UV N − UF P )
2
•
1−P
P
correspond à l’inverse de l’odds de la maladie dans la population à laquelle
le test est appliqué.
CN
• Le ratio 1−P
, que nous noterons R, représente le ratio du coût net moyen
∗ BN
P
sur le bénéfice net moyen dans la population si tout le monde était traité.
• K et C sont des constantes qui ne dépendent pas du seuil de positivité.
En remplaçant la sensibilité et la spécificité hpar les fonctions de
corresponi
répartition
C
1−P
N
dantes, la fonction d’utilité devient : U = K ∗ (1 − FM ) + FS ∗ P ∗ BN + C
Déterminer le seuil qui maximise l’utilité ” populationnelle
” revient
à déterminer le seuil
dFM /dt fM dU T qui annule sa dérivée première : dt T = 0 ⇔ dFS /dt = fS = R
T
3
T
Loi gamma et effet de la maladie
La loi gamma permet de modéliser un effet multiplicatif de la maladie sur la caractéristique
mesurée qui est par nature positive. La valeur x de la caractéristique X mesurée chez un
sujet sain est multipliée par un facteur m lorsqu’il devient malade : y = g (x) = mx avec
m > 1 . La fonction de densité de la loi gamma pour la caractéristique X s’écrit:
f (x) = c(α, β)xα−1 e
−1
x
β
0 < x < +∞; α, β > 0; c(α, β) =
1
Γ(α)β α
En appliquant le théorème de dérivation des fonctions composées, la fonction de densité
de Y peut s’écrire:
f (y) = c(α, β)(
−y
−y
−y
1
1 α−1 mβ
1
1 α−1 mβ
α−1 mβ
)y
e
=
(
)(
)y
e
=
y
e
mα
Γ(α)β α mα
Γ(α)(βm)α
C’est la fonction de densité d’une loi gamma de paramètres α et βm , de moyenne
(αβ)m et de variance (αβ 2 )m2 . Un effet multiplicatif modélisé par la loi gamma correspond ainsi à la situation où seul le paramètre d’échelle varie d’un type de sujets à
l’autre. La moyenne chez les sujets malades est égale à celle des sujets sains multipliée
par la constante m. La variance des sujets malades correspond à celle des sujets sains
multipliée par la constante m2 . Ceci se traduit par une augmentation de la variance avec
la moyenne.
4
Estimation ponctuelle du seuil de positivité
Pour une caractéristique qui suit une distribution gamma dans la population des sujets
sains et des sujets malades, le seuil optimal est tel que :
1
−T
T
fM
αM −1
=
exp(
)Γ(αS )βSαS T 1−αS exp( ) = R
αM T
fS
Γ(αM )βM
βM
βS
3
Dans la situation où la maladie a un effet multiplicatif sur la caractéristique mesurée,
nous pouvons poser αS = αM = α. Le seuil théorique est alors donné par la formule:
βS βM
βS
T =
ln (R) − α ln (
)
βM − βS
βM
L’estimation du logarithme des paramètres convergeant plus rapidement vers une loi
normale, c’est celui-ci qui est estimé. La formule théorique du seuil devient alors :
eln(βS )
eln(βM ) eln(βS )
ln(α)
ln(R) − e
ln( ln(β ) )
T = ln(β )
e M − eln(βS )
e M
On peut montrer que ce seuil est unique. L’estimation ponctuelle du seuil a été
obtenue par plug-in en remplaçant dans cette formule le logarithme des paramètres de la
distribution chez les sujets sains et les sujets malades par leur estimation du maximum
de vraisemblance. C’est la vraisemblance globale des trois paramètres α, βM et βS qui a
été maximisée par l’algorithme de Newton-Raphson.
5
Estimation par intervalle du seuil de positivité
Pour connaı̂tre la précision avec laquelle le seuil a été estimé, un intervalle de confiance
a été construit en approximant la distribution du logarithme du seuil estimé par une loi
normale.
q
q
ln (T̂s ) = ln (T̂ ) + 1.96 var(ln (T̂ ))
ln (T̂i ) = ln (T̂ ) − 1.96 var(ln (T̂ ))
Dans cet espace l’intervalle de confiance est symétrique. L’intervalle de confiance de
T̂ obtenu en prenant l’exponentielle des bornes ln(T̂i ) et ln(T̂s ) devient asymétrique et
contraint à des valeurs positives. La méthode delta, proposées par Casella (1996) a été
choisie pour approximer la variance du seuil estimé par un développement de Taylor au
premier ordre. L’approximation de la variance s’écrit:
!2
!2
!2
∂
T̂
∂
T̂
∂ T̂
ˆ
ˆ M )) +
ˆ S ))
var(ln(α))
+
var(ln(β
var(ln(β
var(T̂ ) ≈
∂ln(α)
∂ln(βM )
∂ln(βS )
!
!
!
!
∂ T̂
∂ T̂
∂
T̂
∂
T̂
ˆ
ˆ M )) + 2
ˆ
ˆ S ))
+ 2
cov(ln(α),
ln(β
cov(ln(α),
ln(β
∂ln(α)
∂ln(βM )
∂ln(α)
∂ln(βS )
!
!
∂ T̂
∂ T̂
ˆ M )), ln(β
ˆ S ))
+ 2
cov(ln(β
∂ln(βM ))
∂ln(βS )
Pour un paramètre θ quelconque : ∂ln∂θ(T̂ ) = T̂1 ∂∂θT̂
La variance du logarithme de seuil estimé peut alors s’écrire : var(ln (T̂ )) =
4
1
var(T̂ ).
T̂ 2
6
Application
Nous présentons une application de ces méthodes pour estimer le seuil de positivité d’un
marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1. Il
s’agit d’une technique de dosage permettant de mesurer la concentration sérique de la cytokératine 19. Les données sont issues d’une étude réalisée par le Docteur Philippe Céruse
(Service d’ORL et de Chirurgie Cervico-faciale, Centre Hospitalier Lyon Sud, Hospices
Civils de Lyon). L’objectif était d’estimer le seuil optimal pour diagnostiquer la maladie
dans la population générale, à partir des données observées dans un groupe de 71 sujets
sains et un groupe de 92 sujets atteints d’un cancer des VADS au stade 1 ou 2 de la
maladie selon la classification TNM.
Estimation des paramètres de la loi gamma: Le tableau ci-dessous donne les estimations du maximum de vraisemblance du paramètre de forme commun et des paramètres
d’échelle dans la population des sujets sains et des sujets malades. Il existait une bonne
adéquation entre les distributions observées et modélisées.
Sujets sains
Sujets malades
Forme α
2,26
Echelle β
0,16
0,53
Estimation ponctuelle et par intervalle du seuil de positivité:: La prévalence
dans la population générale est estimée à 8, 2/1000 (Colonna 2000). Le ratio bénéfice net/
coût net a été fixé à 50 par les cliniciens interrogés. Cela signifie que le médecin est prêt
à réaliser des examens complémentaires à tort chez 50 sujets sains pour ne pas manquer
l’investigation complémentaire d’un sujet malade. Avec ces valeurs R = 2, 42. Le seuil a
été estimé à 0,84 ng/ml avec un intervalle de confiance à 95% compris entre 0,72 et 0,97.
Ce seuil estimé correspond à une sensibilité de 71% et à une spécificité de 90%. A la borne
inférieure de l’intervalle de confiance, la sensibilité était estimé à 79% et la spécificité à
87%. A la borne supérieure de l’intervalle de confiance, la sensibilité était estimée à 60%
et la spécificité à 93%.
7
Conclusion
Ce travail met ainsi à disposition une méthode d’estimation ponctuelle et par intervalle
du seuil de positivité facile à mettre en oeuvre. La situation que nous avons explorée
est celle d’un effet multiplicatif de la maladie correspondant à un paramètre de forme
constant entre sujets sains et sujets malades. L’extension à la loi log-gamma est directe
permettant la prise en compte d’un effet puissance de la maladie. L’utilisation de ces lois
dans un cadre plus large ainsi que l’extension à d’autres lois reste à explorer. Par ailleurs,
les conditions d’utilisation de la méthode restent à évaluer.
5
Bibliographie
[1] Boyko E. (1994) Ruling out or ruling in disease with the most sensitive or specific
diagnostic test: short cut or wrong turn? Medical Decision Making, 14, 175-9.
[2] Casella G, Berger RL (2002) Statistical inference, Duxbury Press, Pacific Grove, CA.
2nd Ed, 240-5.
[3] Colonna M, Hedelin G, Esteve J, Grosclaude P, Launoy G, Muemi A, et al. (2000)
National cancer prevalence estimation in France, International Journal of Cancer, 87,
301-304
[4] DeNeef P, Kent DL (1993) Using treatment-tradeoff preferences to select diagnostic
strategies: linking the ROC curve to threshold analysis. Medical Decision Making, 13,
126-32.
[5] Egan J. (1975) Signal detection theory and ROC analysis, New York,Academic Press
[6] England WL. (1988) An exponential model used for optimal threshold selection on
ROC curves, Medical Decision Making, 8, 120-131.
[7] Greiner M, Pfeiffer D, Smith RD. (2000) Principles and practical application of the
receiver-operating characteristic analysis for diagnostic tests, Preventive Veterinary Medicine,
45, 23-41.
[8] Hanley JA. (1988) The robustness of the ”binormal” assumptions used in fitting ROC
curves, Medical Decision Making, 8, 197-203.
[9] Jund J, Rabilloud M, Wallon M, Ecochard R (2005) Methods to estimate the optimal threshold for normally or log-normally distributed biological tests, Medical Decision
Making, Accepted.
[10] Krieg AF, Abendroth TW, Bongiovanni MB (1986). When is a diagnostic test result
positive? Decision tree models based on net utility and threshold, Archives of pathology
and laboratory medicine, 110, 787-91.
[11] Robert C, Vermont J, Bosson JL (1991). Formulas for threshold computations.
Computers and Biomedical Research, 24, 514-29.
[12] Sox HC, Blatt MA, Higgins MC, Marton KI (1988) Medical Decision Making, Butterworth Publishers, Boston, 49-53.
[13] Swets JA (1992) The science of choosing the right decision threshold in high-stakes
diagnostics, American Psychologist, 47, 522-32.
[14] Tosteson A, Begg CB. (1988) A general regression methodology for ROC curve estimation, Medical Decision Making, 8, 204-215.
6