m´ethode d`estimation du seuil optimal pour un test diagnostique

Transcription

MÉTHODE D’ESTIMATION DU SEUIL OPTIMAL
POUR UN TEST DIAGNOSTIQUE AYANT UNE
DISTRIBUTION GAMMA
Caroline Truntzer Muriel Rabilloud René Ecochard
Laboratoire de Biostatistique - Santé
Centre Hospitalier Lyon Sud-Pavillon 1M
165 Chemin du Grand Revoyet
69495 PIERRE BENITE
Résumé: Une formule explicite du seuil de positivité optimal ainsi qu’une méthode
d’estimation ponctuelle et par intervalle de ce seuil pour un test diagnostique qui suit
une distribution gamma est proposée. Le seuil optimal est celui qui maximise l’état de
santé moyen de la popultation, mesuré par l’utilité ”populationnelle”. Des méthodes
d’estimation du seuil ont été développées par Jund et Rabilloud (2005) pour les tests
diagnostiques qui suivent une distribution normale ou lognormale. Nous proposons une
extension de ces méthodes pour les tests diagnostiques qui suivent une distribution gamma
chez les sujets sains et les sujets malades, avec un effet multiplicatif de la maladie. Cela
correspond à un paramètre de forme de la distribution gamma constant entre sujets sains
et sujets malades. Cette méthode a été appliquée à l’estimation du seuil optimal d’un
marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1.
Mots clé: Test diagnostique - Seuil de positivité - Estimation ponctuelle et par intervalle - Distribution gamma - Utilité populationnelle - Cancer des Voies Aéro-Digestives
Supérieures.
Abstract: The optimal threshold for a diagnostic test is the one that maximises the
average state of health of a population as assessed by ’population’ utility. Jund and Rabilloud have already developed methods to estimate the optimal threshold for diagnostic
tests whose results are normally or lognormally distributed among the diseased and the
healthy subpopulations. We present here an explicit formula to calculate the optimal
threshold as well as point and interval estimates of that threshold for a diagnostic test
whose results are gamma-distributed in both diseased and healthy subpopulations for a
disease that exerts a multiplicative effect; that is that has a constant shape parameter in
both subpopulations. The methods are applied to estimate the optimal threshold for the
antigen Cyfra21.1, a serum marker of cancers of the upper aerodigestive tract.
Key Words: Diagnostic test - Optimal threshold - Point and interval estimates - Gamma
distribution - Population utility - Cancers of the upper aerodigestive tract.
1
1
Introduction
La détermination d’un seuil de positivité est une étape indispensable dans le développement
d’un test diagnostique pour son utilisation dans la pratique clinique comme outil d’aide à
la décision diagnostique et thérapeutique. Le seuil optimal est celui qui maximise l’état de
santé moyen dans la population à laquelle le test est appliqué. Pour un test diagnostique
donné, ce seuil optimal dépend de la prévalence de la maladie dans la population et du
Ratio entre le Bénéfice Net à traiter à raison un sujet malade et le Coût Net à traiter à tort
un sujet non malade. Plusieurs auteurs ont montré comment déterminer le seuil optimal
à partir de la courbe ROC et certains ont proposé une méthode d’estimation ponctuelle
(Egan 1975, England 1988, Greiner 2000, Hanley 1988, Sox 1988, Tosteson 1988). Une
formule explicite du seuil optimal a été donnée par Robert et Vermont (1991) pour une
caractéristique qui suit une distribution normale ou lognormale dans la population des
sujets sains et des sujets malades, de même variance dans les 2 populations. Jund et
Rabilloud (2005) ont proposé une méthode d’estimation ponctuelle et par intervalle du
seuil optimal dans cette situation. Nous proposons un élargissement de la méthode au
cas où la caractéristique mesurée suit une distribution gamma.
2
Préliminaires
L’utilité (Krieg 1986, Swets 1992, DeNeef 1993, Boyko 1994), est une mesure de la
préférence pour différents états de santé sur une même échelle de valeur. Selon le statut
malade ou non malade d’un sujet et le résultat du test diagnostique, il est possible de
définir quatre valeurs sur cette échelle, qui sont dans l’ordre croissant l’utilité chez les faux
négatifs (UF N ), chez les vrais positifs (UV P ), chez les faux positifs (UF P ) et chez les vrais
négatifs (UV N ). Déterminer le seuil qui maximise l’état de santé moyen de la population
revient à chercher le seuil qui maximise l’utilité moyenne (Sox 1988). Pour un seuil de
positivité fixé, celle-ci est une combinaison des quatre utilités pondérées par l’effectif de la
situation qu’elles représentent dans la population à laquelle le test est appliqué. Nous appellerons cette utilité moyenne l’utilité ”populationnelle”, et nous la noterons U . Elle peut
s’écrire comme une fonction linéaire de la sensibilité Se et deh la spécificité
qui
i
Sp du test,
CN
1−P
dépendent toutes les deux du seuil de positivité : U = K ∗ Se + Sp ∗ P ∗ BN + C
• La sensibilité correspond au complément de la fonction de répartition FM de la
caractéristique mesurée chez les sujets malades, tandis que la spécificité correspond
à la fonction de répartition FS de la caractéristique mesurée chez les sujets sains.
• BN correspond au bénéfice net à traiter à raison un sujet malade (BN = UV P − UF N )
• CN correspond au coût net à traiter à tort un sujet sain (CN = UV N − UF P )
2
•
1−P
P
correspond à l’inverse de l’odds de la maladie dans la population à laquelle
le test est appliqué.
CN
• Le ratio 1−P
, que nous noterons R, représente le ratio du coût net moyen
∗ BN
P
sur le bénéfice net moyen dans la population si tout le monde était traité.
• K et C sont des constantes qui ne dépendent pas du seuil de positivité.
En remplaçant la sensibilité et la spécificité hpar les fonctions de
corresponi
répartition
C
1−P
N
dantes, la fonction d’utilité devient : U = K ∗ (1 − FM ) + FS ∗ P ∗ BN + C
Déterminer le seuil qui maximise l’utilité ” populationnelle
” revient
à déterminer le seuil
dFM /dt fM dU T qui annule sa dérivée première : dt T = 0 ⇔ dFS /dt = fS = R
T
3
T
Loi gamma et effet de la maladie
La loi gamma permet de modéliser un effet multiplicatif de la maladie sur la caractéristique
mesurée qui est par nature positive. La valeur x de la caractéristique X mesurée chez un
sujet sain est multipliée par un facteur m lorsqu’il devient malade : y = g (x) = mx avec
m > 1 . La fonction de densité de la loi gamma pour la caractéristique X s’écrit:
f (x) = c(α, β)xα−1 e
−1
x
β
0 < x < +∞; α, β > 0; c(α, β) =
1
Γ(α)β α
En appliquant le théorème de dérivation des fonctions composées, la fonction de densité
de Y peut s’écrire:
f (y) = c(α, β)(
−y
−y
−y
1
1 α−1 mβ
1
1 α−1 mβ
α−1 mβ
)y
e
=
(
)(
)y
e
=
y
e
mα
Γ(α)β α mα
Γ(α)(βm)α
C’est la fonction de densité d’une loi gamma de paramètres α et βm , de moyenne
(αβ)m et de variance (αβ 2 )m2 . Un effet multiplicatif modélisé par la loi gamma correspond ainsi à la situation où seul le paramètre d’échelle varie d’un type de sujets à
l’autre. La moyenne chez les sujets malades est égale à celle des sujets sains multipliée
par la constante m. La variance des sujets malades correspond à celle des sujets sains
multipliée par la constante m2 . Ceci se traduit par une augmentation de la variance avec
la moyenne.
4
Estimation ponctuelle du seuil de positivité
Pour une caractéristique qui suit une distribution gamma dans la population des sujets
sains et des sujets malades, le seuil optimal est tel que :
1
−T
T
fM
αM −1
=
exp(
)Γ(αS )βSαS T 1−αS exp( ) = R
αM T
fS
Γ(αM )βM
βM
βS
3
Dans la situation où la maladie a un effet multiplicatif sur la caractéristique mesurée,
nous pouvons poser αS = αM = α. Le seuil théorique est alors donné par la formule:
βS βM
βS
T =
ln (R) − α ln (
)
βM − βS
βM
L’estimation du logarithme des paramètres convergeant plus rapidement vers une loi
normale, c’est celui-ci qui est estimé. La formule théorique du seuil devient alors :
eln(βS )
eln(βM ) eln(βS )
ln(α)
ln(R) − e
ln( ln(β ) )
T = ln(β )
e M − eln(βS )
e M
On peut montrer que ce seuil est unique. L’estimation ponctuelle du seuil a été
obtenue par plug-in en remplaçant dans cette formule le logarithme des paramètres de la
distribution chez les sujets sains et les sujets malades par leur estimation du maximum
de vraisemblance. C’est la vraisemblance globale des trois paramètres α, βM et βS qui a
été maximisée par l’algorithme de Newton-Raphson.
5
Estimation par intervalle du seuil de positivité
Pour connaı̂tre la précision avec laquelle le seuil a été estimé, un intervalle de confiance
a été construit en approximant la distribution du logarithme du seuil estimé par une loi
normale.
q
q
ln (T̂s ) = ln (T̂ ) + 1.96 var(ln (T̂ ))
ln (T̂i ) = ln (T̂ ) − 1.96 var(ln (T̂ ))
Dans cet espace l’intervalle de confiance est symétrique. L’intervalle de confiance de
T̂ obtenu en prenant l’exponentielle des bornes ln(T̂i ) et ln(T̂s ) devient asymétrique et
contraint à des valeurs positives. La méthode delta, proposées par Casella (1996) a été
choisie pour approximer la variance du seuil estimé par un développement de Taylor au
premier ordre. L’approximation de la variance s’écrit:
!2
!2
!2
∂
T̂
∂
T̂
∂ T̂
ˆ
ˆ M )) +
ˆ S ))
var(ln(α))
+
var(ln(β
var(ln(β
var(T̂ ) ≈
∂ln(α)
∂ln(βM )
∂ln(βS )
!
!
!
!
∂ T̂
∂ T̂
∂
T̂
∂
T̂
ˆ
ˆ M )) + 2
ˆ
ˆ S ))
+ 2
cov(ln(α),
ln(β
cov(ln(α),
ln(β
∂ln(α)
∂ln(βM )
∂ln(α)
∂ln(βS )
!
!
∂ T̂
∂ T̂
ˆ M )), ln(β
ˆ S ))
+ 2
cov(ln(β
∂ln(βM ))
∂ln(βS )
Pour un paramètre θ quelconque : ∂ln∂θ(T̂ ) = T̂1 ∂∂θT̂
La variance du logarithme de seuil estimé peut alors s’écrire : var(ln (T̂ )) =
4
1
var(T̂ ).
T̂ 2
6
Application
Nous présentons une application de ces méthodes pour estimer le seuil de positivité d’un
marqueur du cancer des Voies Aéro-Digestives Supérieures (VADS), le Cyfra 21-1. Il
s’agit d’une technique de dosage permettant de mesurer la concentration sérique de la cytokératine 19. Les données sont issues d’une étude réalisée par le Docteur Philippe Céruse
(Service d’ORL et de Chirurgie Cervico-faciale, Centre Hospitalier Lyon Sud, Hospices
Civils de Lyon). L’objectif était d’estimer le seuil optimal pour diagnostiquer la maladie
dans la population générale, à partir des données observées dans un groupe de 71 sujets
sains et un groupe de 92 sujets atteints d’un cancer des VADS au stade 1 ou 2 de la
maladie selon la classification TNM.
Estimation des paramètres de la loi gamma: Le tableau ci-dessous donne les estimations du maximum de vraisemblance du paramètre de forme commun et des paramètres
d’échelle dans la population des sujets sains et des sujets malades. Il existait une bonne
adéquation entre les distributions observées et modélisées.
Sujets sains
Sujets malades
Forme α
2,26
Echelle β
0,16
0,53
Estimation ponctuelle et par intervalle du seuil de positivité:: La prévalence
dans la population générale est estimée à 8, 2/1000 (Colonna 2000). Le ratio bénéfice net/
coût net a été fixé à 50 par les cliniciens interrogés. Cela signifie que le médecin est prêt
à réaliser des examens complémentaires à tort chez 50 sujets sains pour ne pas manquer
l’investigation complémentaire d’un sujet malade. Avec ces valeurs R = 2, 42. Le seuil a
été estimé à 0,84 ng/ml avec un intervalle de confiance à 95% compris entre 0,72 et 0,97.
Ce seuil estimé correspond à une sensibilité de 71% et à une spécificité de 90%. A la borne
inférieure de l’intervalle de confiance, la sensibilité était estimé à 79% et la spécificité à
87%. A la borne supérieure de l’intervalle de confiance, la sensibilité était estimée à 60%
et la spécificité à 93%.
7
Conclusion
Ce travail met ainsi à disposition une méthode d’estimation ponctuelle et par intervalle
du seuil de positivité facile à mettre en oeuvre. La situation que nous avons explorée
est celle d’un effet multiplicatif de la maladie correspondant à un paramètre de forme
constant entre sujets sains et sujets malades. L’extension à la loi log-gamma est directe
permettant la prise en compte d’un effet puissance de la maladie. L’utilisation de ces lois
dans un cadre plus large ainsi que l’extension à d’autres lois reste à explorer. Par ailleurs,
les conditions d’utilisation de la méthode restent à évaluer.
5
Bibliographie
[1] Boyko E. (1994) Ruling out or ruling in disease with the most sensitive or specific
diagnostic test: short cut or wrong turn? Medical Decision Making, 14, 175-9.
[2] Casella G, Berger RL (2002) Statistical inference, Duxbury Press, Pacific Grove, CA.
2nd Ed, 240-5.
[3] Colonna M, Hedelin G, Esteve J, Grosclaude P, Launoy G, Muemi A, et al. (2000)
National cancer prevalence estimation in France, International Journal of Cancer, 87,
301-304
[4] DeNeef P, Kent DL (1993) Using treatment-tradeoff preferences to select diagnostic
strategies: linking the ROC curve to threshold analysis. Medical Decision Making, 13,
126-32.
[5] Egan J. (1975) Signal detection theory and ROC analysis, New York,Academic Press
[6] England WL. (1988) An exponential model used for optimal threshold selection on
ROC curves, Medical Decision Making, 8, 120-131.
[7] Greiner M, Pfeiffer D, Smith RD. (2000) Principles and practical application of the
receiver-operating characteristic analysis for diagnostic tests, Preventive Veterinary Medicine,
45, 23-41.
[8] Hanley JA. (1988) The robustness of the ”binormal” assumptions used in fitting ROC
curves, Medical Decision Making, 8, 197-203.
[9] Jund J, Rabilloud M, Wallon M, Ecochard R (2005) Methods to estimate the optimal threshold for normally or log-normally distributed biological tests, Medical Decision
Making, Accepted.
[10] Krieg AF, Abendroth TW, Bongiovanni MB (1986). When is a diagnostic test result
positive? Decision tree models based on net utility and threshold, Archives of pathology
and laboratory medicine, 110, 787-91.
[11] Robert C, Vermont J, Bosson JL (1991). Formulas for threshold computations.
Computers and Biomedical Research, 24, 514-29.
[12] Sox HC, Blatt MA, Higgins MC, Marton KI (1988) Medical Decision Making, Butterworth Publishers, Boston, 49-53.
[13] Swets JA (1992) The science of choosing the right decision threshold in high-stakes
diagnostics, American Psychologist, 47, 522-32.
[14] Tosteson A, Begg CB. (1988) A general regression methodology for ROC curve estimation, Medical Decision Making, 8, 204-215.
6

m´ethode d`estimation du seuil optimal pour un test diagnostique

Transcription

Documents pareils

Utilisation des fichiers texte en Java

Grille boîtier Beta - Gamma

etagere murale

Exercice 1 : Découverte de l`objet de type ArrayList Exercice 2

IN328 : RMI

HEBERGEMENT WEB LUXEMBOURG

Construction de panorama

Introduction aux effets audio

Notice biographique Repères biographiques communs Titres

Probl`eme EasyDyn: robot `a 5 degrés de liberté