La survie nette actuelle à long terme Qualités de sept méthodes d
Transcription
La survie nette actuelle à long terme Qualités de sept méthodes d
La survie nette actuelle à long terme Qualités de sept méthodes d’estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d’Épidémiologie et de Santé publique, EA 1801 Faculté de Médecine de Strasbourg Plan • Survie nette : définition, estimation • Description des méthodes d’estimation • Simulation : intérêt, principes et réalisation • Résultats • Conclusions 1 Survie nette Concept • Survie liée à la maladie d’intérêt, les autres causes de décès étant éliminées • Traduit la mortalité liée spécifiquement à une maladie Risques compétitifs • Compétition : un individu est soumis simultanément à différents risques dont l’un aboutit au décès Risque Maladie Autres causes • La cause du décès est unique et détermine le temps de survie 2 Taux observé λo • Le taux global ou observé a deux composantes : λo = λn + λa λn : le taux net lié à la maladie d’intérêt λa : le taux lié aux autres causes • Lorsque la cause du décès n’est pas recueillie (registre), les deux composantes λn et λa sont inconnues Taux relatif • λa : approché par le taux de mortalité de la population générale (âge, sexe, année) Soit λg cette approximation de λa Taux relatif λr = λo – λg • Le taux relatif λr est une approximation du taux net λn 3 Du taux relatif à la survie relative • λr = λo – λg • Sr = So / Sg Sr : survie relative So : survie observée Sg : survie attendue Survie nette actuelle • Celle des patients nouvellement diagnostiqués • Dépend étroitement des moyens actuels • Survie nette actuelle à long terme : difficultés d’estimation par les méthodes classiques 4 Survie nette actuelle à 10 ans ? 1997 2007 2017 Survie nette à 10 ans des patients diagnostiqués en 1997 Survie nette à 10 ans des patients diagnostiqués en 2007 Suivi Année de diagnostic Valeur à estimer Survie nette actuelle à 10 ans 2007 1997 ? Survie nette à 10 ans des patients diagnostiqués en 1997 Suivi Année de diagnostic 5 Méthodes d’estimation Méthodes utilisant une approche traditionnelle de type Kaplan-Meier : • Méthode par cohortes • Méthode complète • Analyse par période (Brenner) Méthodes d’estimation Méthodes utilisant une modélisation : • Méthode régressive d’Estève • Polynôme dérivé de la méthode d’Estève • Analyse par période modélisée 6 Base de données 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Cohorte 2004 2005 2006 Méthode par cohortes 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Informations analysées Informations exclues 2004 2005 2006 7 Méthode complète 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Informations analysées Informations exclues 2004 2005 2006 Analyse par période (Brenner) • Principe : écarter l’information a priori trop ancienne Troncature à gauche = élimination des décès et des censures survenus avant une période considérée comme récente 8 Brenner 1 (analyse par période) 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 Informations analysées 2003 2004 Informations exclues 2005 2006 Analyse par période • Méthode de Kaplan-Meier S(10) = P (1) x P(2\1) x …x P(10\9) 9 Analyse par période P(3\2) Patient A 2006 2007 1999 2000 2001 Patient B 2004 2005 2006 Année calendaire Suivi Brenner 5 (analyse par période) 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 Informations analysées Informations exclues 2003 2004 2005 2006 10 Méthode d’Estève • Méthode régressive modélisant les taux en fonction de l’année de diagnostic • Chaque année calendaire est une strate • Obtention d’un coefficient de régression par strate • Tous les patients sont inclus Méthode d’Estève 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 11 Polynôme • Dérivé de la méthode d’Estève • Fonction de l’année de diagnostic X : β0 + β1X + β2X2 + … + βiXi • Permet d’appréhender l’évolution de la survie nette • Nombre réduit de coefficients de régression Polynôme 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 12 Analyse par période modélisée • Application d’un polynôme à des données récentes • Période d’analyse = 5 ans Analyse par période modélisée 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 Données analysées Données exclues 2003 2004 2005 2006 13 Survie nette actuelle à long terme Ces méthodes fournissent des résultats différents Question : quelle est l’estimation la plus fiable? Évaluation des méthodes • Deux problèmes se posent en pratique : Les estimations varient d’un échantillon à l’autre (fluctuations) La valeur du paramètre à estimer est inconnue 14 Simulation Seul procédé permettant d’évaluer une méthode statistique : Grand nombre d’échantillons (fluctuations d’échantillonnage) Valeur du paramètre à estimer connue Simulation Principes Population fictive Simulation proprement dite Sondage aléatoire Échantillons multiples Analyse Biais = écart entre la moyenne des estimations et la valeur théorique Précision = dispersion des estimations 15 Simulation Principes • Simuler = générer des données à partir de lois de probabilité • Les données générées sont aléatoires et indépendantes Simulation Méthodologie • Identifier les processus à simuler • Choisir les lois de probabilité adéquates • Générer les données à partir des lois de probabilité choisies 16 Simulation Processus La survie observée dépend de 4 processus simultanés et indépendants : • • • • La mortalité liée à la maladie (survie nette) La mortalité liée aux autres causes La guérison La censure : aléatoire et non informative Simulation Lois de probabilité PROCESSUS LOIS DE PROBABILITÉ Maladie Weibull ou log-normale Autres causes Exponentielle par morceau Guérison Bernoulli Censure Uniforme 17 Mortalité nette • Durées de survie • Variable quantitative continue • Fonctions paramétriques du temps : Loi de Weibull Loi log-normale Mortalité nette Loi de Weibull • Dépend de deux paramètres : Un paramètre d’échelle α Un paramètre de forme ß • Les valeurs de ces paramètres déterminent les caractéristiques de la fonction de survie 18 Mortalité nette Loi de Weibull • Le paramètre d’échelle α permet de simuler une amélioration de la survie nette au cours de périodes successives • Le paramètre de forme ß détermine l’évolution du risque au cours du temps : Risque décroissant : ß < 1 Risque constant : ß = 1 Risque croissant : ß > 1 Survie nette Loi de Weibull Amélioration de la survie nette ß = 0,8 α=5 α=2 19 Mortalité nette Loi log-normale • Dépend également de deux paramètres • Propriété intéressante : permet d’obtenir un risque biphasique Mortalité par autres causes • Durées de survie • Loi exponentielle par morceau • Table de mortalité (âge, sexe, période) • Risque constant conditionnellement à l’intervalle 20 Mortalité par autres causes Table de mortalité Années calendaires Age 50 51 52 53 54 2001 0,02 0,02 0,03 0,04 0,04 2002 0,03 0,02 0,04 0,05 0,04 2003 0,02 0,04 0,04 0,06 0,05 2004 0,02 0,03 0,05 0,04 0,05 2005 0,01 0,04 0,05 0,02 0,03 Loi exponentielle par morceau • Un seul paramètre : taux instantané λ • Propriété intéressante : λ est constant au cours du temps, par morceau • Morceau = une année calendaire 21 Mortalité par autres causes Exemple 5 individus diagnostiqués à 50 ans début 2001 et suivi pendant 3 ans Années calendaires Table de mortalité Age 50 51 52 Données générées 2001 2002 λ1 2003 Données obtenues λ2 λ3 1 0,5 1 1 1 1 0,6 1 1 1 0,9 1 - Durée Statut 3 0 0,5 1 2,6 1 3 1,9 0 1 Simulation Guérison • Chaque patient guérit ou ne guérit pas • Variable binaire • Loi de Bernoulli • Si guérison : mortalité par autres causes • Sinon : compétition 22 Simulation Censure • Durées d’observation • Loi uniforme • Toutes les durées sont également probables Simulation Modèle de mélange Patients GUÉRIS NON GUÉRIS COMPÉTITION AUTRES CAUSES CENSURE MALADIE AUTRES CAUSES CENSURE 23 Simulation Échantillons définitifs Données initiales N° Guérison Maladie Données définitives Autres Censure causes Durée Statut 1 1 2,5 3,5 4,2 3,5 1 2 1 1,2 8,2 5,3 5,3 0 3 0 3,6 5,9 6,2 3,6 1 Simulation Échantillons définitifs Structure de l’échantillon définitif N° Durée Statut Age* Année* Sexe 1 3,5 1 50 2001 1 2 5,3 0 50 1999 1 3 3,6 1 51 2002 2 * Au moment du diagnostic 24 Simulation Échantillons définitifs Certaines informations ne seront pas utilisées lors de l’analyse : • Statut vis-à-vis de la guérison • Cause du décès Simulation et analyse Aspects pratiques • La simulation et l’analyse des données simulées nécessitent une programmation informatique Logiciel R 25 Simulation et analyse Aspects pratiques Cinq types de programmes permettant respectivement : De générer les données pour chaque processus De confronter les données générées afin d’obtenir les temps de survie De créer les fichiers contenant l’information nécessaire pour chaque méthode D’analyser les échantillons par chaque méthode De calculer les 3 critères pour chaque méthode Situations cliniques simulées Cancer du poumon : • Survie courte • Risque décroissant Cancer du sein : • Survie longue • Risque croissant puis décroissant Amélioration régulière de la survie nette 26 Échantillons • Nombre : 200 • Taille : 1050 • Pourcentage de censure aléatoire : de 0 à 30% Analyse • Critère : survie relative actuelle à 10 ans • Biais = différence entre la survie théorique et la survie moyenne estimée • Variance des estimations (précision) • Couverture = proportion d’échantillons dont les intervalles de confiance à 95% contiennent la valeur théorique 27 Survie théorique = 0,241 CANCER DU POUMON Survie relative Écart-type Couverture (%) Cohortes 0,084 0,015 0,000 Complète 0,125 0,015 0,000 Brenner 5 0,169 0,023 16,500 Brenner 1 0,202 0,054 85,500 Estève 0,231 0,074 89,500 Polynôme 0,239 0,047 93,800 Période modélisée 0,252 0,073 95,400 Méthodes Distribution Survie théorique = 0,670 CANCER DU SEIN Survie relative Écart-type Couverture (%) Cohortes 0,490 0,027 0,000 Complète 0,543 0,021 0,000 Brenner 5 0,597 0,028 23,500 Brenner 1 0,626 0,061 90,500 Estève 0,729 0,118 86,300 Polynôme 0,695 0,037 91,000 Période modélisée 0,671 0,092 92,000 Méthodes Distribution 28 Cancer du sein Polynôme Période modélisée Proportions d’estimations proches de la valeur théorique Différence Polynôme (%) Période modélisée (%) 0,05 73 41 0,1 98 72 Influence de la censure Cancer du poumon • Méthodes n’utilisant pas de modèle : aucune • Modèles : sous-estimation à partir de 25% de censure Estève : peu marquée Polynômes : plus marquée 29 Influence de la censure Cancer du poumon Méthodes Censure (%) Estève Polynôme Période modélisée 0 0,231 (0,074) 0,239 (0,047) 0,252 (0,073) 5 0,231 (0,074) 0,239 (0,048) 0,251 (0,074) 10 0,230 (0,074) 0,236 (0,048) 0,249 (0,076) 15 0,231 (0,075) 0,234 (0,049) 0,249 (0,077) 20 0,230 (0,076) 0,235 (0,051) 0,252 (0,079) 25 0,227 (0,077) 0,220 (0,050) 0,224 (0,077) 30 0,226 (0,079) 0,214 (0,050) 0,216 (0,080) Évaluation empirique Registre du Bas-Rhin • Estimation de la survie nette à 10 ans des patients diagnostiqués entre 1989 et 1991 • Survie nette réelle fin 2000 30 Évaluation empirique Cancer du poumon • Meilleures méthodes : 65-74 ans et 75-84 ans : polynôme utilisant l’ensemble des données 45-54 ans et 55-64 ans : analyse par période (5 années) Évaluation empirique Cancer du sein • Meilleures méthodes : 35-44 ans et 55-64 ans : polynôme utilisant l’ensemble des données 45-54 ans et 65-74 ans et ≥85 ans : Estève (mais intervalles de confiance plus larges) 31 REGISTRE DU BAS-RHIN • Cancer du poumon • Cas diagnostiqués entre 1975 et 2000 • Date de point : 31/12/2000 Registre : cancer du poumon Méthodes 45-54 55-64 65-74 75-84 ≥85 Cohortes 0,094 (0,018) 0,107 (0,013) 0,090 (0,015) 0,053 (0,019) 0 (0) Complète 0,125 (0,015) 0,154 (0,022) 0,217 (0,055) 0,170 (0,017) 0,166 (0,013) 0,159 (0,027) 0,110 (0,009) 0,168 (0,027) 0,216 (0,050) 0,148 (0,015) 0,144 (0,011) 0,127 (0,022) 0,106 (0,012) 0,093 (0,022) 0,100 (0,022) 0,109 (0,013) 0,106 (0,011) 0,100 (0,009) 0,048 (0,015) 0,044 (0,019) 0,034 (0,064) 0,047 (0,008) 0,044 (0,006) 0,034 (0,010) 0 (0) Brenner 5 Brenner 1 Estève Polynôme Brenner modélisé 0 (0) 0 (0) 0,010 (0,004) 0,009 (0,003) 0,007 (0,005) 32 REGISTRE DU BAS-RHIN • Cancer du sein • Cas diagnostiqués entre 1975 et 2000 • Date de point : 31/12/2000 Registre : cancer du sein Méthodes 35-44 45-54 55-64 65-74 75-84 ≥85 Cohortes 0,709 (0,022) 0,739 (0.014) 0,765 (0,018) 0,827 (0,038) 0,774 (0,014) 0,802 (0,006) 0,792 (0,020) 0,674 (0,017) 0,710 (0,012) 0,751 (0,015) 0,716 (0,034) 0,748 (0,014) 0,778 (0,006) 0,793 (0,018) 0,605 (0.015) 0,654 (0.011) 0,694 (0,015) 0,814 (0,030) 0,688 (0,016) 0,724 (0,008) 0,718 (0,024) 0,525 (0.019) 0,540 (0.013) 0,558 (0,017) 0,551 (0,037) 0,576 (0,020) 0,621 (0,009) 0,571 (0,030) 0,409 (0.028) 0,435 (0,023) 0,456 (0,030) 0,436 (0,064) 0,442 (0,023) 0,494 (0,018) 0,447 (0,041) 0,119 (0.068) 0,179 (0,077) 0,258 (0,110) 0,195 (0,156) 0,259 (0,026) 0,311 (0,011) 0,200 (0,031) Complète Brenner 5 Brenner 1 Estève Polynôme Brenner modélisé 33 Conclusions • Polynôme : méthode la plus performante • Méthode souple permettant de capter l’évolution de la survie nette • Peu de coefficients de régression • Utilisation recommandée dans le cadre d’un registre 34