Université de Montréal Faculté des Arts et des Sciences
Transcription
Université de Montréal Faculté des Arts et des Sciences
Université de Montréal Faculté des Arts et des Sciences Département de Mathématiques et Statistique STT-3260 Modèles de Survie Examen Intra Hiver 2004, Le lundi 23 février, 13h30-15h30 Instructions 1) Aucune documentation n’est permise. 2) Seule, la calculatrice de la SoA est permise. 3) À l’intérieur de la page couverture de votre cahier de réponses, écrivez votre pseudonyme (p.ex. Saku Koivu, Byonce, Mom Boucher, Doc Mailloux, etc.) qui sera utilisé pour la divulgation confidentielle des résultats. 4) Utilisez les pages de gauche comme brouillon et les pages de droite pour vos développements au propre. 5) Il y a 12 questions traditionnelles totalisant 48 points. Vous pouvez donc obtenir une note maximale de 120%. 6) N’hésitez pas à écrire ce que vous croyez approprié. En particulier, le simple fait d’énoncer une formule vous vaudra des points. 7) Les questions ont été ordonnées de sorte que les plus difficiles se retrouvent à la fin. 8) Si Z suit une loi normale standard, alors P (|Z| ≤ 1.96) = 0.95. 1 - Question 1 L’espérance de vie résiduelle est donnée par la fonction suivante: mrl(x) = x + 1. (A) le taux de panne h(x), (B) le taux de panne cumulatif H(x), (C) la fonction de survie S(x) et (D) la fonction de densité f (x). - Question 2 Voici une liste de types de censures et troncations qui ont été vues en classe: (A) censure à droite, (B) censure aléatoire à droite, (C) censure à gauche, (D) censure par intervalles, (E) censure à droite de type 2, (F) troncation à gauche, (G) troncation à droite, (H) troncation par intervalles, Voici maintenant une série de cas pour lesquels on désire analyser le temps de survie. Pour chacun des cas, associez le type de censure ou troncation qui s’applique. Les cas sont décrits de sorte qu’un seul des choix suggérés cihaut s’applique. De plus, donnez le terme de vraisemblance associé à chaque exemple. (1) On fait une étude de mortalité pour un troupeau de vaches. Une vache arrive à l’âge de 3 ans et son décès est observé à l’âge de 7 ans. 2 (2) Une vache naı̂t au sein du troupeau et est toujours vivante à la fin de l’étude. Elle est âgée de 10 ans. (3) Une des vaches, née au sein du troupeau, est décédée entre les âges de 5 et 10 ans mais l’éleveur a oublié quand exactement. (4) Dans une étude de fiabilité de machines on prend un échantillon de 10 nouvelles machines sorties de l’usine et l’étude se termine après que 5 machines aient failli à la tâche. Une des machines est toujours fonctionnelle à la fin de l’étude qui aura duré 2 ans. (5) On conduit une étude du temps entre le moment d’infection et le développement de la maladie du sida. Une personne est infectée le 1er janvier 1995, développe les premiers symptômes le 1er janvier 2002. Notre étude ne tient compte que des personnes ayant développé les symptômes avant le 1er janvier 2004. (6) On conduit une étude de mortalité pour les bénéficiaires d’une maison de retraite. On se base sur les dossiers de décès uniquement. Les personnes toujours en vie n’entrent pas dans notre étude. Une personne est arrivée dans la maison à 65 ans, est décédée à l’âge de 70 ans et aurait aujourd’hui 73 ans. (7) On conduit une étude pour savoir combien de temps les gens mâchent leur gomme. Jean-François a craché sa gomme dans les 10 premières minutes mais ne se souvient plus exactement quand. (8) Après que Julie ait passé 5 minutes à mâcher, Jean-François conte une blague. Julie part à rire, s’étouffe et avale sa gomme. On n’a donc pas pu observer son temps de survie. 3 - Question 3 Soit le diagramme de Lexis suivant où les lettres X indiquent que les temps sont des temps d’événement observés. De même, les lettres C indiquent des temps de censure. 0 1 2 X C X C 3 5 En supposant que le temps de survie suit une loi Log-logistique de paramètres 1 α = 1 et λ inconnu, c-.à-d. S(x) = 1+λx . Calculez λ̂, l’estimateur maximum de vraisemblance pour le paramètre λ. - Question 4 Soit la table de mortalité suivante dans laquelle on retrouve quelques valeurs: j Ij Yj0 wj 1 0-3 803 2 2 3-5 4 3 5-8 3 4 8-13 5 5 13-17 1 Yj dj Ŝ(aj−1 ) fˆ(amj ) ĥ(amj ) 75 1 102 153 0.77877 201 0.58613 257 0.33085 (A) Complétez la première rangée du tableau. (B) Calculez Ŝ(a1 ) (deuxième rangée). (C) Calculez le temps médian de survie. 4 - Question 5 Pour un groupe de 5 individus, on observe les temps de survie suivants: 1,2,3,4,5. Au temps t = 3, (A) calculez l’estimateur de Kaplan-Meier Ŝ(3), (B) calculez l’estimateur de Greenwood pour la variance de Ŝ(3), (C) calculez l’estimateur de Nelson-Aalen H̃(3), (D) calculez l’estimateur de la variance de H̃(3). - Question 6 Vous utilisez un modèle de régression de type log-linéaire pour le temps de survie de certaines machines. Le modèle est le suivant: ln X = 2 + 3Z + 4W. Il n’y a qu’un facteur explicatif dont la valeur est Z = 1 pour la machine qui vous intéresse. Vous considérez deux possibilités pour la distribution du terme d’erreur W : • Pareto: SW (w) = (1 + 6w)−2 , w ≥ 0. • Logistique: SW (w) = (1 + 42w2 )−1 , w ≥ 0. (A) Calculez le temps médian de survie de la machine selon la distribution Pareto. (B) Calculez le temps médian de survie de la machine selon la distribution Logistique. (C) Si l’espérance du temps de survie pour une telle machine est égale à µ, quelle est l’espérance pour une autre machine pour laquelle Z = 0.9 ? 5 - Question 7 Pour un groupe de 4 personnes, les temps de survie observés sont 1,6,10 et 20. On compare ces données à une loi exponentielle avec un taux de panne constant à 0.1. Calculez la statistique de Kolmogorov-Smirnov pour ces données et dites si l’on doit rejeter ou non l’hypothèse. La valeur critique à utiliser est 1.36 pour un test avec un niveau de confiance de 95%. - Question 8 On vous donne les temps d’événement suivants: {Xi }10 i=1 = {1, 3, 5, 7, 7, 7, 12, 17, 17, 20+}. Tous les temps sont observés sauf le dernier qui est un temps de censure à droite. On veut confronter ces données à une mortalité de base dont le taux de panne est constant à h(t) = 0.05. Pouvez-vous conclure que le groupe sous étude subit une mortalité excédentaire par rapport au groupe de base, c.-à-d. doit-on rejeter l’hypothèse nulle selon laquelle les données sont tirées de la fonction de survie S(t) = e−0.05t ? Conduisez le test à t = 20 et utilisez l’hypothèse d’un modèle multiplicatif et un niveau de confiance 1 − α = 95% pour l’intervalle de confiance de type log, c.-à-d., B(t) ∈ [B̂(t)/φ, B̂(t)φ] φ = exp Z1−α/2 V̂ 1/2 (B̂(t)) B̂(t) 6 ! . - Question 9 On analyse le temps de survie entre le temps d’infection et l’apparition des premiers symptômes d’une certaine maladie. La durée de l’étude est de 10 ans. Les temps d’infection de 5 patients sont 1,4,5,6,8. Pour ces patients, les durées avant l’apparition de la maladie furent de 3,4,2,3,1. Calculez l’estimateur de P (X ≥ t|X ≤ 10) pour t ∈ [0, 10]. - Question 10 Vous devez estimer la distribution du temps de survie pour une type de pièce d’équipement. Dans le tableau suivant, Lj est l’âge de la pièce au début de l’étude. Si δj vaut 1, alors Tj est l’âge de cette pièce au moment où elle cesse d’être fonctionnelle. Sinon la pièce est toujours fonctionnelle à la fin de l’étude et Tj est son âge à ce moment. Soit les données suivantes: j Lj 1 0 2 0 3 0 4 2 5 3 6 4 7 4 8 5 Tj 5 3 4 7 5 8 7 8 δj 1 0 1 0 0 0 1 1 (A) Calculez le nombre de pièces à risque pour les temps t = 4, 5, 7, 8. (B) Calculez l’estimateur de Kaplan-Meier pour la fonction de survie en t = 8. 7 - Question 11 On vous donne le tableau suivant pour le temps d’événement de 3 individus. Li 0 1 2 Ri 2 3 4 Les données sont censurées par intervalles, Li représente le temps de censure à gauche et Ri représente le temps de censure à droite. Utilisez l’algorithme de Turnbull pour (A) calculer les valeurs initiales de la fonction de survie et (B) calculer les valeurs de la fonction de survie après une itération de l’algorithme. - Question 12 Soient les données suivantes d’une étude de survie: ti 1 2 di 2 1 Yi 8 5 Calculez l’intervalle de confiance à 95% pour l’estimateur de KaplanMeier évalué en t = 2. Afin de s’assurer que l’intervalle de confiance obtenu ne contienne que des valeurs strictement admissibles, utilisez la transformation suivante, définie en deux parties: ( g(x) = ln(2x) 0 < x < 1/2 −ln(2(1 − x)) 1/2 ≤ x < 1. 8