Université de Montréal Faculté des Arts et des Sciences

Transcription

Université de Montréal Faculté des Arts et des Sciences
Université de Montréal
Faculté des Arts et des Sciences
Département de Mathématiques et Statistique
STT-3260 Modèles de Survie
Examen Intra
Hiver 2004, Le lundi 23 février, 13h30-15h30
Instructions
1) Aucune documentation n’est permise.
2) Seule, la calculatrice de la SoA est permise.
3) À l’intérieur de la page couverture de votre cahier de réponses, écrivez
votre pseudonyme (p.ex. Saku Koivu, Byonce, Mom Boucher, Doc
Mailloux, etc.) qui sera utilisé pour la divulgation confidentielle des
résultats.
4) Utilisez les pages de gauche comme brouillon et les pages de droite pour
vos développements au propre.
5) Il y a 12 questions traditionnelles totalisant 48 points. Vous pouvez
donc obtenir une note maximale de 120%.
6) N’hésitez pas à écrire ce que vous croyez approprié. En particulier, le
simple fait d’énoncer une formule vous vaudra des points.
7) Les questions ont été ordonnées de sorte que les plus difficiles se retrouvent à la fin.
8) Si Z suit une loi normale standard, alors P (|Z| ≤ 1.96) = 0.95.
1
- Question 1 L’espérance de vie résiduelle est donnée par la fonction suivante:
mrl(x) = x + 1.
(A) le taux de panne h(x),
(B) le taux de panne cumulatif H(x),
(C) la fonction de survie S(x) et
(D) la fonction de densité f (x).
- Question 2 Voici une liste de types de censures et troncations qui ont été vues en
classe:
(A) censure à droite,
(B) censure aléatoire à droite,
(C) censure à gauche,
(D) censure par intervalles,
(E) censure à droite de type 2,
(F) troncation à gauche,
(G) troncation à droite,
(H) troncation par intervalles,
Voici maintenant une série de cas pour lesquels on désire analyser le temps
de survie. Pour chacun des cas, associez le type de censure ou troncation
qui s’applique. Les cas sont décrits de sorte qu’un seul des choix suggérés cihaut s’applique. De plus, donnez le terme de vraisemblance associé à chaque
exemple.
(1) On fait une étude de mortalité pour un troupeau de vaches. Une vache
arrive à l’âge de 3 ans et son décès est observé à l’âge de 7 ans.
2
(2) Une vache naı̂t au sein du troupeau et est toujours vivante à la fin de
l’étude. Elle est âgée de 10 ans.
(3) Une des vaches, née au sein du troupeau, est décédée entre les âges de
5 et 10 ans mais l’éleveur a oublié quand exactement.
(4) Dans une étude de fiabilité de machines on prend un échantillon de
10 nouvelles machines sorties de l’usine et l’étude se termine après
que 5 machines aient failli à la tâche. Une des machines est toujours
fonctionnelle à la fin de l’étude qui aura duré 2 ans.
(5) On conduit une étude du temps entre le moment d’infection et le
développement de la maladie du sida. Une personne est infectée le 1er
janvier 1995, développe les premiers symptômes le 1er janvier 2002.
Notre étude ne tient compte que des personnes ayant développé les
symptômes avant le 1er janvier 2004.
(6) On conduit une étude de mortalité pour les bénéficiaires d’une maison
de retraite. On se base sur les dossiers de décès uniquement. Les
personnes toujours en vie n’entrent pas dans notre étude. Une personne
est arrivée dans la maison à 65 ans, est décédée à l’âge de 70 ans et
aurait aujourd’hui 73 ans.
(7) On conduit une étude pour savoir combien de temps les gens mâchent
leur gomme. Jean-François a craché sa gomme dans les 10 premières
minutes mais ne se souvient plus exactement quand.
(8) Après que Julie ait passé 5 minutes à mâcher, Jean-François conte une
blague. Julie part à rire, s’étouffe et avale sa gomme. On n’a donc pas
pu observer son temps de survie.
3
- Question 3 Soit le diagramme de Lexis suivant où les lettres X indiquent que les
temps sont des temps d’événement observés. De même, les lettres C indiquent des temps de censure.
0
1
2
X
C
X
C
3
5
En supposant que le temps de survie suit une loi Log-logistique de paramètres
1
α = 1 et λ inconnu, c-.à-d. S(x) = 1+λx
. Calculez λ̂, l’estimateur maximum
de vraisemblance pour le paramètre λ.
- Question 4 Soit la table de mortalité suivante dans laquelle on retrouve quelques
valeurs:
j
Ij
Yj0 wj
1 0-3 803 2
2 3-5
4
3 5-8
3
4 8-13
5
5 13-17
1
Yj
dj Ŝ(aj−1 ) fˆ(amj ) ĥ(amj )
75
1
102
153 0.77877
201 0.58613
257 0.33085
(A) Complétez la première rangée du tableau.
(B) Calculez Ŝ(a1 ) (deuxième rangée).
(C) Calculez le temps médian de survie.
4
- Question 5 Pour un groupe de 5 individus, on observe les temps de survie suivants:
1,2,3,4,5. Au temps t = 3,
(A) calculez l’estimateur de Kaplan-Meier Ŝ(3),
(B) calculez l’estimateur de Greenwood pour la variance de Ŝ(3),
(C) calculez l’estimateur de Nelson-Aalen H̃(3),
(D) calculez l’estimateur de la variance de H̃(3).
- Question 6 Vous utilisez un modèle de régression de type log-linéaire pour le temps
de survie de certaines machines. Le modèle est le suivant:
ln X = 2 + 3Z + 4W.
Il n’y a qu’un facteur explicatif dont la valeur est Z = 1 pour la machine
qui vous intéresse. Vous considérez deux possibilités pour la distribution du
terme d’erreur W :
• Pareto: SW (w) = (1 + 6w)−2 , w ≥ 0.
• Logistique: SW (w) = (1 + 42w2 )−1 , w ≥ 0.
(A) Calculez le temps médian de survie de la machine selon la distribution
Pareto.
(B) Calculez le temps médian de survie de la machine selon la distribution
Logistique.
(C) Si l’espérance du temps de survie pour une telle machine est égale à µ,
quelle est l’espérance pour une autre machine pour laquelle Z = 0.9 ?
5
- Question 7 Pour un groupe de 4 personnes, les temps de survie observés sont 1,6,10
et 20. On compare ces données à une loi exponentielle avec un taux de
panne constant à 0.1. Calculez la statistique de Kolmogorov-Smirnov pour
ces données et dites si l’on doit rejeter ou non l’hypothèse. La valeur critique
à utiliser est 1.36 pour un test avec un niveau de confiance de 95%.
- Question 8 On vous donne les temps d’événement suivants:
{Xi }10
i=1 = {1, 3, 5, 7, 7, 7, 12, 17, 17, 20+}.
Tous les temps sont observés sauf le dernier qui est un temps de censure à
droite. On veut confronter ces données à une mortalité de base dont le taux
de panne est constant à h(t) = 0.05. Pouvez-vous conclure que le groupe
sous étude subit une mortalité excédentaire par rapport au groupe de base,
c.-à-d. doit-on rejeter l’hypothèse nulle selon laquelle les données sont tirées
de la fonction de survie S(t) = e−0.05t ? Conduisez le test à t = 20 et utilisez
l’hypothèse d’un modèle multiplicatif et un niveau de confiance 1 − α = 95%
pour l’intervalle de confiance de type log, c.-à-d.,
B(t) ∈ [B̂(t)/φ, B̂(t)φ]
φ = exp
Z1−α/2 V̂ 1/2 (B̂(t))
B̂(t)
6
!
.
- Question 9 On analyse le temps de survie entre le temps d’infection et l’apparition
des premiers symptômes d’une certaine maladie. La durée de l’étude est
de 10 ans. Les temps d’infection de 5 patients sont 1,4,5,6,8. Pour ces patients, les durées avant l’apparition de la maladie furent de 3,4,2,3,1. Calculez
l’estimateur de P (X ≥ t|X ≤ 10) pour t ∈ [0, 10].
- Question 10 Vous devez estimer la distribution du temps de survie pour une type de
pièce d’équipement. Dans le tableau suivant, Lj est l’âge de la pièce au début
de l’étude. Si δj vaut 1, alors Tj est l’âge de cette pièce au moment où elle
cesse d’être fonctionnelle. Sinon la pièce est toujours fonctionnelle à la fin de
l’étude et Tj est son âge à ce moment. Soit les données suivantes:
j Lj
1 0
2 0
3 0
4 2
5 3
6 4
7 4
8 5
Tj
5
3
4
7
5
8
7
8
δj
1
0
1
0
0
0
1
1
(A) Calculez le nombre de pièces à risque pour les temps t = 4, 5, 7, 8.
(B) Calculez l’estimateur de Kaplan-Meier pour la fonction de survie en
t = 8.
7
- Question 11 On vous donne le tableau suivant pour le temps d’événement de 3 individus.
Li
0
1
2
Ri
2
3
4
Les données sont censurées par intervalles, Li représente le temps de
censure à gauche et Ri représente le temps de censure à droite. Utilisez
l’algorithme de Turnbull pour
(A) calculer les valeurs initiales de la fonction de survie et
(B) calculer les valeurs de la fonction de survie après une itération de
l’algorithme.
- Question 12 Soient les données suivantes d’une étude de survie:
ti
1
2
di
2
1
Yi
8
5
Calculez l’intervalle de confiance à 95% pour l’estimateur de KaplanMeier évalué en t = 2. Afin de s’assurer que l’intervalle de confiance obtenu ne
contienne que des valeurs strictement admissibles, utilisez la transformation
suivante, définie en deux parties:
(
g(x) =
ln(2x)
0 < x < 1/2
−ln(2(1 − x)) 1/2 ≤ x < 1.
8