TD10 - LPMA

Transcription

TD10 - LPMA
Université Pierre & Marie Curie
UE 3M245 – Probabilités élémentaires
Licence de Mathématiques L3
Année 2016–17
TD10. Loi des grands nombres, théorème central limite
1. Soit (Un )n≥1 une suite de variables aléatoires indépendantes toutes de loi uniforme
sur l’intervalle [0, 1]. Soit f : [0, 1] → R une fonction continue. Que peut-on dire de
f (U1 ) + . . . + f (Un )
n
lorsque n tend vers +∞ ?
Solution de l’exercice 1. La fonction f , continue sur le segment [0, 1], y est bornée.
Ainsi, les variables aléatoires (f (Un ))n≥1 sont indépendantes, de même loi et admettent
un moment d’ordre 1. On peut leur appliquer la loi forte des grands nombres (puisque
la fonction f est bornée, les variables admettent un moment d’ordre 2 et on est même
(Un )
dans le cas dont on a étudié la démonstration en cours) pour trouver que f (U1 )+...+f
n
converge presque sûrement, lorsque n tend vers l’infini, vers
Z 1
E[f (U1 )] =
f (t) dt.
0
Cette méthode est parfois utilisée pour calculer des valeurs approchées d’intégrales et
s’appelle la méthode de Monte-Carlo.
2. On considère une suite de jets indépendants d’un dé équilibré. On désigne par Xk
le résultat du k-ème jet et par Yn le plus grand résultat observé au cours des n premiers
jets.
Yn = max Xk
1≤k≤n
a) Que peut-on dire des propriétés de convergence de la suite (Yn )n≥1 ?
b) On pose : Nn = Card{k ≤ n : Xk = 6} pour tout n ∈ N∗ . Etablir la convergence
presque sûre de la suite Nnn n∈N∗ .
Solution de l’exercice 2.
a) Il est assez évident que la suite va converger presque sûrement vers 6 : Yn vaut 6 à
partir de la première observation d’un 6, et la probabilité qu’on ne fasse aucun 6 est
nulle. Formalisons ceci
P(∃k ∈ N : Xk = 6) = 1
Or (ω : ∃k ∈ N : Xk (ω) = 6) ⊂ (ω : limn→∞ Yn (ω) = 6), d’où
P lim Yn = 6 = 1
n→∞
et la convergence presque sûre de Yn vers 6.
1
P
b) Nn la variable aléatoire qui compte le nombre de 6 peut se réécrire Nn = nk=1 1{Xk =6} .
La suite de variables aléatoires (Zk := 1{Xk =6} )k≥1 est indépendante et identiquement distribuée. Et 1{X1 =6} suit une loi de Bernoulli de paramètre P(X1 = 6) = 16 ,
elle possède donc une espérance. D’après la loi forte des grands nombres, on a
Z1 + ... + Zn p.s. 1
Nn
=
→
n
n
6
3. A l’approche des élections, un institut de sondage contacte successivement des
individus. Notre modèle est le suivant : les appels sont indépendants et chaque individu
répond qu’il va voter pour le candidat A avec probabilité pA (et pour le candidat B avec
probabilité pB = 1 − pA ). Le but est d’estimer le paramètre pA du modèle.
a) Soit NA (n) le nombre de réponses en faveur du candidat A collectées en n appels.
Que dire de la convergence de la suite NAn(n) ?
NA (n)
n
b) L’application de l’inégalité de Tchebychev à la variable aléatoire
de retrouver ce résultat ?
permet-elle
c) Déduire de cette même inégalité un intervalle I(n, δ) tel que
P (pA ∈ I(n, δ)) ≥ 1 − δ
Un tel intervalle est appelé intervalle de confiance pour le paramètre pA .
Solution de l’exercice 3. Introduisons une suite (Xk )k≥1 de Bernoullis indépendantes
de paramètre pA telle que Xk prend la valeur 1 si le k-ème individu appelé se prononce
pour le candidat A, et 0 dans le cas contraire.
P
a) On note que NA (n) = nk=1 Xk et donc d’après la loi forte des grands nombres,
NA (n)
X1 + X2 + ... + Xn p.s.
=
→ pA
n
n
car la suite (Xk )k≥1 est i.i.d. et que X1 admet pour espérance pA .
b) On a
NA (n)
= pA
E
n
NA (n)
1
pA (1 − pA )
Var
=
nVar(X
)
=
1
n
n2
n
donc l’inégalité de Tchebychev appliquée à la variable aléatoire
tout ε > 0,
NA (n)
pA (1 − pA )
P − pA ≥ ε ≤
n
nε2
2
NA (n)
n
donne, pour
Si on avait
NA (n)
P
−
p
≥
ε
< ∞ par application du lemme de Borel
A
n=0
n
P∞
Cantelli (cf exercice 5 TD 8), on obtiendrait la convergence presque sûre de NAn(n)
vers pA . Mais l’inégalité obtenue ne nous donne pas une majoration par le terme
général d’une série convergente, donc n’est pas suffisante pour obtenir la convergence
presque sûre...
c) L’inégalité de Tchebychev va toutefois nous permettre de construire un intervalle
de confiance de niveau 1 − δ pour pA , c’est-à-dire une région qui contient pA avec
probabilité au moins égale à 1−δ. Pour cela on choisit dans l’inégalité de Tchebychev
A)
ci-dessus ε tel que pA (1−p
= δ. Pour cette valeur de ε on a alors
nε2
NA (n)
− pA ≤ ε ≥ 1 − δ
P n
q
A)
En remarquant que ε = √1n pA (1−p
, on peut poser
δ
"
NA (n)
1
I(n, δ) =
−√
n
n
r
pA (1 − pA ) NA (n)
1
;
+√
δ
n
n
r
pA (1 − pA )
δ
#
4. Soit f : [0, 1] → R une fonction continue. Pour tout n ≥ 0, on définit la fonction
bn : [0, 1] → R par la formule
n X
n
k
xk (1 − x)n−k .
∀x ∈ [0, 1], bn (x) =
f
n
k
k=0
a. Montrer que la suite de fonctions (bn )n≥0 converge simplement vers f , c’est-à-dire
∀x ∈ [0, 1], lim bn (x) = f (x).
n→∞
b. Montrer que la convergence est uniforme, c’est-à-dire que
lim sup{|bn (x) − f (x)| : x ∈ [0, 1]} = 0.
n→∞
On a démontré le théorème de Stone-Weierstrass : toute fonction continue sur un segment y est uniformément approximable par une suite de fonctions polynômiales. Plus
précisément on a approximé f par une famille de polynômes de Bernstein.
Solution de l’exercice 4.
a) Soit x ∈ [0, 1]. On observe que bn (x) = E[f (B/n)], où B suit la loi binomiale
de paramètres n et x. Considérons donc (Xn )n≥1 une suite de v.a. i.i.d. de loi de
Bernoulli de paramètre x. On a
X1 + . . . + Xn
bn (x) = E f
.
n
3
n
D’après la loi forte des grands nombres, X1 +...+X
tend presque sûrement, quand
n
n
tend
n tend vers l’infini, vers E[X1 ] = x. Puisque f est continue, f X1 +...+X
n
donc presque sûrement vers f (x). Enfin, puisque f est
continue sur [0, 1], elle y est
X1 +...+Xn
vers f (x) est donc dominée
bornée. La convergence presque sûre de f
n
par le supremum de f et le théorème de convergence dominée permet d’affirmer que
X1 + . . . + Xn
bn (x) = E f
−→ f (x).
n→∞
n
b) On cherche à majorer la différence |bn (x) − f (x)| indépendamment de x.
X1 + ... + Xn
|bn (x) − f (x)| ≤ E f
− f (x)
n
X
+
...
+
X
1
n
≤ E f
− f (x) 1| X1 +...+Xn −x|≥α
n
n
X
+
...
+
X
1
n
− f (x) 1| X1 +...+Xn −x|<α
+E f
n
n
où l’inégalité ci-dessus est vraie pour tout α. On se fixe ε > 0. Par uniforme continuité de f (f est continue sur un segment), il existe un α > 0 tel que |y − x| ≤ α ⇒
|f (y) − f (x)| ≤ ε/2. On a donc pour ce choix de α,
X1 + ... + Xn
|bn (x) − f (x)| ≤ 2||f ||∞ P − x ≥ α +ε/2
n
|
{z
}
A(x)
Il suffit maintenant de majorer A(x) par un petit nombre indépendamment de x :
pour cela il faut appliquer l’inégalité de Tchebychev. Pour tout x ∈ [0, 1], on a :
A(x) ≤ nα1 2 Var(X1 ) = x(1−x)
≤ nα1 2 .
nα2
Donc en prenant n assez grand, on peut rendre aussi petit que l’on veut supx A(x)
ce qui finit la preuve.
5. Soit (Xn )n≥1 une suite
variables aléatoires indépendantes de même loi de Poisson
Pde
n
de
1. Soit Sn = k=1 Xk . Rappeler la loi de Sn et calculer la limite de la suite
paramètre
Pn nk −n
e
.
k=0 k!
n≥1
Solution de l’exercice 5. Une somme de v.a. de Poisson indépendantes est une v.a. de
Poisson dont le paramètre (qui est aussi l’espérance et la variance) est la somme de ceux
des v.a. qu’on a ajoutées. Ainsi Sn suit une loi de Poisson de paramètre n. En particulier,
k
si k ∈ N, alors e−n nk! = P(Sn = k). En sommant, on obtient
!
n
k
X
n
e−n
= P(Sn ≤ n) = P(Sn /n ≤ 1).
k!
k=0
4
La loi des grands nombres nous dit que Sn /n → E[X1 ] = 1 p.s. Ainsi Sn /n est proche de
1, mais ce résultat ne nous dit pas s’il est un peu plus grand ou un peu plus petit. Pour
avoir des informations sur Sn /n − 1, (et en particulier son signe), on applique le théorème
de la limite centrale :
Sn − n loi
√
−→ N (0, 1).
n n→∞
D’après le corrolaire 4.2.1 du cours, on en déduit que, si Y suit une loi normale standard,
alors, lorsque n → ∞,
Sn − n
P(Sn /n ≤ 1) = P( √
≤ 0) → P(Y ≤ 0) = 1/2.
n
L’égalité P(Y ≤ 0) = 1/2 découle du fait que Y est symétrique.
Ainsi, on a montré que
!
n
k
X
n
e−n
→ 1/2.
k!
k=0
6.
a) Soit (pn )n≥1 une suite de réels dans ]0, 1[ telle que limn→+∞ npn = λ > 0. Soit
(Xn )n≥1 une suite de v.a. telles que pour tout n : Xn ∼ B(n, pn ) et X une v.a. de
loi de Poisson paramètre λ. Montrer que (Xn )n≥1 converge en loi vers X.
b) Soit (Xn )n≥1 une suite de v.a. réelles indépendantes de P
même√loi N (0, 1). Etudier
1
le comportement asymptotique en loi de la suite Yn = n nk=1 kXk
Solution de l’exercice 6.
a) Afin de montrer la convergence en loi de (Xn )n≥1 vers X. Montrons que φXn (t) −−−−→
n→+∞
φX (t) pour tout t ∈ R, où φX designe la fonction caractéristique d’une variable aléatoire X.
n
φXn (t) = 1 − pn + pn eit
= exp n ln(1 − pn + pn eit )
= exp −npn (1 − eit ) + npn εn
où εn −−−−→ 0
n→+∞
it
∼n exp −npn (1 − e )
−−−−→ eλ(e
n→+∞
it −1)
= φX (t).
b) Vu la forme de la variable Yn , on est tenté d’appliquer la
√ loi des grands nombres.
Cependant on ne peut pas l’appliquer car les variables kXk ne sont pas identiquement distribuées. On va donc à nouveau utiliser les fonctions caractéristiques
afin de démontrer un résultat de convergence en loi. Les variables aléatoires Xn sont
5
indépendantes, donc Yn est une variable gaussienne de moyenne 0 et de variance
n(n+1)
donc :
2n2
φYn (t) = e−
n(n+1) 2
t
4n2
2 /4
−−−−→ e−t
n→+∞
.
On a donc montré que (Yn )n≥1 converge en loi vers une loi normale centrée réduite
N (0, 21 ).
7. On suppose que l’intervalle de temps entre deux voitures successives à un passage
à niveau (peu fréquenté) suit une loi exponentielle de moyenne 30 minutes. On suppose de
plus qu’il y a indépendance entre les intervalles de temps séparant les instants de passage
de voitures. Calculer (une valeur approchée) de la probabilité qu’il y ait plus de 50 voitures
qui empruntent le passage à niveau une journée donnée.
Solution de l’exercice 7. Soit (Xn )n≥0 une suite de v.a. i.i.d. suivant la loi exponentielle
de paramètre 1/30. On a alors E[X1 ] = 30 et Var(X1 ) = 900. Xn représente le temps (en
minutes) qui sépare le passage de la (n−1)-ième voiture de la n-ième voiture. On considère
ensuite Sn = X1 + . . . Xn . Sn donne l’instant de passage de la n-ième voiture. On veut
déterminer
P[S50 ≤ 24 × 60].
Or on a
24 × 60 − 50 × 30
−2
S50 − 50 × 30
√
√
≤
≈F √
,
≤ 24 × 60] = P
30 × 50
30 × 50
50
P[S50
où F est la fonction de répartition
de
la loi normale centrée réduite, l’approximation étant
≈ F (−0.283) = 1 − F (0.283). En utilisant une table
donnée par le TCL. De plus F √−2
50
ou un logiciel on obtient F (0.283) ≈ 0.61. On a donc P[S50 ≤ 24 × 60] ≈ 0.39.
8. Soit f : R → R une fonction continue bornée. Montrer qu’on a
−n
lim e
n→+∞
Z +∞
∞
X
t2
k − n nk
1
√
f
=√
f (t)e− 2 dt.
k!
n
2π −∞
k=0
Solution de l’exercice 8. Soit (Xn )n≥1 une suite de variables aléatoires indépendantes
de loi de Poisson de paramètre 1. On a E[X1 ] = 1 et Var(X1 ) =
1.
X1 +...+X
n −n
√
D’une part, le théorème central limite assure que la suite
converge
n
n≥1
en loi vers la loi normale centrée réduite. Ainsi, puisque f est continue et bornée,
Z +∞
t2
X1 + . . . + X n − n
1
√
lim E f
=√
f (t)e− 2 dt.
n→∞
n
2π −∞
6
D’autre part, pour tout n ≥ 1, la variable aléatoire X1 + . . . + Xn suit la loi de Poisson
de paramètre n. Ainsi,
∞
X
X 1 + . . . + Xn − n
k − n nk
−n
√
√
E f
=e
.
f
k!
n
n
k=0
En comparant ces deux égalités, on a la convergence voulue.
9. Soient (Xn )n≥1 des variables aléatoires indépendantes, identiquement distribuées
et de carré
√ intégrable. On suppose que leur loi a la propriété suivante : X1 + X2 a même
loi que 2X1 .
a) Exprimer, pour tout n ≥ 0, la loi de X1 + . . . + X2n en fonction de celle de X1 .
b) Déterminer la loi commune des variables aléatoires (Xn )n≥1 .
Solution de l’exercice 9.
√ n
a) On va montrer par récurrence que X1 + . . . + X2n a même loi que 2 X1 , pour tout
n ≥ 1. Pour n = 1, c’est l’hypothèse. Supposons le résultat démontré jusqu’au rang
n et démontrons le au rang n + 1. On écrit
X1 + . . . + X2n+1 = (X1 + . . . + X2n ) + (X2n +1 + . . . + X2n+1 ).
La v.a. X2n +1 + . . . + X2n+1 est indépendante de X1 + . . . + X2n (car les Xn sont
indépendantes et on utilise des paquets d’indices disjoints)
√ n et de même loi. Par l’hypothèse de récurrence,
loi que 2 X1 . Mais alors leur somme
√ n ces deux
√ n v.a. ont
√ même
n
a même loi que 2 X1 + 2 X2 = 2 (X1 + X2 ), qui a bien même loi (d’après
√ n+1
l’hypothèse pour n = 1) que 2 X1 . Ce qui achève la preuve par récurrence.
b) Comme X1 est de carré
entraîne alors
√ intégrable, X1 est intégrable. L’hypothèse
2
2
que E[X1 ] + E[X1 ] = 2E[X1 ], et donc E[X1 ] = 0. Soit σ = E[X1 ]. On applique le
théorème de la limite centrale :
X1 + . . . + Xn loi
√
−→ N (0, σ 2 ).
n→∞
n
On a la même convergence pour les sous-suites, et en particulier :
X1 + . . . + X2n loi
√
−→ N (0, σ 2 ).
n
n→∞
2
Or, d’après la question précédente, le terme de gauche a même loi que X1 , qui suit
donc la loi N (0, σ 2 ).
7