Loi des séries de pile ou face (Kévin Maurin, Mai

Transcription

Loi des séries de pile ou face (Kévin Maurin, Mai
Exercice de khôlle de maths sur les probabilités, prépa
BCPST: Séries de piles et de faces
Mise en contexte :
Cet exercice, dont l’énoncé est dans l’encadré un peu plus bas, m’a été donné lorsque j’étais
en première année de classe prépa filière BCPST, à l’occasion d’une khôlle de maths. Il se base sur le
jeu de pile ou face, et fait intervenir insidieusement la loi des séries.
Mais tout d’abord, qu’est-ce que la loi des séries ? C’est une loi qui dit grosso modo que si
un événement assez exceptionnel se produit, cela entraîne des événements de même type à se
produire à sa suite, comme si ces événements s’attiraient (typiquement: « un malheur n’arrive
jamais seul »). Peut-être vous souvenez-vous des 3 crashs de trains en Europe (et 1 au Québec) en
Juillet 2013 ? A l’époque les médias avaient en toutes lettres invoqué la loi des séries. Idem pour les
5 crashs d’avions en 22 jours de l’été 2005, sauf que là une explication mathématique (qui avait fait
l’objet de plusieurs articles de journaux) invoquant la loi des probabilités (et non des séries) a été
proposée : environ 20 00 vols ont lieu chaque jour, et il y a en moyenne un crash (enfin, un accident,
qu’il soit relativement mineur ou assez majeur, au décollage comme ailleurs durant le vol) tous les
500 000 vols, ce qui fait 1 chance sur 10 que 5 crashs se produisent en 22 jours !
Bref, on pourrait alors penser que cette loi des séries n’est qu’un artefact médiatique (un
drame incite les médias à relater plus d’histoires impliquant ce même drame, histoire de faire dans
le sensationnel, et le commun des mortels pense alors qu’un drame en appelle un autre identique).
Mais, au risque de gâcher la surprise, l’exercice proposé ici est (à mon sens) une super illustration
que cette loi existe… sous certaines conditions ;) A l’époque ça m’avait décoiffé ! Et 4 ans et demi
plus tard j’arrive enfin à le refaire, avec quelques conseils de ma prof de maths de spé, Florence
Gaja, et poussé par des interrogations de quelques amis à qui j’avais parlé de cette fameuse loi et de
cet exercice.
J’ai essayé d’être le plus rigoureux possible au niveau mathématique tout en essayant de
rendre le contenu accessible à pas mal de niveaux différents en maths (d’où les lignes et les lignes
d’explications, afin de notamment traduire en français le langage mathématique :) ). Notamment, les
principaux résultats sont encadrés et en rouge, histoire que ceux qui ne veulent pas s’embêter avec
les démonstrations puissent trouver facilement les réponses ;) Si vraiment vous n’avez que 5
minutes à accorder à cet exercice, sa réponse se trouve au point 5), et sa transposition dans la
« vraie vie » au point 8) ! J’espère avoir limité au maximum les erreurs et les interprétations ou
explications imprécises voire limite incorrectes. Bref, allumez vos cerveaux, c’est parti !
Kévin Maurin, Mai 2015
L’énoncé :
On lance plusieurs fois une pièce de monnaie ayant une probabilité p de donner pile (P) et 1-p de
donner face (F). Les lancers sont indépendants.
Cette séquence de piles et de faces constitue des séries d’un même côté de pièce, que l’on
numérote. Ce numéro augmente à chaque fois qu’une nouvelle série commence (voir l’exemple cidessous).
Côté de pièce PPP FFFFF PPPP FF PPPP F PPPP FFFFFF P
Suite numéro
1
2
3
4
5 6 7
8
9
Question : calculer la longueur moyenne des séries de numéros pairs.
Résolution :
Commençons d’abord par les définitions des lettres qui vont apparaître par la suite (histoire
de savoir de quoi on parle !) :
- La longueur d’une série d’un même côté de pièce : variable aléatoire notée 𝑆, qui prend
des valeurs 𝑘 ∈ ℕ∗ (une série infinie d’un même côté de pièce est improbable, mais pas
impossible (on dit alors quasi-impossible), ce qui est une différence importante en maths
– et qui devrait l’être un peu plus dans la « vraie vie » ;) )
- Le numéro d’une série : 𝑛 ∈ ℕ∗ . Enfin, pas tout à fait : les séries de numéros pairs seront
notées 𝑆2𝑛 (2n donnant alors des numéros pairs, qui commencent bien à 2 qui est le
premier numéro pair de série, pour 𝑛 ∈ ℕ∗ : 2, 4, 6, 8…) et les séries de numéros impairs
notées 𝑆2𝑛−1 (2n-1 donnant alors des numéros impairs, qui commencent bien à 1 qui est
le premier numéro impair de série, pour 𝑛 ∈ ℕ∗ : 1, 3, 5, 7…)
1) L’idée pour calculer la probabilité qu’une série de F soit de longueur k : il faut que l’on
fasse k F de suite après une série de P, et faire un autre P à la fin qui termine la série de F. Chaque F
ayant une probabilité 1-p et le P une probabilité p de sortir, on en déduit que la probabilité qu’une
série de F soit de longueur k est donnée par :
𝑷(𝑺 = 𝒌|𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) = (𝟏 − 𝒑)𝒌−𝟏 𝒑
Suivant le même raisonnement, la probabilité qu’une série de P soit de longueur k est
donnée par :
𝑷(𝑺 = 𝒌|𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷) = 𝒑𝒌−𝟏 (𝟏 − 𝒑)
Là, il y a un petit point conceptuel : pourquoi mettre exposant k-1 et non k ? Ma prof m’a
expliqué qu’il ne faut pas compter le premier jet d’une série car il est indispensable pour commencer
la série, sans lui la série n’existe pas. En gros la probabilité que le premier jet d’une série soit de
même nature que la série qu’il commence est de 1, donc il n’y a que k-1 P qui ont une vraie
probabilité p de sortir sur les k P que compte la série (ou du moins c’est comme ça que je l’ai
compris – et le raisonnement est le même pour les F). Ce n’était pas mon raisonnement quand
j’avais fait l’exercice à l’époque (enfin je crois – je ne m’en souviens plus à vrai dire…), mais ça donne
le même résultat final alors bon ^^’
2) Avant de vraiment s’intéresser à l’aspect pair ou impair des numéros des séries,
commençons par chercher la probabilité de la longueur d’une série indépendamment de sa nature
(c’est-à-dire qu’elle soit de P ou de F).
Il faut pour cela utiliser la formule des probabilités totales, ce que l’on peut faire car
l’ensemble des événements {« c’est une série de P » ; « c’est une série de F »} est un système
complet d’événements (il n’y a que 2 types de série possibles avec deux côtés de pièce). En toutes
lettres d’abord, la formule dit alors :
« La probabilité qu’une série soit de longueur k » = « la probabilité qu’une série soit de
longueur k sachant que c’est une série de F » x « la probabilité que ce soit une série de F » + « la
probabilité qu’une série soit de longueur k sachant que c’est une série de P » x « la probabilité que
ce soit une série de P »
Puis en langage plus mathématique :
𝑃(𝑆 = 𝑘) = 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹)𝑃(𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹) + 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃)𝑃(𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃)
Or on connaît les deux probabilités conditionnelles (voir point 1) ) :
𝑷(𝑺 = 𝒌) = (𝟏 − 𝒑)𝒌−𝟏 𝒑 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) + 𝒑𝒌−𝟏 (𝟏 − 𝒑) 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷)
Equation (1)
Les deux dernières inconnues, à savoir les probabilités que l’on parle d’une série de F ou de
P, vont dépendre de si l’on s’intéresse à des séries de numéros pairs ou impairs.
3) Maintenant, comment formaliser dans le calcul qu’une série est de numéro pair ? Ce qui
était le super problème que j’ai eu en essayant de refaire l’exercice ^^
Si on jette un œil à l’énoncé plus haut, on remarque que les séries de numéros pairs sont des
séries de F. Si l’on veut que les séries de numéros pairs soient des séries de P, on voit qu’il suffit de
remplacer chaque F par un P et vice-versa.
Ce qui change ? Tout bien sûr, mais en particulier le tout premier jet : si les séries de
numéros pairs sont des séries de F, c’est un P, et vice-versa ! C’est donc « tout simplement » le côté
de pièce sorti au premier jet qui détermine de quelle nature sont les séries de numéros pairs !
Donc, pour des séries de numéros pairs :
𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) = 𝑷(𝒕𝒊𝒓𝒆𝒓 𝑷 𝒂𝒖 𝒑𝒓𝒆𝒎𝒊𝒆𝒓 𝒋𝒆𝒕) = 𝒑
et
𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷) = 𝑷(𝒕𝒊𝒓𝒆𝒓 𝑭 𝒂𝒖 𝒑𝒓𝒆𝒎𝒊𝒆𝒓 𝒋𝒆𝒕) = 𝟏 − 𝒑
4) Désormais, on peut intégrer l’aspect « numéro pair de la série » pour répondre à la
question de l’énoncé.
On obtient alors enfin la probabilité qu’une série de numéro pair soit de longueur k :
𝑷(𝑺𝟐𝒏 = 𝒌) = (𝟏 − 𝒑)𝒌−𝟏 𝒑 𝒑 + 𝒑𝒌−𝟏 (𝟏 − 𝒑) (𝟏 − 𝒑)
Je laisse volontairement les carrés développés pour faire la différence entre le tout premier
jet, qui donne le caractère pair au numéro de la série, et le jet qui termine la série.
5) Et ENFIN, on peut répondre à la question de l’énoncé, en calculant l’espérance de
𝑷(𝑺𝟐𝒏 = 𝒌) (l’espérance mathématique étant le moyen de donner la vraie valeur moyenne d’une
variable aléatoire), avec la formule :
+∞
𝐸(𝑆2𝑛 ) = ∑ 𝑘 𝑃(𝑆2𝑛 = 𝑘)
𝑘=1
Je vous passe le calcul, mais pour ceux qui veulent s’amuser à le refaire, un petit rappel ;)
+∞
∑ 𝑘 𝑥 𝑘−1 =
𝑘=1
1
(1 − 𝑥)2
Et Ô magie, miracle, THE résultat qui sur le coup m’a fait regarder mon tableau en mode
« WTF ? » en cherchant l’erreur :
𝑬(𝑺𝟐𝒏 ) = 𝟐
Oui, simplement 2. La longueur d’une suite de numéro pair a en moyenne une longueur de
2, et ce même si la pièce est truquée (ce qui est le truc le plus ouf de cette histoire !). Mais je
reviendrai là-dessus un peu plus bas (voir point 8) ).
6) Comme j’avais fini ces calculs en à peine 20 minutes à l’époque (alors qu’au cumulé, j’ai
bossé presque 4h30 à refaire cet exercice maintenant (sans compter le temps passé à rédiger ce
document) – comme quoi quand on quitte la prépa y’a des réflexes qui se perdent !), et qu’une
khôlle dure normalement 1h, le prof m’avait fait calculer d’autres choses sur le même exercice.
Heureusement pas de variances, que je n’ai d’ailleurs pas envie de calculer maintenant non plus (ça
n’illustre pas mieux le propos de toute façon – ou presque).
Tout d’abord, rebelote mais en considérant les séries de numéros impairs. La méthode est la
même, les calculs sont de même nature mais les résultats diffèrent.
Reprenons d’abord l’équation (1), dans le cas où l’on s’intéresse aux séries de numéros
impairs :
𝑃(𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝐹) = 𝑃(𝑡𝑖𝑟𝑒𝑟 𝐹 𝑎𝑢 𝑝𝑟𝑒𝑚𝑖𝑒𝑟 𝑗𝑒𝑡) = 1 − 𝑝
et
𝑃(𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑃) = 𝑃(𝑡𝑖𝑟𝑒𝑟 𝑃 𝑎𝑢 𝑝𝑟𝑒𝑚𝑖𝑒𝑟 𝑗𝑒𝑡) = 𝑝
On obtient alors la probabilité qu’une série de numéro impair soit de longueur k :
𝑃(𝑆2𝑛−1 = 𝑘) = (1 − 𝑝)𝑘−1 𝑝 (1 − 𝑝) + 𝑝𝑘−1 (1 − 𝑝) 𝑝
Puis on en calcule l’espérance, et on obtient :
1−𝑝
𝑝
𝐸(𝑆2𝑛−1 ) =
+
𝑝
1−𝑝
De manière tout aussi surprenante que le résultat pour les séries de numéros pairs, la
longueur moyenne des séries de numéros impairs dépend elle de p, donc de si la pièce est truquée
ou équilibrée !
7) Et si l’on testait un peu tout ça ? ;)
Ces résultats semblant assez surprenants, pourquoi ne pas aller les vérifier après tout ? Ce
n’est pas à proprement parler une partie de la résolution du problème, mais ça m’amusait ;) Et c’est
intéressant aussi !
J’ai donc pris une pièce d’1$ néozélandais, et j’ai tiré à pile ou face 100 fois en notant à
chaque fois le côté qui sortait du jet. J’ai ensuite délimité les séries, compté leurs longueurs, et fait
les calculs de moyenne des longueurs. J’ai répété cela 20 fois.
Non je rigole, j’ai demandé à un ordinateur de le faire pour moi ! Ça permet de faire bien
plus de tirages pour une même séquence et de réaliser bien plus de séquences que n’importe qui en
aurait eu la patience ;) Enfin, ce n’est pas aussi simple que de le demander, il a fallu faire un peu de
programmation sous R (version 3.1.2). Mon script, que vous pouvez trouver à la fin de ce document,
n’est pas très élégant d’un point de vue de programmeur : il y a très certainement moyen
d’optimiser le nombre de lignes de codes, surtout quand j’utilise les mêmes boucles plusieurs fois, et
surtout j’insiste pour travailler avec des matrices, ce qui rajoute des lignes de code dont j’aurais sans
doute pu me passer ^^’ Mais je l’ai construit en suivant la logique de résolution de l’exercice (qui est
plus logique pour moi en tout cas).
Voici donc les résultats de cette expérience, pour différentes valeurs de p, volontairement
prises « en miroir » autour de ½ :
p = 1/5
p = 1/4
p = 1/3
p = 1/2
p = 2/3
p = 3/4
p = 4/5
2.023469 2.193948 2.025328 2.010931 1.996188
2.0018 2.142271
𝒎𝒆𝒂𝒏(𝑺𝟐𝒏 )
±
±
±
±
±
±
±
± 𝒔𝒅(𝑺𝟐𝒏 )
1.84187 1.657151 0.7422293 0.3262646 0.7961163 1.219517 1.602829
4.489319 2.990809 2.490302 2.024394 2.528058 3.446491 3.960846
𝒎𝒆𝒂𝒏(𝑺𝟐𝒏−𝟏 )
±
±
±
±
±
±
±
± 𝒔𝒅(𝑺𝟐𝒏−𝟏 )
1.739573 1.03441 0.8563335 0.3489073 0.8757788 1.385318 1.796049
En faisant mes petites manips sur R, je me suis aperçu qu’en fait ça valait le coup de calculer
les variances. Du moins de les faire calculer par R, et sans point de comparaison avec une valeur
donnée par le calcul (le calcul à la main des expressions de ces variances étant légèrement relou)…
De toute façon, R ne calcule pas directement une variance mais son estimateur sans biais (qui lui est
largement équivalent pour ce que je vais en faire ici). Et de toute façon bis, la variance (enfin, son
estimateur sans biais) ne sert qu’à illustrer qualitativement les phénomènes suivants : (1) les
variances de 𝑆2𝑛 et 𝑆2𝑛−1 augmentent lorsque p s’éloigne de ½ ; (2) ces conclusions se répètent « en
miroir » autour de ½, comme les valeurs de p. Et de toute façon ter, je ne vais pas faire calculer à R la
variance, mais l’écart-type (enfin, son estimateur sans biais, 𝑠𝑑()) des longueurs des séries (il est
plus naturellement interprétable que la variance, il est plus parlant, bien qu’il ne soit rien de plus
compliqué que √𝑉).
On remarquera aussi au passage que la longueur moyenne des séries de numéros impairs
augmente lorsque p s’éloigne de ½ (ce qui était à prévoir au vu de l’expression de 𝑆2𝑛−1 ).
Comment comprendre que les écarts-types des longueurs des séries augmentent lorsque p
s’éloigne de ½ ? C’est ici où avoir calculé les variances des longueurs des séries (de numéros pairs et
de numéros impairs respectivement) aurait pu aider, en analysant les variations des fonctions
𝑉(𝑆2𝑛 )(𝑝) et 𝑉(𝑆2𝑛−1 )(𝑝)… Donc bon il va falloir expliquer cela avec des mots !
1
Si l’on considère p = 1/5, on a 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃) = (5)𝑘−1
4
1
(5)𝑘−1 5
4
5
et (𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹) =
. Il y a donc bien plus de chance de faire de longues séries de F que de P. Mais il y a aussi
bien plus de chance que les séries de numéros pairs soient des séries de P, puisque le premier jet a
bien plus de chance d’être un F qu’un P. Donc, en somme, quand on tire F au premier jet, les séries
de numéros impairs, qui sont des séries de F, sont très souvent beaucoup plus longues que les séries
de numéros pairs, qui sont des séries de P. Mais le peu de fois où l’on tire P au premier jet, ce sont
les séries de numéros pairs (séries de F) qui deviennent très longues par rapport à celles de numéros
impairs (séries de P).
Ces écarts de longueurs sont alors d’autant plus grands que p s’éloigne de ½, donc l’écarttype de ces longueurs augmente, malgré que 𝑚𝑒𝑎𝑛(𝑆2𝑛 ) reste égale à 2. A noter que le paragraphe
précédent, valable pour p < ½, s’écrit exactement pareil, mais en inversant les lettres P et F, quand p
> ½.
J’aurais pu aussi pousser le vice jusqu’à faire un test statistique d’égalité entre les longueurs
des séries paires et 𝐸(𝑆2𝑛 ), genre en utilisant la matrice des valeurs calculées par mon programme
(valeurs dont je fais la moyenne 𝑚𝑒𝑎𝑛(𝑆2𝑛 ), ce qui donne un estimateur de l’espérance), et la valeur
de l’espérance de la variable aléatoire associée (en l’occurrence 2), histoire de démontrer que les
valeurs de presque 2 pour 𝑚𝑒𝑎𝑛(𝑆2𝑛 ) ne sont pas dues au hasard. Ce que j’ai fini par me résoudre à
faire en fait, en utilisant un test de Wilcoxon* (qui, pour donner une idée simple mais pas tout à fait
exacte sur ce que teste vraiment le test, teste ici 𝐻0 = "𝑚𝑒𝑎𝑛(𝑆2𝑛 ) − 𝐸(𝑆2𝑛 ) = 0", en utilisant des
rangs plutôt que les valeurs exactes), et pour les mêmes valeurs de p que celles prises
précédemment :
p = 1/5 p = 1/4 p = 1/3 p = 1/2 p = 2/3 p = 3/4 p = 4/5
Valeur de la p0.2829
0.3636
0.7619
0.8687
0.8042
0.4572
0.4568
value du test (et
(3)
(4)
(7)
(8.5)
(8)
(5)
(5)
de sa stat W)
* ce test n’est pas capable de calculer des p-value exactes s’il y a des valeurs ex-aequo dans la
matrice 𝑚𝑒𝑎𝑛(𝑆2𝑛 ) ou entre cette matrice et 𝐸(𝑆2𝑛 ) (ce qui arrive extrêmement souvent dans le
cas de cette expérience). Mais d'une part, la différence entre la p-value calculée dans ce cas et la
vraie p-value est relativement négligeable (du moins tant qu’elle ne change pas la conclusion du test,
ce qui est le cas ici). D'autre part, les valeurs de p-value que j’obtenais en relançant plusieurs fois
l’expérience pour une même valeur de p étaient assez dispersées, donc une petite imprécision sur
l'une d'entre elles ne change pas grand-chose au fait que le phénomène des p-values qui diminuent
quand p s'éloigne de 1/2 n'est pas très flagrant (voir remarque un peu après).
Rigoureusement parlant, avoir une p-value supérieure à un certain seuil (seuil qui ici a peu
d’importances vu les valeurs des p-value) rend le test inconclusif à ce seuil. Mais bon, d’une manière
plus informelle, il est d’usage de penser que si la p-value dépasse le seuil, 𝐻0 est vérifiée, donc on
peut admettre ici que les séries de numéros pairs ont bien une longueur moyenne égale à la valeur
de l’espérance de la variable aléatoire qui les donne cette longueur (et qui vaut 2).
A noter que cette p-value décroît d’autant plus que p s’éloigne de ½. Là encore il n’y a pas de
rigueur mathématique dans les trois phrases qui vont suivre, mais cela donne une idée de ce qu’il se
passe. On peut associer ce phénomène au fait que 𝑠𝑑(𝑆2𝑛 ) augmente quand p s’éloigne de ½. En
gros, le fait que cet écart-type augmente rend moins certain le fait que 𝑚𝑒𝑎𝑛(𝑆2𝑛 ) soit réellement
égale a 𝐸(𝑆2𝑛 ) car il montre que certaines valeurs de 𝑚𝑒𝑎𝑛(𝑆2𝑛 ) se trouvent vraiment trop loin de
𝐸(𝑆2𝑛 ) (en vertu de ce que j’ai expliqué un peu plus haut pour comprendre ce phénomène). De ce
fait, la p-value tend à se rapprocher du seuil en dessous duquel 𝐻0 serait rejetée. Mais pour être
honnête (et le tableau ne le montre pas très bien), ce n’est pas si flagrant, surtout lorsque l’on
relance l’expérience pour une même valeur de p plusieurs fois (on obtient des valeurs de p-value
assez dispersées).
Mais bon, pour que toutes ces conclusions qualitatives aient un sens plus quantitatif, il
faudrait faire d’autres tests statistiques… Bref à un moment donné, même si j’aime bien bidouiller
sur R, il faut dire stop :P
J’aurais pu répéter tout ce manège pour les suites de numéros impairs, mais elles n’ont pas
la propriété aussi incroyable que celle des séries de numéros pairs qui est d’avoir une longueur
moyenne indépendante de p. Donc je ne les en ai pas jugées dignes (et bim !).
8) Et dans la « vraie vie » ça donne quoi ?
Ah la voilà, la fameuse question du « Et les maths (du moins, ce genre de maths), ça sert à
quoi dans la ‘’vraie vie’’ ? » ;)
Pour ceux qui n’ont pas eu envie de lire la partie maths, le résultat important est : la
longueur moyenne des séries de numéros pairs est de 2, elle ne dépend pas de p (donc ça marche
même si la pièce est truquée !).
En tant que tel ça ne sert pas à grand-chose, à moins que vous ne deviez un jour parier sur
des longueurs de séries de pile ou face ! Surtout que la propriété démontrée ici pour les séries de
numéros pairs est difficilement utilisable en tant que tel, puisqu’elle suppose que vous ne
connaissiez pas le côté de pièce sorti au premier jet, ni même aux suivants, ce qui semble assez
bizarre (parieriez-vous vraiment sur des piles et des faces sans savoir ce qu’il se passe ?) !
De plus, puisque les pièces de monnaie sont équilibrées (à moins que vous tombiez sur un
roublard qui a truqué sa pièce), les longueurs moyennes des séries, qu’elles soient de numéros pairs
ou impairs, et de 2. En effet, dans ce cas p = ½, l’espérance de la longueur des séries de numéros
impairs est 𝐸(𝑆2𝑛−1 ) =
1−𝑝
𝑝
+
𝑝
1−𝑝
=
1/2
1/2
+
1/2
1/2
= 1 + 1 = 2 (résultat que l’on retrouve d’ailleurs
dans le premier tableau du point 7) ). Donc dans tous les cas de figure, si vous deviez parier sur des
longueurs de séries de lancers de pièce, pariez 2 ;) Ou si la pièce est potentiellement truquée, vous
pouvez au moins vous servir des probabilités conditionnelles du point 1).
Mais bon, au-delà de ses applications pratiques limitées, le point de cet exercice et de
donner une illustration de la loi des séries (son intérêt est donc plus pédagogique que pratique). En
effet, si l’on se replace dans le contexte d’une pièce potentiellement truquée, et pour peu que vous
ne sachiez pas quel côté de pièce est sorti au premier jet, vous êtes en droit de penser que le côté de
pièce sorti au premier jet d’une série de numéro pair en appelle en moyenne un deuxième
identique. Donc la loi des séries existe bien… moyennant certaines conditions (ça fait un peu
démonstration roublarde, mais bon ;) ).
J’ajouterai, pour conclure, un lien vers un PDF contenant d’autres surprises (mathématiques)
sur le jeu de pile ou face : http://www.lifl.fr/~jdelahay/pls/213.pdf
Et en cherchant un peu sur Internet, il y a d’autres propriétés de ce jeu à découvrir, qui en
ont d’ailleurs fait un thème très fertile en termes de sujets de khôlles ou d’autres types d’exercices.
C’est en tout cas incroyable (du moins de mon point de vue, je vous laisse vous faire le vôtre)
combien quelque chose d’aussi simple à faire et qui parait aussi facile à expliquer et à comprendre
puisse donner lieu à de tels questionnements et phénomènes !
Annexe : le script du point 7)
### Nombre de séquences de pile ou face à générer
N = 20
ESpair = matrix()
ESimpair = matrix()
Ces matrices vont contenir les espérances des longueurs des séries (de numéros
pairs dans ESpair et impairs dans ESimpair) sachant quel côté de pièce est sorti au
premier jet, au fur et à mesure qu'elles sont générées à chaque itération de la
boucle for qui suit. Des petits calculs supplémentaires seront nécessaires pour
répondre en bonne et due forme à la question.
Note: matrix() crée une matrice 1x1 contenant NA. La manière dont je vais
remplir ces matrices (et toutes celles créées de la même manière) va nécessiter de
supprimer ce NA avant de faire des calculs avec les matrices (enfin, il me semble
qu’il y a un moyen d'ignorer les NAs, mais je préfère les nettoyer!).
for(n in 1:N) {
### Paramètres de la séquence de tirage à pile (P) ou face (F)
L = 100
# Nombre de lancers de pièce dans la séquence
p = 1/2
# Probabilité de faire P
### On commence par créer une suite de P et de F (matrice "PouF"), avec une
probabilité p d'avoir un P:
PouF = matrix(NA,1,L)
alea = matrix(runif(L, 0, 1))
for(i in 1:L) if (alea[i,1] <= p) PouF[1,i] = "P" else PouF[1,i] = "F"
### Puis, on délimite chaque série et on en compte la longueur, que l'on stocke
dans une matrice "S":
S = matrix()
long = 1
for(i in 2:L) if (PouF[1,i] == PouF[1,i-1]) long = long+1 else {S = matrix(nrow =
1, c(S,long)) ; long = 1}
S = matrix(nrow = 1, c(S,long))
S = matrix(nrow = 1, S[,c(-1)])
### On sépare ensuite la matrice S contenant les longueurs des séries en une
matrice contenant les longueurs des séries de numéros pairs uniquement("pair") et
une autre contenant les longueurs des séries de numéros impairs uniquement
("impair"):
pair = matrix()
impair = matrix()
i = 1
while (2*i-1 <= length(S)) {impair = matrix(nrow = 1, c(impair,S[1,2*i-1])) ; i =
i+1}
i = 1
while (2*i <= length(S)) {pair = matrix(nrow = 1, c(pair,S[1,2*i])); i = i+1}
impair = matrix(nrow = 1, impair[,c(-1)])
pair = matrix(nrow = 1, pair[,c(-1)])
### On sauvegarde enfin les espérances des longueurs de séries, sachant le côté
de pièce du 1er jet, pour les séries paires ("ESpair") et impaires ("ESimpair"):
ESpair = matrix(nrow = 1, c(ESpair, mean(pair)))
ESimpair = matrix(nrow = 1, c(ESimpair, mean(impair)))
}
# Fin de la boucle for = fin d’une seule séquence de pile ou
face
### Enfin, on peut accéder aux espérances et écarts-types des longueurs des séries
de numéros pairs et impairs, indépendamment du côté de pièce sorti au 1er jet:
ESpair = matrix(nrow = 1, ESpair[,c(-1)])
mean(ESpair)
sd(ESpair)
ESimpair = matrix(nrow = 1, ESimpair[,c(-1)])
mean(ESimpair)
sd(ESimpair)
### Et le test de Wilcoxon entre mean(S2n) et E(S2n)
wilcox.test(ESpair, 2)