Le théorème de Bayes, démonstration et exemple
Transcription
Le théorème de Bayes, démonstration et exemple
Le théorème de Bayes Le théorème de Bayes est une conséquence immédiate des probabilités conditionnelles et des probabilités totales. Probabilités conditionnelles Exemple Dans une bibliothèque comportant 100 ouvrages, il y en a 40 qui sont écrits en anglais dont 8 portent sur la biologie. Considérons les événements suivants: A = "le livre est écrit en anglais"; PHAL = 40 ; 100 B = "le livre porte sur la biologie"; A Ý B = "le livre est écrit en anglais et porte sur la biologie"; Probabilité conditionnelle PHA Ý BL = 8 . 100 B A = "le livre porte sur la biologie sachant qu' il est écrit en anglais" P HB 8 AL = 40 (Il s'agit de la fréquence des livres de biologie parmi les livres en langue anglaise.) On a les relations Retenons ou encore P HB 8 AL = = 40 P HB AL = 8 I 100 M 40 I 100 M = P HA Ý BL P HA Ý BL P HAL P HAL P HA Ý BL = P HAL × P HB AL Probabilités totales Considérons une partition A1 , A2 , ..., An de l'ensemble des événements E, c’est-à-dire P(E) = 1 et A1 Ü A2 Ü ... Ü An = E, P HBL = P HA1 L × P HB Démonstration Ai Ý Aj = Æ A1 L + P HA2 L × P HB pour i ¹ j. Alors A2 L + ... + P HAn L × P HB P HBL = P HB Ý EL = P HB Ý A1 L + P HB Ý A2 L + ... + P HB Ý An L = P HA1 L × P HB A1 L + P HA2 L × P HB A2 L + ... + P HAn L × P HB An L An L à Problème Une urne contient 5 boules rouges identiques et 3 boules noires identiques. On effectue des tirages de deux boules sans remise. a) Quelle est la probabilité que la première soit rouge et la deuxième noire ? b) Quelle est la probabilité que l’une des deux boules au moins soit rouge ? c) Sachant que l'une des deux boules au moins est rouge, quelle est la probabilité que l'autre soit noire ? 2 bayes.nb 5 3 8 8 r n 4 3 5 2 7 7 7 7 Hr,rL aL P Hr, nL = 5 3 × 8 Hr,nL 15 Hn,rL Hn,nL = 7 56 avec A = “la première boule est rouge”; B = “la deuxième est noire”; A Ý B = “la première est rouge et la deuxième est noire”; B | A = “la deuxième est noire sachant que la première est rouge”. On retiendra que, dans un arbre, les branches portent des probabilités conditionnelles. La probabilité d’un chemin est est égale au produit des probabilités portées par les branches. bL P Hl ' une des deux boules au moins est rougeL = P Hla première est rouge et la deuxième noireL + P Hla première est noire et la deuxième rougeL + P Hla première est rouge et la deuxième rougeL = P Hla première est rougeL × P Hla deuxième est noire la première est rougeL + P Hla première est noireL × P Hla deuxième est rouge la première est noireL + P Hla première est rougeL × P 5 3 3 5 5 4 25 Hla deuxième est rouge la première est rougeL = × + × + × = 8 7 8 7 8 7 28 cL P Hl ' autre est noire l ' une des deux boules au moins est rougeL = P Hune boule est rouge et l ' autre est noireL P Hl ' une des deux boules au moins est rougeL = P Hr, nL + P Hn, rL P Hr, nL + P Hn, rL + P Hr, rL = 5 3 8 7 5 3 8 7 + + 3 5 8 7 3 5 8 7 + 3 = 5 4 8 7 5 Préparation au théorème de Bayes En intervertissant l'événement et la condition P HA BL = P HAL × P HB P HBL AL La démonstration découle directement de la définition des probabilités conditionnelles P HAL × P HB P HBL AL = P HAL × Formule de Bayes P HA Ý BL P HAL P HBL = P HA Ý BL P HBL = P HA BL Considérons une partition A1 , A2 , ..., An de l'ensemble des événements E. Alors à bayes.nb P HBL = P HA1 L × P HB P HA1 BL = P HA2 BL = ... P HAn BL = A1 L + P HA2 L × P HB P HA1 L × P HB A1 L P HBL P HA2 L × P HB P HBL P HAn L × P HB P HBL A2 L + ... + P HAn L × P HB A2 L 3 An L An L La démonstration a été faite au préalable sous “Probabilités totales” et “Préparation au théorème de Bayes”. L’apport d’une nouvelle information permet de corriger les probabilités à priori Les nombres suivants sont applelés "Probabilité à priori de Ak ": P HA1 L, P HA2 L, ..., P HAn L. Les nombres suivants, appelés “fonction de vraisemblance de Ak ” expriment des apports d’informations: PHB A1 L, P HB A2 L, ... , P HB An L. Les nombres suivants, applelés "Probabilité à postériori de Ak ", expriment comment les probabilités à priori doivent être adaptées à la sous-population B: P H A1 BL, P HA2 Probabilités des causes BL, ... , P HAn BL. Si les A1 , A2 , ..., An expriments les causes possibles de B, on peut maintenant établir la cause la plus probable (éventuellement les causes les plus probables) Ak : c ' est celle où PHAk BL diffère le plus de P HAk L , ce qui indique que les événements Ak et B ne sont pas indépendants. Exemple Dans un laboratoire, on a fait les constats suivants: si une souris porte l'anticorps A, alors 2 fois sur 5 elle porte aussi l'anticorps B; si une souris ne porte pas l'anticorps A, alors 4 fois sur 5 elle ne porte pas l'anticorps B. La moitié de la population porte l’anticorps A. 1 1 2 2 A HA,BL a) A 2 3 1 4 5 5 5 5 HA,BL HA,BL HA,BL Calculez la probabilité que, si une souris porte l’anticorps B, alors elle porte aussi l’anticorps A. Pour la partition IA, AM, la formule de Bayes donne P H BL = P HAL × P HB AL + P HAL × P IB 1 2 AM = 1 1 + 2 5 3 = 2 5 10 4 bayes.nb P HA Interprétation: P IA BL = BM = P HAL × P HB P HBL P HAL × P IB probabilités à priori: P HAL = apports d’informations: P HB P HBL 1 , 2 AL = 2 = 3 10 AM = 3 1 1 2 5 1 = 3 10 P HAL = AL = 1 2 2 5 2 , 5 3 1 ; 2 P IB AM = 1 ; 5 probabilités à postériori pour les porteuses de l’anticorps B: P HA BL = 2 , 3 PIA BM = 1 . 3 Probabilité des causes : Les 2/3 des souris porteuses de l’anticorps B portent aussi l’anticorps A, ce qui dénote une nette incidence de A sur B. b) Calculez la probabilité que, si une souris ne porte pas l’anticorps B, alors elle ne porte pas l’anticorps A. Pour la partition IA, AM, la formule de Bayes donne P H BL = P HAL × P IB P IA Interprétation: P IA BM = BM = AM + P HAL × P IB P HAL × P IB P HBL P HAL × P IB probabilités à priori: P HAL = P IA apports d’informations: P IB probabilités BM = 3 , 7 à PIA postériori BM = AM = AM pour 3 , 5 les 7 = 2 5 10 3 = 7 1 4 2 5 7 10 P HAL = AM = 4 . 7 = 1 4 + 2 5 1 3 2 5 7 10 P HBL 1 , 2 1 3 AM = 4 = 7 1 ; 2 P IB non AM = 4 ; 5 porteuses de l’anticorps B: Probabilité des causes : Les 4/7 des souris qui ne portent pas l’anticorps B ne portent pas non plus l’anticorps A, ce qui dénote peut-être une légère incidence de A sur B. Lien hypertexte vers la page mère http : // www.deleze.name/marcel/culture/probabilites/index.html