PROBABILITES et ECHANTILLONNAGE
Transcription
PROBABILITES et ECHANTILLONNAGE
PROBABILITES et ECHANTILLONNAGE Liens entre programmes de 2nde et de première(s ) Qu’appelle –t- on échantillon de taille n? « Par définition, un échantillon s’obtient par tirage avec remise ». Un échantillon de taille n est donc la liste des n résultats obtenus par n répétitions indépendantes de la même expérience (doc ressource 2nde p.15) Echantillonnage : Fluctuation Expérience aléatoire Fréquence f d’une issue particulière dans différents échantillons de taille n : La fréquence varie (« fluctue ») en fonction de l’échantillon On parle de « fluctuation des fréquences » ou « fluctuation d’échantillonnage » "L'esprit statistique naît lorsqu'on prend conscience de la fluctuation d'échantillonnage" 1. Introduction à la notion de probabilité (3ème – 2nde) Expérience aléatoire Fréquence f d’une issue donnée dans des échantillons de taille n, quand la taille des échantillons augmente Théorème et définition : Quand n devient de plus en plus grand, la fréquence f de chaque issue tend à se « stabiliser » vers une valeur théorique appelée probabilité de cette issue ( « loi faible des grands nombres ») Espace probabilisé et simulations On peut alors associer à l’expérience aléatoire une loi de probabilité (modélisation) Une fois ce modèle choisi, on obtient un espace probabilisé : on peut y réaliser des simulations à partir du modèle choisi On peut alors réaliser une étude statistique sur les résultats obtenus par simulation Le Passé Statistique descriptiv e Probabilités Le Futur Statistique Echantillon inférentielle Population SIMULATION 2. Echantillonnage : Intervalle de fluctuation, Intervalle de confiance Intervalle de fluctuation pour une proportion En 1ère S, STI… la loi binomiale est utilisée …… Intervalle de confiance pour une proportion 2.1. Intervalle de fluctuation Dans une population, on s’intéresse à la fréquence d’apparition d’un caractère particulier : On considère des échantillons de même taille n 2.1. Intervalle de fluctuation On connaît la proportion p du caractère dans la population : On peut chercher l’intervalle de fluctuation au seuil de 95% pour un échantillon de taille n Définition : L’intervalle de fluctuation au seuil de 95% pour un échantillon de taille n est l’intervalle centré sur p où se situe, avec une probabilité de 0,95, la fréquence f du caractère dans un échantillon de taille n Cet intervalle peut être approché par simulation (*) On peut admettre le résultat suivant (P1): p étant la proportion du caractère dans l’ensemble de la population et f la fréquence dans un échantillon de taille n : Pour n 25, il y a 95% de chances pour que f appartienne à l’intervalle [p- 1 n ; p+ 1 n ] Cet intervalle est l’intervalle de fluctuation au seuil de 95% pour un échantillon de taille n Ce résultat peut être conjecturé expérimentalement (*) Quels types de problèmes? Aide à la prise de décision (décider si une différence est significative ou non) : * Un échantillon donné est-il « conforme » à la « norme »? * Semble –t- il provenir de la population connue? Exemple : Situation discriminatoire ou non … 2.2. Intervalle de confiance On ne connaît pas la proportion p du caractère dans la population : On peut chercher à estimer p à partir de la fréquence empirique f (expérimentale) mesurée dans un échantillon Comment estimer p? On peut faire une estimation ponctuelle, en posant p = f Mieux : On peut chercher un intervalle de confiance de la proportion p à partir de la fréquence f mesurée dans un échantillon de taille n On admet la propriété suivante (P2) : Parmi tous les échantillons de taille n possibles, 95% des intervalles associés de la forme 1 1 n, n, contiennent le nombre p. La fréquence empirique f étant connue, on dit que cet intervalle est un intervalle de confiance à 95% pour la proportion p. [f - ; f + ] Propriété (P3) : 1 1 [ p ; p + f appartient à n n] est logiquement équivalent à 1 1 [f ; f + p appartient à n, n, ] Quels types de problèmes? Estimer la proportion d’un caractère dans une population à partir d’un échantillon : Sondages (par exemple électoraux) Contrôles qualité … Exemple 1 (sondages!): Avant une élection, un sondage sur un échantillon de 998 personnes (…) donne les résultats suivants : Candidat A : 20% Candidat B : 22% Candidat C : 23 %. Seuls les deux candidats en tête seront au second tour : Il y aura donc les candidats B et C? Réponse avec les intervalles de confiance : Il y a 95% de chances que les résultats se trouvent dans les intervalles suivants : Pour A : [0,168; 0,232] Pour B : [0,188; 0, 252] Pour C : [0,198; 0,262]. Intersection non vide! (faire un dessin) Exemple 2 : Avant le second tour d’une élection, un sondage sur un échantillon de 998 personnes (…) donne les résultats suivants pour les candidats A et B : Candidat A : 52% Candidat B : 48%. Le candidat A commande le champagne… A –t- il raison? Réponse avec les intervalles de confiance : Il y a 95% de chances pour que les résultats se situent dans les intervalles suivants : Pour A : [0,488; 0,552] Pour B : [0,448; 0, 512] Intersection non vide! Conclusion …. !!! (faire un dessin) [ [ ] ] B A 3. Quelques repères pour l’évaluation Cf. doc ressource de 2nde, page 20 : Des formes variées adaptées à la diversité des objectifs Quelques repères pour l’évaluation Forme « classique » (DS) pour : - Calculs de probabilités, - Représentations graphiques, - Résumés statistiques Mais : …. Quelques repères pour l’évaluation Comptes-rendus de TP ou devoirs maison « majoritairement » pour : - Simulations avec tableur ou calculatrice - Analyse critique d’un résultat d’échantillonnage - Utiliser un logiciel ou une calculatrice pour étudier une série statistique … Quelques repères pour l’évaluation La place de l’oral à travers échanges et exposés, à développer … avec les points d’appui explicités lors de l’expérimentation de l’épreuve pratique!