Les statistiques et les probabilités dans le nouveau programme de 1S

Download Report

Transcript Les statistiques et les probabilités dans le nouveau programme de 1S

Statistiques et probabilité :

Au collège :

• Continuité dans les apprentissages.

• Apprentissage progressif des arbres pondérés de la troisième à la première. (Cette notion est essentielle à la bonne compréhension des probabilités.)

En seconde

Notion d’échantillon

Dans le sens commun des sondages, un échantillon est un sous ensemble obtenu par prélèvement aléatoire dans un population.

Intervalle de fluctuation d’une fréquence au seuil de 95 %

Cas où la proportion est connue :

Propriété : Connaissant la proportion p (0,2≤p≤0,8) d’individus dans une population, la fréquence d’un certain caractère dans un échantillon de taille n, n  25 appartient à l’intervalle [p-1/rac(n) ; p+1/rac(n)] avec une probabilité d’au moins 95%

Exemple : « La parité, c’est quoi ? » Deux entreprises A et B recrutent dans une région où il y a autant d’hommes que de femmes. Dans l’entreprise A, il y a 100 employées dont 43 femmes. Dans l’entreprise B, il y a 2500 employés dont 1150 femmes.

Quelle entreprise respecte le mieux la parité ?

Dans l’entreprise A, l’intervalle de fluctuation est [0,4 ; 0,6] et 43% appartient à cet intervalle.

Dans l’entreprise B, l’intervalle de fluctuation est [0,48 ; 0,52] et 46% n’appartient pas à cet intervalle.

Dans l’entreprise B la proportion 46% s’observe dans moins de 5% des échantillons, donc on peut rejeter l’hypothèse qu’elle respecte mieux la parité que l’entreprise A, contrairement aux apparences

Cas où la proportion n’est pas connue :

Propriété : Dans une population, on désire estimer la proportion inconnue p d’un caractère donné. On étudie, pour cela, un échantillon de taille n, n  25. Le caractère étudié apparait avec la fréquence f (0,2≤f≤0,8). On peut estimer, que la proportion p est dans l’intervalle [f-1/rac(n) ; f+1/rac(n)] avec une probabilité d’au moins 95%

Explication de l’intervalle de fluctuation de la classe de seconde

Nouveau programme en 1

ère

Statistiques et probabilité : S

Les points majeurs : La loi géométrique tronquée La loi binomiale Échantillonnage et prise de decision

CONTENUS

Modèle de la répétition d’expériences identiques et indépendantes à deux ou trois issues.

CAPACITES ATTENDUES

• Représenter la répétition d’expériences identiques et indépendantes par un arbre pondéré.

• Utiliser cette représentation pour déterminer la loi d’une variable aléatoire associée à une telle situation.

COMMENTAIRES

Pour la répétition d’expériences identiques et indépendantes, la probabilité d’une liste de résultats est le produit des probabilités de chaque résultats.

La notion de probabilité conditionnelle est hors programme.

On peut aussi traiter quelques situations autour de la loi géométrique tronquée.

 On peut simuler la loi géométrique tronquée avec un algorithme.

1. Loi géométrique tronquée

Les situations de répétitions d'une expérience aléatoire, dans des conditions d'indépendance constituent un élément fort du programme de première.

L'introduction de la loi géométrique tronquée présente de nombreux avantages : – travailler sur des répétitions d'une expérience de Bernoulli ; – envisager ces répétitions sous l'angle algorithmique ; – présenter une situation d'arbre pour lequel tous les chemins n'ont pas la même longueur ; – exploiter dans un autre cadre les propriétés des suites géométriques ; – exploiter dans un autre cadre des résultats sur la dérivation.

Définition

Soit p un réel de l'intervalle ]0, 1[ et n un entier naturel non nul. On considère l'expérience aléatoire qui consiste à répéter dans des conditions identiques une expérience de Bernoulli de paramètre p avec au maximum n répétitions et arrêt du processus au premier succès.

On appelle loi géométrique tronquée de paramètres n et p la loi de la variable aléatoire X définie par : X = 0 si aucun succès n'a été obtenu ; pour 1≤ k ≤ n, X = k si le premier succès est obtenu à l'étape k.

Exemple pour n=4 p s p s 1-p e p s 1-p e p s Déterminons la loi de X.

1-p e 1-p e X = 0 si aucun succès n'a été obtenu donc avec l'outil arbre: P(X = 0) = (1-p) n Pour 1≤ k ≤ n, avec l'arbre, le premier succès est obtenu à l'étape k pour le chemin qui présente dans l'ordre (k – 1) échecs et un succès d'où : k-1 P(X = k) = (1 – p) p

CONTENUS CAPACITES ATTENDUES COMMENTAIRES

Epreuve de Bernoulli, loi de Bernoulli.

Schéma de Bernoulli, loi binomiale (loi du nombre de succès) Coefficients binomiaux, triangle de Pascal.

Reconnaître des situations relevant de la loi binomiale.

Calculer une probabilité dans le cadre de la loi binomiale.

La représentation à l’aide d’un arbre est privilégiée : il s’agit ici d’installer une représentation mentale efficace. On peut ainsi : - Faciliter la découverte de la loi binomiale pour des petites valeurs de n (n ≤4); n - Introduire le coefficient binomial ( ) comme nombre de chemins de l’arbre réalisant k succès pour n répétitions; Etablir enfin la formule générale de la loi binomiale.

binomiale.

n n n+1 Démontrer que : ( ) + ( ) = ( ) Représenter graphiquement la loi Cette égalité est établie en raisonnant sur le nombre de chemin réalisant k+1 succès pour n+1 répétitions.

On établit également la propriété de symétrie des coefficients binomiaux.

L’utilisation des coefficients binomiaux dans des problèmes de dénombrement et leur écriture à l’aide des factorielles ne sont pas des attendus du programme. En pratique, on utilise une calculatrice ou un logiciel pour obtenir les valeurs des coefficients binomiaux, calculer directement des probabilités et représenter graphiquement la loi binomiale.

Loi binomiale

1 – Découverte de la loi binomiale et introduction des coefficients binomiaux Répétition d'une épreuve de Bernoulli de paramètre p quelconque On répète 4 fois cette épreuve.

Nous représentons cette répétition par un arbre pondéré à 4 niveaux.

On note et on lit « 1 parmi 4 » le nombre de chemins qui conduisent à 1 succès exactement. Ici ( ) = 4 On décide cette fois de répéter 5 fois cette épreuve de Bernoulli et on note toujours X la variable aléatoire correspondant au nombre de succès obtenus à l’issue des 5 répétitions.

La répétition de l’arbre devient fastidieuse.

Nous allons déterminer le nombre ( ) « 2 parmi 5 » le nombre de chemins qui conduisent à 2 succès.

Déterminons ce nombre en utilisant l’arbre déjà réalisé pour 4 répétitions.

Il y a 2 façons d’obtenir 2 succès suivant qu’à la dernière étape on obtient un succès ou un échec.

 Si la dernière étape donne un échec, il faut compter les chemins qui au niveau précédent conduisaient déjà à 2 succès. Avec l’arbre déjà réalisé, on sait que 6 chemins sont dans ce cas.

 Si la dernière étape donne un succès, il faut compter les chemins qui au niveau précédent conduisaient à un seul succès. Avec l’arbre déjà réalisé, on sait que 4 chemins sont dans ce cas.

En conclusion, 6+4=10 chemins de l’arbre des 5 répétitions conduisent à 2

2. Formule générale de la loi binomiale

La probabilité de chacun des chemins qui réalisent k n-k exactement k succès est p (1 – p) . On obtient donc : soient un entier naturel n et un réel p de l'intervalle [0, 1]. La variable aléatoire X correspondant au nombre de succès dans la répétition de n épreuves de Bernoulli de paramètre p suit la loi binomiale B(n, p) avec pour tout entier k compris entre 0 et n : n k k p(X=k) = ( )p (1-p) n-k

CONTENUS CAPACITES ATTENDUES COMMENTAIRES Échantillonnage

Utilisation de la loi binomiale pour une prise de décision à partir d’une fréquence. Exploiter l’intervalle de fluctuation à un seuil donné, déterminé à l’aide de la loi binomiale, pour rejeter ou non une hypothèse sur une proportion L’objectif est d’amener les élèves à expérimenter la notion de « différence significative » par rapport à une valeur attendue et à remarquer que, pour une taille de l’échantillon importante, on conforte les résultats vus en classe de seconde.  L’intervalle de fluctuation peut être déterminé à l’aide d’un tableur ou d’un algorithme. Le vocabulaire des tests (test d’hypothèse, hypothèse nulle, risque de première espèce) est hors programme.

Fluctuation d’échantillonnage

1. Positionnement du problème à l’aide d’un exemple.

Un médecin de santé publique veut savoir si, dans sa région, le pourcentage d’habitants atteints d’hypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion d’hypertendus dans la population de sa région, le médecin formule l’hypothèse p = 0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n = 100 habitants de la région, dont il détermine la fréquence f d’hypertendus (l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise).

Lorsque la proportion dans la population vaut p = 0,16, la variable aléatoire X correspondant au nombre d’hypertendus observé dans un échantillon aléatoire de taille n = 100, suit la loi binomiale de paramètres n = 100 et p = 0,16.

On cherche à partager l’intervalle [0, 100], où X prend ses valeurs, en trois intervalles [0, a – 1], [a, b] et [b + 1, 100] de sorte que X prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 0,025, sans dépasser cette valeur.

En tabulant les probabilités cumulées P(X <= k), pour k allant de 0 à 100, il suffit de déterminer le plus petit entier a tel que P(X <= et le plus petit entier b tel que P(X a) > 0,025 <= b) > 0,975.

On lit a = 9 et b = 23.

La règle de décision est la suivante : si la fréquence observée f appartient à l’intervalle de fluctuation à (au moins) 95 % [a/n , b/n] = [0,09 ; 0,23], on considère que l’hypothèse selon laquelle la proportion d’hypertendus dans la population est p = 0,16 n’est pas remise en question et on l’accepte ; sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p = 0,16.

X suit la loi b (100 ; 0,16)

0,12 0,1 0,08 0,06 0,04 0,02 0 0 Zone de rejet à gauche : au plus 2,5 % 5

a

10 15 20

b

25 Intervalle de fluctuation : au moins 95 % 30 35 40 Zone de rejet à droite : au plus 2,5 %

2. Définition de l’intervalle de fluctuation à 95 % déterminé dans une situation bilatérale à l’aide de la loi binomiale

Définition : l’intervalle de fluctuation à 95 % d’une fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille n, d’une variable aléatoire X de loi • • binomiale, est l’intervalle [a/n , b/n

]

a est le plus petit entier tel que P(X défini par :

<=

a) >0,025 ; b est le plus petit entier tel que P(X <= b) >0,975.

3. Comparaison de l’intervalle de fluctuation de première avec l’intervalle de fluctuation exploité en classe de seconde

Le programme des classes de premières S, ES et STI2D-STL, demande de comparer, pour une taille de l’échantillon importante, cet intervalle avec l’intervalle de fluctuation exploité en classe de seconde.

On pourra le faire lors d’exemples (sur des tailles d’échantillon importantes) pour conforter les résultats vus en seconde