LOI NORMALE et BINOMIALE

Download Report

Transcript LOI NORMALE et BINOMIALE

AUTOUR DE LA LOI NORMALE

Formation nouveaux programmes de Terminales S et ES

Les objectifs du programme de statistique en terminale

Poursuivre le travail de statistique inférentielle commencé en classe de Seconde et de Première   Prise de décision en situation de risque Estimation par intervalle de confiance Avec un nouvel outil :

la loi normale

2 Formation nouveaux programmes de Terminales

POURQUOI LA LOI NORMALE ?

Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans.

Un sondage a été réalisé par un tirage au hasard de 400 personnes, et peut être assimilé à un tirage avec remise.

1.

Dans l’échantillon prélevé pour cette étude on observe :

Hommes Femmes 195 205

Cet échantillon est-il représentatif ?

< 60 ans 313 > 60 ans 87

2. L’étude montre que dans cet échantillon 29% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

4 formation nouveaux programmes de terminales

Un exemple : Etude du surpoids

Pour une étude, mettant en jeu le lien avec certaines caractéristiques connues de la population on considère qu’un échantillon est représentatif, si la fréquence f observée de ces caractéristiques est dans l’intervalle de fluctuation au seuil de 95%.

Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans.

Le sondage a été réalisé par un tirage au hasard de 400 personnes et peut être assimilé à un tirage avec remise.

Au travail !

5 Formation nouveaux programmes de terminales

Etude du surpoids : un scénario possible

Pour une étude, mettant en jeu le lien avec certaines caractéristiques connues de la population on considère qu’un échantillon est représentatif, si la fréquence f observée de ces caractéristiques est dans l’intervalle de fluctuation au seuil de confiance de 95%.

  Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans.

le sondage a été réalisé par un tirage au hasard de 400 personnes et peut être assimilé à un tirage avec remise.

1. Réaliser un échantillon. par simulation,

Cet échantillon est-il représentatif répartition des hommes ?

en ce qui concerne la 6 Formation nouveaux programmes de terminales

Etude du surpoids : réinvestir

2.

Dans l’échantillon prélevé pour cette étude on observe :

Hommes 195 Femmes 205 < 60 ans 313 > 60 ans 87

Cet échantillon est-il représentatif ?

Pour les hommes : p =0,46 (outil de seconde) Pour un seuil de 95%, on a obtenu IF H =[ 0,41 ;0,51 ]

f

=195/400 On établit IF = 0,4875 donc f

Pour les plus de 60 ans :

V

p

 IF H donc cet échantillon est représentatif pour les hommes =0,18 (outil première) cette méthode ne s’applique pas, il faut 0,2

B ( 400;0,18 ) , 7 formation nouveaux programmes de terminales

Etude du surpoids : outil de 2de

3. L’étude montre que dans cet échantillon 29% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

 L’intervalle de confiance de la classe de seconde donne [0,29- 0,05 ; 0,29+0,05] Donc la proportion de personnes en surpoids est dans l’intervalle [0,24 ; 0,33] au niveau de confiance de 95%.

On dit aussi pour un seuil de risque de 5%.

8 formation nouveaux programmes de terminales

Un exemple : Etude du surpoids

4. On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe :  Cet échantillon est-il représentatif ?

Le calcul n’est ici plus possible avec une calculatrice, cela dépasse ses capacités de calcul.

 L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

9 formation nouveaux programmes de terminales

Observation des binomiales pour n grand

 En utilisant Geogebra et l’outil de calcul des probabilités, on peut explorer le comportement des grandes binomiales  Des formes similaires dites « forme en cloche » 10

formation nouveaux programmes de terminales

TP centrer- réduire : le foie gras

Les foies gras d'oie commercialisés en 2012 par un producteur du Sud Ouest ont une masse dont la moyenne est 750 grammes et dont l'écart type est 100 grammes. Le pesage, en grammes, d'un foie pris au hasard dans la production détermine une V.A. G telle que E(G)=750 et  (G)=100. L'année précédente, en 2011, les foies gras commercialisés par ce même producteur avaient un poids moyen de 680 g et un écart type de 120g. Un client fidèle a acheté un foie de 750 g en 2011 et un de 800 g en 2012.

 Quel classement peut-on faire de ces deux foies comparativement à la production annuelle dont ils sont issus ?

11 formation nouveaux programmes de terminales

LOI NORMALE et BINOMIALE

Formation nouveaux programmes de Terminales S et ES

L’idée centrale

Une première idée simplifiée du théorème :    Lorsqu’on observe les représentations graphiques des grandes binomiales, elles présentent une forme commune dite « forme en cloche », connue sous le nom de courbe de Gauss, et qui correspond à la fonction de densité de la loi normale.

On a donc l’idée intuitive qu’on peut approcher les lois binomiales par les normales, pour n grand .

La formalisation de ce constat est énoncée par le « théorème de Moivre-Laplace », ce qui va nécessiter quelques détours… 13 Formation nouveaux programmes de terminales

Le théorème de Moivre-Laplace

Premières remarques :  On reconnait à droite normale N

(0;1).

P(a < Z < b)

  où

Z

suit la loi Ce n’est pas sur

X n

que porte la convergence vers la loi normale, mais sur la « variable centrée réduite »

Z n.

On s’intéresse à des probabilités d’intervalles .

14 formation nouveaux programmes de terminales

Le théorème de Moivre-Laplace

Autre remarque

 Ce théorème définit une convergence en loi : Ce n’est pas

Z n

qui converge vers répartition de

Z n Z

, mais la fonction de qui converge vers la fonction de répartition de

Z

.

15 formation nouveaux programmes de terminales

le théorème de Moivre-Laplace

X n

suit

B(n;p)

On centre et on réduit On obtient

Z n

n tend vers l’infini

16

Y qui suit

N (np; npq)

Dépend de n

Formation nouveaux programmes de terminales

Z qui suit

N(0 ; 1)

Premier problème : le passage du discret au continu

 Premier problème :

la loi binomiale est une loi discrète P(X=a) Diagramme en bâtons la loi normale est une loi continue P(a) Aire sous une courbe

 On va donc plonger la loi binomiale dans le monde des aires 17 formation nouveaux programmes de terminales

Passage du discret au continu

 On considère une variable aléatoire

X n

discrète B(n;p) qui suit la loi

E(X

n

) = np = µ

18

V(X

n

) = np(1-p) =

σ

²

Formation nouveaux programmes de Terminales

Problème du passage du discret au continu

 La loi binomiale, loi discrète, se représente par un diagramme en bâtons, qu’il faut convertir en histogramme pour que les probabilités puissent être interprétées en termes d’aires.

 Le bâton représentant colonne d’aire

p k

.

p(X=k) = p k

doit devenir une  On l’obtient en traçant une colonne de sur

k

: [

k

- 0,5 ;

k

+ 0,5] de hauteur

p k

.

largeur 1 centrée 19 formation nouveaux programmes de terminales

Passage du discret au continu

 On considère une variable aléatoire

X n

discrète B(n;p) qui suit la loi 20

E(X n ) = µ et V(X n ) = σ²

Formation nouveaux programmes de terminales

Passage du discret au continu

 On considère une variable aléatoire

X n

discrète B(n;p) qui suit la loi 21

P(a

X n Et on a :

b) = somme des aires des rectangles

Formation nouveaux programmes de terminales

Comment centrer

  X est une variable aléatoire

centrée

signifie que

E(X) = 0

La variable

Y n = X n –

µ

est centrée 22 Attention :

Y n

ne suit pas une loi binomiale :

Cette variable aléatoire prend des valeurs négatives !

Formation nouveaux programmes de terminales

Comment centrer

 La variable

Y n = X n –

µ

est centrée

E(X+b) = E(X)+ b

donc 23

E(Y

n

) = 0

V(aX+b) = a²V(X)

donc

V(Y

n

) =

²

Formation nouveaux programmes de terminales

Comment réduire

La variable aléatoire

Z n

est centrée

= Y n /

E(Z n ) = 0

Sa variance est égale à 1 : 24

V(aX+b) = a²V(X)

formation nouveaux programmes de terminales

Comment réduire

On a pris la variable aléatoire

Z n = Y n /

 On raisonne sur des aires, on veut

conserver des rectangles

donc si on réduit les abscisses en les divisant par 

d’aire

, on doit compenser en multipliant les ordonnées par 

.

p k

;

On conserve une aire totale de 1.

25 formation nouveaux programmes de terminales

Bilan sur

Z n

, variable centrée réduite

Z n

X n

np (

1 

np p )

26

E(Z n

) = 0

formation nouveaux programmes de terminales

V(Z n

) = 1

Loi normale centrée réduite

  Les histogrammes représentant exactement la même allure

Z n

ont tous La courbe qui approxime cette allure c’est la courbe de Gauss représentant la fonction f définie par :

f(x)

= 1 2 

e

x ²

2 C’est la fonction de densité de la loi normale N (0;1) nouvelle fonction de référence à étudier 27 formation nouveaux programmes de terminales

Lien entre binomiale et normale

Le théorème qui formalise ce constat est le théorème de Moivre Laplace (TML).

X n

suit

B(n;p)

On centre et on réduit On obtient

Z n

TML

28

Y qui suit

N (np; npq)

Z qui suit

N(0 ; 1) Formation nouveaux programmes de terminales

FLUCTUATION ET CONFIANCE

Formation nouveaux programmes de Terminales S et ES

Second théorème du programme

Si

Z

suit N ( 0 ; 1 ) alors pour tout réel α  [0 ; 1],

il existe un réel

u

 tel que

P(-u

 ) =1 

f(x) =

1 2 

e

x ²

2 30 formation nouveaux programmes de terminales

Second théorème du programme

On cherche un intervalle I  =[-u  tel que

P(Z

I

)=1-

 où

Z

suit N (0 ;1) ; u  ] I  est un

intervalle de fluctuation

au seuil de 1 α une V.A. qui suit la loi normale standard N(0 ; 1) .

pour 31 formation nouveaux programmes de terminales

Application à l’intervalle de fluctuation pour une v.a. qui suit

B(n,p)

 où 

Z

Si

X n

un réel donné et

u

 suit N ( 0 ; 1 ) suit B (

n

;

p

) et

F n

= le réel tel que

X n /n P(-u

 ) =1  et

I n

l’intervalle :

I n

   

p

u

p (

1 

p ) ; p

u

n p (

1 

n p )

    d’après le théorème de Moivre-Laplace, on aura :

lim n

 

P ( F n

I n )

 1   Donc pour

n

« assez grand » on a :

P(F

n

I n

)

1 -

I n

est un 1

-

,

intervalle de fluctuation

dit

asymptotique

au seuil 32 Formation nouveaux programmes de terminales

Intervalle de fluctuation pour la loi normale N(0 ; 1) au seuil de 95% α = 0,05 U α ≃ 1,96

u

0

,05

P(F

 [-

u

0

,05 ;

u

0

,05 ])

=

0,95 33

P(F

 [-1,96 ; 1,96]) ≃> 0,95 formation nouveaux programmes de terminales

Intervalle de fluctuation pour une v.a. qui suit B(n ; p) au seuil de 95% α =

0,05

u α

1,96

u 0,05

1,96

on en déduit au seuil de 95% 34 formation nouveaux programmes de terminales

u

0

,05

0,8 Intervalle de fluctuation pour une v.a. qui suit B(n ; p) au seuil de 95% 0,2 0,1 0,4 0,3 0,7 0,6 0,5 0 0 35 200 400 600 800 1000 1200 1400 Formation nouveaux programmes de terminales 1600 1800 2000

trois intervalles de fluctuation au seuil de 95%

 

p

 1

n ; p

 1

n

   

a n ; b n

  formule Pas de formule  

p

1

,

96

p (

1

p ) n ; p

1

,

96

p (

1

n p )

  formule 38

trois intervalles de fluctuation au seuil de 95%

2nde

• Pas de base théorique : simulations • approximation de l’IF de terminale  contraintes : n  25 et 0,2

1ère

• Base théorique : loi binomiale • sans contraintes sur n et p Au moins 95%

Term.

• • Base théorique : TML • Intervalle asymptotique  Environ 95% contraintes : n  30 et np  5 et n( 1 -p)  5 39

Un exemple : Etude du surpoids

4. On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe :  Cet échantillon est-il représentatif ?

 L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

40 formation nouveaux programmes de terminales

Un exemple : Etude du surpoids

4.

On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe : Intervalle de fluctuation asymptotique au niveau de confiance de 0,95 on a p =0,46 et n =1200 donc np >5 IF H Or f = [0,46-1,96x0,014; 0,46-1,96x0,014] =[0,43;0,49] H ≃ 0,46 et f H  De même IF IF H donc l’échantillon est représentatif.

=[0,158;0,202] et f pas représentatif.

V ≃ 0,207 et f H  IF H donc l’échantillon n’est  L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population. [0,32-1/rac(1200) ; 0,32 +1/rac(1200)]≃[0,29 ; 0,35] Donc au niveau de confiance de 0,95 p  [0,29 ; 0,35] 41 formation nouveaux programmes de terminales

Bilan : Intervalle de confiance

 

f

Si la fréquence observée sur un échantillon de taille

n

 30,

nf

 5 et

n(1-f)

 5

n.

Un intervalle de confiance 95% est  

f

1

n ; f

IC

1

n

  au niveau de confiance de .

et on a P(

p

IC

) ≃ 0,95.

Pour

n

et sondage.

f

déterminés, on parlera d’une fourchette de 42 Formation nouveaux programmes de Terminales

Détermination de l’intervalle de confiance par lecture des abaques

n=100

Fréquence observée

f n

44 formation nouveaux programmes de terminales

Intervalle de confiance

A quoi servent les sondages

x x

P

xx x x xx x x x

x

x x

x x x

xx x x

x

x

x

x x x x

x

xx x

x

xx

x

x

x x

x x x x x x

x

x x xx

x

x x xx xx x

x

x x x x x x x

x

x

x

x x

x

x

x

x xx x

x

x x x Extraction d ’un échantillon

E x x x x x x x x x x x x x x x x x x x

Étude sur l ’échantillon Extrapolation à la population

E x x x x x x x x x x x x x x x x x x x

45 Formation nouveaux programmes de Terminales

l’ECHANTILLONNAGE au lycée

Population Proportion p 46 Statistiques inférentielles Je connais f, j’en déduis p formation nouveaux programmes de terminales Échantillon Fréquence f

APPLICATIONS DE L’ECHANTILLLONNAGE

 Théorie des tests, quand on dispose d’une hypothèse sur p

fréquence f sur un échantillon de taille n Intervalle de fluctuation Rejet ou non de l’hypothèse sur p

 Théorie de l'estimation, quand on ne connait pas p .

fréquence f sur un échantillon de taille n Intervalle de confiance Estimation de p

47 Formation nouveaux programmes de terminales

Prise de décision : un exemple

  

Dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons.

Ces observations sont-elles le fruit du hasard ?

Règle de décision : Si f  IF c’est le fruit du hasard, sinon ce n’est pas le fruit du hasard.

On a

f = 46/132 ≃ 0,35 et IF asyptotique =[0,42 ; 0,60] Donc ce n’est pas le fruit du hasard 48 J’accepte l’hypothèse Je rejette l’hypothèse

Hypothèse vraie

1  α

Hypothèse fausse

Formation nouveaux programmes de Terminales β 1-β

Conclusion : pourquoi les statistiques?

 Le statisticien est une personne qui préfère les vrais doutes aux fausses certitudes.

Je sais que je me trompe, mais je peux quantifier mon erreur.

49 formation nouveaux programmes de terminales

Quels types d’exercices en terminale

La situation est modélisée par une loi normale    On connait μ et σ, on c alcule une probabilité On connait μ, σ et p

,

on détermine

x

tel que

P(X

p On connait

x

et

p

, on détermine μ et σ La situation est modélisée par une loi binomiale  On connait μ et p ,

P(X

 [ μ- ε ; μ + ε]

)

on cherche la précision = p ε telle que en approximant par une loi normale Avec une loi normale ou binomiale    Prise de décision avec IF asymptotique Estimation de p avec IC seconde Détermination de la précision d’une estimation.

50

Formation nouveaux programmes de Terminales