3ème partie : Approfondissement

Download Report

Transcript 3ème partie : Approfondissement

STATISTIQUE
INFERENTIELLE
STAGE ACADEMIQUE
LA REUNION
Isabelle ABOU
Professeure Formatrice
1
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
PLAN DE L’EXPOSE
1ière PARTIE: GÉNÉRALITÉS
I.
INTRODUCTION
II.
SITUATIONS PROBLEMES
III.
LA STATISTIQUE INFERENTIELLE
IV.
LE PROGRAMME DE SECONDE
2ième PARTIE: LA THÉORIE
I.
LOI NORMALE
II.
THEORIE DE L’ECHANTILLONNAGE
III.
PRISE DE DECISION
IV.
THEORIE DE L’ESTIMATION
V.
ESTIMATION D’UNE PROPORTION
VI.
EVALUATION DE TRAVAUX AVEC TIC
3ième PARTIE: APPROFONDISSEMENT
I.
TESTS STATISTIQUES
II.
COMPLEMENTS
Isabelle ABOU
2
3ième PARTIE
APPROFONDISSEMENT
Isabelle ABOU
3
I.TESTS
STATISTIQUES
TESTS DE VALIDITE
D’HYPOTHESE
Isabelle ABOU
4
PREAMBULE
• Nous donnons ci-après un aperçu des tests
d’hypothèse pour la cohérence de l’exposé
car c’est un domaine important de la
statistique inférentielle.
• La notion de test ne figure pas au
programme de Seconde de façon explicite,
mais les tests de validité d’hypothèse sont
au programme des classes de BTS.
• Nous commencerons par des généralités
sur les tests statistiques pour aborder
ensuite les test d’hypothèse qui nous
occupent.
Isabelle ABOU
5
TESTS STATISTIQUES
• Un test est un mécanisme qui permet
de trancher entre deux hypothèses sur
la population mère, au vu des résultats
d’un échantillon (ou plusieurs) .
• On veut valider ou pas une hypothèse
que l’on suppose sur la population,
appelée hypothèse nulle H0.
• On essaie de choisir H0 ne manière à ne pas
la rejeter trop souvent.
• L’hypothèse alternative est notée H1.
Isabelle ABOU
6
DIFFERENTS TYPES DE
RISQUES
• Soit H0 l’hypothèse nulle et H1 l’hypothèse alternative,
dont une et une seule est vraie.
• La décision aboutira à choisir l’une ou l’autre.
• Il y a donc 4 cas possibles avec leurs probabilités:
• Choisir H0 alors que H0 est vraie
• Choisir H0 alors que H1 est vraie
• Choisir H1 alors que H1 est vraie
• Choisir H1 alors que H0 est vraie.
• On notera α le niveau de risque accepté sur le test, c’est
la probabilité de choisir H1 alors que H0 est vraie
• Les valeurs courantes sont 0,01; 0,05; 0,1.
Isabelle ABOU
7
Vérité H0
Décision
H0
1- α
H1
H1
β
α
1- β
• α s’appelle le risque de 1ière espèce, c’est la probabilité de
choisir H1 alors que H0 est vraie.
• β s’appelle le risque de 2ième espèce, c’est la probabilité de
conserver H0 alors que H1 est vraie.
• α étant fixé, β sera déterminé comme résultat d’un calcul.
• β varie en sens contraire de α.
• 1-α est la probabilité d’opter pour H0 en ayant raison.
• 1-β est la probabilité d’opter pour H1 en ayant raison.
• 1-β s’appelle « puissance du test ».
Isabelle ABOU
8
LA REGION CRITIQUE
• La variable de décision est celle qui doit apporter le
maximum d’informations sur le problème posé et
dont la loi sera différente selon que H0 ou H1 est
vraie.
• La région critique W est l’ensemble des valeurs de
la variable de décision qui conduise à écarter H0 au
profit de H1.
• Elle est définie par: P(WH 0 ) α .
• La région d’acceptation est son complémentaire et
on a donc:
•
P(W H 0 )  1  α et P(WH1)  1 - β .
• La construction d’un test n’est rien d’autre que la
détermination de région critique.
Isabelle ABOU
9
RESUME
DEMARCHE D’UN TEST
•
•
•
•
•
•
Choix de H0 et H1
Détermination de la variable de décision
Allure de la région critique en fonction de H1.
Calcul de la région critique en fonction de α.
Calcul éventuel de la puissance du test 1-β.
Calcul de la valeur expérimentale de la
variable de décision.
• Conclusion: rejet ou acceptation de H0.
Isabelle ABOU
10
LES GRANDES
CATEGORIES DE TESTS
• - Test paramétrique, son objet est de tester une certaine
hypothèse relative à un ou plusieurs paramètres d’une v.a de loi
spécifiée ou non (tests sur la moyenne, la fréquence, l’écart type).
• Ils sont souvent basés sur la considération de la loi normale, ils
supposent l’existence d’une v.a de référence X normale.
• Si les résultats restent valables quand X n’est pas normale, on dit
que le test est robuste.
• - Test non paramétrique, par exemple le test d’ajustement qui a
pour but de vérifier qu’un échantillon provient ou non d’une v.a de
distribution connue (test du  2 , test de Kolmogorov).
• Dans le programme de Terminale ES, on en a un exemple: le test
d’adéquation à la loi équirépartie.
• Une catégorie de tests robustes est la classe des tests libres: ils
sont valables quelle que soit le loi de la v.a étudiée, en particulier
quand on ignore tout de cette loi (souvent le cas dans la pratique).
Isabelle ABOU
11
TESTS DE VALIDITE
D’HYPOTHESE
• On veut comparer la moyenne (ou la fréquence) inconnue
d’une population à une norme fixée à l’avance.
• On introduit la notion de test d’hypothèse.
• 1ier type de comparaison: test bilatéral.
• L’hypothèse nulle H0 consiste à dire que la moyenne de la
population est égale à la norme fixée à l’avance.
• Pour un test bilatéral H0: m=m0
• L’hypothèse alternative est H1: m<>m0.
• 2ième type de comparaison: test unilatéral.
• Pour un test unilatéral, il s’agit de savoir si la moyenne de la
population mère a été modifiée de façon significative.
• L’hypothèse nulle est donc H0: m=m0 c.ad l’échantillon est
conforme
• L’hypothèse alternative est H1: m>m0 ou H1: m<m0 suivant le
problème posé.
Isabelle ABOU
12
REGION CRITIQUE
• La nature de H0 détermine la façon de
formuler H1 et par conséquent la nature
unilatérale ou bilatérale du test.
• On aboutit à une région critique qui
correspond à une région de rejet de
l’hypothèse nulle, calculée à l’aide le
l’intervalle de confiance à un seuil donné.
Isabelle ABOU
13
TEST BILATERAL
REGION CRITIQUE
• Test bilatéral
• Si H0 consiste à dire que la population
estudiantine qui a une fréquence de
fumeurs égale à « p », est représentative
de la population totale qui, elle, a une
fréquence de fumeurs « p0 », on posera :
• H0 : p = p0 et H1 : p ≠ p0
• Le test sera bilatéral car on considère que
la fréquence p peut être supérieure ou
inférieure à la fréquence p0 .
• La région critique α en vert correspond à
une Probabilité α/2 de part et d’autre de la
courbe.
Isabelle ABOU
14
TEST UNILATERAL
REGION CRITIQUE
•
Test unilatéral
•
Si l’on fait l’hypothèse que la fréquence de fumeurs
dans la population estudiantine p est supérieure à la
fréquence de fumeurs dans la population p0, on
posera:
•
H0 : p = p0 et H1 : p > p0
•
Le test sera unilatéral car on considère que la
fréquence p ne peut être que supérieure à la
fréquence p0 .
La région critique α en vert correspond à une
probabilité α d’un coté de la courbe.
•
•
•
Ce raisonnement peut être formulé avec l’hypothèse
inverse :
H0 : p = p0 et H1 : p < p0
Isabelle ABOU
15
COMPARAISON D’UNE
MOYENNE A UN NOMBRE
•
•
•
•
•
•
•
•
•
C’est un test bilatéral.
H0: m=m0
H1: m<>m0
On détermine l’intervalle d’acceptation de H0 au seuil de
risque α: I=[m0-tσ/√n; m0+tσ/√n].
t vérifie Π(t)=1-α/2.
On prélève un échantillon de taille n (n>=30), de moyenne xe,
et on calcule e=(xe-m0)/(σ/√n) appelé « écart réduit ».
Règle de décision:
Si e є [-t ; t] , on accepte H0: l’échantillon est conforme ou
représentatif
Sinon, on refuse H0: l’échantillon n’est pas conforme .
Isabelle ABOU
16
COMPARAISON D’UNE
FREQUENCE Á UNE
FRÉQUENCE THÉORIQUE
• C’est un test bilatéral.
• On note p la fréquence théorique et f la fréquence de
l’échantillon.
• H0: f=p
• H1: f<>p
• Par un raisonnement analogue:
• t est obtenu avec Π(t)=1-α/2.
• L’écart réduit est: e=(f-p)/σ avec σ= √(p(1-p)/n).
• Règle de décision:
• Si e є [-t ; t] , on accepte H0: l’échantillon est conforme ou
représentatif
• Sinon, on refuse H0: l’échantillon n’est pas conforme .
Isabelle ABOU
17
COMPARAISON DE 2
POPULATIONS
• Comme autre application de ces tests d’hypothèse,
on peut également comparer deux populations:
• -comparaison des moyennes
• - comparaison des fréquences.
• On considèrera dans ce cas là la variable aléatoire
différence D  X  X
.
1
2
• C’est un test bilatéral dont le principe est le même
que précédemment.
Isabelle ABOU
18
COMPARAISON DE 2
MOYENNES
• On considère deux
échantillons prélevés sur
deux populations P1 et P2.
• Le but est de déterminer
s’il y a une différence
significative entre les
moyennes des deux
populations.
• Pour un test bilatéral, et
avec ces notations, on a :
• H0: m1=m2
• H1: m1<>m2
Effectif Moyenne Ecart
type
Population
P1
m1
σ1
Population
P2
m2
σ2
Echantillon n1
sur P1
x1
s1
Echantillon n2
sur P2
x2
s2
Isabelle ABOU
19
TEST BILATERAL
Variable
aléatoire
Moyenne X1
sur la
population P1
Moyenne X2
sur la
population P2
Différence D=X1-X2
Loi suivie
N(m1;σ1/√n1)
N(m2;σ2/√n2) N(m1-m2;σ)
σ = √((σ1)²/n1 + (σ2)²/n2)
•
•
•
•
•
Au risque α: Π(t)=1-α/2.
L’écart réduit vaut: e=(x1-x2)/σ.
Règle de décision:
Si e є [-t ; t] , on accepte H0: m1=m2
Sinon, on refuse H0, on retient l’hypothèse alternative m1<>m2.
Isabelle ABOU
20
COMPARAISON D’UNE MOYENNE
DE FAÇON UNILATERALE
•
•
•
•
Test unilatéral.
H0: l’échantillon est conforme
Au risque α on calcule t tel que Π(t)=1-α.
Ecart réduit: e=(xe-m0)/(σ/√n).
• 1ier cas: H1: m>m0
• Règle de décision :
• si e > t , alors on rejette H0, la moyenne a augmenté de
façon significative.
• 2ième cas: H1: m<m0
• Règle de décision :
• si e < -t , alors on rejette H0, la moyenne a diminué de façon
significative.
Isabelle ABOU
21
INJECTEURS
• Un équipementier commande un lot d’injecteurs dont
l’entreprise annonce que la moyenne des diamètres
intérieurs est de 0,65 mm.
• Afin de vérifier cette affirmation, il prélève un
échantillon de 100 injecteurs dans un lot, et obtient
une moyenne xe =0,644 mm, et un écart type σ =0,018.
• En supposant que l’écart type de l’échantillon est une
bonne approximation de celui du lot, répondre à la
question:
• L’équipementier peut-il accepter au risque de 5%
l’affirmation du fournisseur?
Isabelle ABOU
22
RESOLUTION
•
•
•
•
•
•
On construit un test:
H0: le diamètre moyen m0 = 0,65.
H1: le diamètre moyen m0 <> 0,65.
On calcule e=(xe-m0)/(σ/√n)
Pour α=0,05 on a t=1,96
Règle de décision: si e є[-1,96;1,96], on accepte
H0, sinon on refuse H0.
• Ici e=(0,644-0,65)/(0,018/√100) ce qui donne
environ -3,33.
• Donc e n’appartient pas à [-1,96;1,96] et on refuse
H0 au risque de 5%.
• Au risque de 5%, l’équipementier ne peut accepter
l’affirmation du fournisseur.
Isabelle ABOU
23
PLACES DE CINEMA
• Le nombre de places de cinéma vendues
pendant une journée ouvrable suit la loi
normale de moyenne 2250 et d’écart type
600.
• A la suite d’une campagne publicitaire, une
étude statistique sur 23 jours a donné une
moyenne de 2439.
• L’amélioration des ventes est-elle
significative au seuil de 5%?
Isabelle ABOU
24
RESOLUTION
• On est dans le cas d’un test unilatéral:
• Hypothèse nulle H0: m=2250.
• Hypothèse alternative H1: m> 2250.
• Dans ce cas pour α =0,05,
• Π(t)=1-0,05=0,95 donc t=1,645.
• e=(2439-2250)/((√23)/600)= 1,51.
• Comme e< 1,645, on accepte H0 au seuil de 5%.
• La différence n’est donc pas significative.
Isabelle ABOU
25
PROBLEME DE BTS
• Le problème qui suit est un sujet de BTS posé en
2002 pour le groupement B.
• Il est intéressant car il regroupe différents
problèmes soulevés dans ce stage et utilise
différentes lois.
• A la fin, il y a une estimation ponctuelle, et une par
intervalle de confiance qui permet de conclure à un
risque donné.
• On peut trouver des sujets de BTS, avec parfois les
corrections sur le site de l’APMEP à l’adresse:
• http://www.apmep.asso.fr/-Annales-Bac-Brevet-BTS-
Isabelle ABOU
26
ASSURANCE D’UNE
FLOTTE DE VEHICULES
• Dans un groupe d’assurances on s’intéresse aux sinistres
susceptibles de survenir, une année donnée, aux véhicules de
• la flotte d’une importante entreprise de maintenance de
chauffage collectif.
• 1. Etude du nombre de sinistres par véhicule
• Soit X la variable aléatoire qui, à tout véhicule tiré au hasard
dans un des parcs de la flotte, associe le nombre de sinistres
survenant pendant l’année considérée.
• On admet que X suit la loi de Poisson de paramètre 0,28.
• a) Calculer la probabilité de l’événement A : un véhicule tiré
au hasard dans le parc n’a aucun sinistre pendant
• l’année considérée.
• b) Calculer la probabilité de l’événement B : un véhicule tiré
au hasard dans le parc a, au plus, deux sinistres pendant
l’année considérée
Isabelle ABOU
27
• 2. Etude du nombre de sinistres dans une équipe de 15
conducteurs
• On note E l’événement : un conducteur tiré au hasard dans
l’ensemble des conducteurs de l’entreprise n’a pas de
• sinistre pendant l’année considérée.
• On suppose que la probabilité de l’événement E est 0,6.
• On tire au hasard 15 conducteurs dans l’effectif des
conducteurs de l’entreprise. Cet effectif est assez
important pour que l’on puisse assimiler ce prélèvement à un
tirage avec remise de 15 conducteurs.
• On considère la variable aléatoire Y qui, à tout prélèvement
de 15 conducteurs, associe le nombre de conducteurs
• n’ayant pas de sinistre pendant l’année considérée.
• a) Justifier que la variable aléatoire Y suit une loi binomiale
et déterminer ses paramètres.
• b) Calculer la probabilité que, dans un tel prélèvement, 10
conducteurs n’aient pas de sinistre pendant l’année
• considérée.
Isabelle ABOU
28
•
•
•
•
•
•
•
•
•
•
•
•
3. Etude du coût des sinistres
Dans ce qui suit, on s’intéresse au coût d’une certaine catégorie de sinistres
survenus dans l’entreprise pendant l’année considérée.
On considère la variable aléatoire C qui, à chaque sinistre tiré au hasard parmi
les sinistres de cette catégorie, associe son coût en euros.
On suppose que C suit la loi normale de moyenne 1 200 et d’écart type 200.
Calculer la probabilité qu’un sinistre tiré au hasard parmi les sinistres de ce type
coûte entre 1 000 euros et 1 500 euros.
4. On considère un échantillon de 100 véhicules prélevés au hasard dans le parc
de véhicules mis en service depuis 6 mois. Ce parc contient suffisamment de
véhicules pour qu’on puisse assimiler ce tirage à un tirage avec remise.
On constate que 91 véhicules de cet échantillon n’ont pas eu de sinistre.
a) Donner une estimation ponctuelle du pourcentage p de véhicules de ce parc
qui n’ont pas eu de sinistre 6 mois après leur mise en service.
b) Soit F la variable aléatoire qui à tout échantillon de 100 véhicules prélevés au
hasard et avec remise dans ce parc, associe le pourcentage de véhicules qui n’ont
pas eu de sinistre 6 mois après leur mise en service.
On suppose que F suit la loi normale n(p;√(p(1-p)/100)) où p est le pourcentage
inconnu de véhicules du parc qui n’ont pas eu de sinistre 6 mois après leur mise
en service.
Déterminer un intervalle de confiance du pourcentage p avec le coefficient de
confiance 95%.
c) On considère l’affirmation suivante : le pourcentage p est obligatoirement
dans l’intervalle de confiance obtenu à la question b) Est-elle vraie ?
Isabelle ABOU
29
II. COMPLEMENTS
THEORIQUES
Isabelle ABOU
30
PREAMBULE
• Nous exposerons ci-après les divers
modes de convergence utilisés en
théorie des Probabilités.
• Nous énoncerons ensuite, de manière
un peu plus rigoureuse,
mathématiquement parlant, les grands
théorèmes utilisés dans cet exposé.
Isabelle ABOU
31
LES DIFFERENTS TYPES DE
CONVERGENCE D’UNE SUITE
DE VARIABLES ALEATOIRES
•
•
•
•
Convergence en moyenne quadratique
Convergence presque sûre
Convergence en probabilité
Convergence en loi
Isabelle ABOU
32
CONVERGENCE EN LOI
On dit que la suite (Xn) de variables aléatoires
réelles converge en loi vers la variable aléatoire
X si la suite des fonctions de répartition (Fn)
converge vers F (fonction de répartition de X)
en tout point où F est continue. Ainsi, en tout
point x où F est continue, on a :
P (X < x) =
lim
n  
P (Xn < x).
Isabelle ABOU
33
CONVERGENCE EN
PROBABILITE
On dit que la suite (Xn) de variables aléatoires
réelles converge en probabilité vers la variable
aléatoire X si :
 h > 0, lim P (|Xn  X| > h) = 0.
n
Isabelle ABOU
34
CONVERGENCE EN
MOYENNE QUADRATIQUE
On dit que la suite (Xn) de variables aléatoires
réelles converge en moyenne quadratique vers la
variable aléatoire X si :
2
lim E [(Xn  X) ] = 0
n
Isabelle ABOU
35
CONVERGENCE PRESQUE
SURE
On dit que la suite (Xn) de variables aléatoires
réelles converge presque sûrement vers la
variable aléatoire X si :
pour presque tout  de  , la suite (Xn ())
converge vers X ().
Autrement dit, la probabilité que la suite (Xn)
converge vers X est égale à 1.
Isabelle ABOU
36
COMPARAISON DES DIFFERENTS
TYPES DE CONVERGENCE
Convergence en moyenne quadratique
Convergence presque sûre
Convergence en probabilité
Convergence en loi
Isabelle ABOU
37
Théorème central-limite
Théorème
Soient (X1, X2, …, Xn) n variables aléatoires réelles
indépendantes, et ayant toutes la même loi de probabilité
(d’espérance  et d’écart type ).
X 1  ...  X n

n
Xk  
n
On note Yn = 
=
.

k 1 
n
n
Alors la suite (Yn) converge en loi vers une variable
normale centrée réduite. On a donc :
X 1  ...  X n

u2
x

1
n
2
 x  IR, nlim
P
(
<
x)
=
e
du .


 

2
38
n Isabelle ABOU
Loi faible des grands nombres
Soient (X1, X2, …, Xn) n variables aléatoires réelles deux à
deux indépendantes, et ayant toutes même espérance  et
même écart-type . Alors, lorsque n  + ,
X1  ...  X n

n
Yn =
tend en moyenne quadratique et en

probabilité vers l’espérance mathématique 0.
Isabelle ABOU
39
Loi forte des grands nombres
Soient (X1, X2, …, Xn) n variables aléatoires réelles
indépendantes, et ayant toutes même espérance  et
même écart-type .
X1  ...  X n

n
Alors, lorsque n  + , Yn =
tend presque

sûrement vers 0.
Isabelle ABOU
40
BIBLIOGRAPHIE et
SITOGRAPHIE
Isabelle ABOU
41
BIBLIOGRAPHIE
• Pour la théorie, un excellent livre: Probabilités,
analyse des données et statistiques. G.Saporta. Ed
TECHNIP.
• Itinéraires en statistiques et probabilités.
H.Carnec, R.Seroux, JM.Dagoury, M.Thomas.Ed
ellipses.
• Statistique.T H.Wonnacott. R J. Wonnacott. Ed
Economica.
• Le rôle de la loi normale en statistique. H Rouanet.
B.Leclerc.
• Excellent livre où sont détaillées les méthodes de
sondages: Méthodes des sciences sociales.
Madeleine Grawitz.
Isabelle ABOU
42
REFERENCES
•
•
•
•
•
•
•
•
•
Document ressources pour la classe de seconde -Probabilités et
statistiques-.
http://media.education.gouv.fr/file/Programmes/17/9/Doc_ressou
rce_proba-stats_109179.pdf
Document ressources pour le lycée, enseignement général de la
voie professionnelle.
http://mslp.ac-dijon.fr/spip.php?article202
http://www.acgrenoble.fr/maths/docresseconde/Proba_stat_LP.doc
Mathématiques BTS. P.Taquet, P. Tirel, J. Bance. Ed Hachette.
La loi normale. Wikipedia
http://www.math.univbrest.fr/perso/catherine.rainer/polystat.pdf
http://www.apmep.asso.fr/-Annales-Bac-Brevet-BTS-
Isabelle ABOU
43