Chapitre 4-5
Download
Report
Transcript Chapitre 4-5
Méthodes
de
Biostatistique
Chapitre IV
Inférence Statistique sur la
moyenne
STT6971-Méthodes de Biostatistique
1
1.Estimation ponctuelle de la moyenne
L’estimation de la moyenne d’une population est
donnée par:
ˆ X
Exemple: L’estimation de la moyenne du temps d’attente dans
une salle d’urgence durant les week-ends est donnée par
ˆ X 37.85
STT6971-Méthodes de Biostatistique
2
2. Estimation par intervalle de la moyenne
D’après le théorème central limite, pour une taille échantillonnale grande
(n ¸ 30) , la moyenne échantillonnale a2 une distribution normale de
moyenne X et de variance X2
n
Ainsi, pour une taille échantillonnale assez large, on a
Z
X X
X
Suit une loi normale de moyenne 0 et de variance 1.
STT6971-Méthodes de Biostatistique
3
Supposons qu’on a un niveau de confiance de 95%.
P(1.96 Z 1.96) 0.95
X X
P(1.96
X
1.96) 0.95
P( X 1.96 X X X 1.96 X ) 0.95
puisque X , alors
P( X 1.96 X X 1.96 X ) 0.95
La dernière équation indique la probabilité que l’intervalle
( X 1.96 , X 1.96 )
contient la moyenne
est de 95%. Cet
intervalle est appelé Intervalle de Confiance.
X
X
STT6971-Méthodes de Biostatistique
4
L’intervalle de confiance (IC) de la moyenne à 95% est donné par
X 1.96
n
Supposons dans l’exemple précédent, =9.5, alors l’IC de à 95% est
37.85 1.96
9.5
100
37.85 1.96(0.95) 37.85 1.86 (35.99,39.71)
L’intervalle de confiance (IC) de à 100(1-)% est donné par
X Z 1( / 2 )
n
STT6971-Méthodes de Biostatistique
5
L’IC de quand la variance est inconnue:
Si la taille échantillonnale n ¸ 30, l’IC pour à 100(1-)%,
X Z 1( / 2 )
s
n
Si la taille échantillonnale n < 30, l’IC pour à 100(1-)%,
X t1( / 2)
s
n
ddl=df=n-1, où t représente la distribution appelée Student, et dont les
valeurs sont données par la table 2.
STT6971-Méthodes de Biostatistique
6
Détermination de la taille échantillonnale:
Pour planifier une expérience, spécifiquement trouver la taille échantillonnale
nécessaire pour répondre à des conditions statistiques précises, on doit répondre
tout d’abord à ces deux questions:
1. Quelle erreur peut-on tolérer pour notre estimateur de la moyenne?
2. C’est quoi le niveau de confiance qu’on aimerait utiliser?
Pour la question 2, le chercheur doit décider du niveau de confiance dont il a
besoin. (par ex. 90%, 95% ou 99%)
Pour la question 1, On définit l’erreur par
E Z 1( / 2 )
n
Et donc
Z 1( / 2 )
n
E
2
STT6971-Méthodes de Biostatistique
7
3. Tests d’hypothèses sur la moyenne:
Considérons l’hypothèse suivante:
H0: = 0
vs
H1: > 0
Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit
qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %,
si
Z
X 0
/ n
Z (1 )
STT6971-Méthodes de Biostatistique
8
Considérons l’hypothèse suivante:
vs
H0: = 0
H1: < 0
Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit qu’on
rejette l’hypothèse nulle H0 au niveau de signifiance de %, si
Z
X 0
/ n
Z (1 )
STT6971-Méthodes de Biostatistique
9
Considérons l’hypothèse suivante:
H 0 : 0
H1 : 0
vs
Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit qu’on
rejette l’hypothèse nulle H0 au niveau de signifiance de %, si
Z
X 0
/ n
Z1( / 2)
ou
Z
X 0
/ n
Z1( / 2)
STT6971-Méthodes de Biostatistique
10
Tests d’hypothèses avec la variance inconnue
Considérons l’hypothèse suivante:
H 0 : 0
Considérons un échantillon de taille n provenant d’une population
dont la variance est inconnue. Alors on dit qu’on rejette l’hypothèse
nulle H0 au niveau de signifiance de %, si l’alternative est:
X 0
H1 : 0
Z
t (1 )
s/ n
H1 : 0
H1 : 0
Z
Z
X 0
s/ n
X 0
s/ n
t1( / 2)
t (1 )
ou
Z
STT6971-Méthodes de Biostatistique
X 0
s/ n
t1( / 2)
11
P-value?
La règle suivante peut être utilisée pour prendre des
décisions:
Rejeter H0 si p-value ·
où est le niveau de signifiance choisi pour le test.
Cette règle s’applique pour les tests bilatéraux. Dans le
cas d’un test unilatéral, la règle devient
Rejeter H0 si (p-value/2) ·
Comment calculer la p-value (à la main!)?
(Voir exemple en classe!)
STT6971-Méthodes de Biostatistique
12
Puissance et détermination de la taille échantillonnale
La puissance d’un test est définie par
P = 1- = P(rejeter H0 | H0 fausse)
Calcul de la puissance:
La puissance est une fonction qui dépend des 3
paramètres suivants:
1. n = Taille échantillonnale.
2. = Niveau de signifiance.
3. DT = L’effet de la taille = La différence standardisée des
moyennes spécifiées sous H0 et H1.
STT6971-Méthodes de Biostatistique
13
Considérons le test bilatéral suivant,
H 0 : 0
vs H1 : 0 ( 1 )
Le paramètre DT est défini par:
0 1
DT
La puissance est donnée par
Puis P(Z Z1( / 2) DT n )
STT6971-Méthodes de Biostatistique
14
La taille échantillonnale nécessaire pour s’assurer d’un certain
niveau de puissance pour un test bilatéral est
Z 1( / 2) Z 1
n
DT
2
La taille échantillonnale nécessaire pour s’assurer d’un certain
niveau de puissance pour un test unilatéral est
Z 1 Z 1
n
DT
2
STT6971-Méthodes de Biostatistique
15
4. Inférence statistique sur (1 2 )
4.1 Intervalles de confiance:
Pour construire un IC pour la différence de deux moyennes de deux
populations supposées indépendantes, on étudie les 3 cas suivants:
Cas 1: Variances connues:
( X 1 X 2 ) Z 1( / 2)
12
n1
2
n2
Cas 2: Variances inconnues mais égales:
Si les tailles échantillonnales sont supérieures à 30
( X 1 X 2 ) Z1( / 2) S p
1 1
n1 n2
Si les tailles échantillonnales sont inférieures à 30
( X 1 X 2 ) t1( / 2) S p
1
1
n1 n2
STT6971-Méthodes de Biostatistique
ddl n1 n2 2
16
Cas 3: Variances inconnues et possiblement inégales:
Tests sur les variances:
H 0 : 12 22
s12
F 2 1 F(1( / 2) (df2 , df1 )
s2
vs
H1 : 12 22
s12
F 2 F(1( / 2)) (df1 , df2 )
s2
ou
Si les tailles échantillonnales sont supérieures à 30
( X 1 X 2 ) Z 1( / 2)
s12 s 22
n1 n2
Si les tailles échantillonnales sont inférieures à 30
( X 1 X 2 ) t1( / 2)
s12 s 22
n1 n2
2
où
s12 s 22
n1 n2
ddl 2 2
( s1 / n1 )
( s 22 / n2 ) 2
n1 1
n2 1
STT6971-Méthodes de Biostatistique
17
Puissance et détermination de la taille échantillonnale
Considérons les hypothèses suivantes:
vs H1 : 1 2
H 0 : 1 2
vs H1 : 1 2 0
La puissance est donnée par
H 0 : 1 2 0
Pui P(Z Z1( / 2) DT n / 2 )
Où
DT
1 2
La taille échantillonnale relative à une puissance donnée:
Z 1( / 2 ) Z 1
ni 2
DT
2
en supposant que le tailles échantillonnales sont égales.
STT6971-Méthodes de Biostatistique
18
Cas de deux populations dépendantes: Données pairées
Considérons le test suivant:
H 0 : 1 2 vs H1 : 1 2
Ce qui est équivalent à
H 0 : 1 2 d 0 vs
H1 : 1 2 d 0
On estime d par X d , qui est la moyenne des différences entre
deux observations correspondantes.
Les intervalles de confiances (avec différentes situations par
rapport à la variance) sont les mêmes que ceux d’une moyenne.
Aussi, les mêmes règles pour les tests d’hypothèses sur une
moyenne s’appliquent aussi dans ce contexte. (voir exemple)
STT6971-Méthodes de Biostatistique
19