Chapitre 4-5

Download Report

Transcript Chapitre 4-5

Méthodes
de
Biostatistique
Chapitre IV
Inférence Statistique sur la
moyenne
STT6971-Méthodes de Biostatistique
1
1.Estimation ponctuelle de la moyenne

L’estimation de la moyenne  d’une population est
donnée par:
ˆ  X

Exemple: L’estimation de la moyenne du temps d’attente dans
une salle d’urgence durant les week-ends est donnée par
ˆ  X  37.85
STT6971-Méthodes de Biostatistique
2
2. Estimation par intervalle de la moyenne

D’après le théorème central limite, pour une taille échantillonnale grande
(n ¸ 30) , la moyenne échantillonnale a2 une distribution normale de

moyenne    X et de variance  X2 
n

Ainsi, pour une taille échantillonnale assez large, on a
Z
X  X
X
Suit une loi normale de moyenne 0 et de variance 1.
STT6971-Méthodes de Biostatistique
3

Supposons qu’on a un niveau de confiance de 95%.
P(1.96  Z  1.96)  0.95
X  X
P(1.96 
X
 1.96)  0.95
P( X  1.96 X   X  X  1.96 X )  0.95
puisque    X , alors
P( X  1.96 X    X  1.96 X )  0.95

La dernière équation indique la probabilité que l’intervalle

( X  1.96 , X  1.96 )
contient la moyenne
est de 95%. Cet
intervalle est appelé Intervalle de Confiance.
X
X
STT6971-Méthodes de Biostatistique
4

L’intervalle de confiance (IC) de la moyenne  à 95% est donné par
X  1.96

n
Supposons dans l’exemple précédent, =9.5, alors l’IC de  à 95% est
37.85  1.96


9.5
100
 37.85  1.96(0.95)  37.85  1.86  (35.99,39.71)
L’intervalle de confiance (IC) de  à 100(1-)% est donné par
X  Z 1( / 2 )

n
STT6971-Méthodes de Biostatistique
5

L’IC de  quand la variance est inconnue:

Si la taille échantillonnale n ¸ 30, l’IC pour  à 100(1-)%,
X  Z 1( / 2 )

s
n
Si la taille échantillonnale n < 30, l’IC pour  à 100(1-)%,
X  t1( / 2)
s
n
ddl=df=n-1, où t représente la distribution appelée Student, et dont les
valeurs sont données par la table 2.
STT6971-Méthodes de Biostatistique
6

Détermination de la taille échantillonnale:

Pour planifier une expérience, spécifiquement trouver la taille échantillonnale
nécessaire pour répondre à des conditions statistiques précises, on doit répondre
tout d’abord à ces deux questions:
1. Quelle erreur peut-on tolérer pour notre estimateur de la moyenne?
2. C’est quoi le niveau de confiance qu’on aimerait utiliser?
 Pour la question 2, le chercheur doit décider du niveau de confiance dont il a
besoin. (par ex. 90%, 95% ou 99%)
 Pour la question 1, On définit l’erreur par
E  Z 1( / 2 )

n
Et donc
 Z 1( / 2 )
n  
E




2
STT6971-Méthodes de Biostatistique
7
3. Tests d’hypothèses sur la moyenne:

Considérons l’hypothèse suivante:
H0:  = 0
vs
H1:  > 0

Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit
qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de  %,
si
Z
X  0
/ n
 Z (1 )
STT6971-Méthodes de Biostatistique
8

Considérons l’hypothèse suivante:
vs

H0:  = 0
H1:  < 0
Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit qu’on
rejette l’hypothèse nulle H0 au niveau de signifiance de  %, si
Z
X  0
/ n
 Z (1 )
STT6971-Méthodes de Biostatistique
9

Considérons l’hypothèse suivante:
H 0 :   0

H1 :    0
vs
Considérons un échantillon de taille n provenant d’une population
dont la variance est connue et est donnée par 2. Alors on dit qu’on
rejette l’hypothèse nulle H0 au niveau de signifiance de  %, si
Z
X  0
/ n
 Z1( / 2)
ou
Z
X  0
/ n
 Z1( / 2)
STT6971-Méthodes de Biostatistique
10
Tests d’hypothèses avec la variance inconnue

Considérons l’hypothèse suivante:
H 0 :   0

Considérons un échantillon de taille n provenant d’une population
dont la variance est inconnue. Alors on dit qu’on rejette l’hypothèse
nulle H0 au niveau de signifiance de  %, si l’alternative est:
X  0
H1 :    0
Z
 t (1 )
s/ n
H1 :    0
H1 :    0
Z
Z
X  0
s/ n
X  0
s/ n
 t1( / 2)
 t (1 )
ou
Z
STT6971-Méthodes de Biostatistique
X  0
s/ n
 t1( / 2)
11
P-value?



La règle suivante peut être utilisée pour prendre des
décisions:
Rejeter H0 si p-value · 
où  est le niveau de signifiance choisi pour le test.
Cette règle s’applique pour les tests bilatéraux. Dans le
cas d’un test unilatéral, la règle devient
Rejeter H0 si (p-value/2) · 
Comment calculer la p-value (à la main!)?
(Voir exemple en classe!)
STT6971-Méthodes de Biostatistique
12
Puissance et détermination de la taille échantillonnale

La puissance d’un test est définie par
P = 1- = P(rejeter H0 | H0 fausse)

Calcul de la puissance:
La puissance est une fonction qui dépend des 3
paramètres suivants:
1. n = Taille échantillonnale.
2.  = Niveau de signifiance.
3. DT = L’effet de la taille = La différence standardisée des
moyennes spécifiées sous H0 et H1.
STT6971-Méthodes de Biostatistique
13

Considérons le test bilatéral suivant,
H 0 :   0

vs H1 :   0 (  1 )
Le paramètre DT est défini par:
 0  1
DT 


La puissance est donnée par
Puis  P(Z  Z1( / 2)  DT  n )
STT6971-Méthodes de Biostatistique
14

La taille échantillonnale nécessaire pour s’assurer d’un certain
niveau de puissance pour un test bilatéral est
 Z 1( / 2)  Z 1 
n  
DT





2
La taille échantillonnale nécessaire pour s’assurer d’un certain
niveau de puissance pour un test unilatéral est
 Z 1  Z 1 
n  
DT




2
STT6971-Méthodes de Biostatistique
15
4. Inférence statistique sur (1   2 )


4.1 Intervalles de confiance:
Pour construire un IC pour la différence de deux moyennes de deux
populations supposées indépendantes, on étudie les 3 cas suivants:
Cas 1: Variances connues:
( X 1  X 2 )  Z 1( / 2)

 12
n1

2
n2
Cas 2: Variances inconnues mais égales:

Si les tailles échantillonnales sont supérieures à 30
( X 1  X 2 )  Z1( / 2) S p

1 1

n1 n2
Si les tailles échantillonnales sont inférieures à 30
( X 1  X 2 )  t1( / 2) S p
1
1

n1 n2
STT6971-Méthodes de Biostatistique
ddl  n1  n2  2
16

Cas 3: Variances inconnues et possiblement inégales:

Tests sur les variances:
H 0 :  12   22
s12
F  2  1 F(1( / 2) (df2 , df1 )
s2
vs
H1 :  12   22
s12
F  2  F(1( / 2)) (df1 , df2 )
s2
ou
 Si les tailles échantillonnales sont supérieures à 30
( X 1  X 2 )  Z 1( / 2)

s12 s 22

n1 n2
Si les tailles échantillonnales sont inférieures à 30
( X 1  X 2 )  t1( / 2)
s12 s 22

n1 n2
2
où
 s12 s 22 
  
n1 n2 
ddl  2  2
( s1 / n1 )
( s 22 / n2 ) 2

n1  1
n2  1
STT6971-Méthodes de Biostatistique
17
Puissance et détermination de la taille échantillonnale

Considérons les hypothèses suivantes:
vs H1 : 1   2
H 0 : 1   2
vs H1 : 1   2  0
La puissance est donnée par
H 0 : 1   2  0

Pui  P(Z  Z1( / 2)  DT n / 2 )
Où

DT 
1   2

La taille échantillonnale relative à une puissance donnée:
 Z 1( / 2 )  Z 1 
ni  2
DT




2
en supposant que le tailles échantillonnales sont égales.
STT6971-Méthodes de Biostatistique
18
Cas de deux populations dépendantes: Données pairées

Considérons le test suivant:
H 0 : 1   2 vs H1 : 1   2
Ce qui est équivalent à
H 0 : 1   2   d  0 vs


H1 : 1   2   d  0
On estime  d par X d , qui est la moyenne des différences entre
deux observations correspondantes.
Les intervalles de confiances (avec différentes situations par
rapport à la variance) sont les mêmes que ceux d’une moyenne.
Aussi, les mêmes règles pour les tests d’hypothèses sur une
moyenne s’appliquent aussi dans ce contexte. (voir exemple)
STT6971-Méthodes de Biostatistique
19