Exemple de la viande

Download Report

Transcript Exemple de la viande

ANALYSE DE VARIANCE
ANALYSE DE VARIANCE
B. Palagos
UMR ITAP
Cemagref
[email protected]
M2 Sciences des Procédés - Sciences des Aliments
ANALYSE DE VARIANCE
Exemple
Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs
années plus tard ils souhaitent savoir si la hauteur des arbres est identique
dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on
mesure la hauteur de chaque arbre.
Forêt 1
Forêt 2
Forêt 3
23.4
24.4
24.6
24.9
25.0
26.2
18.9
21.1
21.1
22.1
22.5
23.5
24.5
22.5
22.9
23.7
24.0
24.0
L’analyse de variance (ANOVA)
consiste à chercher si la
variabilité des observations peut
être en partie expliquée par les
différences entre variantes d’un
facteur (ici fôret)
2
ANALYSE DE VARIANCE
OBJECTIF DE l’ANOVA
Analyser des données qui dépendent de plusieurs types d’effets
agissant simultanément, afin de quantifier ces effets
= expliquer une variable quantitative par une ou des variables
qualitatives (facteurs)
 En amont de l’ANOVA : plan expérimental (nombre
d’expériences pour chaque niveau ou modalité, facteurs)
3
ANALYSE DE VARIANCE
Analyse de la variance à 1 facteur
4
ANALYSE DE VARIANCE
Exemple
Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul
le caractère fibreux est considéré, noté sur une échelle de 15 points.
15 dégustateurs différents ont noté chacun une viande
notes pour le caractère fibreux
viande
A
B
C
3
5
6
3
3
10
8
5
7
5
13
11
7
11
8
y1  4
y2  7
y 7
y3  10
5
ANALYSE DE VARIANCE
Modèle de l’analyse de la variance à 1 facteur :
yij     i   ij
Exemple de la viande :
où yij est la variable à expliquer ………………
texture fibreuse d’une viande
i est l’effet du ième niveau du facteur ….....
caractère fibreux de la viande i

caractère fibreux potentiel
est l’effet moyen général ……………….
 ij est la variable aléatoire résiduelle ……… due à l’ensemble des autres causes
qui déterminent la note fibreuse
Hypothèses :
-
les  ij sont indépendants
E( ij )  0
var( ij )   2
 ij suit une loi N (0,  2 )
6
ANALYSE DE VARIANCE
Décomposition de l’élément yij :
yij  y  ( yi  y )  ( yij  yi )
Exemple de la viande :
3 10 13
5 8 11
6 5 7
3 7 11
3 5 8
=
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
Y
M
données
globales
moyenne
générale
=
+
-3
-3
-3
-3
-3
0
0
0
0
0
3
3
3
3
3
+
B
+
écarts
inter-colonnes
-1
1
2
-1
-1
3
1
-2
0
-2
3
1
-3
1
-2
W
+
écarts
intra-colonnes
7
ANALYSE DE VARIANCE
Décomposition de la variabilité
En élevant au carré et en sommant, pour toutes les observations :

i
( yij  y ) 2 
j
Somme des carrés
des écarts totaux
SCETotale

ni ( yi  y ) 2 
i
=

i
Exemple de la viande :
SCEInter
2
j
Somme des carrés des
écarts inter-niveaux
=
( yij  yi )
+
+
Somme des carrés des
écarts intra-niveaux
SCEIntra
SCETotale = 140
SCEInter = 90
SCEIntra = 50
8
ANALYSE DE VARIANCE
On souhaite tester les hypothèses :
H0 : " Il n’y a pas d’effet produit "
càd les moyennes pour les différents produits (niveaux du facteur)
sont égales
contre H1 : " Il y a un effet produit "
càd deux moyennes au moins sont différentes
 Il s’agit donc de comparer la variabilité inter-niveaux à la
variabilité intra-niveaux du facteur
9
ANALYSE DE VARIANCE
Source de
variation
SCE
ddl
Inter-niveaux
SCE Inter
I-1
Intra-niveaux
SCE Intra
n-I
Totale
SCE Totale
n-1
I nombre de niveaux
On définit le carré moyen inter-groupes :
CM inter 
SCE inter
I 1
et le carré moyen intra-groupes :
CM intra 
SCE intra
nI
10
ANALYSE DE VARIANCE
Pour tester H0 contre H1, on évalue la quantité :
F
CM inter
CM intra
Si l’hypothèse H0 est vraie, la valeur F est faible,
sinon, en s’éloignant de cette hypothèse, le rapport F augmente
 à partir de quelle valeur observée de F rejette-t-on H0 ?
 Si les résidus du modèle de l’analyse de la variance suivent une
loi normale, et si H0 est vraie, on sait que F est l’observation d’une
variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (nI) ddl au dénominateur : notée F(I-1, n-I)
H0 est rejetée si Fobs > F (I-1, n-I) pour un niveau de significativité
donné α, c’est-à-dire si p-value < α (cf. table de Fisher)
11
ANALYSE DE VARIANCE
Exemple de la viande :
Tableau d’analyse de la variance
Source de variation SCE ddl CM
Type de viande
90
2
Résiduelle
(intra-produit)
50
12
Totale
140
14
F
p-value
10,8
p < 0,01
45
4,17
 Tables de la loi de Fisher :
pour α = 5 %, Fα,2,12 = 3,88
p-value = p(Fα,1, 2 > Fobs)
pour α = 1 %, Fα,2,12 = 6,93
 H0 rejetée = il existe un effet type de viande significatif
concernant le caractère fibreux
12
ANALYSE DE VARIANCE
Analyse de la variance à 2 facteurs
13
ANALYSE DE VARIANCE
Dispositif complet sans répétition
Supposons maintenant que 5 juges aient évalué une série de 3
échantillons :
notes pour le caractère fibreux
viande
juge
A
B
C
1
2
3
4
5
3
5
6
3
3
x1.  4
10
8
5
7
5
x2.  7
13
11
7
11
8
x3.  10
x.1  8,7
x.2  8
x.3  6
x.4  7
x.5  5,3
x 7
14
III.2 – Dispositif complet
ANALYSE
sans répétition
DE VARIANCE
Modèle de l’analyse de la variance à 2 facteurs sans interaction :
yij     i   j   ij
Exemple de la viande :
où yij est la variable à expliquer ………………
texture fibreuse d’une viande
i est l’effet du ième niveau du facteur A .....
caractère fibreux de la viande i
 j est l’effet du jème niveau du facteur B ....
effet lié au juge j

caractère fibreux potentiel
est l’effet moyen général ……………….
 ij est la variable aléatoire résiduelle ……… due à l’ensemble des autres causes
qui déterminent la note fibreuse
Hypothèses :
-
les  ij sont indépendants
E( ij )  0
var( ij )   2
 ij suit une loi N (0,  2 )
15
III.2 – Dispositif complet
ANALYSE
sans répétition
DE VARIANCE
Equation de la décomposition de la variance :

i
j
( yij  y.. ) 2 

j
2
( yi.  y.. ) 
i
soit :

i
2
( y. j  y.. ) 
j

i
( yij  yi.  y. j  y.. )
2
j
SCET = SCEA + SCEB + SCER
Source de
variation
SCE
ddl
Effet principal de A
SCEA
I-1
Effet principal de B
SCEB
J-1
Résiduelle
SCER
(I-1)(J-1)
Totale
SCET
n-1
16
ANALYSE DE VARIANCE
On teste chaque facteur
Tableau d’analyse de la variance
Source de variation SCE ddl CM
F
Type de viande
90,0
2
45,0
13,2
Effet juge
22,7
4
5,7
1,7
Résiduelle
27,3
8
3,4
Totale
140
14
 1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 %
 H0 rejetée avec un risque de 5 % = il existe un effet produit
significatif concernant le caractère fibreux
 2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 %
 H0 non rejetée = il n’existe pas d’effet juge significatif
17
ANALYSE DE VARIANCE
Dispositif complet avec répétitions
Comparaison de 3 types de sondes pédologiques pour 2 natures de sol
Type de sol
Type de
sonde
1
2
1
43
45
46
53
40
40
40
43
2
41
42
43
44
35
37
40
40
3
42
44
46
48
37
39
40
40
18
III.3 – Dispositif complet
ANALYSE
avec répétitions
DE VARIANCE
Modèle de l’analyse de la variance à 2 facteurs avec interaction :
xijk    i   j  ( )ij   ijk
où xijk est la variable à expliquer
i est l’effet du ième niveau du facteur A
 j est l’effet du jème niveau du facteur B
( )ij est l’interaction des niveaux i et j des 2 facteurs
 est l’effet moyen général
 ijk est la variable aléatoire résiduelle
Hypothèses :
-
les  ijk sont indépendants
E( ijk )  0
2
- var( )  
ijk
-
-
 ijk suit une loi N (0,  2 )
19
ANALYSE DE VARIANCE
Avec répétition
Effet
moyen
A2
PAS
D’INTERACTION
A1
B3
B1
B2
D’INTERACTION
Effet
moyen
A2
A1
B3
B1
B2
20
ANALYSE DE VARIANCE
Equation de la décomposition de la variance :

i
j
soit :
k
( yijk  y...) 2  JK

2
( yi..  y...)  IK

i
2
( y. j.  y...)  K
j

i
2
( yij.  yi..  y. j.  y...) 
j
 ( y
i
j
ijk
 yij. ) 2
k
SCET = SCEA + SCEB + SCEAB + SCER
Source de
variation
SCE
ddl
Effet principal de A
SCEA
I-1
Effet principal de B
SCEB
J-1
Interaction A x B
SCEAB
(I-1)(J-1)
Résiduelle
SCER
IJK-IJ
Totale
SCET
n-1
 3 tests d’hypothèse
21
ANALYSE DE VARIANCE
Type de
sol
1
Typ
e de
son
de
2
3
1
2
43
45
46
53
40
40
40
43
41
42
43
44
35
37
40
40
42
44
46
48
37
39
40
40
Tableau d’analyse de la variance
Source de variation
SCE
ddl
CM
F
Type de sol
181,5
1
Type de sonde
49,0
2
24,5
3,92
0,039
Sol x sonde
3,0
2
1,5
0,24
0,789
Résiduelle
112,5
18
6,2
Totale
346,0
23
181,5 29,04
p-value
< 0,01
22
ANALYSE DE VARIANCE
 Effet sol >> effet sonde
 Effets sol et sonde significatifs pour α = 5 %
 Pas d’effet d’interaction
Réponse
Sol 1
Sol 2
1
2
3
Sonde
23
ANALYSE DE VARIANCE
Tests de comparaisons multiples
Si rejet de l’hypothèse testée : effet du facteur
Le rejet signifie: il existe au moins 1 niveau différent des autres
Le ou lesquels?
Il existe des méthodes complémentaires :
- test LSD (Least Significance Difference) de Fischer (ppds)
- test de Scheffe
- test de Dunnett
- test de Duncan
-…
24
ANALYSE DE VARIANCE
Tests de comparaisons multiples
Pour chaque comparaison de 2 moyennes, on calcule une valeur
seuil r (range), fonction du carré moyen résiduel de l’ANOVA
Si y1  y2  r , alors la différence est déclarée significative, au
niveau de signification α
 Exemple : test LSD
r  t ,ddl
1
1

CM R   
 n1 n2 
ddl de la source de variation résiduelle
25