Transcript y - Free

Méthodes de régression

B. Palagos UMR ITAP Cemagref [email protected]

B. Palagos

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009

LA REGRESSION LINEAIRE

Utilisée pour expliquer, décrire ou prédire une variable quantitative y en fonction d’une ou plusieurs variables x 1 ,….., x p.

Par exemple  y peut-être le prix du pain en fonction de la teneur en eau x y réponse variable à expliquer sortie variable dépendante variable exogène x i prédicteur(s) variable(s) explicative(s) entrée(s) variable(s) indépendante(s) variable(s) endogène (s) p = 1 régression linéaire simple p > 1 régression linéaire multiple (MLR) M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 2

MESURE DE LA RELATION ENTRE 2 VARIABLES CONTINUES

PRIX du pain en fonction de la teneur en EAU Corrélation : -0.76

PRI 63.00

77.00

86.00

89.00

91.00

92.00

92.00

95.00

95.00

106.00

74.00

76.00

85.00

57.00

95.00

132.00

152.00

153.00

EAU 3635.00

3190.00

3530.00

3350.00

3070.00

3130.00

3635.00

3490.00

3460.00

3380.00

3500.00

4030.00

3365.00

3515.00

3960.00

2925.00

2720.00

2340.00

2500 3000 EAU 3500 4000 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 3

COEFFICIENT DE CORRELATION

 : Coefficient de corrélation et Y (populations) (Pearson) entre deux variables aléatoires X

y

r estimateur de 

r

(

x

,

y

) 

i n

  1 (

x i

x

)(

y i

y

)

i n

  1 (

x i

x

) 2

i n

  1 (

y i

y

) 2  r est toujours compris entre -1 et + 1.

 si r proche de + 1 ou - 1 , x et y sont bien corrélées; le nuage de points est presque aligné le long d'une droite (croissante si r > 0, décroissante si r < 0).

 r = 0 Pas de lien linéaire entre x et y M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 4

COEFFICIENT DE CORRELATION

Si taille échantillon n est faible il faut être prudent sur la significativité du coefficient calculé. Il existe des tables statistiques (et logiciels) qui donnent la limite de significativité de r .

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 5

ddl = n-2 n=3 r > 0.99

n= 7 r > 0.75

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 6

Y

COEFFICIENT DE CORRELATION

 1 

r

(

x

,

y

)  1

Y Y

r = -1

Y X

r = -.6

Y X

r = 0

X

r = .6

X

r = 1

X

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 7

COEFFICIENT DE CORRELATION

Toujours faire un graphique r = 0.5

r = - 0.9

r = 0.8

r = 0.0

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 8

FAIRE PASSER UNE DROITE

On modélise la relation linéaire entre y et x par y = a+b x (équation d’une droite) 2500 3000 EAU 3500 4000 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 9

MOINDRES CARRES On cherche la droite (a et b ) telle que

i n

  1 

y i

y

ˆ 

a

bx i

 2 minimum ˆ

i

a

bx i y i y

ˆ

i y i

-

y

ˆ

i y

ˆ

i

MCO points de coordonnée s (

x i

,

y i

) 2500

x i

3000 EAU 3500 4000 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 10

RESULTAT DES MOINDRES CARRES

2500 3000 EAU 3500 4000 Équation de la droite PRI = 258 – 0.05 EAU MCO 2500 3000 3500 4000 Année 2008 -2009 11

ESTIMATIONS – Cas p=1

y

   

x

 

y i

   

x i

 

i

minimum

i n

  1

i i n

  1 

y i a bx i

 2 

a

bx b

i n

  1 

y i

i n

  1 (

x i y

 (

x i

x

) 2 

x

)

a

y

b x

coefficients de régression b (pente) et a (ordonnée à l’origine) M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 12

CAS DE LA REGRESSION SIMPLE p=1

y y i y

ˆ

i y i

y y i

 ˆ

i y i

y

2 3 4 5 x

SST

SSR

SSE

6 7

x i

8

SST

i n

  1 (

y i

y

) 2

SSE

i n

  1 (

y i

 ˆ

i

) 2

SSR

i n

  1 ( ˆ

i

y

) 2 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 13

COEFFICIENT DE DETERMINATION - R²

 R 2 = SSR/SST coefficient de détermination ou pourcentage de variance expliquée par la régression  Permet de juger de la qualité de la régression  Idéal R² = 1  Mauvaise régression: R² = 0 0 Propriétés 

R

2  1

R

2 

i n

  1 (

y

ˆ

i i n

  1 (

y i

y

) 2 

y

) 2 Quand p=1 R² = r² r : coefficient de corrélation linéaire Pour le pain: r=-0.76 donc R²= (-0.76)² M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 14

Étalonnage d’un appareil de mesure

variété Ami Apollo Arminda Artaban Avital Baroudeur Beauchamp CWRS Camp-Remy Carolus Castan Centauro Courtot Duck Manital Recital1 Recital2 Rossini Scipion Sidéral Sleipjner Soissons1 Soissons2 Tango Thésée Win référence 8.6

11.1

11.6

10.9

10 11.6

10.4

11.6

12.9

9 13.1

10.3

infrarouge 9.1

12.4

12.5

10.1

10.6

11.5

10.8

11.3

11.6

8.2

12.9

10.4

13.1

11.6

14 11.5

10.5

9.7

11 11.6

13.3

11.3

13.7

11.1

9.8

9.1

11.6

11.5

= 12 10.6

10 11.5

10.1

11.8

13.2

10.1

10.3

11.5

9.2

11.5

Taux de protéine de 26 variétés de blé - analyse chimiques très précises, très longues (mesure de référence) ( x ) - Spectrométrie proche infra-rouge (SPIR) plus rapide mais mesure indirecte à mettre en relation avec méthode de référence (y) - régression y= a+bx+E y = 0.157+0.981x

Données / droite de régression R²=0.785

14.2

13.2

12.2

11.2

10.2

9.2

8.2

8.6

9.6

10.6

11.6

référence

12.6

13.6

14.6

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 15

Étalonnage d’un appareil de mesure

Calculs avec logiciel R Response: infrarouge Reference Residuals Df 1 24 Sum Sq 38.731 10.569 Mean Sq F value Pr(>F) 38.731 -- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 87.954 1.696e-09 *** 0.440

p-value

Coefficients: Estimate Std. Error t value (Intercept) 0.1566 1.1741 reference 0.9808 0.1046 0.133

9.378

Pr(>|t|) 0.895 1.70e-09 *** -- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.6636 on 24 degrees of freedom Multiple R-Squared: 0.7856, Adjusted R-squared: 0.7767 F-statistic: 87.95 on 1 and 24 DF, p-value: 1.696e-09 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 16

TEST DE NULLITE D’ UN COEFFICIENT

Les tests supposent hypothèse normalité des erreurs (vérification a posteriori)

Test H

0 : 

j

 0 Variance de l’erreur Variance de  j Coefficient pas significatif  ˆ  2 

i n

  1 (

n y i

  2

i

) 2  ˆ 

j

2 

i n

  1  ˆ  (

x i

 2

x

) 2

T Loi de Student à n-2 degrés de liberté

: valeur t ayant la probabilité  en valeur absolue.

d'être dépassée P ( - t < T < O u : P ( T < t ) = 1 - t ) =   . /2 = P ( T > t )

si

 ˆ  ˆ 

j j

>

t rejet de H

0 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 17

COMMENT VERIFIER LES HYPOTHESES SUR L’ERREUR

On regarde les résidus après régression

e i

y i

 ˆ

i

Pour vérifier l’homoscedasticté

Pour vérifier la normalité

Normal Q-Q Plot

8 9 10 11 infrarouge 12 13

-2 -1 0 1 Theoretical Quantiles 2

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 18

5 régressions

JUGEMENT REGRESSION - R²

a: régression sans pb b: modèle pas bon- résidus <0 puis >0 puis <0  modèle quadratique c: a priori une observation atypique d: points alignés mais s’écartent différemment (variance erreurs pas constante) e: droite n’existe que par la dernière observation M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 19

REGRESSION LINEAIRE MULTIPLE (MLR)

• • Explication de la consommation de « fuel » On veut modéliser la consommation d ’un agent énergétique en fonction de facteurs explicatifs : La température moyenne sur un mois est une explication de la consommation L ’épaisseur de l ’isolation en est un autre

Gallons/Month

275.30

363.80

164.30

40.80

94.30

230.90

366.70

300.60

237.80

121.40

31.40

203.50

441.10

323.00

52.50

Avrg. Temp (oF)

40.00

27.00

40.00

73.00

64.00

34.00

9.00

8.00

23.00

63.00

65.00

41.00

21.00

38.00

58.00

Insulation (Inches)

3.00

3.00

10.00

6.00

6.00

6.00

6.00

10.00

10.00

3.00

10.00

6.00

3.00

3.00

10.00

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 20

REGRESSION LINEAIRE MULTIPLE (MLR)

Un modèle de régression linéaire

y i

    1

x i

1   2

x i

2  

i

Observation i de la consommation mensuelle Terme constant Influence de l ’isolation Influence de la température Erreur aléatoire M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 21

REGRESSION LINEAIRE MULTIPLE (MLR)

n observations

y i

p variables x j continues n > p Modèle fuel : n=15 p=2 Pour chaque observation : Coefficients inconnus

y i

    1

x i

1  .....

 

p x ip

 

i

terme d’erreur non observé M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 22

Décomposition de la variance et tests

Source de variation (source) Somme des carrés (sum of square) Régression

SSR

i n

  1 ( ˆ

i

y

) 2 Ddl (df) p Erreurs (résiduals)

SSE

i n

  1 (

y i

y

ˆ

i

) 2 n-p-1 Totale

SST

i n

  1 (

y i

y

) 2 n-1 Carrés moyens (mean square)

CMM

SSR

p i n

  1 ( ˆ

i p

y

) 2

CME

n SSE

p

 1 

i n

  1 (

n

y i p

y i

) 2  1

SST n

 1 

i n

  1 (

y i n

  1

y

) 2 

S

2

y

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 23

COEFFICIENT DE DETERMINATION - R²

 R 2 coefficient de détermination ou pourcentage de variance expliquée par la régression  Permet de juger de la qualité de la régression 0 Propriétés 

R

2  1  Idéal R² = 1  Mauvaise régression: R² = 0 • Si p augmente R²

R

2 

i n

  1 (

y

ˆ

i i n

  1 (

y i

y

) 2 

y

) 2

>

il existe R² ajusté

R

2

aj

 (

n

 1 )

n

R p

2   1

p

Quand p=1 R² = r² r : coefficient de corrélation linéaire M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 24

TEST DE L’EXISTENCE DU MODELE

Test H

0 :  1   2  ........

 

p

 0

SSR

i n

  1 ( ˆ

i

y

) 2

SSE

i n

  1 (

y i

 ˆ

i

) 2

SSR

/

SSE

/

n

p p

1

F

(

p

,

n

p

1 )

F Loi de Fisher à (p,n-p-1 )degrés de liberté

: valeur f ayant la probabilité 0.05 d'être dépassée.

Si SSR

/

SSE

/

n

p p

 1 >

f rejet de H

0

Si H

0

acceptée

:

y

y

  M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 25

EXEMPLE de MLR

reg1=lm(rdt ~ eng + pluie)

Coefficients

: Estimate Std. Error t value Pr(>|t|) (Intercept) 28.095238 2.491482 11.277 0.000352 *** eng 0.038095 0.005832 6.532 0.002838 ** pluie 0.833333 0.154303 5.401 0.005690 ** -- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 rendement maïs dose engrais niveau précipitation y x1 x2 40 50 50 100 200 300 10 20 10 70 65 65 80 400 500 600 700 30 20 20 30

p-value

Residual standard error: 2.315 on 4 degrees of freedom Multiple R-Squared: 0.9814, Adjusted R-squared: 0.972 F-statistic: 105.3 on 2 and 4 DF, p-value: 0.0003472

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 26

REGRESSION MLR cas multicolinéarité

V1 7 1 11 11 7 11 3 1 2 21 1 11 10 Exemple de traitement V2 26 29 56 31 52 55 71 31 54 47 40 66 68 X V3 6 15 8 8 6 9 17 22 18 4 23 9 8 V4 60 52 20 47 33 22 6 44 22 26 34 12 12 y CAL 78.5

74.3

104.3

87.6

95.6

109.2

102.7

72.5

93.1

115.9

83.8

113.3

109.4

quantité de : V1 : tricalcium aluminate V2 : tricalcium silicate V3 : tetracalcium alumino ferrite V4 : dicalcium silicate CAL: calories par gramme de ciment M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 27

REGRESSION MLR

min Q1 Q2 7 moy 7.5

Q3 max 11 21 s V1 1 2 5.9

V2 26 31 52 48.2

56 71 15.6

V3 4 8 9 11.8

17 23 6.4

V4 6 20 26 30 44 60 16.7

CAL 72.5

83.8

95.6

95.4

109.2

115.9

15.1

V1 V2 V3 V4 CAL V1 V2 V3 V4 V5 V1 1 V2 0.23

1 V3 -0.82

-0.13

1 V4 -0.24

-0.97

0.03

1 CAL 0.73

0.82

-0.53

-0.82

1 Matrice de corrélation M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 28

REGRESSION MLR

Résultats de la régression MLR

y

X

   Estimate Std. Error t value Pr(>|t|) (Intercept) 63.4888 70.0031 0.907 0.3909 V1 1.5494

0.7440 2.082 0.0709

V2 0.4960

0.7231 0.686 0 0.5121 V3 0.1004

0.7540 0.133 0.8974 V4 -0.1572 0.7084 -0.222 0.8299 Residual standard error: 2.444 on 8 degrees of freedom Multiple R-Squared: 0.9824, Adjusted R-squared: 0.9736 F-statistic: 111.7 on 4 and 8 DF, p-value: 4.721e-07 Au risque de 5% aucun coefficient n’est significatif que faire????

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 29

REGRESSION SUR COMPOSANTES PRINCIPALES

On fait une

ACP

normée sur le tableau X donc sans la variable CAL ACP sur le tableau X comprenant les variables V1 V2 V3 V4

Valeur propres

[1] 2.235 1.576 0.186 0.001

Proportion of Variance 0.558 0.394 0.0466 0.0004

Cumulative Proportion 0.558926 0.9529425 0.99959406 1.0000000000

Loadings

(vecteurs propres): C1 C2 C3 C4 v1 -0.476 0.509 0.676 0.241

U = v2 -0.564 -0.414 -0.314 0.642

v3 0.394 -0.605 0.638 0.268

v4 0.548 0.451 -0.195 0.677

C1= - 0.476 v1 – 0.564 v2 + 0.394 v3 + 0.548 v4 C2= 0.509 v1 – 0.414 v2 - 0.605 v3 + 0.451 v4 C3= 0.676 v1 – 0.314 v2 + 0.638 v3 - 0.195 v4 C4= 0.241 v1 + 0.642 v2 + 0.268 v3 + 0.677 v4 Combinaisons linéaires M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 30

REGRESSION SUR COMPOSANTES PRINCIPALES

V1 2 21 1 11 10 7 1 11 11 7 11 3 1 ACP sur X MLR X V2 54 47 40 66 68 26 29 56 31 52 55 71 31 V3 18 4 23 9 8 6 15 8 8 6 9 17 22 V4 22 26 34 12 12 60 52 20 47 33 22 6 44 y CAL 78.5

74.3

104.3

87.6

95.6

109.2

102.7

72.5

93.1

115.9

83.8

113.3

109.4

C C1 C2 C3 C4 1 -1.4672378 -1.9030358 -0.53000037 0.038529908

2 -2.1358287 -0.2383536 -0.29018640 -0.029832930

3 1.1298705 -0.1838772 -0.01071259 -0.093700786

4 -0.6598954 -1.5767743 0.17920354 -0.033116396

5 0.3587645 -0.4835379 -0.74012232 0.019187145

6 0.9666396 -0.1699440 0.08570243 -0.012167032

7 0.9307051 2.1348166 -0.17298595 0.008295395

8 -2.2321379 0.6916707 0.45971967 0.022605633

9 -0.3515156 1.4322451 -0.03156437 -0.044987631

10 1.6625430 -1.8280967 0.85119311 0.019836723

11 -1.6401799 1.2951128 0.49417844 0.031388975

12 1.6925940 0.3922488 -0.01980997 0.037185301

13 1.7456786 0.4375254 -0.27461537 0.036775709

M2 Sciences des Procédés - Sciences des Aliments SCORES Année 2008 -2009 31

REGRESSION SUR COMPOSANTES PRINCIPALES

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 95.4000 0.6430 148.373 < e-10 *** C1 9.8791 0.4476 22.072 3.8e-09 *** C2 C3 0.1327 0.5331 0.249 0.8091 4.6539 1.5492 3.004 0.0149 * Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.318 on 9 degrees of freedom Multiple R-Squared: 0.9822, Adjusted R-squared: 0.9763 F-statistic: 165.4 on 3 and 9 DF, p-value: 3.45e-08 CAL = 95.4 + 9.88 C1 + 0.13 C2 +4.65 C3 On repasse aux variables initiales: CAL = 95.4 + 7.78 V1 + 4.16 V2 + -0.85 V3 – 6.38 V4 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 32

REGRESSION PLS

 Méthode plus récente  Partial Least Square  Proche de la régression sur composantes principales RCP : facteurs calculés qu’à partir des variables initiales (et donc sans référence à la variable à expliquer

y

). PLS : La variable à expliquer et les variables explicatives sont prises en comptes simultanément.

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 33

REGRESSION PLS et PCR

RCP et PLS : On remplace l’espace initial par un espace de faible dimension engendré par un petit nombre de composantes (ou facteurs) ou variables latentes qui sont construites l’une après l’autre de façon itérative. Ces facteurs seront les nouvelles variables explicatives d’un modèle de régression linéaire.

Les facteurs sont orthogonaux (non corrélés), et sont des combinaisons linéaires des variables explicatives initiales.

RCP : facteurs calculés qu’à partir des variables initiales (et donc sans référence à la variable à expliquer

y

). PLS : La variable à expliquer et les variables explicatives sont prises en comptes simultanément. M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 34

REGRESSION PLS • Notion de covariance :

  x i  x   y i  y  0.5

0.4

0.3

0.2

0.1

Cov  0 0 -0.1

-0.2

-0.3

-0.4

-0.5

Cov<0 -0.4

-0.2

Cov>0 0 0.2

0.4

M2 Sciences des Procédés - Sciences des Aliments 0.6

Année 2008 -2009 35

REGRESSION PLS

• Notion de covariance (bis) :

– Cov(x,y) =

(x)

(y) r(x,y)

x Dans R n cos(x,y) = r(x,y) ||y||   (y) y x T y  cov(x,y) M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 36

REGRESSION PLS

• Comment ça marche :

– Cherche les combinaisons linéaires u de X, telles que : Cov(Xu,y) maximale – Une régression est ensuite calculée entre les variables latentes de X et y

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 37

v633 v649 v666 v683 v700 v716 v733 ytep 1 0.70 0.94 1.48 1.40 0.31 0.06 0.06 87.37

2 1.93 2.47 3.49 3.14 0.90 0.24 0.12 87.16

3 1.27 1.66 2.45 2.21 0.54 0.13 0.08 87.57

4 1.07 1.22 1.71 1.51 0.36 0.10 0.10 87.16

5 0.49 0.64 1.00 0.90 0.15 0.01 0.04 85.99

6 0.59 0.83 1.30 1.15 0.19 0.01 0.04 86.41

7 0.43 0.46 0.69 0.65 0.14 0.04 0.07 80.75

8 0.53 0.48 0.67 0.64 0.14 0.03 0.06 78.74

9 1.25 1.30 1.67 1.62 0.65 0.33 0.25 79.26

10 3.18 3.81 4.66 4.18 1.60 0.60 0.30 85.56

11 1.36 1.51 2.04 1.94 0.66 0.30 0.23 82.35

12 2.20 2.68 3.54 3.25 1.15 0.45 0.27 83.08

13 0.46 0.60 1.09 1.10 0.23 0.04 0.06 81.13

14 1.96 2.39 3.41 3.20 0.95 0.24 0.11 79.97

15 0.56 0.77 1.33 1.31 0.29 0.05 0.06 82.44

X : absorbances aux longueurs d'onde (nm) 633 649 666 683 700 716 733, mesurées sur des pommes ytep (dernière colonne) : teneur en eau des pommes On cherche à prédire ytep en fonction de X M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 38

Estimate Std. Error t value (Intercept) 77.726 5.987 12.982

v633 -32.425 12.013 v649 78.507 35.796 Pr(>|t|) 3.74e-06 *** -2.699 0.0307 * 2.193 0.0644 . v666 -53.496 45.350 v683 45.365 38.510 v700 -103.69 55.062 v716 50.320 127.846 v733 22.613 114.740 -- -1.180 0.2767 1.178 0.2773 -1.883 0.1017 0.394 0.7056 0.197 0.8494 Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.509 on 7 degrees of freedom Multiple R-Squared: 0.8906, Adjusted R-squared: 0.7813 F-statistic: 8.143 on 7 and 7 DF, p-value: 0.006459 M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 39

Matrice de corrélation des prédicteurs v633 v649 V666 v683 v700 v716 v733 v633 1.00

0.99 0.98 0.97 0.99 0.93 0.79 v649 0.99

1.00

0.99

0.99

0.98

0.90

0.74

v666 0.98

0.99

1.00

1.00

0.97

0.86

0.68

v683 0.97

0.99

1.00

1.00

0.97

0.86

0.69

v700 0.99

0.98

0.97

0.97

1.00

0.96

0.83

v716 0.93

0.90

0.86

0.86

0.96

1.00

0.96

v733 0.79

0.74

0.68

0.69

0.83

0.96

1.00

Corrélations très élevées !!

M2 Sciences des Procédés - Sciences des Aliments Année 2008 -2009 40

p-Value

Probabilité d’être supérieur à la statistique calculée (ou valeur absolue) que l’on compare au risque  choisi

p Value

(

= 0.01). Pas de rejet H0 p Value

<

(

= 0.01). Rejet H0 p Value Rejet

= 0.01

0 1.80

2.4377

T 35

M2 Sciences des Procédés - Sciences des Aliments 79 Année 2008 -2009 41