Transcript 09_ancova
Kovarianzanalyse
Kovarianzanalyse
1.
2.
3.
4.
5.
6.
7.
Störvariablen
Veranschaulichung der Kovarianzanalyse
Quadratsummen und „modifizierte“ Quadratsummen
F-Test
Reduktion der Fehlervarianz
Voraussetzungen
Die Kovarianzanalyse in SPSS
09_ancova
1
Kovarianzanalyse
Kovarianzanalyse
• Die Kovarianzanalyse ist ein Verfahren, das eine Varianzanalyse
mit einer Regressionsanalyse kombiniert.
• Die Kovarianzanalyse wird eingesetzt, um die Fehlervarianz einer
ANOVA zu verringern und damit die Power zu erhöhen.
• Dazu wird der Einfluss einer zusätzlichen Variable aus der AV einer
Varianzanalyse „herauspartialisiert“.
• Beispiel: Vor dem Vergleich der Gedächtnisleistung (AV)
zwischen zwei Lernbedingungen (UV) wird der Einfluss des
Alters (Kovariate) heraus gerechnet.
09_ancova
2
Störvariablen
Statistische Kontrolle von Störvariablen
Beispiel: Untersuchung zum Therapieerfolg
• Faktor Geschlecht des Patienten (2-fach)
• Faktor Therapieform (3-fach)
Es werden ungefähr 2 x 3 x 20 = 120 Vpn benötigt.
• Wenn das Alter (Störvariable) als dritter Faktor (z.B. drei Stufen)
berücksichtigt werden soll, braucht man schon 3 x 120 = 360 Vpn.
• Weil ein solches Vorgehen wenig ökonomisch wäre, ist eine
statistische Kontrolle des Alters vorzuziehen
Kovarianzanalyse
09_ancova
3
Veranschaulichung der Kovarianzanalyse
Theoretisches Vorgehen bei der Kovarianzanalyse:
• Ziel: Statistische Kontrolle einer (Stör-) Variablen, die
möglicherweise die Daten der Untersuchung beeinflusst haben
könnte:
• Frage: Wie sähen die Ergebnisse aus, wenn die Kovariate in allen
Gruppen gleich gewesen wäre?
• (Theoretisches) Vorgehen:
1. Die Störvariable wird zusätzlich erhoben
2. Ihr Einfluss wird mit eine Kovarianzanalyse „neutralisiert“
09_ancova
4
Veranschaulichung der Kovarianzanalyse
Theoretisches Vorgehen bei der Kovarianzanalyse:
• Eine Regressionsanalyse „entfernt“ die Varianz der Kovariate aus
der abhängigen Variablen (AV).
• Dies geschieht, indem eine Regression der AV auf die Kovariate
berechnet wird.
• Die Regressionsresiduen beschreiben den Anteil der AV, der nicht
durch die Kovariate erklärt werden kann.
• Diese Residuen werden als neue AV in eine Varianzanalyse
gegeben
Die nach der Regressionsanalyse verbleibende (nicht
erklärbare) Varianz mit der Hilfe einer ANOVA erklärt.
09_ancova
5
Veranschaulichung der Kovarianzanalyse
Regression
yˆi a xi b
yi a xi b yres i
yi yˆi yres i
• Residuum = nicht durch Prädiktor (x) vorhersagbarer „Rest“ des
Kriteriums (y).
• Varianz der Residuen (Streuung der Datenpunkte um die
Regressionsgerade) = nicht vorhergesagte (erklärte) Varianz
09_ancova
6
Veranschaulichung der Kovarianzanalyse
Beispiel
• 20 Schüler lernen eine Programmiersprache.
– UV: 5 verschiedene Lernmethoden
– AV: Lernerfolg
– Kovariate: mathematische Vorkenntnisse
Der Einfluss der Kovariate auf den Lernerfolg wird statistisch
kontrolliert.
Der Effekt der Lehrmethode kann so auch zuverlässig bestimmt
werden, wenn zufällig in einer Gruppe viele Probanden mit
hohen Vorkenntnissen waren.
09_ancova
7
Veranschaulichung der Kovarianzanalyse
Daten
Training
1
2
3
4
5
VP
1
2
3
4
M
x
y
10 18
20 17
15 23
12 19
14 19.3
x
y
22 40
31 22
16 28
17 31
22 30.3
x
y
30 38
31 40
18 41
22 40
25 39.8
x
y
35 25
37 45
41 50
30 51
36 42.8
x
y
11 15
16 17
19 20
25 23
18 18.8
x: mathematisch-logische Fähigkeiten (Kovariate)
y: Lernerfolg (AV)
09_ancova
8
Veranschaulichung der Kovarianzanalyse
1. Schritt: Regression von y auf x
b y.x rxy
sx
sy
a y.x y - rxy
sx
sy
sx
x
SSx
1578
8.89
N
20
SS y
2671
11.56
N
20
SPxy
1331
rxy
0.65
N s x s y 20 8.89 11.56
sy
b y.x rxy
sy
sx
a y.x y - rxy
0.65
sy
sx
11.56
0.85
8.89
x 30.15 0.85 22.9 10.69
yˆ i 0.85 xi 10.69
09_ancova
9
Veranschaulichung der Kovarianzanalyse
x
y
y(reg)
y(res)
10
18
19.19
-1.19
20
17
27.69
-10.69
15
23
23.44
-0.44
12
19
20.89
-1.89
22
40
29.39
10.61
31
22
37.04
-15.04
16
28
24.29
3.71
17
31
25.14
5.86
30
38
36.19
1.81
31
40
37.04
2.96
18
41
25.99
15.01
22
40
29.39
10.61
35
25
40.44
-15.44
37
45
42.14
2.86
41
50
45.54
4.46
30
51
36.19
14.81
11
15
20.04
-5.04
16
17
24.29
-7.29
19
20
26.84
-6.84
25
23
31.94
-8.94
09_ancova
2. Schritt: Bestimmung der Residuen
yreg a x b
yres y yreg
Wie kann man die Residuen interpretieren?
Das Residuum gibt an wie gut eine Person im
Vergleich mit anderen Personen, die die gleichen
Vorkenntnisse hatten, abgeschnitten hat.
Bsp. Vp 1: Die Person schneidet für ihre
Vorkenntnisse ungefähr durchschnittlich ab.
Bsp. Vp 2: Die Person hat ein deutlich negatives
Residuum obwohl sie fast den gleichen Testwert
hatte: Für ihre guten Vorkenntnisse hat sie ein eher
schlechtes Ergebnis erreicht.
10
Veranschaulichung der Kovarianzanalyse
3. Schritt: ANOVA mit den Residuen
1
-1.19
-10.69
-0.44
-1.89
-3.55
2
10.61
-15.04
3.71
5.86
1.29
3
1.81
2.96
15.01
10.61
7.60
4
-15.44
2.86
4.46
14.81
1.67
5
-5.04
-7.29
-6.84
-8.94
-7.03
Die ANOVA wird wie immer berechnet:
•
•
•
•
09_ancova
Quadratsummen (between & within)
Mittlere Quadratsummen
F-Werte
…
11
Tatsächliche Berechnung der Kovarianzanalyse
• Tatsächlich erfolgt die Berechnung nicht genau wie das gerade
veranschaulicht wurde!
• Stattdessen wird die Varianz der Kovariate wird direkt aus den
Quadratsummen „entfernt“.
• Das mathematische Vorgehen ist folgendes:
1. Quadratsummenzerlegung beider Variablen
2. Produktsummenzerlegung
3. Entfernen der Varianz der Kovariate: Berechnen der
Modifizierten Quadratsummen
4. F-Test
09_ancova
12
Tatsächliche Berechnung der Kovarianzanalyse
1. Quadratsummen
• Quadratsummenzerlegung für die AV (y) und die Kovariate (x)
SStotal ( y ) SSbetween ( y ) SSwithin ( y )
y
n
2
p
i 1 j 1
ij
2
2
y n y j y yij y j
p
j 1
n
p
i 1 j 1
SStotal ( x) SSbetween ( x) SSwithin ( x)
x
n
p
i 1 j 1
09_ancova
ij
2
2
2
x nx j x xij x j
p
j 1
n
p
i 1 j 1
13
Tatsächliche Berechnung der Kovarianzanalyse
1. Quadratsummen
Training
VP
1
2
3
4
M
1
2
3
4
5
x
y
10 18
20 17
15 23
12 19
14 19.3
x
y
22 40
31 22
16 28
17 31
22 30.3
x
y
30 38
31 40
18 41
22 40
25 39.8
x
y
35 25
37 45
41 50
30 51
36 42.8
x
y
11 15
16 17
19 20
25 23
18 18.8
SStotal ( x) 1578
SStotal ( y) 2671
SSbetween( x) 1096
SSbetween( y) 1999
SSwithin ( x) 482
SSwithin ( y) 672
09_ancova
14
Tatsächliche Berechnung der Kovarianzanalyse
2. Produktsummen
p
n
SPxy ( xij x )( yij y )
j 1 i 1
• Die „Produktsumme“ ist die Vorstufe zur Kovarianz (daher hat
die „Kovarianzanalyse“ ihren Namen)
p
covxy
09_ancova
SPxy
N
n
( x
j 1 i 1
ij
x )( yij y )
N
15
Tatsächliche Berechnung der Kovarianzanalyse
Es gilt wie für die Quadratsummen:
SPtotal SPbetween SPwithin
p
n
SPtotal ( xij x )( yij y )
j 1 i 1
p
SPbetween n( x j x )( y j y )
j 1
p
n
SPwithin ( xij x j )( yij y j )
j 1 i 1
09_ancova
16
Tatsächliche Berechnung der Kovarianzanalyse
Training
1
2
3
4
5
VP
1
2
3
4
M
x
y
10 18
20 17
15 23
12 19
14 19.3
x
y
22 40
31 22
16 28
17 31
22 30.3
x
y
30 38
31 40
18 41
22 40
25 39.8
x
y
35 25
37 45
41 50
30 51
36 42.8
x
y
11 15
16 17
19 20
25 23
18 18.8
p
n
SPtotal ( xij x )( yij y )
j 1 i 1
p
SPbetween n( x j x )( y j y )
j 1
p
n
SPwithin ( xij x j )( yij y j )
j 1 i 1
x 22.90 y 30.15
SPtotal (10 22.90) (18 30.15) ... ( 25 22.90) (23 30.15) 1331
SPbetween 4 (14.25 22.90) (19.25 30.15) ... 4 (17.75 22.90) (18.75 30.15) 1349
SPwithin (10 14.25) (18 19.25) ... (25 17.75) (23 18.75) 18
SPtotal SPbetween SPwithin
1331 1349 18
09_ancova
17
Tatsächliche Berechnung der Kovarianzanalyse
3. Modifizierte Quadratsummen (adjusted Sums of Squares)
Die Varianz der Kovariate wird aus den Quadratsummen der AV
eliminiert.
2
SPtotal
SS´total ( y ) SStotal ( y )
SStotal ( x)
2
SPwithin
SS´within ( y ) SSwithin ( y )
SSwithin ( x)
2
within
2
total
SP
SP
SS´between ( y ) SSbetween ( y )
SSwithin ( x) SStotal ( x)
09_ancova
18
Tatsächliche Berechnung der Kovarianzanalyse
3. Modifizierte Quadratsummen (adjusted Sums of Squares)
2
SPtotal
SS´total ( y ) SStotal ( y )
SStotal ( x)
2
SPwithin
SS´within ( y ) SSwithin ( y )
SSwithin ( x)
2
2
SPwithin
SPtotal
SS´between ( y ) SSbetween ( y )
SSwithin ( x) SStotal ( x)
13312
SS´total ( y ) 2671
1547
1577
(18) 2
SS´within ( y ) 672
671
482
(18) 2 13312
SS´between( y ) 1999
876
482
1577
09_ancova
SStotal ( y) 2671
SSbetween( y) 1999
SSwithin ( y) 672
SStotal ( x) 1578
SSbetween( x) 1096
SSwithin ( x) 482
SPtotal 1331
SPbetween 1349
SPwithin 18
19
Tatsächliche Berechnung der Kovarianzanalyse
4. F-Test und Freiheitsgrade
SS´between
MS´between
p 1
SS´within
MS´within
N p 1
MS´between
F p 1;N p 1
MS´within
876
219
5 1
671
MS´within
47
20 5 1
219
F4,14
4.57
48
MS´between
Fkrit = 3.11
signifikanter Effekt der Lernmethode auf den Lernerfolg
wenn gleichzeitig die mathematisch-logische Vorkenntnisse
kontrolliert werden.
09_ancova
20
Reduktion der Fehlervarianz
Hat die Kovarianzanalyse die Fehlervarianz reduziert?
• Eine Reduktion der Fehlervarianz erfolgt nur, wenn Kovariate und
AV korrelieren.
• Es muss die Korrelation zwischen der Kovariate und der AV
berechnet werden, die nicht auf die UV zurückgeführt werden
kann.“
rwithin
SPwithin
SSwithin ( x) SSwithin ( y )
18
0.03
482 672
rw2 (0.03)² 0.001
09_ancova
Reduktion der Fehlervarianz um
nur 0.1%!
21
Voraussetzung der Kovarianzanalyse
Voraussetzung der Kovarianzanalyse
• Es gelten die normalen Voraussetzungen der ANOVA (Varianzhomogenität, Intervallskalenniveau, …)
• Zusätzlich die Bedingung der homogenen Regressionskoeffizienten erfüllt sein:
– Innerhalb jeder Gruppe wird eine Regressionsgerade bestimmt.
– Der Regressionskoeffizient (b) darf sich nicht zwischen den Gruppen
unterscheiden, d.h. die Koeffizienten in der Population (β) müssen gleich
sein.
– Statistische Überprüfung: siehe Bortz
09_ancova
22
Voraussetzung der Kovarianzanalyse
Voraussetzung der Kovarianzanalyse
• Es gelten die normalen Voraussetzungen der ANOVA (Varianzhomogenität, Intervallskalenniveau, …)
• Zusätzlich die Bedingung der homogenen Regressionskoeffizienten erfüllt sein:
– Innerhalb jeder Gruppe wird eine Regressionsgerade bestimmt.
– Der Regressionskoeffizient (b) darf sich nicht zwischen den Gruppen
unterscheiden, d.h. die Koeffizienten in der Population (β) müssen gleich
sein.
– Statistische Überprüfung: siehe Bortz
09_ancova
23
SPSS
09_ancova
24
SPSS
Syntax:
glm av by gruppe with kov.
09_ancova
25
SPSS
Adjustierte
Quadratsummen!
09_ancova
F-Test für den Einfluss
der UV auf die AV, bei
Kontrolle der Kovariate
26
SPSS
Vergleich: Ergebnis ohne Kovariate
09_ancova
27
Kovarianzanalyse
Zusammenfassung
• Die Kovarianzanalyse ist eine Varianzanalyse der
Regressionsresiduen
• Ziel: Statistische Kontrolle einer potentiellen Störvariablen.
• Berechnung:
– Zerlegung der Quadratsummen von Kovariate und AV
– Zerlegung der Produktsummen
– Berechnung der modifizierten Quadratsummen
– F-Test
– Ggf.: Kontrolle der Fehlervarianzreduktion
09_ancova
28