01_multiple_korrelation

Download Report

Transcript 01_multiple_korrelation

Multiple Korrelation
Gliederung
• Partialkorrelation
• Semipartialkorrelation
• Multiple Korrelation
• Inkrementelle Validität
• Beispiele für multiple Korrelationen
• Multiple Korrelation in SPSS
01_multiple_korrelation
1
Ziel der Multiplen Korrelation
Ziele der Multiplen Korrelation
• Die Multiple Korrelation befasst sich mit dem Zusammenhang
mehrere Variablen untereinander.
• Es wird die Frage beantwortet, wie viel Varianz ein Kriterium mit
mehreren Prädiktoren gemeinsam hat.
• Die MK stellt damit eine Vorstufe der Multiplen Regression dar.
Beispiel
• Wie eng ist der Zusammenhang der Lebenszufriedenheit mit
körperlicher Gesundheit, Einkommen, und Optimismus?
01_multiple_korrelation
2
Aufgeklärte Varianz
Der Anteil aufgeklärter Varianz wird oft durch Venn-Diagramme
veranschaulicht:
Varianz von X
Varianz von Y
r²
1-r²
Gemeinsame
Varianz
01_multiple_korrelation
3
Aufgeklärte Varianz
Aufgeklärte Varianz
• Die MK gibt an, wie viel Varianz des Kriteriums durch die
Prädiktoren aufgeklärt wird.
• Bei einem bivariaten Zusammenhang wird der Anteil der
aufgeklärten Varianz durch den Determinationskoeffizienten
angegeben: r²
• Die Varianz des Kriteriums setzt sich additiv aus erklärbarer
Varianz und nicht erklärter Varianz zusammen:


s  r  s  1 r  s
2
y
2
Aufgeklärte
Varianz
01_multiple_korrelation
2
y
2
2
y
nicht-erklärbare
Varianz
4
Partialkorrelation
Problem:
• psychologische Merkmale hängen in aller Regel von vielen
Faktoren (Variablen) ab.
• Die Korrelation zweier Variablen wird meist von (mehreren)
dritten Variablen beeinflusst / vermittelt.
Beispiel:
x: Anzahl von Badeunfällen im Freibad
y: Menge des konsumierten Speiseeises
Lösung:
Konstanthalten/Eliminieren bekannter Drittvariablen durch die
Partialkorrelation (rxy.z)
01_multiple_korrelation
5
Partialkorrelation
Die Partialkorrelation im Venn-Diagramm:
x
x.z
y
z
y.z
2
xy.z
r
Die quadrierte Partialkorrelation r²xy.z ist der
Anteil der Varianz von x, den die Variable y
erklärt, wenn z aus beiden Variablen
herauspartialisiert wird.
01_multiple_korrelation
6
Partialkorrelation
Definition
- Die Partialkorrelation rxy.z beschreibt den linearen
Zusammenhang von zwei Variablen, …
- … aus dem der Einfluss einer dritten Variable eliminiert wurde.
 „Korrelation der Variablen x und y, nachdem eine Variable z aus x
und y herauspartialisiert wurde“
01_multiple_korrelation
7
Partialkorrelation
(Theoretisches) Vorgehen:
- Die Variablen x und y
werden durch eine Regression
auf z residualisiert.
- Anschließend werden die
Residuen miteinander korreliert.
01_multiple_korrelation
8
Partialkorrelation
Beispiel: Gewichtabnahme durch Sport
- Fragestellung: Wie stark hängt das Körpergewicht von sportlicher
Betätigung ab?
-
Gemessen werden:
-
Gewichtsabnahme (y)
Trainingsdauer (x1)
Kalorienaufnahme (x2)
- Dabei ergeben sich folgende Korrelationen
y
y
1.0
x1
x2
01_multiple_korrelation
x1
x2
.43 -.51
1.0
.41
1.0
9
Partialkorrelation
y
x1
x2
• Fragestellung: Wie stark hängt der
y
1.0 .43 -.51
Gewichtsverlust vom Training ab?
 r(y, x1) = .43
x1
1.0 .41
• Aber: Der Gewichtsverlust hängt auch
x2
1.0
mit der Kalorienaufnahme zusammen.
 Wie hoch wäre die Korrelation zwischen Training und Gewichtsverlust, wenn alle Probanden gleich viele Kalorien zu sich
genommen hätten?
• Berechnung der Partialkorrelation:
rx1 y . x2
rx1 y  ryx2  rx1x2
.43  (.51)  .41


 .81
(1  .26)  (1  .17)
(1  ryx2 2 )  (1  rx21x2 )
01_multiple_korrelation
10
Semipartialkorrelation
Die Semipartialkorrelation rx(y.z)
• Die Semipartialkorrelation ist die Korrelation der Variablen x mit
y, nachdem z nur aus y „herauspartialisiert“ wurde.
• Mit der Semipartialkorelation kann berechnet werden, wie viel
Varianz von y durch x zusätzlich zu z aufgeklärt werden kann.
• Beispiel:
– „Wie viel Varianz des Gewichtsverlusts (y) erklärt das Training (x) zusätzlich
zur Kalorienaufnahme (y)?“
01_multiple_korrelation
11
Semipartialkorrelation
Die Semipartialkorrelation im Venn-Diagramm:
x
x
y
z
y.z
2
x ( y. z )
r
Die quadrierte Semipartialkorrelation r²x(y.z) ist
der Anteil der Varianz von x, den die Variable y
zusätzlich zu z erklärt.
01_multiple_korrelation
12
Semipartialkorrelation
• Fragestellung: Wie viel Varianz des
Gewichtsverlusts erklärt das Training
zusätzlich zur Kalorienaufnahme?
y
y
1.0
x1
x2
x1
x2
.43 -.51
1.0
.41
1.0
• Berechnung der Semipartialkorrelation:
ry ( x1 . x2 ) 
ryx1  ryx2  rx1x2
1  r 
2
x1 x2
.43   .51  .41 .64


 .70
2
.91
1  .41
ry2( x1 . x2 )  .702  .49
01_multiple_korrelation
13
Zusammenfassung
• Partialkorrelation rxy.z
– Herauspartialisieren eines dritten
Merkmals aus beiden Variablen
x.z
y.z
• Semipartialkorrelation rx(y.z)
– Herauspartialisieren eines dritten
Merkmals aus nur einer Variable
01_multiple_korrelation
x
y.z
14
Multiple Korrelation
Die Multiple Korrelation
• Der Multiple Korrelationskoeffizient (R) erfasst den Zusammenhang
zwischen mehreren Prädiktorvariablen und einem Kriterium.
• Dies entspricht der Korrelation zwischen einem durch mehrere
Prädiktoren vorhergesagtem Kriterium ( Multiple Regression)
und dem tatsächlichem Kriteriumswert.
• Beispiel:
– Wie stark hängt der Gewichtsverlust vom Training und der
Kalorienaufnahme gemeinsam ab?
– Wie viel Varianz des Gewichtsverlustes können durch beide Variablen
gemeinsam aufgeklärt werden?
• R  vereinigter Zusammenhang aller Prädiktoren mit Kriterium
• R²  Anteil der durch alle Prädiktoren aufgeklärten Varianz
= Maß für die Effektstärke bei der multiplen Regression
01_multiple_korrelation
15
Multiple Korrelation
y
x1
x2
– Wie stark hängt der Gewichtsverlust vom Training
y 1.0 .43
und der Kalorienaufnahme gemeinsam ab?
x1
1.0
– Wie viel Varianz des Gewichtsverlustes können
durch beide Variablen gemeinsam aufgeklärt werden?
x2
-.51
• Fragestellung:
.41
1.0
• Berechnung der Multiplen Korrelation (für zwei Prädiktoren):
Ry . x1x2 
rx21 y  rx22 y  2  rx1x2  rx1 y  rx2 y
1  rx21x2
.18  .26  2  .41 .43  .51
.62


 .86
1  .17
.83
01_multiple_korrelation
16
Multiple Korrelation
ryx
(bivariate Korrelation)
x
Ry.xz
(multiple Korrelation)
x
y
y
z
z
rxy2
01_multiple_korrelation
Ry2.xz
17
Multiple Korrelation
2
y. xz
R
x
01_multiple_korrelation
2
y ( z. x )
x
x
y
z
 r r
2
yx
=
y
z
+
y
y
z
18
Multiple Korrelation
x
x
x
=
y
z
+
y
z
x
…
y
z
01_multiple_korrelation
…
y
y
z
x
y
z
19
Inkrementelle Validität
Inkrementelle Validität
• Eine Variable besitzt inkrementelle Validität, wenn ihre Aufnahme
als zusätzlicher Prädiktor den Anteil der aufgeklärten Varianz (R²)
am Kriterium erhöht.
• D.h. eine Variable mit inkrementeller Validität verbessert die
Vorhersage des Kriteriums.
x
y
z
01_multiple_korrelation
20
Inkrementelle Validität
Beispiel
• Aufgeklärte Varianz:
– x1 klärt 36% der Varianz von y auf
– x2 klärt 20% der Varianz von y auf
y
x1
x2
y
x1
x2
1.0
.60
.45
1.0
.30
• Frage: besitzt x2 inkrementelle Validität?
 Berechnung der Varianz, die durch x1 und x2 gemeinsam
aufgeklärt wird:
1.0
.36  .20  2  .30  .60  .45
 .66
2
1  .30
 .662  .44
R y . x1x2 
R y2. x1x2
• Fazit: Weil R²y.x1x2 > r²yx1 klärt x2 also auch einen Varianzanteil auf
 x2 besitzt inkrementelle Validität!
01_multiple_korrelation
21
Beispiele für multiple Korrelationen
Einige Spezialfälle der Multiplen Korrelation
a. Nullkorrelation
b. Ein Prädiktor korreliert
c. Inkrementelle Validität
d. Keine inkrementelle Validität
e. Suppressor-Effekt
01_multiple_korrelation
22
Beispiele für multiple Korrelationen
Beispiel a: Nullkorrelation
y
.00  .00  2  .60  .00  .00
 .00
2
1  .60
 .002  .00
R y . x1x2 
R y2. x1x2
• Wenn keiner der Prädiktoren mit dem
Kriterium korreliert, ist die multiple
Korrelation immer R² = 0.
01_multiple_korrelation
y
x1
x2
1.0
.00
.00
1.0
.60
x1
x2
1.0
x2
x1
y
23
Beispiele für multiple Korrelationen
Beispiel b: Ein Prädiktor korreliert
R y . x1x2
R y2. x1x2
.36  .00  2  .00  .60  .00

 .60
2
1  .00
 .602  .36
• Wenn nur ein Prädiktoren mit dem
Kriterium korreliert, ist die gemeinsame
Vorhersage ist genauso gut, wie die
Vorhersage durch x1 alleine.
(Ausnahme: siehe Suppressor-Effekt)
• x2 besitzt keine inkrementelle Validität.
01_multiple_korrelation
y
y
x1
x2
1.0
.60
.00
1.0
.00
x1
x2
1.0
y
x1
x2
24
Beispiele für multiple Korrelationen
Beispiel c: Inkrementelle Validität
y
R y . x1x2
R
2
y . x1 x2
.36  .20  2  .30  .60  .45

 .66
2
1  .30
 .662  .44
x1
y
x1
x2
1.0
.60
.45
1.0
.30
x2
1.0
x1
• Beide Prädiktoren besitzen inkrementelle
Validität!
01_multiple_korrelation
y
x2
25
Beispiele für multiple Korrelationen
Beispiel d: Keine Inkrementelle Validität
y
R y . x1x2
R
2
y . x1 x2
.36  .20  2  .80  .60  .45

 .60
2
1  .80
 .602  .36
x1
x2
y
x1
x2
1.0
.60
.45
1.0
.80
1.0
• Weil R²y.x1x2 = r²yx1 besitzt x2 keine
inkrementelle Validität!
01_multiple_korrelation
26
Beispiele für multiple Korrelationen
Beispiel e: Suppressor-Effekt
y
R y . x1x2
R
2
y . x1 x2
.30  .00  2  .55 .55  .00

 .66
2
1  .55
 .662  .43
• Obwohl y und x2 nicht korrelieren, ist
R²y.x1x2 > r²yx1.
• x2 besitzt demnach inkrementelle Validität!
• Diese liegt daran, dass der Anteil von x1,
der nichts mit x2 gemeinsam hat, y
besonders gut vorhersagen kann.
01_multiple_korrelation
y
x1
x2
1.0
.55
.00
1.0
.55
x1
x2
1.0
y
x1
x2
27
Beispiele für multiple Korrelationen
Ein Suppressor Effekt liegt also vor, wenn
• … ein Prädiktor nicht mit dem Kriterium korreliert
• … aber trotzdem die Varianzaufklärung verbessert.
• Dies ist der Fall, wenn der Prädiktor mit anderen Prädiktoren
deutlich korreliert.
01_multiple_korrelation
28
Die Multiple Korrelation in SPSS
SPSS - Menubefehl
• In SPSS wird die Multiple
Korrelation als Teil der
(Multiplen) Regression
berechnet.
01_multiple_korrelation
29
Die Multiple Korrelation in SPSS
SPSS - Syntax
regression
/dependent gv
/method enter training kalorien.
01_multiple_korrelation
30
Die Multiple Korrelation in SPSS
SPSS - Ausgabe
Modellzusammenfassung
Korrigiertes Standardfehler
R-Quadrat des Schätzers
Modell
R
R-Quadrat
1
,546a
,298
,273
3,03409
a. Einflußvariablen : (Konstante), kalorien, training
• Die komplette SPSS-Ausgabe wird detailliert im nächsten Kapitel
(Multiple Regression) besprochen.
01_multiple_korrelation
31
Zusammenfassung
• Partialkorrelation
Herauspartialisieren eines zusätzlichen Prädiktors aus allen anderen
Variablen.
• Semipartialkorrelation
Herauspartialisieren eines zusätzlichen Prädiktors aus einem anderen
Prädiktor
• Multiple Korrelation
Varianzaufklärung mit mehreren Prädiktoren
– Inkrementelle Validität: durch einen Prädiktor zusätzlich erklärte Varianz
– Suppressor-Effekt: Ein Prädiktor verbessert die multiple Korrelation ohne
dass er mit dem Kriterium korreliert.
01_multiple_korrelation
32