Folien - Johannes Gutenberg

Download Report

Transcript Folien - Johannes Gutenberg

Methoden der
Psychologie
Multivariate Analysemethoden
28.10.2013
Günter Meinhardt
Johannes Gutenberg Universität Mainz
Methoden der
Psychologie
Vorlesung
Einführung
Verfahrensdarstellung in
•
•
•
•
•
Übung/Tut
Was sind multivariate Analysemethoden?
Überblick
Grundprinzip
wichtigsten mathematischen Beziehungen
Anwendungsbeispielen
Durchführung mit Excel und Statistica
Vermittlung von Hintergründen/Voraussetzungen
• Grundlagen der linearen Algebra
• Wiederholung / Durcharbeiten der Beispiele
• Aufgaben und Anwendungen auf verwandte
Probleme
Prüfung
• Klausur zum Abschluss des Moduls gemeinsam mit
Testtheorie
Methoden der
Psychologie
Literatur
Einführung
Was sind multivariate Analysemethoden?
a)
b)
c)
d)
Methoden der
Psychologie
Inhalte im
WS 2013/14
Was sind multivariate Analysemethoden?
Einführung
Multivariate Methoden
Vektoren / Matrizen
Faktorenanalyse
Multivariates Testen
Multivariate
Distanz
Multidimensionale
Skalierung
Multivariate
Klassifikation
Methoden der
Psychologie
Einführung
Was sind multivariate Analysemethoden?
Einteilung
Multivariate Analysemethoden
Latente Variable
Konkrete Variable
•
•
•
•
•
• Multiple/Logistische
Regression
• T2 / MANOVA
• Conjoint Measurement
• Kanonische Korrelation
Faktorenanalyse
Diskriminanzanalyse
MDS
Kanonische Korrelation
LISREL
Methoden der
Psychologie
Latente
Variable
Latente Variable
Verfahren
Multidimensionale Skalierung
Problem:
Positionierung von Messobjekten in einem latenten Raum
(hier: Wahrnehmungsraum)
Möglichkeiten:
Faktorenanalyse
Multidimensionale
Skalierung
Methoden der
Psychologie
Latente
Variable
Einführung
Was sind multivariate Analysemethoden?
Faktor / MDS
Demo - Beispiel mit Excel und Statistica
Methoden der
Psychologie
Einführung
Was sind multivariate Analysemethoden?
Multivariates
Testen
Grundüberlegungen zum Unterschied des
Testens mit einer AV und mehreren AVs
Grundprinzip und Beispiel anhand einer 2
Vars – 2 Groups Diskriminanzanalyse
Methoden der
Psychologie
Beispiel
Mittelwertsprüfung bei mehreren Variablen
Lebenszufriedenheit
Privatsphäre
Arbeit
10 Variablen
X1: Gehalt
X4: Ehe
X2: Entscheidungsfreiheit
X3: Qualität der Kommunikation
X5: Freunde/Beziehungen
X6: Sexualität
Person
Aktivität
X7: Lebensansprüche
X9: Hobbies
X8: Sinnhaftigkeit
X10: Sport/Fitness
(x1 , x2 ,K , x10 )
2 Gruppen
Gesunde
Herzinfarktpatienten
Methoden der
Psychologie
Multivariate Mittelwertsvergleiche - Einzeltestungen
Frage
Unterscheiden sich Gesunde und Patienten im Variablenkomplex Lebenszufriedenheit?
Teststrategie
Wir testen auf jeder der 10 Skalen den Gruppenunterschied
mit einem t- Test. Wenn irgend einer der Tests signifikant
wird, sehen wir die Gruppen als verschieden an.
Probleme
1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.
2. Unterstellte Unabhängigkeit: Man behandelt die einzelnen
Skalen als unabhängig voneinander.
3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als
Variablenkomplex mit Binnenstruktur behandelt.
4. Mangelnde Teststärke: Man nutzt nicht die Korrelationsstruktur der Variablen für einen leistungsfähigen Test.
Ausweg
Verwendung eines multivariaten Tests, der die Information
aller 10 Variablen und ihrer Korrelationsstruktur in eine
statistische Prüfgrösse einfliessen lässt.
Methoden der
Psychologie
Multivariate Mittelwertsvergleiche - Verfahren
Variablenkomplex
Multivariates
Testkonstrukt
(x1 , x2 ,K , x10 )
Multivariate Distanz
(Mahalanobisdistanz)
Optimale Linearkombination
(Linear Discriminant Function)
Multivariate Quadratsummen
(SSCP-Matrizen-Zerlegung)
Verfahren
Hotelling‘s T2
MANOVA
DiskriminanzAnalyse
Alle Verfahren entscheiden über den Gruppenunterschied im
gesamten Variablenkomplex mit einem statistischen Test
Methoden der
Psychologie
Grundprinzip
(2 Gruppen)
Multivariates Testen - Diskriminanzanalyse
Für die m Variablen
(x1, x2 ,K , xm )
finde eine Linearkombination zu einer neuen Variable
y = b0 + b1 x1 + b2 x2 + K + bm xm
so dass diese die Gruppen c1 und c2 optimal trennt.
Kriterium der
Optimierung
Das Optimierungskriterium für die Wahl der bj lautet
QS Between
erklärte Variation

 max
QSWithin
nicht erklärte Variation
Die der bj sind so zu wählen, dass auf der neuen Variable y
die Streuung zwischen den Gruppen zu der Streuung
innerhalb der Gruppen ein maximales Verhältnis hat.
Methoden der
Psychologie
2D-Beispiel
2D Beispiel
Diskriminanzanalyse
Man möchte trennen
2 Gruppen
Stechmücken
Blindmücken
c1
c2
Fühlerlänge
Flügellänge
x1
x2
anhand von
2 Variablen
Anforderung
• Maximale Gruppentrennung (Mittelwerte)
• Minimale Klassifikationsfehler (Fall-Klassifikation)
Methoden der
Psychologie
Variablenraum
2D Beispiel
Diskriminanzanalyse
Blindmücke
Regression Stechmücke
1.40
Stechmücke
Regression Blindmücke
1.20
1.00
x2
0.80
(Flügelänge)
0.60
0.40
0.20
0.00
0.00
0.10
0.20
0.30
x1
Ausgangslage
0.40
0.50
0.60
0.70
(Fühlerlänge)
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)
möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• In beiden Gruppen existiert eine Korrelation der Variablen
Fühlerlänge (X1) und Flügellänge (X2).
Methoden der
Psychologie
Variablenraum
2D Beispiel
Diskriminanzanalyse
x2
Blindmücke
Stechmücke
Bestes Kriterium auf
x2
x1
Bestes Kriterium auf
Problem
x1
• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)
möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).
• Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1
und X2 offenbar nicht.
Methoden der
Psychologie
Variablenraum
2D Beispiel
Diskriminanzanalyse
Blindmücke
1.40
Kriteriumsfunktion
Stechmücke
1.20
1.00
x2
0.80
(Flügelänge)
0.60
0.40
0.20
0.00
0.00
0.10
0.20
0.30
0.40
x1
Lösung
0.50
0.60
0.70
(Fühlerlänge)
Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2
Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2).
x2  b  ax1
Somit folgt die Klassifikationsfunktion
 c1 , wenn x2  ax1  b
g  x1 , x2   
c2 , wenn x2  ax1  b
Methoden der
Psychologie
Einfache
Lösung
2D Beispiel
Diskriminanzanalyse
Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen
Winkel a drehen !
x2
x2
Zentrierung
&
Rotation !
a
x1
a
x1
Die Varianz zwischen den Gruppen wird auf der Achse x‘1
maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert
das optimale Trennkriterium.
Methoden der
Psychologie
2D Beispiel
Diskriminanzanalyse
z-Standard
standardisiert
3.00
2.00
1.00
z2
0.00
-1.00
-2.00
-3.00
-3.00
-2.00
-1.00
0.00
z1
1.00
2.00
3.00
Methoden der
Psychologie
z-Standard
2D Beispiel
Diskriminanzanalyse
Koordinaten rotiert um a = 46° (clockwise)
3.00
2.00
1.00
z‘2
0.00
-1.00
-2.00
-3.00
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
z‘1
Diskriminanzfunktion
• Die neue x- Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßt
sich ein Kriterium zur optimalen Trennung beider Gruppen finden.
• Da eine Drehoperation auf die Diskriminanzfunktion geführt hat,
ist sie darstellbar als eine Linearkombination der alten Koordinaten:
z1  b1 z1  b2 z2
Methoden der
Psychologie
2D Beispiel
Diskriminanzanalyse
y: Linearkombination
y (Diskriminanzfunktion)
Kriterium y0
 cos a

 sin a
 sin a   z1   z1 
    
cos a  z2   z2 
z1 cos a  z2 sin a  z1
z1 sin a  z2 cos a  z2
Da y  z1 gilt
y  b1 z1  b2 z2
mit b1  cos a und b2   sin a
Koeffizienten
von y
[Excel-Beispiel]
Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem
Problem, den optimalen Drehwinkel a zu bestimmen. Hierfür braucht
man ein Kriterium der gewünschten maximalen Trennung, und die
Lösung des dahinter stehenden Maximierungsproblems.
Methoden der
Psychologie
2D Beispiel
Diskriminanzanalyse
z2
Rotation zur
y - Funktion
z1
y (Diskriminanzfunktion)
Kriterium y0
y (Diskriminanzfunktion)
Klassifikation
• Case-Classification durch einfachen Vergleich mit dem Kriterium y0.
• Prüfung des Gruppenunterschieds mit einem einfachen t - Test auf y.