Varianzanalyse

Download Report

Transcript Varianzanalyse

Varianzanalyse und Eta²
• (Benninghaus S 344-367)
• Varianzanalyse: Verfahren, um den Zusammenhang zwischen
einer intervallskalierten abhängigen und einer beliebig (meist
nominal, mit wenigen Kategorien) skalierten unabhängigen
Variablen zu ermitteln. Anders formuliert: Es geht um die
Unterschiede in einer AV zwischen Gruppen von
Untersuchungseinheiten, z.B. Unterschied im Einkommen
zwischen Männern und Frauen
• Eta ist das Maß für den Zusammenhang zwischen UV und AV,
Eta² ist der Anteil der erklärten Varianz an der Gesamtvarianz
bzw. die proportionale Fehlerreduktion
• Eta setzt keine Linearität des Zusammenhangs voraus (macht
bei nominalskalierten Variablen auch keinen Sinn)
• ist ein Maß für asymmetrische Hypothesen: es wird zwischen
unabhängiger und abhängiger Variable unterschieden
Varianzanalyse und Eta²
• Theoretisch kann man Eta auch für 2 intervallskalierte
Variablen verwenden, indem man die UV in wenige
Kategorien klassifiziert. Das ist allerdings meist wenig
sinnvoll, weil Eta mit der Anzahl der Kategorien schwankt (je
mehr Kategorien, desto größer Eta).
• Ein solches Verfahren ist nur bei nicht-linearen
Zusammenhängen sinnvoll.
• In dem Fall gibt es theoretisch 2 Etas, je nachdem, welches die
AV ist.
• Eta ist immer größer als die Korrelation r, weil Eta auch die
nicht-linearen Anteile von Zusammenhängen berücksichtigt.
• Im Unterschied zur Korrelation ist Eta vorzeichenlos und
reicht von 0 bis 1.
graphische Veranschaulichung
AV
.
..
….
..
.
.
…
…..
….
1
2
UV
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Ohne Kenntnis der UV
sagen wir für jede
Untersuchungseinheit bei
der Variable y den
Mittelwert y quer vorher.
• Der Fehler, den wir dabei
machen, ist die Summe aller
quadrierten Abweichungen
der Messwerte aller
Untersuchungseinheiten
vom Mittelwert y quer
(Gesamtvariation)
( y  y )
i
2
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Mit Kenntnis der UV sagen
wir für jede
Untersuchungseinheit bei
der Variable y den
Mittelwert der
entsprechenden Kategorie
der UV vorher.
• Der Fehler, den wir dabei
machen, ist die Summe aller
quadrierten Abweichungen
der Messwerte aller
Untersuchungseinheiten von
dem Mittelwert in der
Kategorie der UV (nicht
erklärte Variation)
(
y

y
)
 i j
2
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Erklärte Variation
dagegen sind die
quadrierten
Abweichungen der
Kategorienmittelwerte
vom Gesamtmittelwert
y quer
( y
j
 y)
2
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Varianzzerlegung:
Die Gesamtvariation ist die Summe der erklärten und
nicht erklärten Variation.
Die Gesamtvarianz ist die Summe der erklärten und
der nicht erklärten Varianz:
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Variationszerlegung bei R² (zur Erinnerung)
( y  y)  ( y'  y)  ( y  y' )
2
i
2
i
i
2
i
• Variationszerlegung bei Eta²
( y  y)  ( y
2
i
gesamte
erklärte
 y)  ( yi  y j )
2
j
nicht erklärte Variation
2
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Fehlerreduktion (E1-E2) / E1
• (Gesamtvariarion – nicht erklärte Variation)
geteilt durch Gesamtvariation
• identisch mit erklärte Variation durch
Gesamtvariation
• man erhält die gleichen Werte, wenn man statt der
Variation die Varianz verwendet
Erläuterung der proportionalen Fehlerreduktion (PRE)
• Fehlerreduktion (E1-E2) / E1
E1  ( yi  y)
E2  ( yi  y j )2
2
E1  E2
 

E1
2

2
 ( y  y)   ( y  y )
 ( y  y)
2
i
2
i
n ( y  y)


 ( y  y)
j
i
2
i
i
2
j
2
Interpretation
Interpretation Eta: das Maß für den Zusammenhang zwischen beiden
Variablen
Interpretation Eta²: der Anteil der durch x erklärten Varianz von y an der
Gesamtvarianz von y (damit ist aber noch keine kausale Aussage verknüpft)
oder: Proportionale Fehlerreduktion: Um wie viel sinkt der Fehler bei der
Vorhersage der AV, wenn man die UV kennt?
Wenn Eta² = .20 ist, sinkt der Vorhersagefehler um 20 Prozent.
Arbeitstabelle für Gesamtvariation
yi
fi
fi yi
( yi  y )
( yi  y )2
fi ( yi  y )2
3
2
6
-2
4
8
5
2
10
0
0
0
7
2
14
2
4
8
 16
Arbeitstabelle für erklärte Varianz
nj
yj
( y j  y)
( y j  y ) 2 n j ( y j  y)2
3
3.7
-1.3
1.7
5.1
3
6.3
1.3
1.7
5.1
 = 10.2