Transcript 06_ttest(1)

Der t-Test
Gliederung
• Statistische Hypothesen
– Null- und Alternativhypothese
– Alpha- und Betafehler
– Statistische Entscheidungen
• Mittelwertsvergleiche mit dem t-Test
–
–
–
–
–
06_ttest(1)
Überblick: 3 Arten von t-Tests
Stichprobenkennwerteverteilung von Mittelwertsdifferenzen
Die t-Verteilung
Die Interpretation von t-Werten
Voraussetzungen des t-Tests
1
Statistische Hypothesen
• Die Inferenzstatistik macht Aussagen über eine Population, aus
welcher die untersuchten Stichproben gezogen wurden.
• Dabei werden statistische Hypothesen getestet.
• Statistische Hypothesen sind Erwartungen über Unterschiede
zwischen (bzw. Zusammenhänge von) Variablen.
• Statistische Hypothesen sollten immer vor einer Untersuchung
formuliert werden
• Beispiele für statistische Hypothesen:
– Frauen sind ängstlicher als Männer.
– Es besteht ein negativer Zusammenhang zwischen Ängstlichkeit und
Optimismus.
– Die Selbstsicherheit von Teilnehmer eines Kommunikationstrainigs ist nach
dem Training höher als vor dem Training.
06_ttest(1)
2
Statistische Hypothesen
Woher kommen die Hypothesen?
• Eine psychologische Untersuchung wird immer mit dem Ziel
durchgeführt, eine bestimmte Forschungsfrage zu beantworten.
• Beispiel: Wenn ein neues Therapieprogramm entwickelt wurde,
dann muss der Entwickler dieses Programms zeigen, dass es den
Teilnehmern nach der Therapie besser geht als vorher.
• Je nach Ziel des Programms wird eine Hypothese formuliert:
– Beispiel: „Teilnehmer weisen in einem Test zur Depressivität nach der
Therapie geringere Werte als vor der Therapie auf.“
06_ttest(1)
3
Nullhypothese und Alternativhypothese
• Bei statistischen Tests werden immer (unabhängig von der
Erwartung des beteiligten Forschers) zwei gegensätzliche
Hypothesen formuliert:
(a)
Die Nullhypothese (H0) besagt, dass es keinen Unterschied zwischen
zwei Populationen (bzw. keinen Zusammenhang zwischen zwei
Merkmalen) gibt.
(b) Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied
(bzw. einen Zusammenhang) gibt.
•
Es kann also immer nur eine von beiden Hypothesen zutreffen!
•
Die beiden statistischen Hypothesen (H0 und H1) werden
unabhängig von den tatsächlichen inhaltlichen Erwartungen
formuliert.
06_ttest(1)
4
Nullhypothese und Alternativhypothese
Es gibt zwei Formen der Alternativhypothese
• Eine ungerichtete Alternativhypothese (H1) besagt lediglich, dass
es einen Unterschied (bzw. einen Zusammenhang) gibt
(„zweiseitiger Test“).
– Diese Hypothese gilt als bestätigt,
• wenn Gruppe 1 größere Werte als Gruppe 2 hat
• wenn Gruppe 2 größere Werte als Gruppe 1 hat
• (bzw. wenn ein pos. oder ein neg. Zusammenhang zwischen zwei Variablen
besteht)
• Eine gerichtete Alternativhypothese (H1) spezifiziert die Richtung
des Unterschieds (des Zusammenhang) („einseitiger Test“).
– Beispiel: Es wird erwartet,
• dass Gruppe 1 größere Werte als Gruppe 2 hat.
• (bzw. dass ein pos. neg. Zusammenhang zwischen zwei Variablen besteht)
06_ttest(1)
5
Nullhypothese und Alternativhypothese
Formale Schreibweise
• Ungerichtete Alternativhypothese:
– H1: μ1 ≠ μ2
– H0: μ1 = μ2
• Gerichtete Alternativhypothese (1. Möglichkeit):
– H1: μ1 > μ2
– H0: μ1 ≤ μ2
• Gerichtete Alternativhypothese (2. Möglichkeit):
– H1: μ1 < μ2
– H0: μ1 ≥ μ2
• Die H0 hängt also von der Auswahl der H1 ab!
06_ttest(1)
6
Statistische Hypothesenprüfung
Grundgedanke eines statistischen Tests
• Bei der statistischen Hypothesenprüfung berechnet, wie
wahrscheinlich die empirischen (Mittel-)Werte der Stichprobe
sind, wenn in der Population die H0 gilt.
• Beispiel:
–
–
–
–
H0: μLOT, w = μLOT, m (Mittelwert LOT ist für Frauen und Männer gleich)
Gefundenes Ergebnis: xlot ,w  23.2 xlot ,m  22.9
Wie wahrscheinlich ist dieses Ergebnis, wenn die H0 gilt?
Problem: Exakte Werte einer kontinuierlichen Wahrscheinlichkeitsverteilung haben immer die Wahrscheinlichkeit 0.
– Lösung: Wie Wahrscheinlich ist es, einen Unterschied von 0.3 oder mehr
zu finden, wenn die H0 gilt?
– Wenn dies sehr unwahrscheinlich ist, wird die H0 verworfen, und die H1
angenommen
– Andernfalls wird die H0 beibehalten.
06_ttest(1)
7
Alphafehler und Betafehler
Fehler bei der statistischen Entscheidung
• Die statistische Entscheidung für die H0 oder die H1 wird aufgrund
von Wahrscheinlichkeiten gemacht
• Daher sind immer Entscheidungsfehler möglich
• Je nach der Entscheidung kann man zwei Fehler machen:
(1) Man entscheidet sich für die H1, obgleich zwischen den Populationsmittelwerten kein Unterschied existiert („α-Fehler“ bzw. „Fehler erster
Art“).
(2) Man entscheidet sich für die H0, obgleich es auf Populationsebene einen
bedeutsamen Unterschied gibt („β-Fehler“ bzw. „Fehler zweiter Art“).
•
Für Fehlertypen sollte vor einer Untersuchung die gewünschte
Wahrscheinlichkeit festgelegt werden (oft geschieht dies aber
nur für den Alpha-Fehler)
06_ttest(1)
8
Alphafehler und Betafehler
Das α-Niveau
• Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass ein Test
einen bedeutsamen Effekt anzeigt, obwohl in der Population kein
Effekt besteht:
– Wenn die Wahrscheinlichkeit für den gefundenen Effekt unter der H0
kleiner als α ist, wird die H0 verworfen und die H1 angenommen.
– Mit der Wahrscheinlichkeit α wird also die H1 fälschlicherweise
angenommen.
• Konventionen für das α-Niveau:
– (p ≤ 0.10  „marginal signifikantes“ Ergebnis)
– p ≤ 0.05  „signifikantes“ Ergebnis
– p ≤ 0.01  „hoch signifikantes“ Ergebnis
06_ttest(1)
9
Alphafehler und Betafehler
Das β-Niveau
• Das β-Niveau gibt an, wie wahrscheinlich es ist, dass ein Test
keinen bedeutsamen Effekt anzeigt, obwohl in der Population ein
Effekt besteht:
– Mit der Wahrscheinlichkeit β wird also die H0 fälschlicherweise
beibehalten.
• Konventionen für das β-Niveau…
– … gibt es leider nicht
– Es gibt jedoch eigentlich keinen Grund warum β>α sein sollte (obwohl das
in vielen Untersuchungen der Fall ist).
– β kann im Gegensatz zu α nicht frei gewählt werden, sondern ergibt sich
aus verschiedenen anderen Größen (u.a. aus dem gewählten α Niveau und
der Stichprobengröße)
06_ttest(1)
10
Statistische Entscheidungen
In der Population
gilt die
Testergebnis
Entscheidung
H0
H1
p>α
„H0“
korrekt
β
p<α
„H1 “
α
korrekt
06_ttest(1)
11
Der t-Test
Drei Formen des t-Tests
(1) Der t-Test für unabhängige Stichproben
–
–
Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen
unterscheiden
Beispiel: „Sind Frauen ängstlicher als Männer?“
(2) Der t-Test für abhängige Stichproben
–
–
Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei
Messzeitpunkten unterscheidet
Beispiel: „Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer
als vor der Therapie“
(3) Der Ein-Gruppen t-Test
–
–
06_ttest(1)
Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem
vorgegeben Wert unterscheidet
Beispiel: „Liegt der mittlere IQ einer Gruppe über 100?“
12
Der t-Test für unabhängige Stichproben
• Mit dem t-Test für unabhängige Stichproben wird verglichen, ob
sich zwei Populationsmittelwerte voneinander unterscheiden.
• Der t-Test gehört zu den parametrischen Testverfahren.
Parametrische Testverfahren setzen eine bestimmte
Verteilungsform (in der Regel die Normalverteilung) des
untersuchten Merkmals voraus.
• Daher bildet die Normalverteilung des untersuchten Merkmals
eine Voraussetzung für den t-Tests.
06_ttest(1)
13
Kennwert des t-Tests
Der Kennwert des t-Tests
• Der Kennwert des t-Tests ist die Differenz der Mittelwerte der
beiden Stichproben:
 x  x1  x2
• Der t-Test schätzt die bedingte Wahrscheinlichkeit :
p(  x | H 0 )
• Wenn p < α, wird die H0 verworfen und die H1 angenommen.
06_ttest(1)
14
Stichprobenkennwerteverteilung
Die Stichprobenkennwerteverteilung des t-Tests
• Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische
Stichprobenkennwerteverteilung der Mittelwertsdifferenzen
unter der Nullhypothese gebildet.
• Diese Verteilung gibt an, wie sich empirische Mittelwertsdifferenzen verteilen, wenn man sehr oft Stichproben zieht.
0.4
0.3
0.2
0.1
0.0
-10
06_ttest(1)
-5
0
5
10
x1 x2
15
Stichprobenkennwerteverteilung
0.4
Stichprobenkennwerteverteilung
• Wenn die H0 gilt, muss die Stichprobenkennwerteverteilung ihren Gipfel bei 0
haben.
• Die theoretische Verteilung von Mittelwertsdifferenzen ist bei
großen Stichproben normalverteilt.
• Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“
Verteilung.
• Wenn die Verteilung bekannt ist, kann die Wahrscheinlichkeit für
bestimmte Wertebereiche als „Fläche unter der Kurve“ bestimmt
werden.
0.3
0.2
0.1
0.0
-10
06_ttest(1)
-5
0
5
10
x1 x2
16
Stichprobenkennwerteverteilung
Der Standardfehler der Stichprobenkennwerteverteilung
• Der Standardfehler der Stichprobenkennwerteverteilung des
t-Tests hängt von den Standardabweichungen und den Größen
der beiden Teilstichproben ab:
ˆ x  x 
1
2
ˆ12
N1

ˆ 22
N2
• Der Standardfehler wird benötigt, um die gefundene
Mittelwertsdifferenz interpretieren zu können
06_ttest(1)
17
Stichprobenkennwerteverteilung
Die t-Verteilung
• Die empirische Mittelwertsdifferenz wird durch den
Standardfehler dividiert.
x1  x2
t df  
ˆ x1  x2
• Der resultierende Wert kann nun mit der t-Verteilung verglichen
werden.
• Die genaue For der t-Verteilung hängt von deren Freiheitsgraden
(df = degree of freedom) ab.
06_ttest(1)
18
Freiheitsgrade
Die Freiheitsgrade der t-Verteilung
• Die Freiheitsgrade der t-Verteilung berechnen sich als:
df  N1  N2  2
• Dabei beeinflussen die Freiheitsgrade die Form der t-Verteilung.
• Bei vielen Freiheitsgraden (df >120) ist die t-Verteilung nahezu
identisch mit der z-Verteilung.
• Je weniger Freiheitsgrade gegeben sind, desto schmalgipfliger
wird die t-Verteilung.
06_ttest(1)
19
Der t-Test für unabhängige Stichproben
Entscheidung über die Nullhypothese
• Mittels der t-Tabelle wird der empirische t-Wert interpretiert.
• Dazu wird ein kritischer t-Wert aus der t-Tabelle entnommen
– Der kritische t-Wert häng dabei ab:
• von den Freiheitsgraden,
• von dem gewählten Alpha-Nivea
• von der Art der Testung (einseitig vs. zweiseitig)
– Der kritische t-Wert definiert die Grenze des Bereichs für den empirischen
t-Wert, ab dem die H0 verworfen wird.
06_ttest(1)
20
Der t-Test für unabhängige Stichproben
0.4
einseitiger Test
(gerichtete H0)
0.3
H0
0.2
p = 1-
0.1
0
-3
zweiseitiger Test
(ungerichtete H0)
-2
-1
0
1
tkrit
2
3
0.4
0.3
0.2
H0
H1
0
-3
H1
p = 1-
0.1
06_ttest(1)
H1
-2
-1
0
1
2
tkrit
3
21
Der t-Test für unabhängige Stichproben
Entscheidungsregeln
• Einseitiger Test:
– Wenn temp > tkrit wird die H0 verworfen
• Zweiseitiger Test
– Wenn |temp| > tkrit wird die H0 verworfen
• In der t-Tabelle werden immer Werte für den einseitigen Test
angegeben.
• Für einen 2-seitigen Test muss tkrit so gewählt werden, dass ein
Bereich von α/2 „von der Verteilung abgeschnitten wird“
06_ttest(1)
22
Die t-Verteilung
df p=.800
1
1,376
2
1,061
3
0,978
4
0,941
5
0,920
6
0,906
7
0,896
8
0,889
9
0,883
10
0,879
20
0,860
30
0,854
40
0,851
50
0,849
60
0,848
70
0,847
80
0,846
90
0,846
100
0,845
200
0,843
06_ttest(1)
1000
0,842
p=.900 p=.950
3,078 6,314
2,920 2,920
2,353 2,353
2,132 2,132
2,015 2,015
1,943 1,943
1,895 1,895
1,860 1,860
1,833 1,833
1,812 1,812
1,725 1,725
1,697 1,697
1,684 1,684
1,676 1,676
1,671 1,671
1,667 1,667
1,664 1,664
1,662 1,662
1,660 1,660
1,653 1,653
1,646 1,646
p=.975
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,086
2,042
2,021
2,009
2,000
1,994
1,990
1,987
1,984
1,972
1,962
p=.990 p=.995
31,821 63,657
6,965 9,925
4,541 5,841
3,747 4,604
3,365 4,032
3,143 3,707
2,998 3,499
2,896 3,355
2,821 3,250
2,764 3,169
2,528 2,845
2,457 2,750
2,423 2,704
2,403 2,678
2,390 2,660
2,381 2,648
2,374 2,639
2,368 2,632
2,364 2,626
2,345 2,601
2,330 2,581
0.4
0.3
0.2
1-
0.1
0
-3
-2
-1
0
1
tkrit
2
3
Kritische t-Werte:
α = .05, einseitig, df=100:
tkrit(100) = 1.66
α = .05, zweiseitig, df=100:
tkrit(100) = 1.98
α = .01, einseitig, df=100:
tkrit(100) = 2.63
23
Der t-Test für unabhängige Stichproben
Arbeitsschritte beim t-Test für unabhängige Stichproben:
(1) Formulierung der (inhaltlichen und statistische) Hypothesen
–
(2)
(3)
(4)
(5)
(6)
(7)
gerichtet oder ungerichtet?
Erfassung des Merkmals in zwei unabhängigen Stichproben
Berechnung der Mittelwerte in beiden Stichproben
Schätzung der Populationsvarianz
Berechnung des Standardfehlers der Mittelwertsdifferenz
Berechnung des empirischen t-Werts
Bestimmung des kritischen t-Werts
–
aus df, α, und Art des Tests
(8) Entscheidung für H0 oder H1
06_ttest(1)
24
Voraussetzungen
Voraussetzungen des t-Tests für unabhängige Stichproben:
(1) Intervallskalenniveau der Variable
(2) Normalverteilung des Merkmals in der Grundgesamtheit
(3) „Varianzhomogenität“ (Gleiche Varianzen des Merkmals in
beiden Populationen)
(4) Unabhängigkeit der Stichproben
06_ttest(1)
25
Voraussetzungen
Normalverteilung des Merkmals in der Grundgesamtheit
• Die Normalverteilungsannahme kann statistisch überprüft
werden
– Dazu dient der Kolmogorov-Smirnov-Test (KS-Test).
• Die Verletzung der Normalverteilungsannahme ist vor allem bei
kleinen Stichproben problematisch (N<50).
• Bei Verletzung der Normalverteilungsannahme sollte ein nichtparametrisches Test verwenden werden (U-Test).
– Solche Verfahren haben aber immer eine höhere β-Fehler
Wahrscheinlichkeit, d.h. vorhandene Effekte können oft nicht
nachgewiesen werden.
06_ttest(1)
26
Voraussetzungen
Varianzhomogenität
• Auch die Varianzhomogenität kann statistisch überprüft werden
(Levene-Test).
• SPSS prüft die Varianzhomogenität automatisch bei jedem
t-Test für unabhängige Stichproben.
• Bei einem signifikanten Ergebnis (p < .05), werden die
Freiheitsgrade des Tests „korrigiert“.
dfcorr 
1
c2
(1  c 2 )

N1  1 N 2  1
ˆ x2
m it c  2
ˆ x  ˆ x22
1
1
06_ttest(1)
27
Zusammenfassung
• Zu Beginn einer empirischen Untersuchung wird die
Nullhypothese (H0) und die Alternativhypothese (H1) formuliert.
• Ein statistischer Test bezieht sich immer auf die Nullhypothese.
• Wenn ein empirisches Ergebnis unter der Nullhypothese sehr
unwahrscheinlich ist (p<α), wird diese verworfen und damit die
H1 angenommen.
• Mit der Wahrscheinlichkeit α wird also die H1 fälschlicher-weise
angenommen (Fehler erster Art)
• Der Fehler zweiter Art (β-Fehler) besteht darin, die H0
fälschlicherweise anzunehmen.
06_ttest(1)
28
Zusammenfassung
• Der t-Test für unabhängige Stichproben dient dazu, die
Ausprägung eines Merkmales zwischen zwei Gruppen zu
vergleichen.
• Unter Annahme der H0 kann eine theoretische Verteilung für
Mittelwertsdifferenzen bestimmt werden.
• Der empirische t-Wert ergibt sich als empirische Mittelwertsdifferenz dividiert durch den Standardfehler.
• Anhand der Anzahl der Freiheitsgrade und des vorher
festgelegten α-Niveaus wird ein kritischer t-Wert aus der Tabelle
zur t-Verteilung abgelesen.
• Wenn der empirische t-Wert größer als der kritischer t-Wert ist,
wird die H0 verworfen und damit die H1 angenommen.
06_ttest(1)
29
Zusammenfassung
• Voraussetzung für den t-Tests für unabhängige Stichproben sind
(a) Intervallskalenniveau der Variable; (b) Normalverteilung des
Merkmals in der Grundgesamtheit (c) „Varianzhomogenität“ und
(d) Unabhängigkeit der Stichproben
06_ttest(1)
30