Transcript Termin 11

Einführung in SPSS/PASW
SEMINAR: DATENERHEBUNG
Inhaltsübersicht
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Intro (02.11.2010)
Deskriptive Statistik (09.11.2010)
Ausgaben (16.11.2010)
Grafik und Übungen (23.11.2010)
Wiederholung (30.11.2010)
Datentyp Datum (07.12.2010)
Theorie 1 (14.12.2010)
Theorie 2 (11.01.2011)
Korrelationskoeffizient (18.01.2011)
Regression & Tests (25.01.2011)
ANOVA & Klausurvorbereitung(01.02.2011)
Varianzanalyse (ANOVA)
 ANOVA: analysis of variance
 Sie dient dem Vergleich dreier oder mehrerer
Gruppenmittelwerte
 ein-faktoriell vs. mehr-faktoriell
 Vergleiche ich die Gruppenmittelwerte nur einer
Variablen (ein-faktoriell) oder möchte ich
Wechselwirkungen der Gruppen zwischen
mehreren Variablen untersuchen (mehrfaktoriell)?
Aufstellen eines einfaktoriellen Modells
 Untersuchungsgegenstand: Merkfähigkeit im
Alter
 Wir haben 3 Gruppen G: jung, mittel, alt
 G1, G2, G3
 Null-Hypothese: Die Erwartungswerte der
verschiedenen Altersklassen sind gleich
Kochrezept 11_1
 Titel: Berechnen Sie eine ANOVA mit den
Faktoren X1,…,Xn für die Variable Y
 Ziel: Mittelwerte von mehr als 2 Gruppen
vergleichen (ist n größer 1, also hat man
mehrere Faktoren, greift man auf die
multifaktorielle ANOVA zurück – siehe Ende
des Rezepts)
PostHoc-Tests
 Gebräuchlich ist Bonferroni, aber die Liste ist
lang
Multifaktorielle ANOVA
Ergebnis einer ANOVA
 Die Varianz-Analyse liefert Ihnen die
Irrtumswahrscheinlichkeit p=.0001 für den Wert t=31,917
der Testgröße F. Die Null-Hypothese sollte abgelehnt
werden, d.h. es liegt mindestens ein signifikanter
Unterschied zwischen den Erwartungswerten der
Gruppen vor.
Ergebnis der post-hoc
Betrachtung
 Betrachtung der Mittelwerte verdeutlicht,
dass die Merkfähigkeit signifikant mit dem
Alter abnimmt - traurig, aber wahr.
Übungen
1.
2.
3.
Führen Sie eine einfache Varianzanalyse für die Variable cpitn
(Behandlungsbedürftigkeit des Gebisses) aus der Arbeitsdatei
zahn.sav jeweils mit den Variablen alter (Alter), g (Geschlecht), s
(Schulabschluß), pu (Putzhäufigkeit), zb (Wechsel der
Zahnbürste) und beruf als mögliche Faktoren durch. Hinweise:
Wie lauten Ihre Hypothesen? Sollten die Hypothesen verworfen
oder nicht verworfen werden? Welche Mittelwerte sind jeweils
signifikant unterschiedlich (post-hoc Tests)?
Welche Voraussetzungen sollten vor einer Varianz-Analyse
überprüft werden und welche Möglichkeiten gibt es hierzu?
(Stichworte: Normalverteilung, Varianzhomogenität)
Besteht für das Einkommen ein signifikanter Unterschied bzgl.
der Schulbildung? Verwenden Sie passende Variablen für
Einkommen und Schulbildung aus der Arbeitsdatei
allbus90.sav, um diese Fragestellung zu untersuchen. Welche
anderen Faktoren könnten einen Einfluß haben?
Referenzen
 Übungen und Datensätze adaptiert aus:
 Statistische Datenanalyse mit SPSS für
Windows: Grundlegende Konzepte und
Techniken, Universität Osnabrück.
Rechenzentrum, Dipl.-Math. Frank Elsner
Klausurvorbereitung
SEMINAR: DATENERHEBUNG
Parametrische Verfahren
Abhängige Stichproben
Unabhängige Stichproben
Univariat
Multivariat
Univariat
t-Test für
abhängige
Stichproben
Varianzanalyse
mit Messwiederholung
t-Test für
Unabhängige
Stichproben
Multivariat
Varianzanalyse
ohne Messwiederholung
Nicht-Parametrische Verfahren
Abhängige Stichproben
Unabhängige Stichproben
Univariat
Multivariat
Univariat
Multivariat
WilcoxonTest
FriedmannTest
U-Test
H-Test
Klausurvorbereitung
 Auflisten möglicher Klausurinhalte
 Wiederholung (aller, wenn wir so weit
kommen) möglicher Aufgabenstellungen
anhand eines Beispieldatensatzes
 Es können durchweg Fragen gestellt werden
Mögliche Prüfungsinhalte 1/4
 Daten einlesen
 .sav öffnen
 Textdaten einlesen (.xls, .xlsx)
 Daten aufbereiten
 Variablen berechnen
 z.B. um Altersgruppen zu erstellen
 Variablen umkodieren
 Daten aufteilen
 Daten filtern
Mögliche Prüfungsinhalte 2/4
 Explorative Datenanalyse & -kontrolle
 Mittelwerte anschauen
 Wertelabels prüfen
 Via Diagrammen ein Gefühl für die Daten bekommen / sie auf
Plausibilität testen






Kreuztabellen
Histogramme
Streudiagramme
Boxplot
Häufigkeitabellen
Fehlerbalkendiagramme
 Dateneigenschaften testen
 Normalverteilung der Daten? – Kolmogorov-Smirnov (Lillifors)
 Abhängigkeit zwischen Variablen? – Chi²
Mögliche Prüfungsinhalte 3/4
 Korrelationen
 Korrelationskoeffizient
 Lineare Regression
 Hypothesentesten
 Mittelwertsvergleich von 2 Gruppen, sind sie
unterschiedlich? – T-Test
 Mittelwertsvergleich von mehr als 2 Gruppen –
ANOVA
 Mittelwertsvergleich über verschiedene Faktoren
– multifaktorielle ANOVA
Mögliche Prüfungsinhalte 4/4
Wichtig bleibt bei allen statistischen
Berechnungen, dass Ihr die Ergebnisse
auslesen und interpretieren könnt
 SPSS-Tabellen auf das Wesentliche hin sondieren
 Generieren und verstehen statistischer
Fragestellungen
 Stichprobengrößen
 Begründung der Wahl eines statistischen Tests
Übungsdatensatz (IQ & EQ)
Ist der Datensatz so in Ordnung?
1.

Prüft anhand eines geeigneten Diagramms oder einer Tabelle, ob der
Datensatz für die statistischen Analysen bereit ist
Gibt es einen Unterschied zwischen Männern und Frauen in den
Quotienten?
2.


Abhängig oder unabhängig?
Prüfen Sie diese Hypothese anhand eines t-Test und geben Sie in 2
Sätzen das Ergebnis wieder
Gleichen sich die beiden IQ-Maße?
3.


Abhängig oder unabhängig?
Prüfen Sie diese Hypothese anhand eines t-Test und geben Sie in 2
Sätzen das Ergebnis wieder
Berechnet eine Multiple Regression der Testleistung auf
Nervenleitgeschwindigkeit, IQ_IST und EQ_r.
4.

Welche Rückschlüsse könnt ihr anhand der Regressionskennwerte
ziehen?
Vielen Dank für Eure
Aufmerksamkeit