German Stata User Meeting 2003 Tabellierung von Mehrfachantwortgruppen Zwei neue Programme Hilde Schaeper / [email protected].

Download Report

Transcript German Stata User Meeting 2003 Tabellierung von Mehrfachantwortgruppen Zwei neue Programme Hilde Schaeper / [email protected].

German Stata User Meeting 2003
Tabellierung von
Mehrfachantwortgruppen
Zwei neue Programme
Hilde Schaeper / [email protected]
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Bei HIS: Zwei Arten der Kodierung von
Mehrfachantwortfragen
1. Set von binären Variablen
In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen
aktiv mitgewirkt? (Mehrfachnennung möglich)
Ich habe in Gruppen an der Bearbeitung von Studienaufgaben mitgewirkt
lform1
Ich habe in praxis-/forschungsorientieten Projektstudien mitgearbeitet
lform2
Ich habe in kooperativen Studienprojekten von Hochschule und Betrieben/
Dienststellen gearbeitet
lform3
Ich habe freiwillige betriebliche Praktika absolviert
lform4
Ich habe in internationalen Zusammenhängen studiert
lform5
Ich war als Tutor/Tutorin eingesetzt
lform6
German Stata User Meeting, 12.08.2003
2
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
2. Set von polytomen Merkmalen
In welchen Fächern haben Sie Ihre Abiturprüfung abgelegt?
LK1
LK2
GK1
GK2
Haben Sie neben den für das Studium erforderlichen Lehrveranstaltungen auch Veranstaltungen innerhalb oder außerhalb der
Hochschule speziell mit dem Ziel der Verbesserung der Berufschancen besucht?
Mathematik
1
Physik
2
Chemie
3
Biologie
4
Geographie
5
Deutsch
6
Englisch
7
Französisch
8
1.
Spanisch
9
2.
Geschichte
10
Sozialkunde
11
usw.
fach1 fach2 fach3 fach4
German Stata User Meeting, 12.08.2003
ja
1
nein
2
Wenn ja, welche?
3.
lv1
lv2
lv3
3
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Die SPSS-Prozedur <mult response> (Beispiele)
1. univariate Verteilung dichotomer Mehrfachantwortvariablen
mult response groups=lehrform(lform1 to lform9 (1)) /freq=lehrform.
Mehrfachantworten
Group LEHRFORM (Value tabulated = 1)
Dichotomy label
Name
Formen:
Formen:
Formen:
Formen:
Formen:
Formen:
LFORM1
LFORM2
LFORM3
LFORM4
LFORM5
LFORM6
Gruppen
Projektstudien
koop. Studienprojekte
freiwillige Praktika
internationales Studium
Tutor/in
 --- snip ---
350 missing cases;
Count
5997
2557
814
2910
1432
1399
------Total responses
22728
Pct of
Responses
26,4
11,2
3,6
12,8
6,3
6,2
----100,0
Pct of
Cases
77,4
33,0
10,5
37,5
18,5
18,0
----293,2
7.752 valid cases
German Stata User Meeting, 12.08.2003
4
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
2. bivariate Verteilung dichotomer Mehrfachantwortvariablen
GESCHL
Count |männlich weiblich
Row pct |
Row
Col pct |
Total
|
1 |
2 |
LEHRFORM
--------+--------+--------+
LFORM1
| 2490 | 3507 | 5997
Formen: Gruppen
| 41,5 | 58,5 | 77,4
| 78,2 | 76,8 |
+--------+--------+
LFORM2
| 1074 | 1483 | 2557
Formen: Projektstudi | 42,0 | 58,0 | 33,0
| 33,7 | 32,5 |
+--------+--------+
 --- snip --+--------+--------+
Column
3186
4566
7752
Total
41,1
58,9
100,0
Percents and totals based on respondents
7.752 valid cases;
350 missing cases
German Stata User Meeting, 12.08.2003
5
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
3. Tabellierung polytomer Mehrfachantwortvariablen
mult response groups=lehrveranst(lv1 to lv3 (1, 99))/freq=lehrveranst.
Mehrfachantworten
Group LEHRVERA
Category label
Einsatz von EDV(-Programmen), Programmie
techn. Grundlagen der DV
EDV allgemein
Wirschaftsveranstaltungen
Jura-Veranstaltungen
Regionalstudien
Veranstaltungen zur Ökologie
(Fremd-)Sprachenveranstaltungen
Zusatzzertifikate
Pct of Pct of
Responses Cases
Code
Count
1
2
3
4
5
6
7
8
9
399
26
80
358
94
11
33
960
224
8,3
,5
1,7
7,4
1,9
,2
,7
19,9
4,6
12,5
,8
2,5
11,2
3,0
,3
1,0
30,2
7,0
99
53
------4826
1,1
----100,0
1,7
----151,6
 --- snip --Sonstiges
Total responses
4.919 missing cases;
3.183 valid cases
German Stata User Meeting, 12.08.2003
6
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Tabellierung von Mehrfachantwortvariablen in Stata
1. Dichotome Mehrfachantwortvariablen
a) <tabstat> (interner Ado-File)
tabstat lform1-lform6 [aw=gewinsg], statistics(mean count) ///
columns(statistics) format(%3.1f)
variable |
mean
N
------------+-------------------lform1 |
75,5
7752,0
lform2 |
31,3
7752,0
lform3 |
10,1
7752,0
lform4 |
37,3
7752,0
lform5 |
18,3
7752,0
lform6 |
18,0
7752,0
---------------------------------
German Stata User Meeting, 12.08.2003
7
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
a) <tabstat> mit by()-Option
tabstat lform1-lform3 [aw=gewinsg], statistics(mean count) ///
columns(statistics) format(%3.1f) by(geschl)
Summary for variables: lform1 lform2 lform3
by categories of: geschl (Geschlecht)
geschl |
mean
N
----------------+-------------------männlich |
77,2
3186,0
|
31,6
3186,0
|
10,7
3186,0
----------------+-------------------weiblich |
73,5
4566,0
|
30,9
4566,0
|
9,4
4566,0
----------------+-------------------Total |
75,5
7752,0
|
31,3
7752,0
|
10,1
7752,0
------------------------------------German Stata User Meeting, 12.08.2003
8
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <tabstat>

Übersichtlichkeit


keine absoluten Häufigkeiten für „genannt“
Gewichte (aweights, fweights)

keine Variablenetiketten
Formatierung der Statistiken



Präfix „by ... :“

Option by()

für Prozentwerte ist vorherige Rekodierung notwendig

Variablen müssen als Indikatorvariablen vorliegen

keine Ausgabe in Form
von Kreuztabellen
German Stata User Meeting, 12.08.2003
Formatanweisung gilt für
alle Statistiken
9
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
b) <tabcond> (externer Ado-File)
tabcond variables lform1-lform9, cond("@==1")
-------------------------------------------Variable |
@==1
--------------------------------+----------Formen: Gruppen |
5997
Formen: Projektstudien |
2557
Formen: koop. Studienprojekte |
814
Formen: freiwillige Praktika |
2910
Formen: international |
1432
Formen: Tutor/in |
1399
Formen: Studiengruppen geleitet |
603
Formen: Lernprogramme genutzt |
1387
Formen: Recheche mit PC |
5629
--------------------------------------------
German Stata User Meeting, 12.08.2003
10
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (neuer externer Ado-File)
Syntax
mrditab varlist [weight] [if exp] [in range]
[, response(integer) missing(integer) format(%fmt)]
Eigenschaften










Übersichtlichkeit
prozentuale Häufigkeiten auf Basis der Fälle und Antworten
Variablennamen u. -etiketten
Formatierung der Statistiken
Gewichte (aweight, iweight, fweight)
Definition von bis zu zwei „missing values“
Spezifikation des für die Tabellierung zu benutzenden Wertes
Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung
keine Ausgabe von Kreuztabellen
nur numerische Variablen
German Stata User Meeting, 12.08.2003
11
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel ohne Optionen)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4
variable
variable
|
pct. of
pct. of
name
label
|
freq.
cases
resp.
----------------------------------+------------------------------lform1
Formen: Gruppen
|
5997
77,4
48,8
|
lform2
Formen: Projektstudien|
2557
33,0
20,8
|
lform3
Formen: koop. Studienp|
814
10,5
6,6
rojekte
|
lform4
Formen: freiwillige Pr|
2910
37,5
23,7
aktika
|
-----------------------------------------------------------------valid cases (unweighted):
7752
missing cases (unweighted):
350
total responses (unweighted):
12278
German Stata User Meeting, 12.08.2003
12
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Formatoption)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4, format(%5.2f)
variable
variable
|
pct. of
pct. of
name
label
|
freq.
cases
resp.
----------------------------------+------------------------------lform1
Formen: Gruppen
|
5997
77,36
48,84
|
lform2
Formen: Projektstudien|
2557
32,99
20,83
|
lform3
Formen: koop. Studienp|
814
10,50
6,63
rojekte
|
lform4
Formen: freiwillige Pr|
2910
37,54
23,70
aktika
|
-----------------------------------------------------------------valid cases (unweighted):
7752
missing cases (unweighted):
350
total responses (unweighted):
12278
German Stata User Meeting, 12.08.2003
13
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Gewichtsanweisung)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4 [aw=gewinsg], format(%5.2f)
!!!weighted analysis using aweight = gewinsg!!!
variable
variable
|
pct. of
pct. of
name
label
|
freq.
cases
resp.
----------------------------------+------------------------------lform1
Formen: Gruppen
|
5828
75,46
47,46
|
lform2
Formen: Projektstudien|
2415
31,27
19,67
|
lform3
Formen: koop. Studienp|
777
10,06
6,33
rojekte
|
lform4
Formen: freiwillige Pr|
2881
37,30
23,46
aktika
|
-----------------------------------------------------------------valid cases (unweighted):
7752
missing cases (unweighted):
350
total responses (unweighted):
12278
German Stata User Meeting, 12.08.2003
14
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Missing-Option)
. mrditab lform1-lform4, mis(-1)
variable
variable
|
pct. of
pct. of
name
label
|
freq.
cases
resp.
----------------------------------+------------------------------lform1
Formen: Gruppen
|
5997
77,4
48,8
|
lform2
Formen: Projektstudien|
2557
33,0
20,8
|
lform3
Formen: koop. Studienp|
814
10,5
6,6
rojekte
|
lform4
Formen: freiwillige Pr|
2910
37,5
23,7
aktika
|
-----------------------------------------------------------------valid cases (unweighted):
7752
missing cases (unweighted):
350
total responses (unweighted):
12278
German Stata User Meeting, 12.08.2003
15
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Response-Option)
. qui recode lform1-lform9 (1=2)(0=1)(-1=.)
. mrditab lform1-lform4, response(2)
variable
variable
|
pct. of
pct. of
name
label
|
freq.
cases
resp.
----------------------------------+------------------------------lform1
Formen: Gruppen
|
5997
77,4
48,8
|
lform2
Formen: Projektstudien|
2557
33,0
20,8
|
lform3
Formen: koop. Studienp|
814
10,5
6,6
rojekte
|
lform4
Formen: freiwillige Pr|
2910
37,5
23,7
aktika
|
-----------------------------------------------------------------valid cases (unweighted):
7752
missing cases (unweighted):
350
total responses (unweighted):
12278
German Stata User Meeting, 12.08.2003
16
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Tabellierung von Mehrfachantwortvariablen in Stata
2. Polytome Mehrfachantwortvariablen
a) <mrdum> (externer Ado-File)
mrdum lv1-lv3, stub(lv) response(1 2 3 4) labels
--------------------------------------------------------------------responses | code present
percent
-----------------------------------------+--------------------------Einsatz von EDV(-Programmen), Programmie |
399
12,54
techn. Grundlagen der DV |
26
0,82
EDV allgemein |
80
2,51
Wirschaftsveranstaltungen |
358
11,25
--------------------------------------------------------------------Cases with at least one response : 3183 (39.29 %)
Completely missing : 4919
Total cases : 8102
Variables created for 4 possible responses + 1 for missing
German Stata User Meeting, 12.08.2003
17
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <mrdum>


Übersichtstabelle der absoluten und prozentualen
Häufigkeiten
(Kreuz-)Tabellierung der resultierenden Dummy-Variablen
German Stata User Meeting, 12.08.2003

keine Übersichtstabelle unter
Verwendung von Gewichten

bei Verwendung von Gewichten oder Erstellen von Kreuztabellen : zweistufiges Vorgehen erforderlich
18
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
b) <mtab> (externer Ado-File)
pct. responses
pct. cases
mtab lv1-lv3
Overall
Between
Within
respset |
Freq. Percent
Freq. Percent
Percent
----------+----------------------------------------------------Einsatz |
399
8,27
399
12,54
51,42
techn. G |
26
0,54
26
0,82
50,00
EDV allg |
80
1,66
80
2,51
47,06
Wirschaf |
358
7,42
358
11,25
52,65
Jura-Ver |
94
1,95
94
2,95
50,00
Regional |
11
0,23
11
0,35
45,83
Veransta |
33
0,68
33
1,04
47,83
 --- snip --Kontakte |
51
1,06
51
1,60
54,26
zusätzl. |
16
0,33
16
0,50
69,57
sonstige |
53
1,10
53
1,67
49,53
---------+----------------------------------------------------Total |
4826
100,00
4826
151,62
55,74
(n = 3183)
German Stata User Meeting, 12.08.2003
19
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <mtab>


übersichtliche Tabellierung
der absoluten und prozentualen Häufigkeiten
Prozentuierung sowohl auf
Basis der Antworten als auch
auf Basis der Beobachtungen
German Stata User Meeting, 12.08.2003

keine Gewichte

keine Kreuztabellen

kein Präfix „by ...:“
20
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (neuer externer Ado-File)
Syntax
mrtab varlist [weight] [if exp] [in range] [, by(varname)
format(%fmt) center count column row name(varname)]
Eigenschaften









Übersichtlichkeit
ein- und zweidimensionale Häufigkeitstabellen
absol. Häufigkeiten, Spaltenprozente, Zeilenprozente (wählbar)
Formatierung der Statistiken
Gewichte (aweight, iweight, fweight)
Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung
keine Ausgabe von Randverteilungen
nur numerische Variablen
keine Spaltenvariablen mit negativen Werten
German Stata User Meeting, 12.08.2003
21
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel für eindimensionale Häufigkeitstabellen)
. mrtab lv1-lv3, count col
----------------------------------------------------------------respset |
count
col. pct
-----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie |
399
12,5
techn. Grundlagen der DV |
26
0,8
EDV allgemein |
80
2,5
(Fremd-)Sprachenveranstaltungen |
960
30,2
Rhetorikkurse, Persönlichkeitstraining |
386
12,1
Veranstaltungen im eigenen Fach |
1060
33,3
Veranstaltungen im anderen Fach |
299
9,4
sonstiges |
1431
45,0
----------------------------------------------------------------valid cases (unweighted)
3183
missing cases (unweighted)
4919
German Stata User Meeting, 12.08.2003
22
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel mit name-Option)
. mrtab lv1-lv3, count col name(lehrveranstaltungen)
----------------------------------------------------------------lehrveranstaltungen |
count
col. pct
-----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie |
399
12,5
techn. Grundlagen der DV |
26
0,8
EDV allgemein |
80
2,5
(Fremd-)Sprachenveranstaltungen |
960
30,2
Rhetorikkurse, Persönlichkeitstraining |
386
12,1
Veranstaltungen im eigenen Fach |
1060
33,3
Veranstaltungen im anderen Fach |
299
9,4
sonstiges |
1431
45,0
----------------------------------------------------------------valid cases (unweighted)
3183
missing cases (unweighted)
4919
German Stata User Meeting, 12.08.2003
23
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel für Kreuztabellen (by-Option))
. mrtab lv1-lv3 [aw=gewinsg], count col row by(geschl) ///
name(lehrveranstaltungen)
!!!weighted analysis using aweight = gewinsg!!!
+--------------------------------+
|
cell content
|
|--------------------------------|
| 1. frequency
|
| 2. row percent
|
| 3. column percent (of cases)
|
+--------------------------------+
----------------------------------------------------------------|
Geschlecht
lehrveranstaltungen |
männlich
weiblich
-----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie |
206
199
|
50,9
49,1
|
12,4
13,0
 --- snip ------------------------------------------------------------------valid cases (unweighted) 1 = "männlich"
1294
valid cases (unweighted) 2 = "weiblich"
1889
missing cases (unweighted)
4919
German Stata User Meeting, 12.08.2003
24
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Behandlung von identischen Werten
bei polytomen Mehrfachantwortvariablen
Beispielsdatensatz
id
abifach1
abifach2
abifach3
abifach4
1
Biologie
Deutsch
Englisch
sonst. Sprache
2
Deutsch
Mathematik
sonst. Sprache
sonst. Sprache
Auswertung mit „mult response“
Category label
Biologie
Deutsch
Englisch
Mathematik
sonst. Sprachen
Count
Pct of
Cases
1
2
1
1
3
50,0
100,0
50,0
50,0
150,0
Auswertung mit <mrtab>
---------------------------------Abiturfächer | count col. pct
----------------+----------------Biologie |
1
50,0
Deutsch |
2
100,0
Englisch |
1
50,0
Mathematik |
1
50,0
sonst. Sprachen |
2
100,0
----------------------------------
German Stata User Meeting, 12.08.2003
25