German Stata User Meeting 2003 Tabellierung von Mehrfachantwortgruppen Zwei neue Programme Hilde Schaeper / [email protected].
Download ReportTranscript German Stata User Meeting 2003 Tabellierung von Mehrfachantwortgruppen Zwei neue Programme Hilde Schaeper / [email protected].
German Stata User Meeting 2003 Tabellierung von Mehrfachantwortgruppen Zwei neue Programme Hilde Schaeper / [email protected] Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Bei HIS: Zwei Arten der Kodierung von Mehrfachantwortfragen 1. Set von binären Variablen In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen aktiv mitgewirkt? (Mehrfachnennung möglich) Ich habe in Gruppen an der Bearbeitung von Studienaufgaben mitgewirkt lform1 Ich habe in praxis-/forschungsorientieten Projektstudien mitgearbeitet lform2 Ich habe in kooperativen Studienprojekten von Hochschule und Betrieben/ Dienststellen gearbeitet lform3 Ich habe freiwillige betriebliche Praktika absolviert lform4 Ich habe in internationalen Zusammenhängen studiert lform5 Ich war als Tutor/Tutorin eingesetzt lform6 German Stata User Meeting, 12.08.2003 2 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 2. Set von polytomen Merkmalen In welchen Fächern haben Sie Ihre Abiturprüfung abgelegt? LK1 LK2 GK1 GK2 Haben Sie neben den für das Studium erforderlichen Lehrveranstaltungen auch Veranstaltungen innerhalb oder außerhalb der Hochschule speziell mit dem Ziel der Verbesserung der Berufschancen besucht? Mathematik 1 Physik 2 Chemie 3 Biologie 4 Geographie 5 Deutsch 6 Englisch 7 Französisch 8 1. Spanisch 9 2. Geschichte 10 Sozialkunde 11 usw. fach1 fach2 fach3 fach4 German Stata User Meeting, 12.08.2003 ja 1 nein 2 Wenn ja, welche? 3. lv1 lv2 lv3 3 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Die SPSS-Prozedur <mult response> (Beispiele) 1. univariate Verteilung dichotomer Mehrfachantwortvariablen mult response groups=lehrform(lform1 to lform9 (1)) /freq=lehrform. Mehrfachantworten Group LEHRFORM (Value tabulated = 1) Dichotomy label Name Formen: Formen: Formen: Formen: Formen: Formen: LFORM1 LFORM2 LFORM3 LFORM4 LFORM5 LFORM6 Gruppen Projektstudien koop. Studienprojekte freiwillige Praktika internationales Studium Tutor/in --- snip --- 350 missing cases; Count 5997 2557 814 2910 1432 1399 ------Total responses 22728 Pct of Responses 26,4 11,2 3,6 12,8 6,3 6,2 ----100,0 Pct of Cases 77,4 33,0 10,5 37,5 18,5 18,0 ----293,2 7.752 valid cases German Stata User Meeting, 12.08.2003 4 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 2. bivariate Verteilung dichotomer Mehrfachantwortvariablen GESCHL Count |männlich weiblich Row pct | Row Col pct | Total | 1 | 2 | LEHRFORM --------+--------+--------+ LFORM1 | 2490 | 3507 | 5997 Formen: Gruppen | 41,5 | 58,5 | 77,4 | 78,2 | 76,8 | +--------+--------+ LFORM2 | 1074 | 1483 | 2557 Formen: Projektstudi | 42,0 | 58,0 | 33,0 | 33,7 | 32,5 | +--------+--------+ --- snip --+--------+--------+ Column 3186 4566 7752 Total 41,1 58,9 100,0 Percents and totals based on respondents 7.752 valid cases; 350 missing cases German Stata User Meeting, 12.08.2003 5 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen 3. Tabellierung polytomer Mehrfachantwortvariablen mult response groups=lehrveranst(lv1 to lv3 (1, 99))/freq=lehrveranst. Mehrfachantworten Group LEHRVERA Category label Einsatz von EDV(-Programmen), Programmie techn. Grundlagen der DV EDV allgemein Wirschaftsveranstaltungen Jura-Veranstaltungen Regionalstudien Veranstaltungen zur Ökologie (Fremd-)Sprachenveranstaltungen Zusatzzertifikate Pct of Pct of Responses Cases Code Count 1 2 3 4 5 6 7 8 9 399 26 80 358 94 11 33 960 224 8,3 ,5 1,7 7,4 1,9 ,2 ,7 19,9 4,6 12,5 ,8 2,5 11,2 3,0 ,3 1,0 30,2 7,0 99 53 ------4826 1,1 ----100,0 1,7 ----151,6 --- snip --Sonstiges Total responses 4.919 missing cases; 3.183 valid cases German Stata User Meeting, 12.08.2003 6 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Tabellierung von Mehrfachantwortvariablen in Stata 1. Dichotome Mehrfachantwortvariablen a) <tabstat> (interner Ado-File) tabstat lform1-lform6 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) variable | mean N ------------+-------------------lform1 | 75,5 7752,0 lform2 | 31,3 7752,0 lform3 | 10,1 7752,0 lform4 | 37,3 7752,0 lform5 | 18,3 7752,0 lform6 | 18,0 7752,0 --------------------------------- German Stata User Meeting, 12.08.2003 7 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen a) <tabstat> mit by()-Option tabstat lform1-lform3 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) by(geschl) Summary for variables: lform1 lform2 lform3 by categories of: geschl (Geschlecht) geschl | mean N ----------------+-------------------männlich | 77,2 3186,0 | 31,6 3186,0 | 10,7 3186,0 ----------------+-------------------weiblich | 73,5 4566,0 | 30,9 4566,0 | 9,4 4566,0 ----------------+-------------------Total | 75,5 7752,0 | 31,3 7752,0 | 10,1 7752,0 ------------------------------------German Stata User Meeting, 12.08.2003 8 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <tabstat> Übersichtlichkeit keine absoluten Häufigkeiten für „genannt“ Gewichte (aweights, fweights) keine Variablenetiketten Formatierung der Statistiken Präfix „by ... :“ Option by() für Prozentwerte ist vorherige Rekodierung notwendig Variablen müssen als Indikatorvariablen vorliegen keine Ausgabe in Form von Kreuztabellen German Stata User Meeting, 12.08.2003 Formatanweisung gilt für alle Statistiken 9 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen b) <tabcond> (externer Ado-File) tabcond variables lform1-lform9, cond("@==1") -------------------------------------------Variable | @==1 --------------------------------+----------Formen: Gruppen | 5997 Formen: Projektstudien | 2557 Formen: koop. Studienprojekte | 814 Formen: freiwillige Praktika | 2910 Formen: international | 1432 Formen: Tutor/in | 1399 Formen: Studiengruppen geleitet | 603 Formen: Lernprogramme genutzt | 1387 Formen: Recheche mit PC | 5629 -------------------------------------------- German Stata User Meeting, 12.08.2003 10 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (neuer externer Ado-File) Syntax mrditab varlist [weight] [if exp] [in range] [, response(integer) missing(integer) format(%fmt)] Eigenschaften Übersichtlichkeit prozentuale Häufigkeiten auf Basis der Fälle und Antworten Variablennamen u. -etiketten Formatierung der Statistiken Gewichte (aweight, iweight, fweight) Definition von bis zu zwei „missing values“ Spezifikation des für die Tabellierung zu benutzenden Wertes Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung keine Ausgabe von Kreuztabellen nur numerische Variablen German Stata User Meeting, 12.08.2003 11 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel ohne Optionen) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4 variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | -----------------------------------------------------------------valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003 12 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Formatoption) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4, format(%5.2f) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------lform1 Formen: Gruppen | 5997 77,36 48,84 | lform2 Formen: Projektstudien| 2557 32,99 20,83 | lform3 Formen: koop. Studienp| 814 10,50 6,63 rojekte | lform4 Formen: freiwillige Pr| 2910 37,54 23,70 aktika | -----------------------------------------------------------------valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003 13 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Gewichtsanweisung) . qui mvdecode lform1-lform9, mv(-1) . mrditab lform1-lform4 [aw=gewinsg], format(%5.2f) !!!weighted analysis using aweight = gewinsg!!! variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------lform1 Formen: Gruppen | 5828 75,46 47,46 | lform2 Formen: Projektstudien| 2415 31,27 19,67 | lform3 Formen: koop. Studienp| 777 10,06 6,33 rojekte | lform4 Formen: freiwillige Pr| 2881 37,30 23,46 aktika | -----------------------------------------------------------------valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003 14 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Missing-Option) . mrditab lform1-lform4, mis(-1) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | -----------------------------------------------------------------valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003 15 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrditab> (Beispiel mit Response-Option) . qui recode lform1-lform9 (1=2)(0=1)(-1=.) . mrditab lform1-lform4, response(2) variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 | lform2 Formen: Projektstudien| 2557 33,0 20,8 | lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte | lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika | -----------------------------------------------------------------valid cases (unweighted): 7752 missing cases (unweighted): 350 total responses (unweighted): 12278 German Stata User Meeting, 12.08.2003 16 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Tabellierung von Mehrfachantwortvariablen in Stata 2. Polytome Mehrfachantwortvariablen a) <mrdum> (externer Ado-File) mrdum lv1-lv3, stub(lv) response(1 2 3 4) labels --------------------------------------------------------------------responses | code present percent -----------------------------------------+--------------------------Einsatz von EDV(-Programmen), Programmie | 399 12,54 techn. Grundlagen der DV | 26 0,82 EDV allgemein | 80 2,51 Wirschaftsveranstaltungen | 358 11,25 --------------------------------------------------------------------Cases with at least one response : 3183 (39.29 %) Completely missing : 4919 Total cases : 8102 Variables created for 4 possible responses + 1 for missing German Stata User Meeting, 12.08.2003 17 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <mrdum> Übersichtstabelle der absoluten und prozentualen Häufigkeiten (Kreuz-)Tabellierung der resultierenden Dummy-Variablen German Stata User Meeting, 12.08.2003 keine Übersichtstabelle unter Verwendung von Gewichten bei Verwendung von Gewichten oder Erstellen von Kreuztabellen : zweistufiges Vorgehen erforderlich 18 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen b) <mtab> (externer Ado-File) pct. responses pct. cases mtab lv1-lv3 Overall Between Within respset | Freq. Percent Freq. Percent Percent ----------+----------------------------------------------------Einsatz | 399 8,27 399 12,54 51,42 techn. G | 26 0,54 26 0,82 50,00 EDV allg | 80 1,66 80 2,51 47,06 Wirschaf | 358 7,42 358 11,25 52,65 Jura-Ver | 94 1,95 94 2,95 50,00 Regional | 11 0,23 11 0,35 45,83 Veransta | 33 0,68 33 1,04 47,83 --- snip --Kontakte | 51 1,06 51 1,60 54,26 zusätzl. | 16 0,33 16 0,50 69,57 sonstige | 53 1,10 53 1,67 49,53 ---------+----------------------------------------------------Total | 4826 100,00 4826 151,62 55,74 (n = 3183) German Stata User Meeting, 12.08.2003 19 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Eigenschaften von <mtab> übersichtliche Tabellierung der absoluten und prozentualen Häufigkeiten Prozentuierung sowohl auf Basis der Antworten als auch auf Basis der Beobachtungen German Stata User Meeting, 12.08.2003 keine Gewichte keine Kreuztabellen kein Präfix „by ...:“ 20 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (neuer externer Ado-File) Syntax mrtab varlist [weight] [if exp] [in range] [, by(varname) format(%fmt) center count column row name(varname)] Eigenschaften Übersichtlichkeit ein- und zweidimensionale Häufigkeitstabellen absol. Häufigkeiten, Spaltenprozente, Zeilenprozente (wählbar) Formatierung der Statistiken Gewichte (aweight, iweight, fweight) Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung keine Ausgabe von Randverteilungen nur numerische Variablen keine Spaltenvariablen mit negativen Werten German Stata User Meeting, 12.08.2003 21 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel für eindimensionale Häufigkeitstabellen) . mrtab lv1-lv3, count col ----------------------------------------------------------------respset | count col. pct -----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0 ----------------------------------------------------------------valid cases (unweighted) 3183 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003 22 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel mit name-Option) . mrtab lv1-lv3, count col name(lehrveranstaltungen) ----------------------------------------------------------------lehrveranstaltungen | count col. pct -----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0 ----------------------------------------------------------------valid cases (unweighted) 3183 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003 23 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen c) <mrtab> (Beispiel für Kreuztabellen (by-Option)) . mrtab lv1-lv3 [aw=gewinsg], count col row by(geschl) /// name(lehrveranstaltungen) !!!weighted analysis using aweight = gewinsg!!! +--------------------------------+ | cell content | |--------------------------------| | 1. frequency | | 2. row percent | | 3. column percent (of cases) | +--------------------------------+ ----------------------------------------------------------------| Geschlecht lehrveranstaltungen | männlich weiblich -----------------------------------------+----------------------Einsatz von EDV(-Programmen), Programmie | 206 199 | 50,9 49,1 | 12,4 13,0 --- snip ------------------------------------------------------------------valid cases (unweighted) 1 = "männlich" 1294 valid cases (unweighted) 2 = "weiblich" 1889 missing cases (unweighted) 4919 German Stata User Meeting, 12.08.2003 24 Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen Behandlung von identischen Werten bei polytomen Mehrfachantwortvariablen Beispielsdatensatz id abifach1 abifach2 abifach3 abifach4 1 Biologie Deutsch Englisch sonst. Sprache 2 Deutsch Mathematik sonst. Sprache sonst. Sprache Auswertung mit „mult response“ Category label Biologie Deutsch Englisch Mathematik sonst. Sprachen Count Pct of Cases 1 2 1 1 3 50,0 100,0 50,0 50,0 150,0 Auswertung mit <mrtab> ---------------------------------Abiturfächer | count col. pct ----------------+----------------Biologie | 1 50,0 Deutsch | 2 100,0 Englisch | 1 50,0 Mathematik | 1 50,0 sonst. Sprachen | 2 100,0 ---------------------------------- German Stata User Meeting, 12.08.2003 25