PowerPoint-Präsentation

Download Report

Transcript PowerPoint-Präsentation

Stichproben und Grundgesamtheit
Zusammenfassung und Beispiele
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Ziel einer Stichprobe
Mit der Stichprobe soll ein exemplarischer Ausschnitt aus der
Grundgesamtheit (GG) befragt werden, die Ergebnisse der
Datenanalyse sollen für die GG gelten. Ziel der Stichprobe ist
das Sparen von Geld und Zeit
Voraussetzungen
1. Stichprobe muss verkleinerte Abbildung der GG hinsichtlich
der Heterogenität der Elemente und der Repräsentativität der
Variablenausprägungen sein.
2. Grundgesamtheit muss definiert sein.
3. Die Elemente (Einheiten) der Stichprobe müssen definiert
sein.
4. Wahl eines angemessenen Auswahlverfahrens.
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Auswahlgesamtheit und Inferenzpopulation
Oft kann zwischen „angestrebter Grundgesamtheit“ und
„Auswahlgesamtheit“ unterscheiden werden Bsp. ETB
• Erstere umfasst alle Elemente, über die Aussagen beabsichtigt sind,
• letztere alle Elemente, die eine prinzipielle Chance haben, in die
Stichprobe zu gelangen
„Overcoverage“ und „Undercoverage“
Inferenzpopulation (tatsächliche Stichprobe)
• auch Durchführung der Erhebung kann dazu führen, dass die
Stichprobe nicht alle Elemente enthält, die gezogen werden sollen
(Ziel: möglichst große Übereinstimmung mit Grundgesamtheit)
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Grundgesamtheit BIBB/BAuA-Erwerbstätigenbefragung 2006
Grundgesamtheit der Untersuchung sind erwerbstätige Personen ab 15 Jahren
(ohne Auszubildende). Als Erwerbstätigkeit gilt dabei eine Tätigkeit, bei der
regelmäßig mindestens zehn Stunden pro Woche gegen Bezahlung gearbeitet wird.
Dies betrifft auch folgende Tätigkeiten:
Vergütete Beschäftigungsverhältnisse, die neben einer Qualifizierung ausgeübt werden, z.B.
wenn Studierende oder Auszubildende nebenbei „jobben“ oder die Tätigkeit im Rahmen eines
Referendariats oder einer Facharztausbildung erfolgt;
Tätigkeiten als mithelfende Familienangehörige;
Beschäftigungsverhältnisse, die zum Erhebungszeitpunkt wegen Mutterschutz oder aus anderen
Gründen für maximal 3 Monate unterbrochen wurden.
Nicht als Erwerbstätigkeit zählen dagegen:
Tätigkeiten, die notwendiger Bestandteil einer Ausbildung sind, z.B. im Rahmen einer
betrieblichen Ausbildung oder Lehre, einer schulischen Ausbildung, beispielsweise an einer
Berufsfachschule, oder einer Beamtenausbildung für die Laufbahn des öffentlichen Dienstes;
bezahlte ehrenamtliche Tätigkeiten (da hier meist keine Einkünfteerzielungsabsicht vorliegt)
Wehr- und Zivildienst; freiwilliges soziales oder ökologisches Jahr.
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Auswahlverfahren
Wie kann aus den Elementen der Grundgesamtheit eine
Stichprobe gezogen werden?
• Zufallsstichproben
– Einfache Zufallsstichprobe
Aus einer Grundgesamtheit mit N Elementen wird eine Stichprobe mit n
Elementen so gezogen, dass jede mögliche Stichprobe mit n Elementen
dieselbe Chance zur Realisierung besitzt
(nur hier sind die Fehler, die vom Schluss von der Stichprobe auf die
Grundgesamtheit entstehen, berechenbar) Bsp. CATI
– Die Schätzung des Mittelwerts ist mit einem zufälligen Fehler
behaftet (Standardfehler).
– Konfidenzintervall: Ein Intervall um den Mittelwert der Stichprobe,
das den unbekannten Parameter der Grundgesamtheit mit
vorgegebener Wahrscheinlichkeit (üblich: 95 %, 99 %, 99,9 %)
überdeckt.
– Je kleiner der Standardfehler und je größer die Stichprobe, desto
kleiner das Konfidenzintervall.
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Konfidenzintervall
Mit der Inferenzstatistik wird gezeigt, dass man aus der Stichprobe Intervalle
schätzen kann, die den wahren Parameter mit einer vorgegebenen
Wahrscheinlichkeit enthalten. Diese Intervalle werden als Konfidenzintervalle
bezeichnet.
Andersherum wird häufig nach der Irrtumswahrscheinlichkeit gefragt,
mit der das Intervall den wahren Parameter nicht enthält.
Man erhält damit Aussagen der Art:
Mit einer (Irrtums-)Wahrscheinlichkeit von p – häufig wählt man für p einen
Wert von 0,05, manchmal aber auf 0,01 oder 0,001 – enthält das
Konfidenzintervall mit der Untergrenze GU und der Obergrenze GO nicht den
wahren Wert. Bsp. Durchschnittsalter im Kurs
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Bsp. Erwerbstätigenbefragung 2006
Zufallsverfahren („Gabler-Häder-Verfahren“), das sicherstellt, dass
ein repräsentativer Querschnitt der Bevölkerung befragt wird.
Die Grundidee des „Gabler-Häder-Verfahrens“ besteht darin, innerhalb eines
Ortsnetzes Rufnummern verzerrungsfrei ziehen zu können, also unabhängig
davon, ob eine Rufnummer eingetragen ist oder nicht und unabhängig von der
Dichte und Häufigkeit der Einträge im Telefonbuch.
Das Vorgehen hierzu ist wie folgt:
Auf Basis aller Telefonbucheinträge werden im ersten Schritt die so genannten
Nummernstämme gebildet, indem von jeder eingetragenen Telefonnummer die
letzten beiden Ziffern gelöscht werden. Dieser Datenbestand wird auf doppelte
Nummernstämme geprüft und bereinigt. Im zweiten Schritt wird für jeden
Nummernstamm der 100er-Block erzeugt, indem die Ziffernfolge 00 bis 99 ergänzt
wird.
Zu befragende Zielperson aus der Auswahlgesamtheit der im Haushalt lebenden
Personen ab 15 Jahren mit Schwedenschlüssel (Kish-Methode) bestimmt.
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
– Geschichtete Zufallsstichproben
• Elemente werden in Schichten gruppiert, für jede Schicht wird eine einfache
Zufallsstichprobe gezogen Bsp. Migranten, Geschiedene
– Klumpenstichprobe
• Einfache Zufallsstichprobe, bei der die Auswahlregeln nicht auf die Elemente
der Grundgesamtheit, sondern auf zusammengefasste Elemente angewendet
werden und jeweils die Daten aller Elemente eines Klumpen/Clusters erhoben
werden. Spezialfall einer mehrstufigen Stichprobe (auf der 2. Stufe alle
Elemente)
•
Bsp. Klassen; Problem, wenn sich Klassen unterscheiden
– Mehrstufige Auswahlverfahren
• Mehrstufige Auswahlverfahren bestehen aus einer Reihe nacheinander
durchgeführter Stichproben, wobei die jeweilige Zufallsstichprobe die
Auswahlgrundlage der folgenden Stichprobe bildet
• Bsp. 1. Stufe Gemeinden, Stimmbezirke, 2. Stufe: Haushalte durch Random
Route, 3. Stufe: Personen durch Kish-Methode, Last-Birthday
• Personenstichprobe durch Gewichtung mit Reziprokwert der Haushaltsgröße
• Warum? Um Kosten zu sparen, Grundgesamtheit nicht genau bekannt, keine
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
• Willkürliche und bewusste Auswahlen
(Inferenzstatistik zumeist nicht anwendbar)
– Willkürliche Auswahlen
Aufnahme eines Elements in die Stichprobe nicht durch Auswahlplan
kontrolliert, liegt im Ermessen des Auswählenden
– Bewusste Auswahlen
• erfolgen nach Auswahlplan mit zumeist überprüfbaren Kriterien
• Beispiele: Expertengespräche (sofern Experten nicht zufällig
ausgewählt), Auswahl typischer Fälle oder Auswahl extremer Fälle
– Auswahl nach Konzentrationsprinzip
• Auswahl derjenigen Fälle, bei denen ein interessierendes Merkmal so
stark ausgeprägt ist, dass diese Fälle nahezu die gesamte Verteilung in
der Grundgesamtheit bestimmen (Bsp. Unternehmen mit größtem Umsatz)
– Schneeball-Verfahren
• ausgehend von einer Person werden die von dieser benannten
Personen befragt
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
– Quota-Verfahren
• Auswahl von Personen derart, dass bestimmte Merkmale in der
Stichprobe exakt in der gleichen Häufigkeit vorkommen wie in der
Grundgesamtheit, endgültige Auswahl bleibt Interviewer vorbehalten.
• Setzt Wissen über die Merkmale der Grundgesamtheit voraus
• Kritikpunkte am Quota-Verfahren
1. Keine Zufallsauswahl => Anwendung der Inferenztechniken
erschwert oder unmöglich
2. Erhöhte Auswahlwahrscheinlichkeit für Personen, die häufig an
ihrem Wohnort anzutreffen sind
3. Es werden vor allem Personen ausgewählt, die sich kooperativ
verhalten => Gefahr erheblicher Verzerrung
• Verwendung in der Marktforschung
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
• Ausfälle
– Ausmaß = Nonresponsequote (Gegenteil:
Ausschöpfungsquote)
• Ausfallursachen
- Unit-Nonresponse (Kontaktperson o. Zielperson), ItemNonresponse, Nichterreichbarkeit, Person gehört nicht zur
Grundgesamtheit, Verweigerung etc.)
• Systematische Ausfälle:
– Variablen des Untersuchungsgegenstands hängen mit den
Ursachen des Ausfalls zusammen Bsp. Einstellung ÖPNV
– Problem systematischer Ausfälle: Ausfallmechanismus in der
Regel unbekannt (einzige Möglichkeit, Verzerrungen zu
vermeiden: weitgehende Minimierung der Ausfälle)
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
• Unterscheidung zwischen Schwer-Erreichbaren,
Nicht-Befragbaren und Verweigerern
– Nicht-Befragbare: Personen, die aufgrund körperlicher
Gebrechen oder schwer akuter Erkrankung aus der
Stichprobe ausscheiden
– Schwer-Erreichbare: trotz mehrfacher Kontaktversuche nicht
am Wohnsitz anzutreffen
– Verweigerer (problematischste Kategorie)
– Insgesamt kann nicht von einer homogenen und konstanten
Zusammensetzung der Verweigerer gesprochen werden
– Aber nur in Zufallsstichprobe zusätzliche Unsicherheit durch
Ausfälle überhaupt berechenbar
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Nicht-Teilnahme an Befragungen
Es gibt nur wenige prinzipielle Verweigerer, aber eine Vielzahl von
Gründen oder Ausreden für die Nichtteilnahme, z. B. „ich habe gerade
keine Zeit“, d. h. der Interviewer muss überzeugen können;
• ungewohnt mit Fremden zu sprechen (Vertrauen erwecken),
• ungeübt in formaler Kommunikation,
• (diffuse) Furcht vor negativen Folgen (z. B. Datenschutz),
• Desinteresse am Thema.
Gründe geben und Interesse wecken!
Auf Vertraulichkeit hinweisen - Zusicherung der Anonymität!
Mehrfache Rückfragen, um Rücklaufquote zu erhöhen
Bsp. BIBB/IAB, verschiedene Erhebungstechniken
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®
Stichproben und Grundgesamtheit
Repräsentativität
der Begriff Repräsentativität meint, dass eine Stichprobe die Zusammensetzung der
Grundgesamtheit widerspiegeln soll, also beispielsweise ebenso viele Frauen oder
Personen mit Hochschulbildung usw. enthalten soll wie die Grundgesamtheit.
Stichprobentheoretisch ist nicht entscheidend, ob eine Stichprobe repräsentativ im
o.a. Sinne ist, sondern ob es sich um eine Zufallsstichprobe handelt.
Wenn in der Öffentlichkeit dennoch häufig von "R." gesprochen wird, bedeutet dies
meist, dass man nicht einfach willkürlich irgendwelche Personen befragt, sondern
versucht hat, eine Stichprobe zu bestimmen, die "für die Grundgesamtheit steht".
Allerdings wird R. in diesem Sinne häufig auch für Stichprobenverfahren reklamiert,
die überhaupt nichts mit Zufallsstichproben zu tun haben (Quotenauswahlen).
Es muss genau geprüft werden, in welchem Sinne Repräsentativität verwendet wird!
Aber auch eine repräsentative Stichprobe ist wertlos,
wenn der verwendete Fragebogen schlecht ist!
Dozenten/innen: Hr. Dr. Bott; Fr. Braun; Hr. Dorau; Fr. Hall;
Hr. Dr. Helmrich; Fr. Höhns; Hr. Maier; Hr. Wünsche
®