Direkte Erhebungen

Download Report

Transcript Direkte Erhebungen

Einführung in die amtliche Statistik
DIE STATISTISCHE ERHEBUNG
Scuola Secondaria di Secondo grado; Argomento: Introduzione – Indagine (30.09.13); Pacchetto: S2.A.2
INHALT
1) Definitionen
2) Die Phasen einer statistischen Erhebung
•
•
•
•
Definition der Ziele
Definition des Erhebungsdesigns
Vollerhebungen und Stichprobenerhebungen
Pro
und
kontra
von
GesamtStichprobenerhebungen
•
Einige Beispiele
und
3) Die Erhebung der Daten
•
•
•
Direkte Erhebungen. Definition und einige
Beispiele
Indirekte Erhebungen. Definitionen und einige
Beispiele
Pro und kontra von direkten und indirekten
Erhebungen
DEFINITIONEN
Die statistische Erhebung
Eine statistische Erhebung ist eine Datensammlung,
die als komplexer Prozess abläuft, dessen Ziel die
Produktion von statistischen Informationen bzw. die
Produktion von zusammenfassenden Beschreibungen
quantitativer Art hinsichtlich eines kollektiven
Phänomens ist.
Der Untersuchungsgegenstand jedes
Einzelphänomens, welche das kollektive Phänomen
bilden, wird Erhebungseinheit genannt.
Die statistische Erhebung
Das kollektive Phänomen wird durch die Beobachtung
oder Messung eines oder mehrerer Merkmale der
Erhebungseinheiten untersucht.
Jede Eigenschaft wird Merkmal oder statistische Variable genannt
und die „Art“, in der sich ein Merkmal zeigt, ist die
Merkmalsausprägung.
Die Gesamtheit der Erhebungseinheiten ist die
Grundgesamtheit.
Beispiele für Erhebungseinheiten:
jede Person einer Bevölkerung,
jedes Ehepaar,
jede Produktionseinheit.
DIE PHASEN DER STATISTISCHEN
ERHEBUNG UND DIE
DATENERFASSUNG
Eine Erhebung planen
Die Planung und Durchführung einer Erhebung ist das
Ergebnis einer multidisziplinären Arbeit, welche zahlreiche
Fachkräfte zur Einschätzung und Definition der verschiedenen
Erhebungsphasen betrifft:
 Festlegung der Ziele
 Erhebungsdesign
 Erhebung vor Ort
 Eingabe, Revision und Validierung
 Methodologische Ausarbeitung
 Vorstellung und Verwendung der Ergebnisse
 Verbreitung
Festlegung der Ziele
In dieser Phase ist vor allem auf Folgendes zu achten:
 die zu erfassenden Informationen genau ermitteln, indem genau
festgelegt wird, was für die Erhebung interessant ist und was nicht.
Dabei gilt immer: Je weiter der Bereich der behandelten Themen,
umso größere Komplexität auf begrifflicher und operativer Ebene
 die Grundgesamtheit bzw. die Gesamtheit der Erhebungseinheiten,
auf welche die Ergebnisse der Erhebung ausgedehnt werden sollen,
ermitteln
 definieren, ob ein Phänomen statisch oder dynamisch beschrieben
werden soll und das Bezugsgebiet und den Bezugszeitraum genau
eingrenzen
 die Variablen und ihre Klassifikationen definieren
Erhebungsdesign
Durch die Definition des Erhebungsdesigns sollen die
folgenden Aspekte beantwortet werden:
 festlegen, welche Art von Erhebung am besten geeignet
ist, die gewünschten Statistiken zu produzieren
o direkte Erhebung
o indirekte Erhebung
 zwischen Vollerhebung und Stichprobenerhebung
entscheiden, und, im zweiten Fall, die Stichprobe umreißen
und ziehen (Stichprobenstrategie)
Direkte Erhebungen
Es handelt sich um eine direkte Erhebung, wenn die Beobachtungen bei
den einzelnen Einheiten, welche die Grundgesamtheit bilden und welche
während der Erhebungsphase kontaktiert werden, eingehoben werden.
Erhebungsverfahren
 direkte Befragung oder Face-to-face-Erhebung
 postalische Befragung
 telefonische Befragung
 Selbstausfüllung
Die verschiedenen Erhebungsverfahren führen zu unterschiedlich
zuverlässigen Ergebnissen.
Arten der Fragebögen und Befragungen
 PAPI (Pencil und paper)
 CAPI (Computer Assisted Personal Interview)
 CATI (Computer Assisted Telephone Interview)
 CAWI (Computer Assisted Web Interview)
Direkte Erhebungen
Direkte Befragung (oder Face-to-face)
Die Befragung wird von einem Interviewer durchgeführt, der die Fragen
und die Antwortmöglichkeiten genau in der Reihenfolge und Formulierung
vorliest, wie sie im Fragebogen verwendet werden. Die Antworten
werden so eingetragen, wie sie vom Befragten gegeben werden.
Wenn CAPI:
• sofortige Eintragung der Informationen
• automatische Verwendung der Filter und die Möglichkeit, sehr komplexe
Fragebögen zu verwenden
• sofortige Kontrolle der Informationen durch Kompatibilitätsregeln
Postalische Befragung
Dieses Verfahren sieht vor, dass der Papierfragebogen auf dem Postweg
zugeschickt wird. Der Befragte füllt ihn aus und sendet ihn an das
Erhebungsamt zurück.
Telefonische Befragung
Die Befragung wird telefonisch durchgeführt. Dabei liest ein Interviewer
die Fragen und Antwortmöglichkeiten genau in der Reihenfolge und
Formulierung vor, wie sie im Fragebogen verwendet werden. Die
Antworten werden so eingetragen, wie sie vom Befragten gegeben
werden (CATI).
Selbstausfüllung
Der Befragte liest den Fragebogen und beantwortet ihn.
Direkte Erhebungen
Vorteile
 Entsprechung zwischen den Erhebungszielen und den
erfassten Informationen

Möglichkeit, den Befragten zu kontaktieren

geringere Ausfallquote (Überzeugung zur Mitarbeit)

Möglichkeit, Erklärungen abzugeben
Nachteile

höhere Erhebungskosten

langsamer

größere statistische Belastung

größere Erhebungsfehler

Notwendigkeit einer weit verzweigten Organisation im Gebiet

größere Gefahr der Konditionierung
Direkte Erhebungen
Einige direkte Erhebungen des Istat
Gesundheitszustand und Nutzung der Gesundheitsdienste
Gemischtes Erhebungsverfahren: persönliche
Befragung + Selbstausfüllung des Fragebogens
Erhebung der Arbeitskräfte
Gemischtes Erhebungsverfahren: persönliche Befragung
(CAPI) + telefonische Nachbefragung (CATI)
Indirekte Erhebungen
Eine indirekte Erhebung (oder statistische Erhebung basierend auf
Daten aus Verwaltungsquellen) ist eine Erhebung, die Verwaltungsdaten zu statistischen Zwecken verwendet. Die meisten vom Istat
durchgeführten Erhebungen basieren auf Verwaltungsdaten.
Merkmale
 Die statistische Information wird durch die normale
Verwaltungstätigkeit produziert.
 Sie ergibt sich aus der Registrierung einer Sachlage.
 Es sind vollständige Daten.
Indirekte Erhebungen
Vorteile
 Sie verringern die Erhebungskosten.
 Sie verringern die statistische Belastung.
Nachteile
 Die Grundgesamtheit, auf die sich die Informationen beziehen
sollen, könnte nicht mit jener der Erhebung der Verwaltungsdaten
übereinstimmen (Erfassungsfehler).
 Die Begriffe, Definitionen und Klassifikationen, die bei der Erhebung
der Verwaltungsdaten angewandt werden, könnten nicht mit jener der
statistischen Erhebung übereinstimmen.
 Die Qualität, mit der die Informationen bei den Verwaltungsdaten
erhoben werden, könnte nicht für die Ziele der Forschung ausreichen.
 Die Daten sind nicht immer dann verfügbar, wenn die statistischen
Informationen benötigt werden.
Indirekte Erhebungen
Einige Beispiele für vom Istat durchgeführte indirekte Erhebungen
Demografische Erhebungen der Bevölkerung (ins Melderegister
eingetragene Geburten, Wanderungsbewegungen der
Wohnbevölkerung, Eheschließungen, …)
Gerichtsstatistiken (angezeigte Straftaten, Ehetrennungen, …)
Erhebung der Verkehrsunfälle
Außenhandel
Bewegung der Kunden in den Beherbergungsbetrieben
Voll- und Stichprobenerhebungen
Die Untersuchung einer Grundgesamtheit kann auf zwei Wegen
erfolgen.
 Durchführung einer Vollerhebung (oder Großzählung), d.h.
eine vollständige Auflistung der interessierenden
Erhebungseinheiten erstellen und jede einzelne Einheit einer
Grundgesamtheit, egal ob Personen oder Dinge, untersuchen
 Durchführung einer Stichprobenerhebung, d.h. Auswählen
einer Teilmenge der Einheiten der Grundgesamtheit, die so
gewählt werden, dass sie für alle Einheiten der
Bezugsgrundgesamtheit repräsentativ sind
Beide Ansätze liefern Angaben, mit denen die gesamte
Grundgesamtheit beschrieben werden kann.
Vollerhebungen
Vorteile
 Sie liefern ein reales Abbild (ohne Stichprobenfehler) der
Grundgesamtheit
 Die erhobenen Daten können als Bezugsbasis für weitere
Untersuchungen verwendet werden
 Hoher Analysedetailgrad
Nachteile
 Die Abgabe der Informationen benötigt sehr viel Zeit
 Hohe Kosten, sowohl Personal als auch Geld
Stichprobenerhebungen
Um die Probleme bei den Vollerhebungen zu beheben, werden
Stichprobenerhebungen durchgeführt. Sie zeichnen sich dadurch
aus, dass nur ein Teil der Erhebungseinheiten der Grundgesamtheit
ausgewählt und befragt wird.
Man greift außerdem auf Stichprobenerhebungen zurück, wenn:
 die Grundgesamtheit unendlich ist
 die Erhebung die Zerstörung der beobachteten Einheiten bewirkt
 die Kosten gesenkt werden müssen
 die Zeiten zum Erhalt der Informationen verkürzt werden
müssen
 die Datenqualität in Bezug auf Genauigkeit verbessert werden
muss
Stichprobenstrategien
Die Definition der Modalitäten zur Stichprobenziehung, des Umfangs
und der Funktionen der Daten, die verwendet werden, um aus den
Daten der Stichproben Schätzungen für die Grundgesamtheit machen
zu können, werden unter dem Namen Stichprobenstrategie
zusammengefasst.
Die Kriterien zur Auswahl der Stichprobe können sein:
 Probabilistisch: der Stichprobenplan erfolgt durch Zufallsmechanismen, denen eine (konstante oder variable) Wahrscheinlichkeit zu-
gewiesen werden kan, mit welcher eine Erhebungseinheit gezogen wird
 Nicht probabilistisch: der Stichprobenplan sieht von den Kriterien
der Zufälligkeit bei der Ziehung der Stichprobeneinheiten ab
Probabilistische Kriterien
Einfache Zufallsstichproben: für alle Einheiten der
Grundgesamtheit besteht die gleiche Wahrscheinlichkeit, in die
Stichprobe zu fallen
 mit Wiederholung
 ohne Wiederholung
Stichproben mit variablen Wahrscheinlichkeiten: jede
Einheit der Grundgesamtheit hat eine andere Wahrscheinlichkeit,
gezogen zu werden
 Geschichtete Stichprobe
 Klumpenstichprobe
 Zweistufige Stichprobe
Nicht probabilistische Kriterien
Bewusste Auswahl: die Erhebungseinheiten werden anhand von
logischen Kriterien der Repräsentativität, Fachkenntnis des Problems
usw. ermittelt
Quotenstichprobe: die Erhebungseinheiten werden vom Erheber so
gewählt, dass die gesamte Stichprobe die Proportionen einhält, die
vorher von den Planern der Erhebung festgelegt wurden
Freiwillige Stichprobe: die Erhebungseinheiten entscheiden
selbstständig, ob sie Teil der Stichprobe sein wollen oder nicht
Großzählung
Die Großzählung ist:
eine Vollerhebung
Die gesamte Bezugsgrundgesamtheit wird beobachtet.
gleichzeitig
Die Angaben müssen sich auf denselben Zeitpunkt beziehen (die
erhobene Situation muss jene zum Zeitpunkt sein, der als Stichtag
der Zählung festgelegt wurde).
Periodisch
Sie wird in regelmäßigen Abständen wiederholt.
Direkt
Die Informationen werden bei jeder Erhebungseinheit eingeholt.
Die Großzählungen des Istat
o Allgemeine Landwirtschaftszählung
o Volks- und Wohnungszählung
o Arbeitsstättenzählung und Zählung der Nonprofit-Organisationen
Die Innovationen bei den Großzählungen
Bei den Zählungen im Zeitraum 2010-2012 wurden zahlreiche
Innovationen eingeführt, vor allem hinsichtlich der Modalitäten zur
Beantwortung und Rückgabe des Fragebogens.
Rückgabe über mehrere Kanäle
Die Unternehmen oder Haushalte konnten entscheiden, ob sie den
Fragebogen über das Internet zurückschicken oder ob sie den
Papierfragebogen beim Gemeindezählungsamt oder in einem
Postamt zurückgeben.
Der Zähler wurde vor allem bei Antwortausfällen eingesetzt.
Die Innovationen bei den Großzählungen
Die Rückgabe über mehrere Kanäle hat die verschiedenen Probleme
in Zusammenhang mit der Datenqualität aufgezeigt.
 Selbstausfüllung vs. Beantwortung mit Zähler
(Möglichkeit, nach Erklärungen zu fragen, fehlende Antworten/sich
wiederholende Antworten usw.)
 Unterstützte Beantwortung über Internet vs. Beantwortung auf
Papier
(Folgerichtigkeit der Abläufe, probabilistische/deterministische
Kontrollen usw.)
 Notwendigkeit der Dateneingabe
(Tippfehler/optisches Einlesen, Verlust/Beschädigung der
Fragebögen usw.)
Bibliografie
Fortini, M. (2000), Linee guida metodologiche per rilevazioni
statistiche, Istat
http://www.istat.it/it/files/2010/09/lineeguida.pdf
Maggino, F. (2005), L’analisi dei dati nell’indagine statistica, Firenze
University Press
…und jetzt…
Gute Arbeit!
Rete per la promozione
della cultura statistica
Per ulteriori moduli didattici relativi alle scuole secondarie di secondo grado si prega di consultare anche la piattaforma Scuola di
statistica – Lab (accessibile dal link http://scuoladistatistica-lab.istat.it/)