Vzorčni načrt – verjetnostni vzorci

Download Report

Transcript Vzorčni načrt – verjetnostni vzorci

Podatki
Vzorčni načrt
Vzorec ali populacija?
Prednosti vzorca:
•
•
vseh enot populacije ne moremo uporabiti
 zaradi stroškov (ni mogoče zajeti vseh)
 zaradi učinka merjenja (ni smiselno zajeti
vseh)
skupna napaka je manjša
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt
Koraki procesa vzorčenja:

opredelitev populacije

glede na raziskovalni problem

problem pogostosti (incedence)

po lastnostih, prostorsko, časovno, ...

izbor vzorčnega okvirja (spiska enot opredeljene
populacije)

stopnja pomanjkljivosti vzorčnih okvirjev

izbor metode vzorčenja

neverjetnostni vzorci, pri katerih posploševanje na
populacijo z logiko statističnega sklepanja ni možno
(vzorčne napake ne moremo oceniti)

verjetnostni vzorci, pri katerih je možno
posploševanje na populacijo z logiko statističnega
sklepanja (vzorčno napako lahko ocenimo)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt

določitev velikosti vzorca: pomembna je variabilnost
merjenega, ne pa velikost populacije!

vsaj nekaj sto enot

intuitivna ocena oziroma ocena strokovnjaka

pripravljalna raziskava

pri verjetnostnih vzorcih izračun
 na osnovi absolutne natančnosti ali relativne
natančnosti ali dopustnega tveganja
 pri oceni parametra ali pri zavračanju ničelne domneve

izračun na osnovi drugih raziskav

poseben primer so zaporedni (sequential) vzorci, kjer
število enot ni vnaprej določeno
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – neverjetnostni vzorci



priložnostni vzorec (convenience sample)

vzorec enot, ki so 'pri roki‘
 npr. prostovoljci, mimoidoči, ..., kličejo na odzivnik, ...
subjektivni vzorec (judgment sample)

vzorec enot, ki ga sestavi poznavalec na osnovi svoje presoje
za predstavitev opredeljene populacije
 npr. prebivalci “ključnih” okolišev, ..., snežna kepa, ...,
košarice, ... , izbrane trgovine, ...
kvotni vzorec (quota sample)

enote niso izbrane naključno, vendar celotni vzorec odseva
izbrane lastnosti populacije
 npr. izobrazbeno strukturo, vernost, spol, ...
 izbrane lastnosti morajo biti ključne za problem (tiste, ki
povzročajo variabilnost merjenega)
 po drugih lastnostih je vzorec lahko povsem
nereprezentativen
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci


enostavni slučajni vzorec (simple random sample )

vzorec, pri katerem naključno izbiramo enote iz
vzorčnega okvirja
 npr. žreb iz bobna, naključna števila, ...
 problem je resnična naključnost
 vsak element ima vnaprej znano in enako verjetnost
izbora, vse kombinacije elementov v izbranem
vzorcu so enako verjetne, ...
 intuitivno preprost vzorec, izhodišče vseh teorij
 običajno precej veliki vzorci
 primeren predvsem za splošne, manj raziskane
probleme
sistematični vzorec (sistematic sample )

vzorec, pri katerem po naključnem začetku
sistematično izbiramo enote iz urejenega vzorčnega
okvirja
 npr. vsako n-to enoto, po narisanem vzorcu, ...
 primerno predvsem kot korak do končnega vzorca
prirejeno po: Lobe, Uhan, Tivadar,
...
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci

stratificirani vzorec (stratified sample )

vzorec, pri katerem enote v vzorčnem okvirju najprej
stratificiramo v homogene stratume, nato pa vzorčimo
znotraj vsakega stratuma
 izbor lastnosti za oblikovanje stratumov in število
stratumov sta ključna - v stratumih mora biti
variabilnost merjenega karseda majhna
 pri vzorčenju lahko iz stratumov z večjo variabilnostjo
izberemo neproporcionalno višje deleže enot
 ocena parametra bo natančnejša pri manjšem vzorcu,
oblikovanje vzorca pa zahtevnejše
 primerno predvsem za konkretne, že dobro raziskane
probleme
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci

vzorec skupin (cluster sample )

vzorec, pri katerem enote najprej razdelimo na heterogene
skupine, nato pa izberemo vzorec skupin (enostopenjski
vzorec skupin) ali pa vzorčimo znotraj vsake skupine
(dvostopenjski vzorec skupin)
 v skupinah mora biti variabilnost merjenega karseda
podobna variabilnosti v populaciji
 sistematično vzorčenje lahko uporabimo za oblikovanje
skupin na osnovi urejenega vzorčnega okvira
 geografske enote lahko uporabimo za oblikovanje skupin
brez kakršnegakoli vzorčnega okvira
 pri vzorčenju iz skupin (druga stopnja) lahko popravimo
verjetnost izbora enot iz bolj zapostavljenih skupin
 primerno predvsem, kadar vzorčni okvir ni dosegljiv ali
ima preveč pomanjkljivosti (uporabimo geografske enote)
 stroškovno je praviloma ugoden, zato lahko zajame večje
število anketiranih
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Preprost primer ESV

Najpreprostejša metoda (ne tudi najbolj razširjena), vsebuje
načela kompleksnejših metod
Ponazoritev:


1. populacija so vsi študenti in študentke vpisani na FDV
2000/09
2. uporabimo celoten seznam vpisnih številk - npr. N=2000
študentov
 (celoten seznam enot v populaciji = primer vzorčnega
okvira)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Preprost primer ESV

3. določimo velikost vzorca, recimo n = 250
 Znak “n” se uporablja za velikost vzorca, “N” za velikost
ciljne populacije. Vzorčni delež je f=250/2000=0.125
 vzorčni interval je 1:8
 sistematični vzorec n=250 dobimo tako, da določimo
slučajno številko med 1 in 8 - s tem dobimo prvega
študenta v vzorcu, nato pa vključimo vsakega osmega
študenta
prirejeno po: Lobe, Uhan, Tivadar,
FDV
ESV


če se zgodi, da nam zmanjka
enot, tj. da bi prišli do konca
seznama, preden bi nabrali dovolj
enot, nadaljujemo na začetku
seznama

(obravnamo ga kot, da je
cikličen = konec in začetek
seznama se stikata)
Problem: če je vzorčni okvir
narejen po kakšnem specifičnem
ključu – npr.
slučajni začetek = 2
vzorčni interval = 4
prirejeno po: Lobe, Uhan, Tivadar,
FDV
1
M
2
Ž
3
M
4
Ž
5
M
6
Ž
7
M
8
Ž
9
M
10
Ž
11
M
12
Ž
Stratificirani vzorec

Zgled:
 1. ciljna populacija: vpisani na visokošolski program v
šolskem letu 2008/09 na FDV
 2. seznam vpisnih številk po letnikih (letnik = stratum),
 3. iz vsakega letnika v vzorec slučajno izberemo
določeno število vpisnih številk,
 tako, da je velikost posameznega stratuma,
sorazmerna velikosti posameznega letnika.
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
Ko popolnega seznama enot ciljne populacije nimamo ali
ko želimo prihraniti čas in denar (zelo pogosta želja).
Značilen tip vzorčenja pri osebnem anketiranju na terenu
oz. za velike in/ali geografsko razpršene populacije
 npr. država, regije, velika mesta
 Uporabljamo hierarhijo skupin:
 najprej izberemo večje skupine, v njih manjše itn.
dokler ne pridemo do stopnje, kjer izbiramo enote,
npr.
 1. seznam vseh podjetij (npr. srednje velikih podjetij)
, 2. izberemo verjetnostni vzorec 100 podjetij, 3. v
vsakem od 100 podjetij naredimo verjetnostni vzorec
zaposlenih




prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
 Odločitev: koliko skupin?
 Manj podjetij in več oseb ali več podjetij in manj oseb
v vsakem?
 Več skupin je bolje kot manj  večja raznolikost 
boljša reprezentativnost
 Še boljše: večstopenjsko vzorčenje v skupinah
 Primer: ciljna populacija: zaposleni v srednje velikih
podjetjih
 1. naredimo seznam srednje velikih podjetij po
dejavnosti (SKD – npr. strokovne, znanstvene in
tehnične; finančne in zavarovalniške, informacijske in
komunikacijske ...)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
 2. iz vsake dejavnosti slučajno izberemo
po eno podjetje
 3. iz vsakega podjetja z enim od
verjetnostnih postopkov izberemo
zaposlene
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin



1) Komplicirani statistični izračuni oz.
2) Praksa (Neuman, 2001) – ki izhaja iz statistične teorije:
manjša kot je populacija, večji vzorec rabimo
 za populacije manjše od 1000 enot  vključi 30 %
populacije (n = 300)
 za populacije 10.000 enot  vključi 10 % populacije (n =
1000)
 populacije nad 150.000  vključi 1 % populacije (n =
1500)
 populacije nad 10 milijonov  vključi 0,025 % populacije
(n = 2500)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Moč verjetnostnih vzorcev
 V splošnem verjetnostni vzorci bolj verjetno
predstavljajo populacijo kot neverjetnostni = so bolj
verjetno reprezentativni
 Verjetnostni vzorci nam omogočajo, da na podlagi
rezultata, ki smo ga dobili z njimi, sklepamo, kakšen
rezultat bi dobili, če bi vprašali vso populacijo  jezik:
statistično značilne razlike
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorčna napaka
 Nikoli pa ne moremo biti 100 % gotovi, vedno obstaja
možnost, da se motimo, tudi pri odličnih verjetnostnih
vzorcih
 Vzorčna napaka:
 posledica tega, da raziskujemo vzorec in ne celo
populacijo
 = razlika med vzorcem in populacijo iz katere je
izbran
  zato je pričakovano, da se rezultati različnih
raziskav istega pojava (npr. katero stranko bi volili
...?), med seboj razlikujejo
prirejeno po: Lobe, Uhan, Tivadar,
FDV