Vzorčni načrt – verjetnostni vzorci
Download
Report
Transcript Vzorčni načrt – verjetnostni vzorci
Podatki
Vzorčni načrt
Vzorec ali populacija?
Prednosti vzorca:
•
•
vseh enot populacije ne moremo uporabiti
zaradi stroškov (ni mogoče zajeti vseh)
zaradi učinka merjenja (ni smiselno zajeti
vseh)
skupna napaka je manjša
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt
Koraki procesa vzorčenja:
opredelitev populacije
glede na raziskovalni problem
problem pogostosti (incedence)
po lastnostih, prostorsko, časovno, ...
izbor vzorčnega okvirja (spiska enot opredeljene
populacije)
stopnja pomanjkljivosti vzorčnih okvirjev
izbor metode vzorčenja
neverjetnostni vzorci, pri katerih posploševanje na
populacijo z logiko statističnega sklepanja ni možno
(vzorčne napake ne moremo oceniti)
verjetnostni vzorci, pri katerih je možno
posploševanje na populacijo z logiko statističnega
sklepanja (vzorčno napako lahko ocenimo)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt
določitev velikosti vzorca: pomembna je variabilnost
merjenega, ne pa velikost populacije!
vsaj nekaj sto enot
intuitivna ocena oziroma ocena strokovnjaka
pripravljalna raziskava
pri verjetnostnih vzorcih izračun
na osnovi absolutne natančnosti ali relativne
natančnosti ali dopustnega tveganja
pri oceni parametra ali pri zavračanju ničelne domneve
izračun na osnovi drugih raziskav
poseben primer so zaporedni (sequential) vzorci, kjer
število enot ni vnaprej določeno
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – neverjetnostni vzorci
priložnostni vzorec (convenience sample)
vzorec enot, ki so 'pri roki‘
npr. prostovoljci, mimoidoči, ..., kličejo na odzivnik, ...
subjektivni vzorec (judgment sample)
vzorec enot, ki ga sestavi poznavalec na osnovi svoje presoje
za predstavitev opredeljene populacije
npr. prebivalci “ključnih” okolišev, ..., snežna kepa, ...,
košarice, ... , izbrane trgovine, ...
kvotni vzorec (quota sample)
enote niso izbrane naključno, vendar celotni vzorec odseva
izbrane lastnosti populacije
npr. izobrazbeno strukturo, vernost, spol, ...
izbrane lastnosti morajo biti ključne za problem (tiste, ki
povzročajo variabilnost merjenega)
po drugih lastnostih je vzorec lahko povsem
nereprezentativen
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci
enostavni slučajni vzorec (simple random sample )
vzorec, pri katerem naključno izbiramo enote iz
vzorčnega okvirja
npr. žreb iz bobna, naključna števila, ...
problem je resnična naključnost
vsak element ima vnaprej znano in enako verjetnost
izbora, vse kombinacije elementov v izbranem
vzorcu so enako verjetne, ...
intuitivno preprost vzorec, izhodišče vseh teorij
običajno precej veliki vzorci
primeren predvsem za splošne, manj raziskane
probleme
sistematični vzorec (sistematic sample )
vzorec, pri katerem po naključnem začetku
sistematično izbiramo enote iz urejenega vzorčnega
okvirja
npr. vsako n-to enoto, po narisanem vzorcu, ...
primerno predvsem kot korak do končnega vzorca
prirejeno po: Lobe, Uhan, Tivadar,
...
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci
stratificirani vzorec (stratified sample )
vzorec, pri katerem enote v vzorčnem okvirju najprej
stratificiramo v homogene stratume, nato pa vzorčimo
znotraj vsakega stratuma
izbor lastnosti za oblikovanje stratumov in število
stratumov sta ključna - v stratumih mora biti
variabilnost merjenega karseda majhna
pri vzorčenju lahko iz stratumov z večjo variabilnostjo
izberemo neproporcionalno višje deleže enot
ocena parametra bo natančnejša pri manjšem vzorcu,
oblikovanje vzorca pa zahtevnejše
primerno predvsem za konkretne, že dobro raziskane
probleme
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Podatki
Vzorčni načrt – verjetnostni vzorci
vzorec skupin (cluster sample )
vzorec, pri katerem enote najprej razdelimo na heterogene
skupine, nato pa izberemo vzorec skupin (enostopenjski
vzorec skupin) ali pa vzorčimo znotraj vsake skupine
(dvostopenjski vzorec skupin)
v skupinah mora biti variabilnost merjenega karseda
podobna variabilnosti v populaciji
sistematično vzorčenje lahko uporabimo za oblikovanje
skupin na osnovi urejenega vzorčnega okvira
geografske enote lahko uporabimo za oblikovanje skupin
brez kakršnegakoli vzorčnega okvira
pri vzorčenju iz skupin (druga stopnja) lahko popravimo
verjetnost izbora enot iz bolj zapostavljenih skupin
primerno predvsem, kadar vzorčni okvir ni dosegljiv ali
ima preveč pomanjkljivosti (uporabimo geografske enote)
stroškovno je praviloma ugoden, zato lahko zajame večje
število anketiranih
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Preprost primer ESV
Najpreprostejša metoda (ne tudi najbolj razširjena), vsebuje
načela kompleksnejših metod
Ponazoritev:
1. populacija so vsi študenti in študentke vpisani na FDV
2000/09
2. uporabimo celoten seznam vpisnih številk - npr. N=2000
študentov
(celoten seznam enot v populaciji = primer vzorčnega
okvira)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Preprost primer ESV
3. določimo velikost vzorca, recimo n = 250
Znak “n” se uporablja za velikost vzorca, “N” za velikost
ciljne populacije. Vzorčni delež je f=250/2000=0.125
vzorčni interval je 1:8
sistematični vzorec n=250 dobimo tako, da določimo
slučajno številko med 1 in 8 - s tem dobimo prvega
študenta v vzorcu, nato pa vključimo vsakega osmega
študenta
prirejeno po: Lobe, Uhan, Tivadar,
FDV
ESV
če se zgodi, da nam zmanjka
enot, tj. da bi prišli do konca
seznama, preden bi nabrali dovolj
enot, nadaljujemo na začetku
seznama
(obravnamo ga kot, da je
cikličen = konec in začetek
seznama se stikata)
Problem: če je vzorčni okvir
narejen po kakšnem specifičnem
ključu – npr.
slučajni začetek = 2
vzorčni interval = 4
prirejeno po: Lobe, Uhan, Tivadar,
FDV
1
M
2
Ž
3
M
4
Ž
5
M
6
Ž
7
M
8
Ž
9
M
10
Ž
11
M
12
Ž
Stratificirani vzorec
Zgled:
1. ciljna populacija: vpisani na visokošolski program v
šolskem letu 2008/09 na FDV
2. seznam vpisnih številk po letnikih (letnik = stratum),
3. iz vsakega letnika v vzorec slučajno izberemo
določeno število vpisnih številk,
tako, da je velikost posameznega stratuma,
sorazmerna velikosti posameznega letnika.
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
Ko popolnega seznama enot ciljne populacije nimamo ali
ko želimo prihraniti čas in denar (zelo pogosta želja).
Značilen tip vzorčenja pri osebnem anketiranju na terenu
oz. za velike in/ali geografsko razpršene populacije
npr. država, regije, velika mesta
Uporabljamo hierarhijo skupin:
najprej izberemo večje skupine, v njih manjše itn.
dokler ne pridemo do stopnje, kjer izbiramo enote,
npr.
1. seznam vseh podjetij (npr. srednje velikih podjetij)
, 2. izberemo verjetnostni vzorec 100 podjetij, 3. v
vsakem od 100 podjetij naredimo verjetnostni vzorec
zaposlenih
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
Odločitev: koliko skupin?
Manj podjetij in več oseb ali več podjetij in manj oseb
v vsakem?
Več skupin je bolje kot manj večja raznolikost
boljša reprezentativnost
Še boljše: večstopenjsko vzorčenje v skupinah
Primer: ciljna populacija: zaposleni v srednje velikih
podjetjih
1. naredimo seznam srednje velikih podjetij po
dejavnosti (SKD – npr. strokovne, znanstvene in
tehnične; finančne in zavarovalniške, informacijske in
komunikacijske ...)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
2. iz vsake dejavnosti slučajno izberemo
po eno podjetje
3. iz vsakega podjetja z enim od
verjetnostnih postopkov izberemo
zaposlene
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorec skupin
1) Komplicirani statistični izračuni oz.
2) Praksa (Neuman, 2001) – ki izhaja iz statistične teorije:
manjša kot je populacija, večji vzorec rabimo
za populacije manjše od 1000 enot vključi 30 %
populacije (n = 300)
za populacije 10.000 enot vključi 10 % populacije (n =
1000)
populacije nad 150.000 vključi 1 % populacije (n =
1500)
populacije nad 10 milijonov vključi 0,025 % populacije
(n = 2500)
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Moč verjetnostnih vzorcev
V splošnem verjetnostni vzorci bolj verjetno
predstavljajo populacijo kot neverjetnostni = so bolj
verjetno reprezentativni
Verjetnostni vzorci nam omogočajo, da na podlagi
rezultata, ki smo ga dobili z njimi, sklepamo, kakšen
rezultat bi dobili, če bi vprašali vso populacijo jezik:
statistično značilne razlike
prirejeno po: Lobe, Uhan, Tivadar,
FDV
Vzorčna napaka
Nikoli pa ne moremo biti 100 % gotovi, vedno obstaja
možnost, da se motimo, tudi pri odličnih verjetnostnih
vzorcih
Vzorčna napaka:
posledica tega, da raziskujemo vzorec in ne celo
populacijo
= razlika med vzorcem in populacijo iz katere je
izbran
zato je pričakovano, da se rezultati različnih
raziskav istega pojava (npr. katero stranko bi volili
...?), med seboj razlikujejo
prirejeno po: Lobe, Uhan, Tivadar,
FDV