Mintavételes eljárások - Gazdaságtudományi kar

Download Report

Transcript Mintavételes eljárások - Gazdaságtudományi kar

Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Mintavételes eljárások
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Adatszerzési módok
Kontrollált kísérletek
Részleges adatfelvétel
Teljes körű adatfelvétel
Reprezentatív
megfigyelés
Egyéb részleges
adatfelvétel
Véletlenen alapuló
kiválasztás
FAE
EV
R
CS
Nem véletlenen alapuló
kiválasztás
TL
Szisztematikus
Kvótás
Hólabda
Koncentrált
Önkényes
Stb.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Kontrollált kísérletek
• végtelen sokaságról való informálódás
eszköze
• arra ad választ, hogy a kísérlet végzője által
megtervezett feltétel együttesek (kezelések)
milyen eredményre vezetnek.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Reprezentatív megfigyelés
• A mintavételből származó eredményeket a
sokaság egészének jellemzésére használják,
azaz általánosítanak a teljes sokaságra.
• A reprezentatív minta: tükrözi az alapsokaságot, annak tulajdonságait, összetételét.
• Mindig megadható a mintavételi hiba, azaz,
hogy a mintavétel tényéből mekkora hiba
fakad.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Nem reprezentatív megfigyelés
(egyéb részleges megfigyelés)
• Nincs benne az általánosításra való
törekvés, a következtetések kizárólag
megfigyelt egyedekre vonatkoznak.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Véletlenen alapuló kiválasztás
módjai
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
FAE - független, azonos eloszlású
minta
• Homogén és végtelen (nagyon nagy)
számosságú sokaságból veszünk mintát
visszatevéssel vagy visszatevés nélkül.
• Hasonló eredményre vezet, ha véges
sokaságból egyenlő valószínűséggel
visszatevéses mintát veszünk.
• Gyakorlati alkalmazása: elsősorban a
tömegtermelés minőségellenőrzésénél.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
EV - egyszerű véletlen minta
• Homogén és véges elemszámú sokaság
esetén alkalmazható.
• A mintát visszatevés nélkül választjuk ki.
• Minden lehetséges n elemű minta
kiválasztásának a valószínűsége azonos.
• Hasonló a FAE mintához, de véges és
kisebb elemszámú sokaságok esetén inkább
ez használatos.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
R - rétegzett mintavétel
• Heterogén sokaság esetén alkalmazható.
• A fősokaságot valamilyen ismérv szerint átfedésmentesen homogén rétegekre osztjuk.
• Az egyes rétegeken belül egymástól függetlenül
EV (ritkábban FAE) mintát veszünk.
• Azonos mintanagyság esetén a vizsgált
jellemzőkre (, ) kisebb hibát kapunk, mint az
EV mintavétellel feltéve, hogy a rétegezés jó volt.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
egyenletes rétegzés
N1
N3
N2
n
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
arányos rétegzés
N1
n1
N3
n3
n2
N2
ni  n
N i i
L
N 
i 1
i
i
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Neyman-féle optimális rétegzés
• – nagyobb rétegekből nagyobb mintát vesz
• – a változékonyabb, heterogénebb
rétegekből szintén nagyobb mintát vesz
ni  n
N i i
L
N 
i 1
i
i
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
költség-optimális rétegzés
• az egyes rétegek szórása mellett
figyelembe vesszük az egyes rétegek
megfigyelésének költségét is
• adott költségkeret mellett minimális
hibát eredményez
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
CS - csoportos (egylépcsős)
mintavétel
• Homogén, véges sokaság esetén, ha nem áll
rendelkezésre a sokasági elemek teljes listája, de
nagyobb csoportokra rendelkezünk listával.
• Ha a csoportok a koncentráltságuk miatt
könnyebben, olcsóbban figyelhetők meg, mint az
egyedek.
• Először a csoportok halmazából EV mintát
veszünk, majd az így kiválasztott csoportokat
teljes körűen megfigyeljük (pl: iskolások
drogfogyasztási szokásai).
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
TL - többlépcsős mintavétel
• hasonló esetekben használjuk, mint a
csoportos mintavételt
• itt több lépcsőben jutunk el a végső
megfigyelési egységhez
• leggyakoribb a kétlépcsős
• először EV mintavétellel kiválasztjuk a
csoportokat, majd a csoporton belül is EV
mintavételt végzünk
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Grafikusan ábrázolva
R
EV vagy FAE
R
CS
TL
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Nem véletlen mintavételi eljárások
1.Szisztematikus kiválasztás
• ha n elemű mintát akarunk venni egy N elemű
sokaságból, akkor meghatározva a k=N/n
lépésközt a k0 véletlen kezdőpontból kiindulva
minden k-adik elemet figyeljük meg:
k0, k0+k, k0 +2k; …
• A minta gyorsan és mechanikusan kiválasztható.
• Egybeeshet az EV megfigyeléssel, ha az elemek
felsorolása független a megfigyelés tárgyától.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Nem véletlen mintavételi eljárások
•
•
•
•
2.) Kvótás kiválasztás
3.) Koncentrált kiválasztás
4.) Hólabda kiválasztás
5.) Önkényes (szubjektív) kiválasztás
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Ismételt vagy másodlagos
mintavételi eljárások jellemzői
• Speciális csoport a gyakorlatban alkalmazott
mintavételi módok között.
• Elvi alapja az a felismerés, hogy a tényleges
mintavétel igen költséges, míg a számítógép
használata egyre olcsóbb! → a meglévő kisebb és
olcsóbb mintákat számítógépes módszerekkel
megtöbbszörözik.
• A meglévő mintából újabb mintákat képeznek
azért, hogy a mintában lévő információkat jobban
kihasználják.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Ismételt vagy másodlagos
mintavételi eljárások
•
•
•
•
1.) Független részminták módszere
2.) Kiegyensúlyozott ismétlések
3.) Jackknife módszer
4.) Bootstrap módszer
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Bolt
Napi átl eladási
sorszáma forgalom (eFt)
1
8480
2
3360
3
2680
4
1520
5
1160
6
1040
7
1000
8
3080
9
800
10
1120
11
400
12
200
Összesen
24840
átlag
2070
Az alapsokaság adatai
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Bolt sorszáma
első réteg
1
2
3
második réteg
1
2
3
harmadik réteg
1
2
3
4
5
negyedik réteg
1
2
3
Napi átlagos eladási forgalom (eFt)
I. rétegzés
II. rétegzés
III. rétegzés
8480
3360
3080
8480
-
3080
1040
200
2680
1520
1160
3360
3080
2680
8480
1160
400
1120
1040
1000
-
1520
1160
1040
1120
1000
3360
1160
800
-
800
400
200
800
400
200
2680
1520
1000
Napi átlagos
eladási
forgalom eFt
Osztály
közép
eFt
376-625
626-875
876-1125
1126-1375
1376-1625
1626-1875
1876-2125
2126-2375
2376-2625
2626-2875
2876-3125
3126-3375
3376-3625
3626-3875
3876-4125
4126-4375
4376-4625
Összesen
500
750
1000
1250
1500
1750
2000
2250
2500
2750
3000
3250
3500
3750
4000
4250
4500
-
n=4 elemű minták átlagainak eloszlása
egyszerű
rétegezés
rétegezés rétegezés
véletlen
I.
II.
III.
kiválasztás
2
1
28
6
38
9
57
2
9
89
30
10
44
15
2
10
49
7
29
5
16
13
2
12
1
3
34
13
4
25
8
5
43
6
4
33
6
12
3
12
4
1
495
81
45
81
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Az egyszerű véletlen és a rétegzett
minták paramétereinek
összehasonlítása
n=4 elemű minták átlagainak eloszlása
egyszerű
Megnevezés
véletlen rétegezés rétegezés rétegezés
kiválasztás
I.
II.
III.
Szóródás
terjedelme
3800
1910
537
3800
Standard
hiba
923
644
121
1020
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
STATISZTIKAI BECSLÉS
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Statisztikai becslés rétegzett minta
alapján
• Az átlag pontbecslése rétegzett mintából a
rétegenként becsült átlagoknak a sokaság
nagyságával súlyozott átlaga.
ˆ ;Θ
ˆ ]  x  z s
[Θ
a
f

x
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Hányados-becslés
• A „h” mintabeli hányados nem torzítatlan becslő
függvénye a sokasági jellemzőnek. Azonban a
torzítás mértéke nagy minta esetén
elhanyagolható.
• A becsült érték (hányados) eloszlása nagy minta
esetén megközelítőleg normális eloszlást követ.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Független részminták alkalmazása
• A módszer alapja egy „n” elemű véletlen
módszerrel választott minta „k” egyenlő nagyságú
részmintára történő felosztása.
• A már kiválasztott minta utólagos felosztása helyett
célszerűbb az ún. ismételt mintavételt alkalmazni.
• Egy „m” elemű minta kiválasztását hajtjuk végre
valamely véletlen módszer alkalmazásával.
• Ezután függetlenül az előzőtől, azonos módszerekkel újabb és újabb mintát vételezünk egészen addig,
amíg „k” darab egymástól független „m”
elemszámú mintánk lesz.