Optimális rétegzés és településrétegzési vizsgálatok a KSH

Download Report

Transcript Optimális rétegzés és településrétegzési vizsgálatok a KSH

Optimális rétegzés
és
településrétegzési vizsgálatok a
KSH lakossági felvételeiben
Fraller Gergely
1. Mintavételi rétegzés – példa
2. Településrétegzési vizsgálatok – az ok
3. Településrétegzési vizsgálatok
- rétegzés
- allokáció
4. Új mintavételi terv
- rétegzés
- allokáció
Példa:
adott 10000 elemű sokaság – x
Példa (folyt.):
X értékösszeg becslése egy
• 99 elemű
• rétegzett (rétegszám=3)
• egyszerű véletlen
mintából,
• arányos allokáció mellett
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
1.
2.
3.
4.
5.
10 000
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
129 063
34
rétegben
nincs rétegzés
1.
2.
3.
4.
5.
egyenlő elemszám
10 000
3 333
3 333
3 334
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
10 000
1.
egyenlő elemszám
3 333
3 333
3 334
129 063
34
2.
egyenlő súlyú x-re
5 275
2 974
1 751
93 929
25
3.
4.
5.
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
10 000
1.
egyenlő elemszám
3 333
3 333
3 334
129 063
34
2.
egyenlő súlyú x-re
5 275
2 974
1 751
93 929
25
4 277
4 603
1 120
85 157
23
3.
4.
5.
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
10 000
1.
egyenlő elemszám
3 333
3 333
3 334
129 063
34
2.
egyenlő súlyú x-re
5 275
2 974
1 751
93 929
25
3.
4 277
4 603
1 120
85 157
23
4.
5 578
3 599
823
79 908
21
5.
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
10 000
1.
egyenlő elemszám
3 333
3 333
3 334
129 063
34
2.
egyenlő súlyú x-re
5 275
2 974
1 751
93 929
25
3.
4 277
4 603
1 120
85 157
23
4.
5 578
3 599
823
79 908
21
5.
5 529
3 642
829
79 921
21
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
elemszám az
rétegzés
1.
2.
3.
szórásnégyzet
szórásnégyzet
a rétegzés
nélküli változat
%-ában
376 817
100
rétegben
nincs rétegzés
10 000
1.
egyenlő elemszám
3 333
3 333
3 334
129 063
34
2.
egyenlő súlyú x-re
5 275
2 974
1 751
93 929
25
3.
kumulatív √f szabály
4 277
4 603
1 120
85 157
23
4.
Sethi algoritmusa
5 578
3 599
823
79 908
21
5.
A1-A4 algoritmus
5 529
3 642
829
79 921
21
Léteznek optimális
rétegzési eljárások
Optimális rétegzésegyszerű véletlen kiválasztás
• Számos eredmény már az ’50-es években
• Sethi:
– táblázatban optimális réteghatárok
Normális és Khi-négyzet eloszlásokra
különböző allokációkra
különböző rétegszám mellett
– egyszerű algoritmusok
Optimális rétegzéspps kiválasztás
•
•
•
•
A1-A4 algoritmus (a kanadai gyakorlatból)
Arányos allokáció  optimális rétegzés
Több változó bevonása lehetséges!
A hatékonyság mérőszáma:
rétegzési index (0-100)
ennyi %-kal csökken az összegbecslés
szórásnégyzete
Példa (folyt.)
értékösszegbecslés elméleti szórásnégyzete
és a rétegzési index
elemszám az
rétegzés
1.
2.
3.
rétegben
nincs rétegzés
10 000
szórásnégyzet
a rétegzés
nélküli változat
%-ában
rétegzési
index
100
0
1.
egyenlő elemszám
3 333
3 333
3 334
34
66
2.
egyenlő súlyú x-re
5 275
2 974
1 751
25
75
3.
kumulatív √f szabály
4 277
4 603
1 120
23
77
4.
Sethi algoritmusa
5 578
3 599
823
21
79
5.
A1-A4 algoritmus
5 529
3 642
829
21
79
A településrétegzési vizsgálatok
előélete
• 2003: új MEFés HKF
• 2004: LUSZ
• 2005: IKT és VÉKA
 1135 település érintett 2008-ban
• 2008-9: koncentrált összeíró-hálózat
• 2008: a lakossági adatgyűjtések
mintáinak harmonizálása projekt
A lakossági adatgyűjtések mintáinak
harmonizálása –
településrétegzési vizsgálatok
1.
2.
3.
4.
5.
6.
helyzetfelmérés
rétegzési technikák kutatása
új rétegző változók és technikák tesztelése
optimális allokáció vizsgálata
konkrét településrétegzés
konkrét allokáció
Új rétegző változók és technikák
tesztelése – célok
• Milyen változókat érdemes bevonni?
• Milyen technikát érdemes alkalmazni?
• Hány réteget célszerű kialakítani?
Új rétegző változók és technikák
tesztelése – módszer
• Nagy számú rétegzés kialakítása
– különböző változók bevonásával
– különböző módszerekkel
– különböző rétegszámokkal
• Az összehasonlítás alapja a MEF
• Az összehasonlítás eszköze a rétegzési
index népszámlálási változókon, a MEF nem
önreprezentáló településeinek sokaságán
Új rétegző változók és technikák
tesztelése – néhány rétegzés
rétegzési index
a rétegzés rövid leírása
T1
MEF-es rétegzés (utólagos rétegzéssel!)
megyén belül 4 réteg
R7
egy főre eső regisztrált mn. szerint ’01
K7
komplex fejlettségi mutató szerint ’02
K’7
komplex fejlettségi mutató szerint ’07
S7
SZJA001 szerint ’01
a regisztrált munkanélküli létszám és a
településre eső SZJA alapot képező
O501
jövedelem szerint optimális rétegzés (A1A4)
O415 V1-V4 szerint optimális rétegzés (A1-A4)
60 évnél
felsőfokú fiatalabb
munkané foglalkoz
végzetts felsőfokú
lküli
tatott
égű
végzettségű
háztartásfő
53
63
40
39
62
48
53
53
62
73
78
75
36
66
64
61
36
65
63
60
62
75
58
58
75
78
77
77
Új rétegző változók és technikák
tesztelése – tanulságok
•
•
•
•
az A1-A4 algoritmust célszerű használni
megyénként eltérő számú réteg
megyénként független rétegkialakítás
a regisztrált mn. és jövedelem változók
bevonása célszerű
• felértékelődik az optimális allokáció
Az optimális allokáció vizsgálata
• Képletszerű megoldások a településszámra
és a településenkénti mintaelemszámokra
• Vizsgálatok a MEF rétegzése mellett
– Az összehasonlítás alapja: a munkanélküli
létszám becslésének elméleti szórásnégyzete
– Optimális allokáció
– X-optimális allokáció
– Rétegen belüli allokáció
• Vizsgálatok alternatív rétegzések mellett
Optimális allokáció alternatív
rétegzések mellett
a rétegzés
T1
MEF-es rétegzés (utólagos rétegzéssel!)
megyén belül 4 réteg
a munkanélküliség
becslés
szórásnégyzete a
MEF %-ában
100
K7
komplex fejlettségi mutató szerint ’02
95
K’7
komplex fejlettségi mutató szerint ’07
93
S7
93
O501
SZJA001 szerint ’01
a regisztrált munkanélküli létszám és a
településre eső SZJA alapot képező
jövedelem szerint optimális rétegzés (A1A4)
O415
V1-V4 szerint optimális rétegzés (A1-A4)
85
90
Új mintavételi terv –
településrétegzés
• Bevont változók
– V1 munkanélküli létszám (2001 cenzus)
– V2 foglakoztatott létszám (2001 cenzus)
– V3 felsőfokú végz. létszáma (2001 cenzus)
– V4-V11 regisztrált munkanélküliek 2001-2008
– V12-V19 jövedelem 2001-2008
• Összesen 113 réteg, megyénként 5-8
Új mintavételi terv –
településrétegzés, eredmény
Országos rétegzés indexek a V1-V19 változókra
rétegzés
réteg
szám
V
1
V
2
V
3
V
4
V
5
V
6
V
7
V
8
V
9
V
10
V
11
V
12
V
13
V
14
V
15
V
16
V
17
V
18
V
19
113
77
80
73
81
82
82
82
81
80
79
78
87
89
88
89
88
88
88
87
103
53
63
40
61
60
57
56
54
52
52
50
68
69
68
67
66
65
68
66
alternatív
rétegzés
MEF
rétegzés
Új mintavételi terv – allokáció
• A MEF megyei mintaelemszámai mellett
• Cél: minél kevesebb település mellett nem
kevésbé pontos becslések
• Településszám-allokáció
• Településenkénti mintaelemszám
Mintaelemszám és szórásnégyzet – a MEF és az új terv szerint
ország összesen
02 - Közép-Mo.
03 - Közép-Du.
04 - Nyugat-Du.
05 - Dél-Du.
06 - Észak Mo.
07 - Észak-Alf.
08 - Dél-Alf.
02
Budapest
02
Pest
03
Fejér
03
Komárom-Esztergom
03
Veszprém
04
Győr-Moson-Sopron
04
Vas
04
Zala
05
Baranya
05
Somogy
05
Tolna
06
Borsod-Abaúj-Zemplén
06
Heves
06
Nógrád
07
Hajdú-Bihar
07
Szabolcs-Szatmár-Bereg
07
Jász-Nagykun-Szolnok
08
Bács-Kiskun
08
Békés
08
Csongrád
új és régi szórásnégyzet hányadosa %településszám
lakássszám
ban
összes
összes
MEF
új
MEF
új
V1
V2
V3
684
534 37 710 37 719
88
90
93
98
84 8 466
8 394
92
96
102
83
71 4 242
4 223
89
95
82
87
71 4 065
4 203
86
84
82
102
87 4 260
4 351
80
77
71
115
78 5 364
5 321
85
87
83
108
69 5 610
5 570
89
88
96
91
74 5 703
5 657
89
89
93
23
23 4 455
4 416
97
101
108
75
61 4 011
3 978
82
85
81
28
21 1 623
1 605
92
96
81
24
20 1 236
1 227
88
94
83
31
30 1 383
1 391
87
95
82
27
25 1 527
1 551
89
84
84
31
28 1 275
1 385
80
79
76
29
18 1 263
1 267
85
88
83
41
31 1 725
1 788
79
72
65
37
34 1 497
1 522
81
76
73
24
22 1 038
1 041
81
85
86
60
43 2 868
2 847
87
87
81
29
19 1 407
1 394
81
87
89
26
16 1 089
1 080
83
85
82
28
23 1 863
1 849
91
91
100
51
25 2 229
2 217
92
85
90
29
21 1 518
1 504
83
88
98
41
36 2 670
2 649
89
88
93
30
22 1 563
1 548
87
91
94
20
16 1 470
1 460
92
88
93
Településrétegzési kutatások –
összefoglalás
• Eredményes elméleti kutatás  új
ismeretek az optimális rétegzés területén
• Gyakorlati tapasztalatok az optimális
településrétegzés és allokáció területén 
hatékonynak tűnő újfajta mintavételi terv
– időbeli hatékonysága bizonytalan
Településrétegzési kutatások –
jelen és jövő
• a projektnek vége,
• a kutatásnak még nem
– a 2011-es cenzus után ellenőrzés két
népszámlálás adatai alapján
 válasz arra, hogy időben tud-e hatékony
maradni az újfajta mintavételi terv (rétegzés)