Területi eloszlások és földrajzi összefüggések elemzése

Download Report

Transcript Területi eloszlások és földrajzi összefüggések elemzése

Területi eloszlások és
földrajzi összefüggések
elemzése
dr. Jeney László
egyetemi adjunktus
[email protected]
Regionális és környezeti elemzési módszerek
I. BME Regionális és környezeti gazdaságtan mesterszak (MSc), levelező
2014/2015, I. félév
BCE Gazdaságföldrajz és Jövőkutatás Tanszék
Területi egyenlőtlenségek
mérésére szolgáló statisztikai
eszközök

Területi egyenlőtlenségi indexek, leggyakrabban
használtak:
– A területi polarizáltság mérőszámai


Relatív terjedelem/Relatív range (Q)
Duál mutató/Éltető–Frigyes index (D)
– Szórás-típusú területi egyenlőtlenségi indexek

Súlyozott relatív szórás (V)
– Területi eloszlást mérő egyenlőtlenségi indexek


Hirschman–Herfindahl index (K)
Hoover-index/Krugman-index (H)
– Területi egyenlőtlenségek összetettebb mérési módszerei



Gini együttható (G)
Távolságfüggvények
Korrelációs mérőszámok
2
A területi koncentráció mérése:
Hirschman–Herfindahl index
Hirschman–Herfindahl index



Egy jelenség földrajzi koncentrációjának mérésére
használt mutatószám
Csak összegezhető (nem fajlagos) mutatóra számítható
2


Képlete


– Xi = nem fajlagos mutató i régióban
xi 

– Σxi = nem fajlagos mutató a teljes régióban K  
n


i 1
Értékkészlete: 1/n ≤ K ≤ 1
  xi 
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség
 i 1 
n

– Előfordulhat, hogy alacsonyabb területi szinten csökken az
értéke

Mértékegysége: nincs
4
Hirschman–Herfindahl index
kiszámításának lépései
1.
2.
3.
Összegezzük a vizsgált adatsort
Minden térség esetében elosztom az adott
térség értékét az előbb kiszámított összeggel
(Excel  $)
Minden térség esetében a kapott hányadosokat
négyzetre emelem (Excel  jobb oldali Alt+3
együtt, majd 2 = ^2)
– 2–3. lépések egy oszlopban is megoldhatók
4.
Az így kapott értékeket összegzem
5
Hirschman–Herfindahl index
kiszámítása Excelben
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
8
0,4 =B2/B$6
0,16 =C2^2
3
2. régió
4
0,2
0,04
4
3. régió
6
0,3
0,09
5
4. régió
2
0,1
0,01
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
0,36
=SZUM(D2:D5)
Hirschman–Herfindahl index
elméleti maximuma
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
0
0 =B2/B$6
0 =C2^2
3
2. régió
0
0
0
4
3. régió
20
1
1
5
4. régió
0
0
0
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
7
1 =SZUM(D2:D5)
Hirschman–Herfindahl index
elméleti minimuma (4 elem
esetén)
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
5
0,25 =B2/B$6
0,0625 =C2^2
3
2. régió
5
0,25
0,0625
4
3. régió
5
0,25
0,0625
5
4. régió
5
0,25
0,0625
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
0,258
=SZUM(D2:D5)
Területi eloszlások
összevetése: Hoover index
Hoover index


Egyik legelterjedtebb, legáltalánosabban használt területi
egyenlőtlenségi index
Két mennyiségi ismérv területi megoszlásának eltérését
méri
– Az egyik ismérv, társadalmi-gazdasági jelenség mennyiségének
hány százalékát kell a területi egységek között átcsoportosítani
ahhoz, hogy területi megoszlása a másik jellemzőével azonos
legyen
– Területi kutatásokban leggyakrabban a népesség területi
eloszlásával vetjük össze más társadalmi-gazdasági ismérvével


1941: E. M. Hoover, amerikai agrárközgazdász
Használja a földrajz, szociológia, közgazdaságtan,
ökológia is
10
Hoover index

Két nem fajlagos mutató területi megoszlása közötti
eltérést mérhetjük vele
– Egy fajlagos mutató számlálója és nevezője között is lehet

Képlete:
– xi = i régió részesedése x nem fajlagos mutatóból
– yi = i régió részesedése y nem fajlagos mutatóból

n
H
x y
i 1

az alábbi összefüggések
A mutató szimmetrikus, a két összevetett megoszlás (xi
és yi) szerepe, sorrendje felcserélhető
Értékkészlete: 0 ≤ H ≤ 100
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség 11

2
i
xi és yi: két megoszlási viszonyszám, melyekre fennállnak
– Σxi = 100
– Σyi = 100

i
Mértékegysége: %
Hoover index kiszámításának
lépései
1.
2.
3.
4.
Mindkét nem fajlagos mutató adatsorának értékeit
összegezzük
Minden térség esetében kiszámítjuk az adott térség
százalékos részesedését az összes mennyiségből
(mindkét mutató esetében)
Minden térség esetében kivonjuk az egyik mutató
szerinti százalékos részesedésből a másik mutató
szerinti százalékos részesedést
Minden térség esetében az így kapott különbségek
abszolút értékét vesszük (ABS)
– 2–4. lépések egy oszlopban is megoldhatók
5.
6.
Az abszolút értékeket összegzem
A kapott összeg értékét megfelezem
12
Hoover index kiszámítása
Excelben
A
1
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
40%
=B2/B$6*
100
40%
=C2/C$6*
100
0% =D2-E2
0%
2
1. régió
8
4
3
2. régió
4
1
20%
10%
10%
10%
4
3. régió
6
3
30%
30%
0%
0%
5
4. régió
2
2
10%
20%
–10%
10%
6
összesen
20
10
100%
100%
0%
20%
7 Hoover index
=SZUM(
B2:B5)
=SZUM(
C2:C5)
=ABS(F2)
=SZUM(G2:
G5)
13
10%
=G6/2
Hoover index elméleti maximuma
A
1
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
60%
=B2/B$6*
100
0%
=C2/C$6*
100
60% =D2E2
60%
=ABS(F2)
2
1. régió
12
0
3
2. régió
8
0
40%
0%
40%
40%
4
3. régió
0
0
0%
0%
0%
0%
5
4. régió
0
10
0%
100%
–100%
100%
6
összesen
20
10
100%
100%
0%
200%
7 Hoover index
=SZUM(
B2:B5)
=SZUM(
C2:C5)
=SZUM(G2:
G5)
14
100%
=G6/2
Hoover index elméleti minimuma
A
1
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
40%
=B2/B$6*
100
40%
=C2/C$6*
100
0% =D2-E2
0%
2
1. régió
8
4
3
2. régió
4
2
20%
20%
0%
0%
4
3. régió
6
3
30%
30%
0%
0%
5
4. régió
2
1
10%
10%
0%
0%
6
összesen
20
10
100%
100%
0%
0%
7 Hoover index
=SZUM(
B2:B5)
=SZUM(
C2:C5)
=ABS(F2)
=SZUM(G2:
G5)
0%15 =G6/2
„Pszeudo-egymutatós”
egyenlőtlenségi index

Két nem fajlagos mutató területi eloszlása
közötti eltérés mérése
– Pl. nép-jöv, kisebbség-egész társadalom stb.

Egy fajlagos mutató területi egyenlőtlenségének
mérése
– Pl. Jöv/fő, kisebbségek aránya
16
Hoover index használhatósága

Egyik legjobban interpretálható eredményt adja
a területi egyenlőtlenségi indexek közül
– Értékei 0–100 között mozognak: a 100 magas, a 0
alacsony érték (szórás-típusú területi egyenlőtlenségi
mutatóknak nincs maximuma)
– H = 33%  az egyik mutató 33 %-át kell a régiók
között átcsoportosítani ahhoz, hogy a területi
megoszlása megegyezzen a másikéval
17
Hoover index más neveken

Robin Hood index („Rózsa Sándor” index)
– Népesség és jövedelem között

Dinamikus értelmezés (itt lehet az egy évre jutó
változást is mérni, ha 2 helyett 2t-vel osztunk)
– Korábbi és későbbi állapotok között

(Településszociológiában Duncan&Duncan házaspár)
– Disszimilaritási index: rész–rész viszonylatban
– Szegregációs index: rész–egész viszonylatban, vagy rész–többi
rész viszonylatban


Egyes változatoknál nem százalékban fejezzük ki, ekkor
értékkészlete: 0 ≤ H ≤ 1
Krugman index (Földrajz és kereskedelem c. könyv,
1993.)
– Ha nem osztjuk el 2-vel (nehezebben értelmezhető)
– 0 ≤ H ≤ 200 (vagy 0 ≤ H ≤ 2)
18
Hoover index vizsgálati
lehetőségei


Magyarország 2005 jöv-nép megyei szint
Egy számítás önmagában általában kevés 
összehasonlítás kell:
– Területek között: pl. Szlovákiára is
– Időbeni állapotok között: pl. 1990-re is
– Mutatók között: pl. személygépkocsi és a népesség
között is
– Területi szinteken (Hoover-index specialitása): pl.
települési szinten is
19
Különböző területi szintek 
egyenlőtlenségek eltérő alakulása
16%

14%
Az adóköteles jövedelmek területi egyenlőtlenségeinek
változása különböző területi szinteken, Robin Hood index,
1998–2002
12%
10%
8%
Települések (~3100)
6%
168 kistérség
20 megye
7 régió
4%
3 NUTS-I. egység
Budapest-Vidék
Települések Bp. nélkül
2%
Kistérségek Bp. nélkül
Megyék Bp. nélkül
20
0%
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
Földrajzi összefüggések
elemzése: sztochasztikus
módszerek
21
Társadalmi jelenségek
együttmozgása

Tagoltság vizsgálata: szinte sohasem szűkül le
egy-egy jelenség (mutatószám) térbeli
eloszlásának elemzésére
– Már a fajlagos adatok egyenlőtlenségeinek mérésekor
is 2 jelenséget kapcsolunk össze


Térbeli együttmozgások elemzése: kifejezetten
területi kölcsönhatások (néha ok-okozati
kapcsolatok) is megjelennek
Összefüggések mérése: korreláció- és
regressziószámítás
– Erősség: milyen erős az összefüggés
22
– Irány: egyenes (+) vagy fordított (–) arányosság
Szignifikancia



Megbízható (szignifikáns) összefüggés: ha
viszonylag nagy elemszámú mintából, hosszú
adatsorból számítjuk
Erős szignifikancia: megfigyelési egységek körét
véletlenszerűen újabbakkal bővítve, nagy
valószínűséggel nem változik az összefüggés
iránya és szorossága
Meghatározza:
– Elemszámtól (1000 vagy 10 területi egységre mérünk)
– Kapcsolat szorossági szintje (korreláció absz. 0,9 vagy
0)

Szignifikancia-tesztek: pl. SPSS
23
Korreláció
24
Korreláció

Jelzőszámok közötti kapcsolat szorosságának
meghatározására szolgáló eljárás (egyfajta sajátos
egyenlőtlenségi mutató
– Egy mutatószámmal (r): korrelációs együttható

Korreláció típusai területi elemzésekben
– Lineáris korreláció azonos megfigyelési egységekre vonatkozó
két adatsor között
– Autokorreláció
– Keresztkorreláció




Ugyanígy lehet autoregresszió és keresztregresszió is
Értékkészlete: –1 ≤ r ≤ 1
Mértékegysége nincs
25
Súlyozás problémája a korrelációszámításban
Lineáris korreláció

Lineáris korreláció azonos megfigyelési
egységekre vonatkozó két adatsor között
– r = corr (xi yi)


Legismertebb: Pearson-féle korrelációs
együttható
Egyfajta sajátos egyenlőtlenségi mutató
26
A korrelációs-együtthatók
értékeinek értelmezése
r értéke
kapcsolat jellege
r=1
Lineáris függvénykapcsolat, egyenes arányosság van a
két jellemző között
0,7 ≤ r < 1
Szoros kapcsolat, egyirányú együttmozgás
0,3 ≤ r < 0,7
Közepes erősségű kapcsolat, egyirányú együttmozgás
0 < r < 0,3
Gyenge kapcsolat, egyirányú együttmozgás
r=0
Nincs lineáris kapcsolat, a két jellemző korrelálatlan
–0,3 < r < 0
Gyenge kapcsolat, ellentétes irányú együttmozgás
–0,7 < r ≤ –0,3 Közepes erősségű kapcsolat, ellentétes irányú
együttmozgás
–1 < r ≤ –0,7
Szoros kapcsolat, ellentétes irányú együttmozgás
r = –1
Lineáris függvénykapcsolat, fordított arányosság 27van a
két jellemző között
Lineáris korrelációs együtthatók

Pearson-féle lineáris korreláció együttható
– Excel  fx= KORREL()
– Angol nyelvű Excel  fx= CORREL()
n
r

 x  X  y
i 1
i
n
n
i 1
i 1
i
Y 
2
2




x

X
y

Y
 i
 i
Spearman-féle rangkorreláció
n
6 d i
2
– Ordinális (sorrendi) adatskála esetén R  1  i 1
2
28
n
n
1
– di: összetartozó rangszámok különbségei


Korrelációs mátrix






f(x) függvényvarázsló segítségével számítható
a mátrixban szereplő adatsorok egymás mellé rendezése úgy, hogy üres
oszlop és egyéb adat ne legyen benne!
mátrix keretének elkészítése a fejléc átmásolása vízszintesen és
függőlegesen, a bal fölső cella üres)
minden sorból egy korrelációs együttható kiszámítása, a sorban állandó
jelzőszám tömbjének betűjeli lerögzítendők!
(további egyszerűsítés is végezhető, de teljesen automatikusan nem lehet
kitölteni minden cellát!)
29
ellenőrzés: átlóban 1-esek szerepelnek, a mátrix az átlóra szimmetrikus
Regresszió-elemzés
Regressziószámítás a regionális
elemzésekben


Változókapcsolatokat valószínűségi
(sztochasztikus) függvénykapcsolatként
értelmezi
Függő és független (vagy magyarázó) változók
– Független: x tengely, fajlagos mutató nevezője, bal
oszlop
– Függő: y tengely, fajlagos mutató számlálója, jobb
oszlop

Típusai:
– Lineáris vagy nem lineáris
– Két- vagy többváltozós

Alkalmas becslésre, előrejelzésre
31
Kétváltozós lineáris regresszió

y = a + bx
– x: magyarázó (független) változó
– b: regressziós együttható (regressziós koefficiens): az egyenes
meredekségét vagy dőlését jelöli (az x értékének egységnyi
növekedése y értékének mekkora mértékű és milyen irányú
változását vonja maga után
– a: regressziós állandó (konstans): értéke megegyezik az egyenes
y tengelyen tapasztalt metszéspontjával (a értéke egyenlő y
értékével x=0 helyen)
– y: a függő változó regressziós egyenlet alapján becsült értéke

Determinációs együttható (R2) itt a Pearson-féle lineáris
korrelációs együttható négyzete
32
Kétváltozós lineáris regresszó
számítása Excelben
1.
2.
3.
4.
5.
6.
a két adatsor egymás mellé rendezése úgy,
hogy a bal oldalon az x tengelyre kerülő változó
legyen.
szórásdiagram készítése (pontdiagram)
formázási műveletek
jobb klikk valamely pontra: trendvonal felvétele
egyenlet és r négyzet látszik
számítás
33
Kétváltozós lineáris regressziós
összefüggések
Értéktermelő-képesség és az újonann épített lakások csatornával való ellátottságának
összefüggése a magyar megyékben (2000)
új, közcsatornával ellátott lakások lakások aránya (%)
120
100
80
60
40
y = 0.0181x + 50.145
R2 = 0.3873
20
0
34
0
500
1000
1500
GDP (ezer Ft/fő)
2000
2500
3000
Nem lineáris összefüggések

Nem lineáris regressziós egyenletek alaptípusai
–
–
–
–
–

Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
Hatványkitevős y = a*xb
Determináció együttható (R2)dönti el, melyik írja le
legjobban az adott összefüggést
– Azt a trendvonaltípust érdemes választani, amelynél magasabb
az R2 értéke


Elemzésük és értelmezésük nehézkesebb, mint a lineáris
egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
35
vizsgálatában
Nem lineáris összefüggések
egy főre eső jövedelem (ezer Ft/fő)




A nyugat-keletregressziós
pozíció és az 1 főre jutó jövedelem
összefüggése a magyar
megyékben (2000)
Nem lineáris
egyenletek
alaptípusai
–
–
–
–
–
Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
y = -0.3278x + 326.59
b
R = 0.2786
Hatványkitevős y = a*x
600
500
400
2
y = 319.67e-0.0011x
R2 = 0.3502
Determináció együttható dönti el, melyik írja le legjobban
az adott öszefüggést
Elemzésük és értelmezésük nehézkesebb, mint a
lineáris egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
vizsgálatában
36
300
200
y = -6E-07x3 - 0.0011x2 - 0.2748x + 340.93
R2 = 0.3226
100
0
-200
-150
-100
-50
0
50
NY-K koordináta (km)
lineáris
polinomiális
exponenciális
100
150
200
250