Földrajzi összefüggések elemzése

Download Report

Transcript Földrajzi összefüggések elemzése

Földrajzi összefüggések
elemzése
dr. Jeney László
egyetemi adjunktus
[email protected]
Regionális és környezeti elemzési módszerek
I. BME Regionális és környezeti gazdaságtan mesterszak (MSc)
2013/2014, II. félév
BCE Gazdaságföldrajz és Jövőkutatás Tanszék
Korreláció
2
Társadalmi jelenségek
együttmozgása

Tagoltság vizsgálata: szinte sohasem szűkül le
egy-egy jelenség (mutatószám) térbeli
eloszlásának elemzésére
– Már a fajlagos adatok egyenlőtlenségeinek mérésekor
is 2 jelenséget kapcsolunk össze


Térbeli együttmozgások elemzése: kifejezetten
területi kölcsönhatások (néha ok-okozati
kapcsolatok) is megjelennek
Összefüggések mérése: korreláció- és
regressziószámítás
– Erősség: milyen erős az összefüggés
– Irány: egyenes (+) vagy fordított (–) arányosság
3
Szignifikancia



Megbízható (szignifikáns) összefüggés: ha
viszonylag nagy elemszámú mintából, hosszú
adatsorból számítjuk
Erős szignifikancia: megfigyelési egységek körét
véletlenszerűen újabbakkal bővítve, nagy
valószínűséggel nem változik az összefüggés
iránya és szorossága
Meghatározza:
– Elemszámtól (1000 vagy 10 területi egységre mérünk)
– Kapcsolat szorossági szintje (korreláció absz. 0,9
vagy 0)

Szignifikancia-tesztek: pl. SPSS
4
Korreláció

Jelzőszámok közötti kapcsolat szorosságának
meghatározására szolgáló eljárás (egyfajta sajátos
egyenlőtlenségi mutató
– Egy mutatószámmal (r): korrelációs együttható

Korreláció típusai területi elemzésekben
– Lineáris korreláció azonos megfigyelési egységekre vonatkozó
két adatsor között
– Autokorreláció
– Keresztkorreláció




Ugyanígy lehet autoregresszió és keresztregresszió is
Értékkészlete: –1 ≤ r ≤ 1
Mértékegysége nincs
5
Súlyozás problémája a korrelációszámításban
Lineáris korreláció

Lineáris korreláció azonos megfigyelési
egységekre vonatkozó két adatsor között
– r = corr (xi yi)


Legismertebb: Pearson-féle korrelációs
együttható
Egyfajta sajátos egyenlőtlenségi mutató
6
A korrelációs-együtthatók
értékeinek értelmezése
r értéke
kapcsolat jellege
r=1
Lineáris függvénykapcsolat, egyenes arányosság van
a két jellemző között
0,7 ≤ r < 1
Szoros kapcsolat, egyirányú együttmozgás
0,3 ≤ r < 0,7
Közepes erősségű kapcsolat, egyirányú együttmozgás
0 < r < 0,3
Gyenge kapcsolat, egyirányú együttmozgás
r=0
Nincs lineáris kapcsolat, a két jellemző korrelálatlan
–0,3 < r < 0
Gyenge kapcsolat, ellentétes irányú együttmozgás
–0,7 < r ≤ –0,3
Közepes erősségű kapcsolat, ellentétes irányú
együttmozgás
–1 < r ≤ –0,7
Szoros kapcsolat, ellentétes irányú együttmozgás
r = –1
Lineáris függvénykapcsolat, fordított arányosság van
a
7
két jellemző között
Lineáris korrelációs együtthatók

Pearson-féle lineáris korreláció együttható
– Excel  fx= KORREL()
– Angol nyelvű Excel  fx= CORREL()
n
r

 x  X  y
i 1
i
n
n
i 1
i 1
i
Y 
2
2




x

X
y

Y
 i
 i
Spearman-féle rangkorreláció
n
6 d i
2
– Ordinális (sorrendi) adatskála esetén R  1  i 1
28
n
n
1
– di: összetartozó rangszámok különbségei


Korrelációs mátrix






f(x) függvényvarázsló segítségével számítható
a mátrixban szereplő adatsorok egymás mellé rendezése úgy, hogy üres
oszlop és egyéb adat ne legyen benne!
mátrix keretének elkészítése a fejléc átmásolása vízszintesen és
függőlegesen, a bal fölső cella üres)
minden sorból egy korrelációs együttható kiszámítása, a sorban állandó
jelzőszám tömbjének betűjeli lerögzítendők!
(további egyszerűsítés is végezhető, de teljesen automatikusan nem lehet
kitölteni minden cellát!)
ellenőrzés: átlóban 1-esek szerepelnek, a mátrix az átlóra szimmetrikus9
Autokorreláció


Egyazon adatsor különböző (időben eltolt vagy térben
szomszédos) megfigyelési egységekre vonatkozó értékei
közötti kapcsolat
Időbeni autokorreláció: minden i-edik időponthoz tartozó
xi értékhez ugyanezen x változónak egy k évvel eltolt (k
évvel korábbi) adatát rendelve számítjuk  adatsor
hossza k évvel csökken
– r = corr (xi xi–k)

Területi autokorreláció: i-edik megfigyelési területegység
xi adatához a vele szomszédos területegységek értékeit
(átlagát) számítjuk
– r = corr (xi xs(i))
10
Keresztkorreláció


Két adatsor különböző (időben eltolt vagy térben
szomszédos) megfigyelési egységekre
vonatkozó értékei közötti kapcsolat
Időbeli keresztkorreláció
– r = corr (xi yi–k)

Területi keresztkorreláció
– r = corr (xi ys(i))
11
Regresszió-elemzés
Regressziószámítás a regionális
elemzésekben


Változókapcsolatokat valószínűségi
(sztochasztikus) függvénykapcsolatként
értelmezi
Függő és független (vagy magyarázó) változók
– Független: x tengely, fajlagos mutató nevezője, bal
oszlop
– Függő: y tengely, fajlagos mutató számlálója, jobb
oszlop

Típusai:
– Lineáris vagy nem lineáris
– Két- vagy többváltozós

Alkalmas becslésre, előrejelzésre
13
Kétváltozós lineáris regresszió

y = a + bx
– x: magyarázó (független) változó
– b: regressziós együttható (regressziós koefficiens): az egyenes
meredekségét vagy dőlését jelöli (az x értékének egységnyi
növekedése y értékének mekkora mértékű és milyen irányú
változását vonja maga után
– a: regressziós állandó (konstans): értéke megegyezik az
egyenes y tengelyen tapasztalt metszéspontjával (a értéke
egyenlő y értékével x=0 helyen)
– y: a függő változó regressziós egyenlet alapján becsült értéke

Determinációs együttható (R2) itt a Pearson-féle lineáris
korrelációs együttható négyzete
14
Kétváltozós lineáris regresszó
számítása Excelben
1.
2.
3.
4.
5.
6.
a két adatsor egymás mellé rendezése úgy,
hogy a bal oldalon az x tengelyre kerülő változó
legyen.
szórásdiagram készítése (pontdiagram)
formázási műveletek
jobb klikk valamely pontra: trendvonal felvétele
egyenlet és r négyzet látszik
számítás
15
Kétváltozós lineáris regressziós
összefüggések
Értéktermelő-képesség és az újonann épített lakások csatornával való ellátottságának
összefüggése a magyar megyékben (2000)
új, közcsatornával ellátott lakások lakások aránya (%)
120
100
80
60
40
y = 0.0181x + 50.145
R2 = 0.3873
20
0
16
0
500
1000
1500
GDP (ezer Ft/fő)
2000
2500
3000
Nem lineáris összefüggések

Nem lineáris regressziós egyenletek alaptípusai
–
–
–
–
–

Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
Hatványkitevős y = a*xb
Determináció együttható (R2)dönti el, melyik írja le
legjobban az adott összefüggést
– Azt a trendvonaltípust érdemes választani, amelynél magasabb
az R2 értéke


Elemzésük és értelmezésük nehézkesebb, mint a
lineáris egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
17
vizsgálatában
Nem lineáris összefüggések
egy főre eső jövedelem (ezer Ft/fő)




A nyugat-keletregressziós
pozíció és az 1 főre jutó jövedelem
összefüggése a magyar
megyékben (2000)
Nem lineáris
egyenletek
alaptípusai
–
–
–
–
–
Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
y = -0.3278x + 326.59
b
R = 0.2786
Hatványkitevős y = a*x
600
500
400
2
y = 319.67e-0.0011x
R2 = 0.3502
Determináció együttható dönti el, melyik írja le legjobban
az adott öszefüggést
Elemzésük és értelmezésük nehézkesebb, mint a
lineáris egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
vizsgálatában
18
300
200
y = -6E-07x3 - 0.0011x2 - 0.2748x + 340.93
R2 = 0.3226
100
0
-200
-150
-100
-50
0
50
NY-K koordináta (km)
lineáris
polinomiális
exponenciális
100
150
200
250