Transcript PowerPoint

Regionális
elemzések módszerei

Tematika: területi statisztikai elemzési
módszerek Excelben
– Adatbázis kezelés, területi egyenlőtlenségi mutatók,
földrajzi összefüggés elemzések, grafikus ábrázolási
módszerek

Számonkérés:
– Félévvégi zh (100 pont)

Számítógépes gyakorlati feladatok a tanult elemzési
módszerek segítségével
1
Felhasználható
irodalom



A felkészüléshez elsősorban a gyakorló
feladatsor és az órai jegyzet ajánlott
Gyakorló feladatsor letölthető lesz:
http://jeney.web.elte.hu
Nemes Nagy, J. (szerk.) (2005): Regionális
elemzési módszerek, Regionális Tudományi
Tanulmányok, 11. ELTE Regionális Földrajzi
Tanszék – MTA–ELTE Regionális Tudományi
Kutatócsoport, Budapest 284 p.
Letölthető:
http://geogr.elte.hu/old/REF/Kiadvanyok/REF_1
1_PDF/RTT-11-tartalom.htm#RTT-11
2
Regionális elemzések
módszerei
dr. Jeney László
egyetemi adjunktus
[email protected]
Regionális elemzések módszerei
II. Gazdasági és vidékfejlesztési agrármérnök alapszak (BSc)
2013/2014, II. félév
BCE Gazdaságföldrajz és Jövőkutatás Tanszék
Adattípusok
Adatsorok 2 fő típusa: nem fajlagos
és fajlagos mutatók
x
x
y
f

Nem fajlagos (abszolút) mutatók
– Pl. népességszám, GDP, személygépkocsik száma, terület,
városlakók száma
– Jelölése: xi azaz x abszolút mutató értéke adott „i” régióban

Fajlagos mutatók (relatív vagy származtatott mutatók)
– Pl. egy főre jutó GDP, ezer lakosra jutó személygépkocsik,
népsűrűség, városlakók aránya
– Lehet százalékos részesedés is: pl. városlakók aránya
– Jelölése: yi azaz y fajlagos mutató értéke adott „i” régióban
– Általában 2 nem fajlagos mutató hányadosa, pl. GDP és
népesség (ritkán 2 fajlagos mutató hányadosa, pl. megyei
GDP/fő az országos átlagos GDP/fő %-ában)
– Esetükben súlyozni kell (pl. súlyozott átlag, súlyozott szórás)
– A súly a fajlagos mutató képletének nevezőjében van, jelölése fi
azaz f súly értéke adott „i” régióban
5
– Súly gyakran népességszám, de nem mindig
Nem fajlagos – fajlagos mutatók
valamint a súly közötti átszámítások

Ha a nem fajlagos mutató (GDP) és a súly
(népességszám) ismert
– A fajlagos mutató (GDP/fő): a nem fajlagos mutató
és a súly
x
hányadosa
GDP / fő 

GDP
népességsz ám
Ha a nem fajlagos (GDP) és a fajlagos mutató ismert
(GDP/fő)
– A súly (népesség): a nem fajlagos és a fajlagos mutató
hányadosa
népességsz ám 

GDP
GDP / fő
Ha a fajlagos mutató (GDP/fő) és a súly (népesség)
ismert
GDP  GDP / fő  népességsz
ám
6
– Nem fajlagos mutató (GDP): a fajlagos mutató és a súly szorzata
Adatsorok jellegadó értékei
Adatsorok jellegadó értékei

Középértékek
– Számtani átlag / súlyozott számtani átlag
– Mértani átlag
– Helyzeti középértékek (módusz, medián)

Szélső értékek
– Maximum
– Minimum

Adatsor terjedelme és szórása (átvezet a területi
egyenlőtlenségi mutatók felé)
– Terjedelem-típusú mutatók
– Szórás-típusú mutatók
Középértékek: átlagok

Számtani átlag
– Az eredeti számok helyébe helyettesítve azok összege
változatlan
xi
– n db adat (xi)
x
– Excel  fx= ÁTLAG()
n


–
–

y f

n db fajlagos adat (y )
y
Súly (f ): a fajlagos mutató nevezőjében szereplő adat
f
Súlyozott számtani átlag
i i
i
i
i
Mértani átlag
– Az eredeti számok helyébe helyettesítve azok szorzata
változatlan
n
– n db adat (xi)
*
x n
x
i
i 1
 n x1  x2  ...  xi  ...  xn
Helyzeti középértékek

Medián
– Az az érték, aminél kisebb és nagyobb adatok száma egyenlő
(felező pont)
– Extrém adatokat tartalmazó adatsorok esetében érdemes
használni
– Kvantilisek: kvartilis (negyedelő), kvintilis (ötödölő), decilis
(tizedelő), percentilis (századoló)
– Medián/átlag: egyenlőtlenségi mutató (minél kisebb, annál
nagyobb az egyenlőtlenség)
– Excel  fx= MEDIÁN()

Módusz („divatos érték”)
– A legtöbbször előforduló érték
– Lehet többmóduszú (többcsúcsú) adatsor is
– Excel  fx= MÓDUSZ()
A szélső értékek és a terjedelem
típusú egyenlőtlenségi mutatók

Maximum
– Az adatsor legnagyobb értéke (xmax)
– Excel  fx= MAX()

Minimum
– Az adatsor legkisebb értéke (xmin)
– Excel  fx= MIN()

Alapja a terjedelem típusú egyenlőtlenségi mutatóknak
– Range (szóródás terjedelme)
P  xmax  xmin
– Range-arány (adatsor terjedelme)
xmax
K
xmin
– Relatív range
xmax  xmin
Q
x
Súlyozatlan relatív terjedelem
kiszámításának lépései (abszolút
mutatóknál)
1.
2.
3.
4.
5.
Ki kell számítani az adatsor maximumát
(függvényvarázsló: max)
Ki kell számítani az adatsor minimumát
(függvényvarázsló: min)
Ki kell vonni a maximális értékből a minimálist
(ez a terjedelem)
Ki kell számítani az adatsor (sima) átlagát
(függvényvarázsló: átlag)
El kell osztani a terjedelmet az átlaggal
Súlyozatlan relatív terjedelem
kiszámítása Excelben
A
1
B
C
xa
xb
2
1. régió
24
10
3
2. régió
4
10
4
3. régió
0
10
5
4. régió
12
10
maximum
24
10
=MAX(B2:B5)
=MAX(C2:C5)
0
10
=MIN(B2:B5)
=MIN(C2:C5)
6
7
minimum
8
terjedelem
9
átlag
10
relatív terjedelem
24
10
=ÁTLAG(B2:B5)
2,4
0
=B6-B7
=B8/B9
10
=C6-C7
=ÁTLAG(C2:C5)
0
=C8/C9
Súlyozott relatív terjedelem
kiszámításának lépései (fajlagos
mutatóknál)
1.
2.
3.
4.
5.
Ki kell számítani az adatsor maximumát
(függvényvarázsló: max)
Ki kell számítani az adatsor minimumát
(függvényvarázsló: min)
Ki kell vonni a maximális értékből a minimálist
(ez a terjedelem)
Ki kell számítani az adatsor súlyozott átlagát
El kell osztani a terjedelmet a súlyozott átlaggal
Súlyozott relatív terjedelem
kiszámítása Excelben
A
1
2
1. régió
B
C
D
E
F
G
ya
fa
xa
yb
fb
Xb
24
1
24
10
1
10
=B2*C2
=E2*F2
3
2. régió
4
3,5
14
10
3,5
35
4
3. régió
0
4,5
0
10
4,5
45
5
4. régió
12
1
12
10
1
10
6
összeg
10
50
10
100
7
max.
24
8
min.
0
9
terj.
=MAX(B2:B5)
=MIN(B2:B5)
24
10 s. átlag
5
11 rel terj
4,8
=MAX(E2:E5)
10
=MIN(E2:E5)
0
=B6-B7
=E6-E7
10
=D6/C6
=B9/B10
10
rel terj
0
=G6/F6
=E9/E10
A szórás típusú egyenlőtlenségi
mutatók
Szórás-típusú egyenlőtlenségi
mutatók



Nem fajlagos (abszolút) mutatók (xi): (súlyozatlan)
szórás
Fajlagos mutatók (yi): súlyozott szórás
A valódi egyenlőtlenségeket a relatív szórással
mérhetjük
– Nem fajlagos: (súlyozatlan) relatív szórás (szórás az átlag %ában)
– Fajlagos mutatók: súlyozott relatív szórás (súlyozott szórás a
súlyozott átlag %-ában)
17
(Súlyozatlan) szórás: nem fajlagos
mutatók esetében


Adatsorok egyes értékeinek (xi) az átlagtól való
négyzetes eltérésének az átlaga
Képlete
– Xi = abszolút mutató i régióban
– n = elemszám


2


x

x
 i
i
n
Kiszámítása
– Excel:  fx= SZÓRÁSP() ( és nem SZÓRÁS)
– Angol nyelvű Excel  fx= STDEVP()

Értékkészlete: 0 ≤ σ ≤ ∞
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség

Mértékegysége: mint az eredeti értékek (Xi)
mértékegysége
18
(Súlyozatlan) relatív szórás: nem
fajlagos mutatók esetében



A valódi egyenlőtlenségeket a relatív szórással
mérhetjük
Relatív szórás: abszolút mutatók esetében
Képlete:
– σ = Xi adatsor szórása
– x = Xi adatsor átlaga


v  100
x
Kiszámítása
– a szórás értékeket elosztjuk az átlaggal és megszorozzuk 100zal (a szórás értékeit az átlag százalékában fejezzük ki)

Értékkészlete: 0 ≤ v ≤ ∞
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség

Mértékegysége: %
19
Súlyozott szórás: fajlagos mutatók
esetében



Fajlagos mutatók (yi) esetében
Adatsorok egyes értékeinek (yi) az átlagtól való
négyzetes eltérésének az átlaga
2
Képlete


y

y
fi
 i
– yi = fajlagos mutató i régióban

– fi = súly (fajlagos mutató nevezője)

i
f
i
i
Értékkészlete: 0 ≤ σ ≤ ∞
– Minél nagyobb az értéke, annál nagyobb az
egyenlőtlenség

Mértékegysége: mint az eredeti értékek (yi)
mértékegysége
20
Súlyozott szórás kiszámításának
lépései
1.
2.
3.
4.
Kiszámítom a fajlagos mutató súlyozott átlagát
Minden térség esetében kiszámítom a vizsgált fajlagos
mutató értékeinek eltérését a súlyozott átlagtól (Excel 
$)
Minden térség esetében a kapott különbségeket
négyzetre emelem (Excel  jobb oldali Alt+3 együtt,
majd 2 = ^2)
Minden térség esetében a kapott értékeket
megszorzom a térséghez tartozó súllyal
– 2–4. lépések egy oszlopban is megoldhatók
5.
6.
7.
Az így kapott szorzatokat összegzem
Ezt az összeget elosztom a súlyok összegével
21
Ennek a hányadosnak a négyzetgyökét veszem (^0,5)
Súlyozott relatív szórás: fajlagos
mutatók esetében

A valódi egyenlőtlenségeket a relatív szórással
mérhetjük
– Fajlagos mutatók esetében: súlyozott relatív szórással

Képlete:
– σ = yi adatsor súlyozott szórása
– y = yi adatsor súlyozott átlaga

v

y
100
Kiszámítása
– A súlyozott szórás értékeket elosztjuk a súlyozott átlaggal és
megszorozzuk 100-zal (a súlyozott szórás értékeit a súlyozott
átlag százalékában fejezzük ki)

Értékkészlete: 0 ≤ v ≤ ∞
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség22

Mértékegysége: %
Súlyozott relatív szórás kiszámítása
Excelben
A
1
B
C
D
E
F
G
y
f
x
átl elt
négyzet
súlyozás
361
361 =F2*C2
2
1. régió
24
1
24 =B2*C2
19 =B2B$7
=E2^2
3
2. régió
4
3,5
14
–1
1
3,5
4
3. régió
0
4,5
0
–5
25
112,5
5
4. régió
12
1
12
7
49
49
6
összeg
10
50
7
s. átlag
8 s. szórás
5 =D6/C6
=SZUM(D2:D5)
526
=SZUM(G2:G5)
52,6 =G6/C6
7,25
=G7^0,5
9 s. relatív 145,05
szórás =B8/B7*1
00
23
A területi koncentráció mérése:
Hirschman–Herfindahl index
Területi egyenlőtlenségek mérésére
szolgáló statisztikai eszközök

Területi egyenlőtlenségi indexek, leggyakrabban
használtak:
– A területi polarizáltság mérőszámai


Relatív terjedelem/Relatív range (Q)
Duál mutató/Éltető–Frigyes index (D)
– Szórás-típusú területi egyenlőtlenségi indexek

Súlyozott relatív szórás (V)
– Területi eloszlást mérő egyenlőtlenségi indexek


Hirschman–Herfindahl index (K)
Hoover-index/Krugman-index (H)
– Területi egyenlőtlenségek összetettebb mérési módszerei



Gini együttható (G)
Távolságfüggvények
Korrelációs mérőszámok
25
Hirschman–Herfindahl index



Egy jelenség földrajzi koncentrációjának mérésére
használt mutatószám
Csak összegezhető (nem fajlagos) mutatóra számítható
2


Képlete


xi 

K  n


i 1
Értékkészlete: 1/n ≤ K ≤ 1
  xi 
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség
 i 1 
– Xi = nem fajlagos mutató i régióban
– Σxi = nem fajlagos mutató a teljes régióban

n
– Előfordulhat, hogy alacsonyabb területi szinten csökken az
értéke

Mértékegysége: nincs
26
Hirschman–Herfindahl index
kiszámításának lépései
1.
2.
3.
Összegezzük a vizsgált adatsort
Minden térség esetében elosztom az adott
térség értékét az előbb kiszámított összeggel
(Excel  $)
Minden térség esetében a kapott hányadosokat
négyzetre emelem (Excel  jobb oldali Alt+3
együtt, majd 2 = ^2)
– 2–3. lépések egy oszlopban is megoldhatók
4.
Az így kapott értékeket összegzem
27
Hirschman–Herfindahl index
kiszámítása Excelben
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
8
0,4 =B2/B$6
0,16 =C2^2
3
2. régió
4
0,2
0,04
4
3. régió
6
0,3
0,09
5
4. régió
2
0,1
0,01
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
0,328
=SZUM(D2:D5)
Hirschman–Herfindahl index elméleti
maximuma
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
0
0 =B2/B$6
0 =C2^2
3
2. régió
0
0
0
4
3. régió
20
1
1
5
4. régió
0
0
0
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
29
1 =SZUM(D2:D5)
Hirschman–Herfindahl index elméleti
minimuma (4 elem esetén)
A
1
B
C
D
xi
hányados
négyzet
2
1. régió
5
0,25 =B2/B$6
0,0625 =C2^2
3
2. régió
5
0,25
0,0625
4
3. régió
5
0,25
0,0625
5
4. régió
5
0,25
0,0625
6
összesen
20
1
7
Hirshman–
Herfindahl i.
=SZUM(B2:B5)
30
0,25
=SZUM(D2:D5)
Területi eloszlások
összevetése: Hoover index
Hoover index


Egyik legelterjedtebb, legáltalánosabban használt területi
egyenlőtlenségi index
Két mennyiségi ismérv területi megoszlásának eltérését
méri
– Az egyik ismérv, társadalmi-gazdasági jelenség mennyiségének
hány százalékát kell a területi egységek között átcsoportosítani
ahhoz, hogy területi megoszlása a másik jellemzőével azonos
legyen
– Területi kutatásokban leggyakrabban a népesség területi
eloszlásával vetjük össze más társadalmi-gazdasági ismérvével


1941: E. M. Hoover, amerikai agrárközgazdász
Használja a földrajz, szociológia, közgazdaságtan,
ökológia is
32
Hoover index

Két nem fajlagos mutató területi megoszlása közötti
eltérést mérhetjük vele
– Egy fajlagos mutató számlálója és nevezője között is lehet

– xi = i régió részesedése x nem fajlagos mutatóból
– yi = i régió részesedése y nem fajlagos mutatóból

n
Képlete:
H
x y
i 1
i
2
xi és yi: két megoszlási viszonyszám, melyekre
fennállnak az alábbi összefüggések
– Σxi = 100
– Σyi = 100


A mutató szimmetrikus, a két összevetett megoszlás (xi
és yi) szerepe, sorrendje felcserélhető
Értékkészlete: 0 ≤ H ≤ 100
– Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség33

Mértékegysége: %
i
Hoover index kiszámításának
lépései
1.
2.
3.
4.
Mindkét nem fajlagos mutató adatsorának értékeit
összegezzük
Minden térség esetében kiszámítjuk az adott térség
százalékos részesedését az összes mennyiségből
(mindkét mutató esetében)
Minden térség esetében kivonjuk az egyik mutató
szerinti százalékos részesedésből a másik mutató
szerinti százalékos részesedést
Minden térség esetében az így kapott különbségek
abszolút értékét vesszük (ABS)
– 2–4. lépések egy oszlopban is megoldhatók
5.
6.
Az abszolút értékeket összegzem
A kapott összeg értékét megfelezem
34
Hoover index kiszámítása Excelben
A
1
2
1. régió
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
8
4
40%
40%
0% =D2-E2
0%
=B2/B$6*
100
=C2/C$6*
100
=ABS(F2)
3
2. régió
4
1
20%
10%
10%
10%
4
3. régió
6
3
30%
30%
0%
0%
5
4. régió
2
2
10%
20%
–10%
10%
6
összesen
20
10
100%
100%
0%
20%
=SZUM(
B2:B5)
=SZUM
(C2:C5)
7 Hoover index
=SZUM(G2:
G5)
35
10%
=G6/2
Hoover index elméleti maximuma
A
1
2
1. régió
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
12
0
60%
0%
60% =D2-
60%
=B2/B$6*
100
=C2/C$6*
100
E2
=ABS(F2)
3
2. régió
8
0
40%
0%
40%
40%
4
3. régió
0
0
0%
0%
0%
0%
5
4. régió
0
10
0%
100%
–100%
100%
6
összesen
20
10
100%
100%
0%
200%
=SZUM(
B2:B5)
=SZUM
(C2:C5)
7 Hoover index
=SZUM(G2:
G5)
36
100%
=G6/2
Hoover index elméleti minimuma
A
1
2
1. régió
B
C
D
E
F
G
xi
yi
xi%
yi%
xi%–yi%
absz
8
4
40%
40%
0% =D2-E2
0%
=B2/B$6*
100
=C2/C$6*
100
=ABS(F2)
3
2. régió
4
2
20%
20%
0%
0%
4
3. régió
6
3
30%
30%
0%
0%
5
4. régió
2
1
10%
10%
0%
0%
6
összesen
20
10
100%
100%
0%
0%
=SZUM(
B2:B5)
=SZUM
(C2:C5)
7 Hoover index
=SZUM(G2:
G5)
0%37 =G6/2
„Pszeudo-egymutatós”
egyenlőtlenségi index

Két nem fajlagos mutató területi eloszlása
közötti eltérés mérése
– Pl. nép-jöv, kisebbség-egész társadalom stb.

Egy fajlagos mutató területi egyenlőtlenségének
mérése
– Pl. Jöv/fő, kisebbségek aránya
38
Hoover index használhatósága

Egyik legjobban interpretálható eredményt adja
a területi egyenlőtlenségi indexek közül
– Értékei 0–100 között mozognak: a 100 magas, a 0
alacsony érték (szórás-típusú területi egyenlőtlenségi
mutatóknak nincs maximuma)
– H = 33%  az egyik mutató 33 %-át kell a régiók
között átcsoportosítani ahhoz, hogy a területi
megoszlása megegyezzen a másikéval
39
Hoover index más neveken

Robin Hood index („Rózsa Sándor” index)
– Népesség és jövedelem között

Dinamikus értelmezés (itt lehet az egy évre jutó változást
is mérni, ha 2 helyett 2t-vel osztunk)
– Korábbi és későbbi állapotok között

(Településszociológiában Duncan&Duncan házaspár)
– Disszimilaritási index: rész–rész viszonylatban
– Szegregációs index: rész–egész viszonylatban, vagy rész–többi
rész viszonylatban


Egyes változatoknál nem százalékban fejezzük ki, ekkor
értékkészlete: 0 ≤ H ≤ 1
Krugman index (Földrajz és kereskedelem c. könyv,
1993.)
– Ha nem osztjuk el 2-vel (nehezebben értelmezhető)
– 0 ≤ H ≤ 200 (vagy 0 ≤ H ≤ 2)
40
Hoover index vizsgálati lehetőségei


Magyarország 2005 jöv-nép megyei szint
Egy számítás önmagában általában kevés 
összehasonlítás kell:
– Területek között: pl. Szlovákiára is
– Időbeni állapotok között: pl. 1990-re is
– Mutatók között: pl. személygépkocsi és a népesség
között is
– Területi szinteken (Hoover-index specialitása): pl.
települési szinten is
41
Különböző területi szintek 
egyenlőtlenségek eltérő alakulása
16%

14%
Az adóköteles jövedelmek területi egyenlőtlenségeinek
változása különböző területi szinteken, Robin Hood index,
1998–2002
12%
10%
8%
Települések (~3100)
6%
168 kistérség
20 megye
7 régió
4%
3 NUTS-I. egység
Budapest-Vidék
Települések Bp. nélkül
2%
Kistérségek Bp. nélkül
Megyék Bp. nélkül
42
0%
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
Korreláció
43
Társadalmi jelenségek
együttmozgása

Tagoltság vizsgálata: szinte sohasem szűkül le
egy-egy jelenség (mutatószám) térbeli
eloszlásának elemzésére
– Már a fajlagos adatok egyenlőtlenségeinek mérésekor
is 2 jelenséget kapcsolunk össze


Térbeli együttmozgások elemzése: kifejezetten
területi kölcsönhatások (néha ok-okozati
kapcsolatok) is megjelennek
Összefüggések mérése: korreláció- és
regressziószámítás
– Erősség: milyen erős az összefüggés
– Irány: egyenes (+) vagy fordított (–) arányosság
44
Szignifikancia



Megbízható (szignifikáns) összefüggés: ha
viszonylag nagy elemszámú mintából, hosszú
adatsorból számítjuk
Erős szignifikancia: megfigyelési egységek körét
véletlenszerűen újabbakkal bővítve, nagy
valószínűséggel nem változik az összefüggés
iránya és szorossága
Meghatározza:
– Elemszámtól (1000 vagy 10 területi egységre mérünk)
– Kapcsolat szorossági szintje (korreláció absz. 0,9
vagy 0)

Szignifikancia-tesztek: pl. SPSS
45
Korreláció

Jelzőszámok közötti kapcsolat szorosságának
meghatározására szolgáló eljárás (egyfajta sajátos
egyenlőtlenségi mutató
– Egy mutatószámmal (r): korrelációs együttható

Korreláció típusai területi elemzésekben
– Lineáris korreláció azonos megfigyelési egységekre vonatkozó
két adatsor között
– Autokorreláció
– Keresztkorreláció




Ugyanígy lehet autoregresszió és keresztregresszió is
Értékkészlete: –1 ≤ r ≤ 1
Mértékegysége nincs
46
Súlyozás problémája a korrelációszámításban
Lineáris korreláció

Lineáris korreláció azonos megfigyelési
egységekre vonatkozó két adatsor között
– r = corr (xi yi)


Legismertebb: Pearson-féle korrelációs
együttható
Egyfajta sajátos egyenlőtlenségi mutató
47
A korrelációs-együtthatók
értékeinek értelmezése
r értéke
kapcsolat jellege
r=1
Lineáris függvénykapcsolat, egyenes arányosság van
a két jellemző között
0,7 ≤ r < 1
Szoros kapcsolat, egyirányú együttmozgás
0,3 ≤ r < 0,7
Közepes erősségű kapcsolat, egyirányú együttmozgás
0 < r < 0,3
Gyenge kapcsolat, egyirányú együttmozgás
r=0
Nincs lineáris kapcsolat, a két jellemző korrelálatlan
–0,3 < r < 0
Gyenge kapcsolat, ellentétes irányú együttmozgás
–0,7 < r ≤ –0,3
Közepes erősségű kapcsolat, ellentétes irányú
együttmozgás
–1 < r ≤ –0,7
Szoros kapcsolat, ellentétes irányú együttmozgás
r = –1
Lineáris függvénykapcsolat, fordított arányosság48van a
két jellemző között
Lineáris korrelációs együtthatók

Pearson-féle lineáris korreláció együttható
– Excel  fx= KORREL()
– Angol nyelvű Excel  fx= CORREL()
n
r

 x  X  y
i 1
i
n
n
i 1
i 1
i
Y 
2
2




x

X
y

Y
 i
 i
Spearman-féle rangkorreláció
n
6 d i
2
– Ordinális (sorrendi) adatskála esetén R  1  i 1
2
49
n
n
1
– di: összetartozó rangszámok különbségei


Korrelációs mátrix






f(x) függvényvarázsló segítségével számítható
a mátrixban szereplő adatsorok egymás mellé rendezése úgy, hogy üres
oszlop és egyéb adat ne legyen benne!
mátrix keretének elkészítése a fejléc átmásolása vízszintesen és
függőlegesen, a bal fölső cella üres)
minden sorból egy korrelációs együttható kiszámítása, a sorban állandó
jelzőszám tömbjének betűjeli lerögzítendők!
(további egyszerűsítés is végezhető, de teljesen automatikusan nem lehet
kitölteni minden cellát!)
50
ellenőrzés: átlóban 1-esek szerepelnek, a mátrix az átlóra szimmetrikus
Regresszió-elemzés
Regressziószámítás a regionális
elemzésekben


Változókapcsolatokat valószínűségi
(sztochasztikus) függvénykapcsolatként
értelmezi
Függő és független (vagy magyarázó) változók
– Független: x tengely, fajlagos mutató nevezője, bal
oszlop
– Függő: y tengely, fajlagos mutató számlálója, jobb
oszlop

Típusai:
– Lineáris vagy nem lineáris
– Két- vagy többváltozós

Alkalmas becslésre, előrejelzésre
52
Kétváltozós lineáris regresszió

y = a + bx
– x: magyarázó (független) változó
– b: regressziós együttható (regressziós koefficiens): az egyenes
meredekségét vagy dőlését jelöli (az x értékének egységnyi
növekedése y értékének mekkora mértékű és milyen irányú
változását vonja maga után
– a: regressziós állandó (konstans): értéke megegyezik az
egyenes y tengelyen tapasztalt metszéspontjával (a értéke
egyenlő y értékével x=0 helyen)
– y: a függő változó regressziós egyenlet alapján becsült értéke

Determinációs együttható (R2) itt a Pearson-féle lineáris
korrelációs együttható négyzete
53
Kétváltozós lineáris regresszó
számítása Excelben
1.
2.
3.
4.
5.
6.
a két adatsor egymás mellé rendezése úgy,
hogy a bal oldalon az x tengelyre kerülő változó
legyen.
szórásdiagram készítése (pontdiagram)
formázási műveletek
jobb klikk valamely pontra: trendvonal felvétele
egyenlet és r négyzet látszik
számítás
54
Kétváltozós lineáris regressziós
összefüggések
Értéktermelő-képesség és az újonann épített lakások csatornával való ellátottságának
összefüggése a magyar megyékben (2000)
új, közcsatornával ellátott lakások lakások aránya (%)
120
100
80
60
40
y = 0.0181x + 50.145
R2 = 0.3873
20
0
55
0
500
1000
1500
GDP (ezer Ft/fő)
2000
2500
3000
Nem lineáris összefüggések

Nem lineáris regressziós egyenletek alaptípusai
–
–
–
–
–

Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
Hatványkitevős y = a*xb
Determináció együttható (R2)dönti el, melyik írja le
legjobban az adott összefüggést
– Azt a trendvonaltípust érdemes választani, amelynél magasabb
az R2 értéke


Elemzésük és értelmezésük nehézkesebb, mint a
lineáris egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
56
vizsgálatában
Nem lineáris összefüggések
egy főre eső jövedelem (ezer Ft/fő)




A nyugat-keletregressziós
pozíció és az 1 főre jutó jövedelem
összefüggése a magyar
megyékben (2000)
Nem lineáris
egyenletek
alaptípusai
–
–
–
–
–
Logaritmikus: y = a + (b*lnx)
Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn)
Exponenciális y = a*bx
Hiperbolikus y =a +b/x
y = -0.3278x + 326.59
b
R = 0.2786
Hatványkitevős y = a*x
600
500
400
2
y = 319.67e-0.0011x
R2 = 0.3502
Determináció együttható dönti el, melyik írja le legjobban
az adott öszefüggést
Elemzésük és értelmezésük nehézkesebb, mint a
lineáris egyenleteké
Idősorok elemzésénél, trendszámításban gyakrabban
használják mint a területi adatok keresztmetszeti
vizsgálatában
57
300
200
y = -6E-07x3 - 0.0011x2 - 0.2748x + 340.93
R2 = 0.3226
100
0
-200
-150
-100
-50
0
50
NY-K koordináta (km)
lineáris
polinomiális
exponenciális
100
150
200
250
Grafikus ábrázolási módszerek
Grafikus ábrázolási módszerek

Grafikus ábrázolási módszerek típusai
– Általános statisztikai grafikus módszerek
– Térképészeti eljárások

Funkciói: eszköz és cél
– Kutatási munkában elemzési eszköz
– Dolgozatban, prezentációban illusztrációs cél

Jó, ha szöveg nélkül is megállja a helyét (főleg
PowerPoint-ban)
– De: nem helyettesítheti az elemzést: (minden ábrához
legyen szöveg)
59
Minden lényeges információ rajta
legyen (ismétlődés nélkül)

Inkább a címben
– Vizsgált terület: pl. Magyarország (területi szint: pl. NUTS2-es
régiók)
– Vizsgált jelenség: pl. regionális gazdasági fejlettségi
különbségek
– Mutató: pl. egy főre jutó GDP
– Vizsgált idő (vagy időszak): pl. 2004 (vagy 2004–2012)

Inkább a kategóriatengely feliratainál
– Mértékegység, pl. amerikai dollár/fő


Egyik infó se szerepeljen egyszerre két helyen (vagy a
címben vagy a kategóriatengelyen vagy a címben)
Ritkán szerepel a cím magán az Excel ábrán (nem hiba)
– Word: ábra alá külön sorba (utólag is könnyebben módosítható),
PowerPoint: előfordulhat, hogy már az Excelben felkerül) 60
Mindig a jelenséghez tartozó
ábratípust válasszunk

Egyszerűbb grafikus ábrázolási módszerek
–
–
–
–
–
–
–
Oszlopdiagram
Kördiagram: ritkábban ajánlott (csak kevés körcikkel)
Pontdiagram
Buborékdiagram
Vonaldiagram (grafikon)
Radar- (sugár-)diagram
Háromszögdiagram
61
Egyszerű oszlopdiagram
Regionális gazdasági fejlettségi különbségek Magyarországon
2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján)

14.0
Forrás: EuroStat  Egyszínű (kiv kitüntetett
12.9
12.0

10.0
ezer € / fő
8.5
8.0
6.0
értékek, pl. átlag)
Adatok szinte mindig
csökkenő sorrendben
– Kiv: ha van az adatsornak
irányultsága (pl. idősor, Ny–K,
5.8
5.6 korfa) 5.4
korszerkezet

7.8
5.3
4.0
2.0
0.0
KözépMagyarország
NyugatMagyarország
Közép-Dunántúl
Dél-Dunántúl
Dél-Alföld
ÉszakMagyarország
62
Észak-Alföld
Semleges értékhatárok a
kategóriatengelyen
Hibás ábra
Regionális gazdasági fejlettségi különbségek Magyarországon
2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján)
100.0
90.0

„Jelentéktelen” egyenlőtlenségek

Forrás: EuroStat
80.0
ezer € / fő
70.0
60.0
50.0
40.0
30.0
20.0
12.9
10.0
8.5
7.8
5.8
5.6
5.4
5.3
Dél-Dunántúl
Dél-Alföld
ÉszakMagyarország
63
Észak-Alföld
0.0
KözépMagyarország
NyugatKözép-Dunántúl
Magyarország
Semleges értékhatárok a
kategóriatengelyen
Hibás ábra
Regionális gazdasági fejlettségi különbségek Magyarországon
2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján)
13.0
12.0
12.9

„Óriási”
egyenlőtlenségek

Forrás: EuroStat
ezer € / fő
11.0
10.0
9.0
8.5
7.8
8.0
7.0
5.8
6.0
5.6
5.4
5.0
KözépMagyarország
NyugatMagyarország
Közép-Dunántúl
Dél-Dunántúl
Dél-Alföld
ÉszakMagyarország
5.3
64
Észak-Alföld
A jól elkészített diagram ismérvei
Regionális gazdasági fejlettségi különbségek Magyarországon
2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján)
14.0
12.9

Forrás: EuroStat
12.0
10.0
ezer € / fő
8.5
8.0
7.8
6.0
5.8
5.6
5.4
5.3
Dél-Dunántúl
Dél-Alföld
ÉszakMagyarország
65
Észak-Alföld
4.0
2.0
0.0
KözépMagyarország
NyugatMagyarország
Közép-Dunántúl
Hibás csoportosított oszlopdiagram
Hibás ábra
A regionális gazdasági fejlettségi különbségek alakulása
Magyarországon 1995–2004 között (megyei szinten, egy főre
 Többszínű
jutó GDP alapján)
18
16
14


Értékeket hasonlít össze kategóriák mentén
Alkalmas pl. területi egyenlőtlenségek időbeli
változásának vizsgálatára
10
8
6
– Fontos: az összehasonlíthatóság érdekében fontos, hogy
1995
mindkét időpontban százalékos értékek szerepeljenek
2004
– A sorrendet a korábbi érték határozza meg
4
2
Va
s
Fe
Cs jér
on
gr
ád
To
Ko
ln
m
a
ár
om
Z
-E
sz ala
te
rg
Ve om
sz
pr
é
Ba m
Bá ran
y
cs
-K a
isk
un
Já
Bé
sz
ké
-N Haj
s
ag dú
-B
yk
un iha
r
-S
Bo
z
o
rs
ln
od
o
-A
So k
ba
m
og
új
-Z
em y
pl
én
Sz
ab
He
ol
ve
cs
s
-S
za
P
tm
es
ár
t
-B
er
eg
Nó
gr
ád
rM
Bu
da
os
on pes
t
-S
op
ro
n
0
Gy
ő
ezer €
12

66
Forrás: EuroStat
Jó csoportosított oszlopdiagram
(divergencia Magyarországon)
250

Alkalmas pl. területi egyenlőtlenségek időbeli
változásának vizsgálatára
200
150
– Fontos: az összehasonlíthatóság érdekében fontos, hogy
mindkét időpontban százalékos értékek szerepeljenek
– Itt a sorrendet a korábbi érték határozza meg
1995
2004
100
50
Cs
Fe
j
Va
s
é
on r
gr
ád
To
Ko
ln
m
a
ár
om
Z
-E
sz ala
te
rg
Ve om
sz
pr
é
Ba m
Bá ran
y
cs
-K a
isk
un
Já
Bé
sz
k
-N Haj
dú és
ag
-B
yk
un iha
r
-S
Bo
zo
rs
ln
od
o
-A
So k
ba
m
og
új
-Z
em y
pl
én
Sz
ab
He
ol
ve
cs
s
-S
za
P
tm
es
ár
t
-B
er
eg
Nó
gr
ád
-M
Bu
da
os
on pes
t
-S
op
ro
n
0
Gy
őr
% (országos átlag = 100%)
A regionális gazdasági fejlettségi különbségek alakulása
Magyarországon 1995–2004 között (megyei szinten, egy főre
jutó GDP alapján)

67
Forrás: EuroStat
Halmozott oszlopdiagram: csak
abszolút mutatóknál!
A GDP régiók közötti megoszlásának alakulása
Magyarországon 1995–2004 között (NUTS2-es szinten)
90
80


ezer €
70
60

50

40
Többszínű
Kategóriánként összehasonlítja, hogy az egyes értékek
mekkora részét adják a teljes értéknek (a teljes érték is
változik)
Dél-Alföld
Egyszerre látható a növekedés és a belső átrendeződés
Észak-Alföld
Ritkábban használatos: gyakran nem állapítható
meg a
Észak-Magyarország
Dél-Dunántúl
belső összetétel átalakulása
Nyugat-Magyarország
Közép-Dunántúl
Közép-Magyarország
30
20
10
0
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004Forrás:

68
EuroStat
100%-ig halmozott oszlopdiagram:
csak abszolút mutatóknál!
A GDP régiók közötti megoszlásának alakulása
Magyarországon 1995–2004 között (NUTS2-es szinten)
100%


80%

60%
Többszínű
100%-ig halmozott oszlop: többszínű
Kategóriánként összehasonlítja, hogy az egyes értékek
mekkora részét adják a teljes értéknek (a teljes érték
Dél-Alföld
mindig azonos)
Észak-Alföld
Észak-Magyarország
Dél-Dunántúl
Nyugat-Magyarország
Közép-Dunántúl
Közép-Magyarország
40%
20%
0%
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004Forrás:

69
EuroStat
Jó színezés legyen (hasonló színű
szomszédos egységek feketefehérben ne mosódjanak egybe)
Hibás ábra



Forrás: EuroStat
Színezés: fekete-fehérben is látszódjon (nyomtatás, fénymásolás)
 inkább színárnyalatok különböző színek helyett
Szomszédos egységek eltérő színárnyalatúak legyenek (kivéve ha
az adatsoroknak sorrendje van)
70
Jó színezés legyen (hasonló színű
szomszédos egységek feketefehérben ne mosódjanak egybe)
Hibás ábra



Forrás: EuroStat
Jelmagyarázat legyen (különböző adatsoroknál, színárnyalatoknál)
Ha az adatsorban van irányultság (pl. korszerkezet,
településnagyságkategóriák stb.), a szomszédos jelölők lehetnek
71
szomszédos színárnyalatok
Halmozott sávdiagram speciális
fajtája a korfa
Magyarország korfája, 1998
64 év feletti
nőtöbblet
55-64 éves
korcsoportok
férfiak
nők
45-54 éves
35-44 éves
férfitöbblet
25-34 éves
15-24 éves
15 év alatti
200
150
100
50
0
ezer fő
50
100

150
72
200
Forrás: EuroStat
Célorientált, áttekinthető legyen, ne
túlságosan összetett (inkább külön
diagramokon)!
Hibás ábra
bruttó hozzáadott érték,
milliárd €
50

100
Forrás: EuroStat
40
80
30
60
53
20
53
39
36
10
0
36
22
40
28
25
8
0
Közép-Magyarország
mezőgazdaság
részesedés az ország mezőgazdaságából
20
Dunántúl
ipar
részesedés az ország iparából
százalék (ország = 100%)
A magyar régiók gazdasága ágazatonként, illetve a
régiók aránya az ágazatokból (NUTS1-es szinten, bruttó
hozzáadott érték alapján), 2004-ben
Alföld és Észak
73
szolgáltatás
részesedés az ország szolgáltatásából
Egyszerű legyen, ne túldizájnolt!
Hibás ábra
Regionális gazdasági fejlettségi különbségek Magyarországon
2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján)
14.0

Dél-Alföld
5.8 5.6 5.4
5.3
Észak-Alföld
Kúpok helyett oszlopok
3D helyett 2D
7.8
Észak-Magyarország

8.5
Dél-Dunántúl
– Elegánsabb a fehér
háttér
10.0
– Régi Excel:
8.0
ezer € / fő
alapbeállításban
6.0
szereplő szürke háttér
4.0
előtt kevésbé látszanak
a szürkéskék jelölők 2.0
0.0
– Nyomtatásnál
felesleges
„festékpazarlás”
12.9
Közép-Dunántúl
12.0
Nyugat-Magyarország
Kerüljük a színes vagy
mintás hátteret
Közép-Magyarország

74

Forrás: EuroStat
Kördiagram: csak abszolút
mutatóknál!




Nem ajánlott (helyette inkább oszlop diagram)
Nehezen mérhető az összetétel változása
(perec diagram)
3–4 cikknél nem lehet több (össze kell vonni a
kisebb értékeket  egyéb kategória)
Végképp rossz:
– 3D, robbantott kör
75
Jobb kördiagram
A GDP megoszlása Magyaraország régiói között 2004-ben
(NUTS1-es szinten)
28%
44%
Közép-Magyarország
Dunántúl
Alföld és Észak
28%
76

Forrás: EuroStat
Rossz kördiagram (ne legyen 3–4-nél
több körcikk)
Hibás ábra
1%
A GDP koncentrációja Magyarországon 2004-ben (megyei
2%
szinten)
Budapest
2%
2%
2%
3%
3%
3%
35%
3%
3%
3%
3%
4%
4%
4%
10%
4%

Forrás: EuroStat
5%
5%
Pest
Gyor-Moson-Sopron
Borsod-Abauj-Zemplen
Fejer
Hajdu-Bihar
Bacs-Kiskun
Komarom-Esztergom
Csongrad
Szabolcs-Szatmar-Bereg
Baranya
Veszprem
Zala
Vas
Jasz-Nagykun-Szolnok
Bekes
Heves
Somogy
77
Tolna
Nograd
Jobb kördiagram: nagyobb
elemszámnál aggregálni kell
A GDP koncentrációja Magyarországon 2004-ben (megyei
szinten)
35%
Budapest
Pest
Többi megye
55%
10%
78

Forrás: EuroStat
Optikailag semleges legyen, kerüljük
a térhatást (3D-t)!
Hibás ábra
A GDP megoszlása Magyaraország régiói között 2004-ben
(NUTS1-es szinten)

Forrás: EuroStat
28%
44%
Közép-Magyarország
Dunántúl
Alföld és Észak
28%

Térhatású kördiagram nem jó
– Előtérben lévő körcikkek nagyobbnak látszanak
– Térhatás komolytalan dizájnolás (oszlopdiagramnál is)
79
Rossz kördiagram (ne legyen
térhatású)
Hibás ábra
A GDP koncentrációja Magyarországon 2004-ben (megyei
szinten)
35%
Budapest
Pest
Többi megye
55%
10%
80

Forrás: EuroStat
Rossz kördiagram (ne legyen
robbantott)
Hibás ábra
A GDP koncentrációja Magyarországon 2004-ben (megyei
szinten)
35%
Budapest
Pest
Többi megye
55%
10%
81

Forrás: EuroStat
Jobb kördiagram: színezés
A korszerkezet különbségei a Benelux államokban (1998)
13%
16%
14%
Hollandia
Belgium
Luxemburg
31%
30%
30%
fiatal <25
középkorú 25-64
idős >=65
56%
54%
56%

82
Ha van az adatsornak irányultsága  a szomszédos jelölők
 Forrás: EuroStat
szomszédos színárnyalatok legyenek
Pontdiagram: két dimenziós
összehasonlítás






Az EU tagállamainak csoportosítása két jelzőszám szerint
Oszlopdiagram
200
Kördiagram:
nem ajánlott
180
Sugárdiagram
160
140
Buborékdiagram
120
Pontdiagram
100
80
Vonaldiagram
(grafikon)
60
Háromszögdiagram
40
GDP/fő (PPS, EU15=100%), 2000

L
U
P
O
20
0
45
50
55
60
Aktív népesség aránya (%), 2000
65
83

Forrás: EuroStat
Pontdiagram speciális típusa a
regressziós diagram


új, közcsatornával ellátott lakások
lakások aránya (%)

Értéktermelő-képesség és az újonann épített lakások
Oszlopdiagram
csatornával való ellátottságának összefüggése a magyar
Kördiagram: nemmegyékben
ajánlott(2000)
120
Sugárdiagram
100
Buborékdiagram
80
Pontdiagram
60
y = 0.0181x + 50.145
Vonaldiagram
(grafikon)
R = 0.3873
40
Háromszögdiagram




2
20
0
0
500
1000
1500
2000
GDP/fő (ezer Ft/fő)

2500
843000
Forrás: KSH T-Star
Buborékdiagram: három dimenziós
összehasonlítás


GDP/fő (PPS, EU15=100%)





Az EU csatlakozásra váró országok három jelzőszám tükrében
Oszlopdiagram
(2000)
Kördiagram: nem ajánlott
90
Sugárdiagram
80
CY
70
SL
Buborékdiagram
60
MT
CZ
Pontdiagram
50
HU
SK
EE
40
Vonaldiagram (grafikon)
PL
LT
LV
30
BG
Háromszögdiagram
RO
jelmagyarázat:
20
10
5 millió fő
1 millió fő
0
0
5
10
15
Munkanélküliségi ráta (%)
20

85
25
Forrás: EuroStat
Buborékdiagram sajátos esete a
piktogramos térkép







Tolna megye népességének települési megoszlása (2000)
Oszlopdiagram
Budapest (0;0)
-60
Kördiagram:
nem
ajánlott
-100
-80
-60
-40
-20
0
20
Sugárdiagram
-80
Buborékdiagram
Paks
-100
Pontdiagram
Vonaldiagram (grafikon)
-120
Dombóvár
Szekszárd
Háromszögdiagram
jelmagyarázat:
10 000
fő
-140
-160
86

Forrás: KSH T-Star
Vonaldiagram (grafikon): két
dimenziós összehasonlítás (egyik
dimenzió az idő)



GDP/fő (ezer Ft/fő)




Pest megye gazdasági fejlődése (1994-2000)
Oszlopdiagram
1200
Kördiagram:
nem ajánlott
 Forrás: KSH
Sugárdiagram
1000
Buborékdiagram
800
773
Pontdiagram
653
600
Vonaldiagram (grafikon)
493
400
399
Háromszögdiagram
324
1025
911
200
Azonos időközöknél: Excel: „Grafikon” diagramtípus
0
87
1994
1995
1996
1997
1998 
1999
2000
Forrás:
EuroStat
Vonaldiagram (grafikon): két
dimenziós összehasonlítás (egyik
dimenzió az idő)



százalék (ország=100)




Délkelet-Anglia gazdasági fejlődése az egy főre jutó GDP
Oszlopdiagram
alapján (1950-1996)
Kördiagram: nem ajánlott
124
Sugárdiagram
122
Buborékdiagram
120
Pontdiagram
118
Vonaldiagram (grafikon)
116
Háromszögdiagram
114
Eltérő időközöknél: Excel: „Pontdiagram” diagramtípus  vonallal
112
összekötni a pontokat
88
1950
1955
1960
1965
1970
1975
1980
1985
1990
1995
2000
 Forrás:
EuroStat
Radar- (sugár-)diagram: sok
dimenziós összehasonlítás





Tolna megye kistérségeinek fejelttsége (2000) (megyei
Oszlopdiagram
átlag=100%)
Kördiagram: nem ajánlott
Sugárdiagram
Buborékdiagram
Pontdiagram
Vonaldiagram (grafikon)
BONYHÁD
Háromszögdiagram
egy lakosra jutó jövedelem
reciprok munkanélküliek aránya


ezer lakosra jutó telefonvonal
DOMBÓVÁR
PAKS
SZEKSZÁRD
TAMÁSI
Tolna megye
ezer lakosra jutó személygépkocsi

89
Forrás: KSH-T-Star
Radar- (sugár-)diagram: sok
dimenziós összehasonlítás
A fejlettség területi egyenlőtlenségei Tolna megyében (2000)
(megyei átlag=100%)
TAMÁSI
DOMBÓVÁR
PAKS
140
120
100
80
60
40
20
0
SZEKSZÁRD
egy lakosra jutó jövedelem
ezer lakosra jutó telefonvonal
ezer lakosra jutó személygépkocsi
reciprok munkanélküliek aránya
BONYHÁD
90

Forrás: KSH-T-Star