Transcript PowerPoint
Regionális elemzések módszerei Tematika: területi statisztikai elemzési módszerek Excelben – Adatbázis kezelés, területi egyenlőtlenségi mutatók, földrajzi összefüggés elemzések, grafikus ábrázolási módszerek Számonkérés: – Félévvégi zh (100 pont) Számítógépes gyakorlati feladatok a tanult elemzési módszerek segítségével 1 Felhasználható irodalom A felkészüléshez elsősorban a gyakorló feladatsor és az órai jegyzet ajánlott Gyakorló feladatsor letölthető lesz: http://jeney.web.elte.hu Nemes Nagy, J. (szerk.) (2005): Regionális elemzési módszerek, Regionális Tudományi Tanulmányok, 11. ELTE Regionális Földrajzi Tanszék – MTA–ELTE Regionális Tudományi Kutatócsoport, Budapest 284 p. Letölthető: http://geogr.elte.hu/old/REF/Kiadvanyok/REF_1 1_PDF/RTT-11-tartalom.htm#RTT-11 2 Regionális elemzések módszerei dr. Jeney László egyetemi adjunktus [email protected] Regionális elemzések módszerei II. Gazdasági és vidékfejlesztési agrármérnök alapszak (BSc) 2013/2014, II. félév BCE Gazdaságföldrajz és Jövőkutatás Tanszék Adattípusok Adatsorok 2 fő típusa: nem fajlagos és fajlagos mutatók x x y f Nem fajlagos (abszolút) mutatók – Pl. népességszám, GDP, személygépkocsik száma, terület, városlakók száma – Jelölése: xi azaz x abszolút mutató értéke adott „i” régióban Fajlagos mutatók (relatív vagy származtatott mutatók) – Pl. egy főre jutó GDP, ezer lakosra jutó személygépkocsik, népsűrűség, városlakók aránya – Lehet százalékos részesedés is: pl. városlakók aránya – Jelölése: yi azaz y fajlagos mutató értéke adott „i” régióban – Általában 2 nem fajlagos mutató hányadosa, pl. GDP és népesség (ritkán 2 fajlagos mutató hányadosa, pl. megyei GDP/fő az országos átlagos GDP/fő %-ában) – Esetükben súlyozni kell (pl. súlyozott átlag, súlyozott szórás) – A súly a fajlagos mutató képletének nevezőjében van, jelölése fi azaz f súly értéke adott „i” régióban 5 – Súly gyakran népességszám, de nem mindig Nem fajlagos – fajlagos mutatók valamint a súly közötti átszámítások Ha a nem fajlagos mutató (GDP) és a súly (népességszám) ismert – A fajlagos mutató (GDP/fő): a nem fajlagos mutató és a súly x hányadosa GDP / fő GDP népességsz ám Ha a nem fajlagos (GDP) és a fajlagos mutató ismert (GDP/fő) – A súly (népesség): a nem fajlagos és a fajlagos mutató hányadosa népességsz ám GDP GDP / fő Ha a fajlagos mutató (GDP/fő) és a súly (népesség) ismert GDP GDP / fő népességsz ám 6 – Nem fajlagos mutató (GDP): a fajlagos mutató és a súly szorzata Adatsorok jellegadó értékei Adatsorok jellegadó értékei Középértékek – Számtani átlag / súlyozott számtani átlag – Mértani átlag – Helyzeti középértékek (módusz, medián) Szélső értékek – Maximum – Minimum Adatsor terjedelme és szórása (átvezet a területi egyenlőtlenségi mutatók felé) – Terjedelem-típusú mutatók – Szórás-típusú mutatók Középértékek: átlagok Számtani átlag – Az eredeti számok helyébe helyettesítve azok összege változatlan xi – n db adat (xi) x – Excel fx= ÁTLAG() n – – y f n db fajlagos adat (y ) y Súly (f ): a fajlagos mutató nevezőjében szereplő adat f Súlyozott számtani átlag i i i i i Mértani átlag – Az eredeti számok helyébe helyettesítve azok szorzata változatlan n – n db adat (xi) * x n x i i 1 n x1 x2 ... xi ... xn Helyzeti középértékek Medián – Az az érték, aminél kisebb és nagyobb adatok száma egyenlő (felező pont) – Extrém adatokat tartalmazó adatsorok esetében érdemes használni – Kvantilisek: kvartilis (negyedelő), kvintilis (ötödölő), decilis (tizedelő), percentilis (századoló) – Medián/átlag: egyenlőtlenségi mutató (minél kisebb, annál nagyobb az egyenlőtlenség) – Excel fx= MEDIÁN() Módusz („divatos érték”) – A legtöbbször előforduló érték – Lehet többmóduszú (többcsúcsú) adatsor is – Excel fx= MÓDUSZ() A szélső értékek és a terjedelem típusú egyenlőtlenségi mutatók Maximum – Az adatsor legnagyobb értéke (xmax) – Excel fx= MAX() Minimum – Az adatsor legkisebb értéke (xmin) – Excel fx= MIN() Alapja a terjedelem típusú egyenlőtlenségi mutatóknak – Range (szóródás terjedelme) P xmax xmin – Range-arány (adatsor terjedelme) xmax K xmin – Relatív range xmax xmin Q x Súlyozatlan relatív terjedelem kiszámításának lépései (abszolút mutatóknál) 1. 2. 3. 4. 5. Ki kell számítani az adatsor maximumát (függvényvarázsló: max) Ki kell számítani az adatsor minimumát (függvényvarázsló: min) Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) Ki kell számítani az adatsor (sima) átlagát (függvényvarázsló: átlag) El kell osztani a terjedelmet az átlaggal Súlyozatlan relatív terjedelem kiszámítása Excelben A 1 B C xa xb 2 1. régió 24 10 3 2. régió 4 10 4 3. régió 0 10 5 4. régió 12 10 maximum 24 10 =MAX(B2:B5) =MAX(C2:C5) 0 10 =MIN(B2:B5) =MIN(C2:C5) 6 7 minimum 8 terjedelem 9 átlag 10 relatív terjedelem 24 10 =ÁTLAG(B2:B5) 2,4 0 =B6-B7 =B8/B9 10 =C6-C7 =ÁTLAG(C2:C5) 0 =C8/C9 Súlyozott relatív terjedelem kiszámításának lépései (fajlagos mutatóknál) 1. 2. 3. 4. 5. Ki kell számítani az adatsor maximumát (függvényvarázsló: max) Ki kell számítani az adatsor minimumát (függvényvarázsló: min) Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) Ki kell számítani az adatsor súlyozott átlagát El kell osztani a terjedelmet a súlyozott átlaggal Súlyozott relatív terjedelem kiszámítása Excelben A 1 2 1. régió B C D E F G ya fa xa yb fb Xb 24 1 24 10 1 10 =B2*C2 =E2*F2 3 2. régió 4 3,5 14 10 3,5 35 4 3. régió 0 4,5 0 10 4,5 45 5 4. régió 12 1 12 10 1 10 6 összeg 10 50 10 100 7 max. 24 8 min. 0 9 terj. =MAX(B2:B5) =MIN(B2:B5) 24 10 s. átlag 5 11 rel terj 4,8 =MAX(E2:E5) 10 =MIN(E2:E5) 0 =B6-B7 =E6-E7 10 =D6/C6 =B9/B10 10 rel terj 0 =G6/F6 =E9/E10 A szórás típusú egyenlőtlenségi mutatók Szórás-típusú egyenlőtlenségi mutatók Nem fajlagos (abszolút) mutatók (xi): (súlyozatlan) szórás Fajlagos mutatók (yi): súlyozott szórás A valódi egyenlőtlenségeket a relatív szórással mérhetjük – Nem fajlagos: (súlyozatlan) relatív szórás (szórás az átlag %ában) – Fajlagos mutatók: súlyozott relatív szórás (súlyozott szórás a súlyozott átlag %-ában) 17 (Súlyozatlan) szórás: nem fajlagos mutatók esetében Adatsorok egyes értékeinek (xi) az átlagtól való négyzetes eltérésének az átlaga Képlete – Xi = abszolút mutató i régióban – n = elemszám 2 x x i i n Kiszámítása – Excel: fx= SZÓRÁSP() ( és nem SZÓRÁS) – Angol nyelvű Excel fx= STDEVP() Értékkészlete: 0 ≤ σ ≤ ∞ – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség Mértékegysége: mint az eredeti értékek (Xi) mértékegysége 18 (Súlyozatlan) relatív szórás: nem fajlagos mutatók esetében A valódi egyenlőtlenségeket a relatív szórással mérhetjük Relatív szórás: abszolút mutatók esetében Képlete: – σ = Xi adatsor szórása – x = Xi adatsor átlaga v 100 x Kiszámítása – a szórás értékeket elosztjuk az átlaggal és megszorozzuk 100zal (a szórás értékeit az átlag százalékában fejezzük ki) Értékkészlete: 0 ≤ v ≤ ∞ – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség Mértékegysége: % 19 Súlyozott szórás: fajlagos mutatók esetében Fajlagos mutatók (yi) esetében Adatsorok egyes értékeinek (yi) az átlagtól való négyzetes eltérésének az átlaga 2 Képlete y y fi i – yi = fajlagos mutató i régióban – fi = súly (fajlagos mutató nevezője) i f i i Értékkészlete: 0 ≤ σ ≤ ∞ – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség Mértékegysége: mint az eredeti értékek (yi) mértékegysége 20 Súlyozott szórás kiszámításának lépései 1. 2. 3. 4. Kiszámítom a fajlagos mutató súlyozott átlagát Minden térség esetében kiszámítom a vizsgált fajlagos mutató értékeinek eltérését a súlyozott átlagtól (Excel $) Minden térség esetében a kapott különbségeket négyzetre emelem (Excel jobb oldali Alt+3 együtt, majd 2 = ^2) Minden térség esetében a kapott értékeket megszorzom a térséghez tartozó súllyal – 2–4. lépések egy oszlopban is megoldhatók 5. 6. 7. Az így kapott szorzatokat összegzem Ezt az összeget elosztom a súlyok összegével 21 Ennek a hányadosnak a négyzetgyökét veszem (^0,5) Súlyozott relatív szórás: fajlagos mutatók esetében A valódi egyenlőtlenségeket a relatív szórással mérhetjük – Fajlagos mutatók esetében: súlyozott relatív szórással Képlete: – σ = yi adatsor súlyozott szórása – y = yi adatsor súlyozott átlaga v y 100 Kiszámítása – A súlyozott szórás értékeket elosztjuk a súlyozott átlaggal és megszorozzuk 100-zal (a súlyozott szórás értékeit a súlyozott átlag százalékában fejezzük ki) Értékkészlete: 0 ≤ v ≤ ∞ – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség22 Mértékegysége: % Súlyozott relatív szórás kiszámítása Excelben A 1 B C D E F G y f x átl elt négyzet súlyozás 361 361 =F2*C2 2 1. régió 24 1 24 =B2*C2 19 =B2B$7 =E2^2 3 2. régió 4 3,5 14 –1 1 3,5 4 3. régió 0 4,5 0 –5 25 112,5 5 4. régió 12 1 12 7 49 49 6 összeg 10 50 7 s. átlag 8 s. szórás 5 =D6/C6 =SZUM(D2:D5) 526 =SZUM(G2:G5) 52,6 =G6/C6 7,25 =G7^0,5 9 s. relatív 145,05 szórás =B8/B7*1 00 23 A területi koncentráció mérése: Hirschman–Herfindahl index Területi egyenlőtlenségek mérésére szolgáló statisztikai eszközök Területi egyenlőtlenségi indexek, leggyakrabban használtak: – A területi polarizáltság mérőszámai Relatív terjedelem/Relatív range (Q) Duál mutató/Éltető–Frigyes index (D) – Szórás-típusú területi egyenlőtlenségi indexek Súlyozott relatív szórás (V) – Területi eloszlást mérő egyenlőtlenségi indexek Hirschman–Herfindahl index (K) Hoover-index/Krugman-index (H) – Területi egyenlőtlenségek összetettebb mérési módszerei Gini együttható (G) Távolságfüggvények Korrelációs mérőszámok 25 Hirschman–Herfindahl index Egy jelenség földrajzi koncentrációjának mérésére használt mutatószám Csak összegezhető (nem fajlagos) mutatóra számítható 2 Képlete xi K n i 1 Értékkészlete: 1/n ≤ K ≤ 1 xi – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség i 1 – Xi = nem fajlagos mutató i régióban – Σxi = nem fajlagos mutató a teljes régióban n – Előfordulhat, hogy alacsonyabb területi szinten csökken az értéke Mértékegysége: nincs 26 Hirschman–Herfindahl index kiszámításának lépései 1. 2. 3. Összegezzük a vizsgált adatsort Minden térség esetében elosztom az adott térség értékét az előbb kiszámított összeggel (Excel $) Minden térség esetében a kapott hányadosokat négyzetre emelem (Excel jobb oldali Alt+3 együtt, majd 2 = ^2) – 2–3. lépések egy oszlopban is megoldhatók 4. Az így kapott értékeket összegzem 27 Hirschman–Herfindahl index kiszámítása Excelben A 1 B C D xi hányados négyzet 2 1. régió 8 0,4 =B2/B$6 0,16 =C2^2 3 2. régió 4 0,2 0,04 4 3. régió 6 0,3 0,09 5 4. régió 2 0,1 0,01 6 összesen 20 1 7 Hirshman– Herfindahl i. =SZUM(B2:B5) 0,328 =SZUM(D2:D5) Hirschman–Herfindahl index elméleti maximuma A 1 B C D xi hányados négyzet 2 1. régió 0 0 =B2/B$6 0 =C2^2 3 2. régió 0 0 0 4 3. régió 20 1 1 5 4. régió 0 0 0 6 összesen 20 1 7 Hirshman– Herfindahl i. =SZUM(B2:B5) 29 1 =SZUM(D2:D5) Hirschman–Herfindahl index elméleti minimuma (4 elem esetén) A 1 B C D xi hányados négyzet 2 1. régió 5 0,25 =B2/B$6 0,0625 =C2^2 3 2. régió 5 0,25 0,0625 4 3. régió 5 0,25 0,0625 5 4. régió 5 0,25 0,0625 6 összesen 20 1 7 Hirshman– Herfindahl i. =SZUM(B2:B5) 30 0,25 =SZUM(D2:D5) Területi eloszlások összevetése: Hoover index Hoover index Egyik legelterjedtebb, legáltalánosabban használt területi egyenlőtlenségi index Két mennyiségi ismérv területi megoszlásának eltérését méri – Az egyik ismérv, társadalmi-gazdasági jelenség mennyiségének hány százalékát kell a területi egységek között átcsoportosítani ahhoz, hogy területi megoszlása a másik jellemzőével azonos legyen – Területi kutatásokban leggyakrabban a népesség területi eloszlásával vetjük össze más társadalmi-gazdasági ismérvével 1941: E. M. Hoover, amerikai agrárközgazdász Használja a földrajz, szociológia, közgazdaságtan, ökológia is 32 Hoover index Két nem fajlagos mutató területi megoszlása közötti eltérést mérhetjük vele – Egy fajlagos mutató számlálója és nevezője között is lehet – xi = i régió részesedése x nem fajlagos mutatóból – yi = i régió részesedése y nem fajlagos mutatóból n Képlete: H x y i 1 i 2 xi és yi: két megoszlási viszonyszám, melyekre fennállnak az alábbi összefüggések – Σxi = 100 – Σyi = 100 A mutató szimmetrikus, a két összevetett megoszlás (xi és yi) szerepe, sorrendje felcserélhető Értékkészlete: 0 ≤ H ≤ 100 – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség33 Mértékegysége: % i Hoover index kiszámításának lépései 1. 2. 3. 4. Mindkét nem fajlagos mutató adatsorának értékeit összegezzük Minden térség esetében kiszámítjuk az adott térség százalékos részesedését az összes mennyiségből (mindkét mutató esetében) Minden térség esetében kivonjuk az egyik mutató szerinti százalékos részesedésből a másik mutató szerinti százalékos részesedést Minden térség esetében az így kapott különbségek abszolút értékét vesszük (ABS) – 2–4. lépések egy oszlopban is megoldhatók 5. 6. Az abszolút értékeket összegzem A kapott összeg értékét megfelezem 34 Hoover index kiszámítása Excelben A 1 2 1. régió B C D E F G xi yi xi% yi% xi%–yi% absz 8 4 40% 40% 0% =D2-E2 0% =B2/B$6* 100 =C2/C$6* 100 =ABS(F2) 3 2. régió 4 1 20% 10% 10% 10% 4 3. régió 6 3 30% 30% 0% 0% 5 4. régió 2 2 10% 20% –10% 10% 6 összesen 20 10 100% 100% 0% 20% =SZUM( B2:B5) =SZUM (C2:C5) 7 Hoover index =SZUM(G2: G5) 35 10% =G6/2 Hoover index elméleti maximuma A 1 2 1. régió B C D E F G xi yi xi% yi% xi%–yi% absz 12 0 60% 0% 60% =D2- 60% =B2/B$6* 100 =C2/C$6* 100 E2 =ABS(F2) 3 2. régió 8 0 40% 0% 40% 40% 4 3. régió 0 0 0% 0% 0% 0% 5 4. régió 0 10 0% 100% –100% 100% 6 összesen 20 10 100% 100% 0% 200% =SZUM( B2:B5) =SZUM (C2:C5) 7 Hoover index =SZUM(G2: G5) 36 100% =G6/2 Hoover index elméleti minimuma A 1 2 1. régió B C D E F G xi yi xi% yi% xi%–yi% absz 8 4 40% 40% 0% =D2-E2 0% =B2/B$6* 100 =C2/C$6* 100 =ABS(F2) 3 2. régió 4 2 20% 20% 0% 0% 4 3. régió 6 3 30% 30% 0% 0% 5 4. régió 2 1 10% 10% 0% 0% 6 összesen 20 10 100% 100% 0% 0% =SZUM( B2:B5) =SZUM (C2:C5) 7 Hoover index =SZUM(G2: G5) 0%37 =G6/2 „Pszeudo-egymutatós” egyenlőtlenségi index Két nem fajlagos mutató területi eloszlása közötti eltérés mérése – Pl. nép-jöv, kisebbség-egész társadalom stb. Egy fajlagos mutató területi egyenlőtlenségének mérése – Pl. Jöv/fő, kisebbségek aránya 38 Hoover index használhatósága Egyik legjobban interpretálható eredményt adja a területi egyenlőtlenségi indexek közül – Értékei 0–100 között mozognak: a 100 magas, a 0 alacsony érték (szórás-típusú területi egyenlőtlenségi mutatóknak nincs maximuma) – H = 33% az egyik mutató 33 %-át kell a régiók között átcsoportosítani ahhoz, hogy a területi megoszlása megegyezzen a másikéval 39 Hoover index más neveken Robin Hood index („Rózsa Sándor” index) – Népesség és jövedelem között Dinamikus értelmezés (itt lehet az egy évre jutó változást is mérni, ha 2 helyett 2t-vel osztunk) – Korábbi és későbbi állapotok között (Településszociológiában Duncan&Duncan házaspár) – Disszimilaritási index: rész–rész viszonylatban – Szegregációs index: rész–egész viszonylatban, vagy rész–többi rész viszonylatban Egyes változatoknál nem százalékban fejezzük ki, ekkor értékkészlete: 0 ≤ H ≤ 1 Krugman index (Földrajz és kereskedelem c. könyv, 1993.) – Ha nem osztjuk el 2-vel (nehezebben értelmezhető) – 0 ≤ H ≤ 200 (vagy 0 ≤ H ≤ 2) 40 Hoover index vizsgálati lehetőségei Magyarország 2005 jöv-nép megyei szint Egy számítás önmagában általában kevés összehasonlítás kell: – Területek között: pl. Szlovákiára is – Időbeni állapotok között: pl. 1990-re is – Mutatók között: pl. személygépkocsi és a népesség között is – Területi szinteken (Hoover-index specialitása): pl. települési szinten is 41 Különböző területi szintek egyenlőtlenségek eltérő alakulása 16% 14% Az adóköteles jövedelmek területi egyenlőtlenségeinek változása különböző területi szinteken, Robin Hood index, 1998–2002 12% 10% 8% Települések (~3100) 6% 168 kistérség 20 megye 7 régió 4% 3 NUTS-I. egység Budapest-Vidék Települések Bp. nélkül 2% Kistérségek Bp. nélkül Megyék Bp. nélkül 42 0% 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 Korreláció 43 Társadalmi jelenségek együttmozgása Tagoltság vizsgálata: szinte sohasem szűkül le egy-egy jelenség (mutatószám) térbeli eloszlásának elemzésére – Már a fajlagos adatok egyenlőtlenségeinek mérésekor is 2 jelenséget kapcsolunk össze Térbeli együttmozgások elemzése: kifejezetten területi kölcsönhatások (néha ok-okozati kapcsolatok) is megjelennek Összefüggések mérése: korreláció- és regressziószámítás – Erősség: milyen erős az összefüggés – Irány: egyenes (+) vagy fordított (–) arányosság 44 Szignifikancia Megbízható (szignifikáns) összefüggés: ha viszonylag nagy elemszámú mintából, hosszú adatsorból számítjuk Erős szignifikancia: megfigyelési egységek körét véletlenszerűen újabbakkal bővítve, nagy valószínűséggel nem változik az összefüggés iránya és szorossága Meghatározza: – Elemszámtól (1000 vagy 10 területi egységre mérünk) – Kapcsolat szorossági szintje (korreláció absz. 0,9 vagy 0) Szignifikancia-tesztek: pl. SPSS 45 Korreláció Jelzőszámok közötti kapcsolat szorosságának meghatározására szolgáló eljárás (egyfajta sajátos egyenlőtlenségi mutató – Egy mutatószámmal (r): korrelációs együttható Korreláció típusai területi elemzésekben – Lineáris korreláció azonos megfigyelési egységekre vonatkozó két adatsor között – Autokorreláció – Keresztkorreláció Ugyanígy lehet autoregresszió és keresztregresszió is Értékkészlete: –1 ≤ r ≤ 1 Mértékegysége nincs 46 Súlyozás problémája a korrelációszámításban Lineáris korreláció Lineáris korreláció azonos megfigyelési egységekre vonatkozó két adatsor között – r = corr (xi yi) Legismertebb: Pearson-féle korrelációs együttható Egyfajta sajátos egyenlőtlenségi mutató 47 A korrelációs-együtthatók értékeinek értelmezése r értéke kapcsolat jellege r=1 Lineáris függvénykapcsolat, egyenes arányosság van a két jellemző között 0,7 ≤ r < 1 Szoros kapcsolat, egyirányú együttmozgás 0,3 ≤ r < 0,7 Közepes erősségű kapcsolat, egyirányú együttmozgás 0 < r < 0,3 Gyenge kapcsolat, egyirányú együttmozgás r=0 Nincs lineáris kapcsolat, a két jellemző korrelálatlan –0,3 < r < 0 Gyenge kapcsolat, ellentétes irányú együttmozgás –0,7 < r ≤ –0,3 Közepes erősségű kapcsolat, ellentétes irányú együttmozgás –1 < r ≤ –0,7 Szoros kapcsolat, ellentétes irányú együttmozgás r = –1 Lineáris függvénykapcsolat, fordított arányosság48van a két jellemző között Lineáris korrelációs együtthatók Pearson-féle lineáris korreláció együttható – Excel fx= KORREL() – Angol nyelvű Excel fx= CORREL() n r x X y i 1 i n n i 1 i 1 i Y 2 2 x X y Y i i Spearman-féle rangkorreláció n 6 d i 2 – Ordinális (sorrendi) adatskála esetén R 1 i 1 2 49 n n 1 – di: összetartozó rangszámok különbségei Korrelációs mátrix f(x) függvényvarázsló segítségével számítható a mátrixban szereplő adatsorok egymás mellé rendezése úgy, hogy üres oszlop és egyéb adat ne legyen benne! mátrix keretének elkészítése a fejléc átmásolása vízszintesen és függőlegesen, a bal fölső cella üres) minden sorból egy korrelációs együttható kiszámítása, a sorban állandó jelzőszám tömbjének betűjeli lerögzítendők! (további egyszerűsítés is végezhető, de teljesen automatikusan nem lehet kitölteni minden cellát!) 50 ellenőrzés: átlóban 1-esek szerepelnek, a mátrix az átlóra szimmetrikus Regresszió-elemzés Regressziószámítás a regionális elemzésekben Változókapcsolatokat valószínűségi (sztochasztikus) függvénykapcsolatként értelmezi Függő és független (vagy magyarázó) változók – Független: x tengely, fajlagos mutató nevezője, bal oszlop – Függő: y tengely, fajlagos mutató számlálója, jobb oszlop Típusai: – Lineáris vagy nem lineáris – Két- vagy többváltozós Alkalmas becslésre, előrejelzésre 52 Kétváltozós lineáris regresszió y = a + bx – x: magyarázó (független) változó – b: regressziós együttható (regressziós koefficiens): az egyenes meredekségét vagy dőlését jelöli (az x értékének egységnyi növekedése y értékének mekkora mértékű és milyen irányú változását vonja maga után – a: regressziós állandó (konstans): értéke megegyezik az egyenes y tengelyen tapasztalt metszéspontjával (a értéke egyenlő y értékével x=0 helyen) – y: a függő változó regressziós egyenlet alapján becsült értéke Determinációs együttható (R2) itt a Pearson-féle lineáris korrelációs együttható négyzete 53 Kétváltozós lineáris regresszó számítása Excelben 1. 2. 3. 4. 5. 6. a két adatsor egymás mellé rendezése úgy, hogy a bal oldalon az x tengelyre kerülő változó legyen. szórásdiagram készítése (pontdiagram) formázási műveletek jobb klikk valamely pontra: trendvonal felvétele egyenlet és r négyzet látszik számítás 54 Kétváltozós lineáris regressziós összefüggések Értéktermelő-képesség és az újonann épített lakások csatornával való ellátottságának összefüggése a magyar megyékben (2000) új, közcsatornával ellátott lakások lakások aránya (%) 120 100 80 60 40 y = 0.0181x + 50.145 R2 = 0.3873 20 0 55 0 500 1000 1500 GDP (ezer Ft/fő) 2000 2500 3000 Nem lineáris összefüggések Nem lineáris regressziós egyenletek alaptípusai – – – – – Logaritmikus: y = a + (b*lnx) Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn) Exponenciális y = a*bx Hiperbolikus y =a +b/x Hatványkitevős y = a*xb Determináció együttható (R2)dönti el, melyik írja le legjobban az adott összefüggést – Azt a trendvonaltípust érdemes választani, amelynél magasabb az R2 értéke Elemzésük és értelmezésük nehézkesebb, mint a lineáris egyenleteké Idősorok elemzésénél, trendszámításban gyakrabban használják mint a területi adatok keresztmetszeti 56 vizsgálatában Nem lineáris összefüggések egy főre eső jövedelem (ezer Ft/fő) A nyugat-keletregressziós pozíció és az 1 főre jutó jövedelem összefüggése a magyar megyékben (2000) Nem lineáris egyenletek alaptípusai – – – – – Logaritmikus: y = a + (b*lnx) Polinomiális: y = a + (b1*x) + (b2*x2) + … + (bn*xn) Exponenciális y = a*bx Hiperbolikus y =a +b/x y = -0.3278x + 326.59 b R = 0.2786 Hatványkitevős y = a*x 600 500 400 2 y = 319.67e-0.0011x R2 = 0.3502 Determináció együttható dönti el, melyik írja le legjobban az adott öszefüggést Elemzésük és értelmezésük nehézkesebb, mint a lineáris egyenleteké Idősorok elemzésénél, trendszámításban gyakrabban használják mint a területi adatok keresztmetszeti vizsgálatában 57 300 200 y = -6E-07x3 - 0.0011x2 - 0.2748x + 340.93 R2 = 0.3226 100 0 -200 -150 -100 -50 0 50 NY-K koordináta (km) lineáris polinomiális exponenciális 100 150 200 250 Grafikus ábrázolási módszerek Grafikus ábrázolási módszerek Grafikus ábrázolási módszerek típusai – Általános statisztikai grafikus módszerek – Térképészeti eljárások Funkciói: eszköz és cél – Kutatási munkában elemzési eszköz – Dolgozatban, prezentációban illusztrációs cél Jó, ha szöveg nélkül is megállja a helyét (főleg PowerPoint-ban) – De: nem helyettesítheti az elemzést: (minden ábrához legyen szöveg) 59 Minden lényeges információ rajta legyen (ismétlődés nélkül) Inkább a címben – Vizsgált terület: pl. Magyarország (területi szint: pl. NUTS2-es régiók) – Vizsgált jelenség: pl. regionális gazdasági fejlettségi különbségek – Mutató: pl. egy főre jutó GDP – Vizsgált idő (vagy időszak): pl. 2004 (vagy 2004–2012) Inkább a kategóriatengely feliratainál – Mértékegység, pl. amerikai dollár/fő Egyik infó se szerepeljen egyszerre két helyen (vagy a címben vagy a kategóriatengelyen vagy a címben) Ritkán szerepel a cím magán az Excel ábrán (nem hiba) – Word: ábra alá külön sorba (utólag is könnyebben módosítható), PowerPoint: előfordulhat, hogy már az Excelben felkerül) 60 Mindig a jelenséghez tartozó ábratípust válasszunk Egyszerűbb grafikus ábrázolási módszerek – – – – – – – Oszlopdiagram Kördiagram: ritkábban ajánlott (csak kevés körcikkel) Pontdiagram Buborékdiagram Vonaldiagram (grafikon) Radar- (sugár-)diagram Háromszögdiagram 61 Egyszerű oszlopdiagram Regionális gazdasági fejlettségi különbségek Magyarországon 2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján) 14.0 Forrás: EuroStat Egyszínű (kiv kitüntetett 12.9 12.0 10.0 ezer € / fő 8.5 8.0 6.0 értékek, pl. átlag) Adatok szinte mindig csökkenő sorrendben – Kiv: ha van az adatsornak irányultsága (pl. idősor, Ny–K, 5.8 5.6 korfa) 5.4 korszerkezet 7.8 5.3 4.0 2.0 0.0 KözépMagyarország NyugatMagyarország Közép-Dunántúl Dél-Dunántúl Dél-Alföld ÉszakMagyarország 62 Észak-Alföld Semleges értékhatárok a kategóriatengelyen Hibás ábra Regionális gazdasági fejlettségi különbségek Magyarországon 2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján) 100.0 90.0 „Jelentéktelen” egyenlőtlenségek Forrás: EuroStat 80.0 ezer € / fő 70.0 60.0 50.0 40.0 30.0 20.0 12.9 10.0 8.5 7.8 5.8 5.6 5.4 5.3 Dél-Dunántúl Dél-Alföld ÉszakMagyarország 63 Észak-Alföld 0.0 KözépMagyarország NyugatKözép-Dunántúl Magyarország Semleges értékhatárok a kategóriatengelyen Hibás ábra Regionális gazdasági fejlettségi különbségek Magyarországon 2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján) 13.0 12.0 12.9 „Óriási” egyenlőtlenségek Forrás: EuroStat ezer € / fő 11.0 10.0 9.0 8.5 7.8 8.0 7.0 5.8 6.0 5.6 5.4 5.0 KözépMagyarország NyugatMagyarország Közép-Dunántúl Dél-Dunántúl Dél-Alföld ÉszakMagyarország 5.3 64 Észak-Alföld A jól elkészített diagram ismérvei Regionális gazdasági fejlettségi különbségek Magyarországon 2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján) 14.0 12.9 Forrás: EuroStat 12.0 10.0 ezer € / fő 8.5 8.0 7.8 6.0 5.8 5.6 5.4 5.3 Dél-Dunántúl Dél-Alföld ÉszakMagyarország 65 Észak-Alföld 4.0 2.0 0.0 KözépMagyarország NyugatMagyarország Közép-Dunántúl Hibás csoportosított oszlopdiagram Hibás ábra A regionális gazdasági fejlettségi különbségek alakulása Magyarországon 1995–2004 között (megyei szinten, egy főre Többszínű jutó GDP alapján) 18 16 14 Értékeket hasonlít össze kategóriák mentén Alkalmas pl. területi egyenlőtlenségek időbeli változásának vizsgálatára 10 8 6 – Fontos: az összehasonlíthatóság érdekében fontos, hogy 1995 mindkét időpontban százalékos értékek szerepeljenek 2004 – A sorrendet a korábbi érték határozza meg 4 2 Va s Fe Cs jér on gr ád To Ko ln m a ár om Z -E sz ala te rg Ve om sz pr é Ba m Bá ran y cs -K a isk un Já Bé sz ké -N Haj s ag dú -B yk un iha r -S Bo z o rs ln od o -A So k ba m og új -Z em y pl én Sz ab He ol ve cs s -S za P tm es ár t -B er eg Nó gr ád rM Bu da os on pes t -S op ro n 0 Gy ő ezer € 12 66 Forrás: EuroStat Jó csoportosított oszlopdiagram (divergencia Magyarországon) 250 Alkalmas pl. területi egyenlőtlenségek időbeli változásának vizsgálatára 200 150 – Fontos: az összehasonlíthatóság érdekében fontos, hogy mindkét időpontban százalékos értékek szerepeljenek – Itt a sorrendet a korábbi érték határozza meg 1995 2004 100 50 Cs Fe j Va s é on r gr ád To Ko ln m a ár om Z -E sz ala te rg Ve om sz pr é Ba m Bá ran y cs -K a isk un Já Bé sz k -N Haj dú és ag -B yk un iha r -S Bo zo rs ln od o -A So k ba m og új -Z em y pl én Sz ab He ol ve cs s -S za P tm es ár t -B er eg Nó gr ád -M Bu da os on pes t -S op ro n 0 Gy őr % (országos átlag = 100%) A regionális gazdasági fejlettségi különbségek alakulása Magyarországon 1995–2004 között (megyei szinten, egy főre jutó GDP alapján) 67 Forrás: EuroStat Halmozott oszlopdiagram: csak abszolút mutatóknál! A GDP régiók közötti megoszlásának alakulása Magyarországon 1995–2004 között (NUTS2-es szinten) 90 80 ezer € 70 60 50 40 Többszínű Kategóriánként összehasonlítja, hogy az egyes értékek mekkora részét adják a teljes értéknek (a teljes érték is változik) Dél-Alföld Egyszerre látható a növekedés és a belső átrendeződés Észak-Alföld Ritkábban használatos: gyakran nem állapítható meg a Észak-Magyarország Dél-Dunántúl belső összetétel átalakulása Nyugat-Magyarország Közép-Dunántúl Közép-Magyarország 30 20 10 0 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004Forrás: 68 EuroStat 100%-ig halmozott oszlopdiagram: csak abszolút mutatóknál! A GDP régiók közötti megoszlásának alakulása Magyarországon 1995–2004 között (NUTS2-es szinten) 100% 80% 60% Többszínű 100%-ig halmozott oszlop: többszínű Kategóriánként összehasonlítja, hogy az egyes értékek mekkora részét adják a teljes értéknek (a teljes érték Dél-Alföld mindig azonos) Észak-Alföld Észak-Magyarország Dél-Dunántúl Nyugat-Magyarország Közép-Dunántúl Közép-Magyarország 40% 20% 0% 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004Forrás: 69 EuroStat Jó színezés legyen (hasonló színű szomszédos egységek feketefehérben ne mosódjanak egybe) Hibás ábra Forrás: EuroStat Színezés: fekete-fehérben is látszódjon (nyomtatás, fénymásolás) inkább színárnyalatok különböző színek helyett Szomszédos egységek eltérő színárnyalatúak legyenek (kivéve ha az adatsoroknak sorrendje van) 70 Jó színezés legyen (hasonló színű szomszédos egységek feketefehérben ne mosódjanak egybe) Hibás ábra Forrás: EuroStat Jelmagyarázat legyen (különböző adatsoroknál, színárnyalatoknál) Ha az adatsorban van irányultság (pl. korszerkezet, településnagyságkategóriák stb.), a szomszédos jelölők lehetnek 71 szomszédos színárnyalatok Halmozott sávdiagram speciális fajtája a korfa Magyarország korfája, 1998 64 év feletti nőtöbblet 55-64 éves korcsoportok férfiak nők 45-54 éves 35-44 éves férfitöbblet 25-34 éves 15-24 éves 15 év alatti 200 150 100 50 0 ezer fő 50 100 150 72 200 Forrás: EuroStat Célorientált, áttekinthető legyen, ne túlságosan összetett (inkább külön diagramokon)! Hibás ábra bruttó hozzáadott érték, milliárd € 50 100 Forrás: EuroStat 40 80 30 60 53 20 53 39 36 10 0 36 22 40 28 25 8 0 Közép-Magyarország mezőgazdaság részesedés az ország mezőgazdaságából 20 Dunántúl ipar részesedés az ország iparából százalék (ország = 100%) A magyar régiók gazdasága ágazatonként, illetve a régiók aránya az ágazatokból (NUTS1-es szinten, bruttó hozzáadott érték alapján), 2004-ben Alföld és Észak 73 szolgáltatás részesedés az ország szolgáltatásából Egyszerű legyen, ne túldizájnolt! Hibás ábra Regionális gazdasági fejlettségi különbségek Magyarországon 2004-ben (NUTS2-es szinten, egy főre jutó GDP alapján) 14.0 Dél-Alföld 5.8 5.6 5.4 5.3 Észak-Alföld Kúpok helyett oszlopok 3D helyett 2D 7.8 Észak-Magyarország 8.5 Dél-Dunántúl – Elegánsabb a fehér háttér 10.0 – Régi Excel: 8.0 ezer € / fő alapbeállításban 6.0 szereplő szürke háttér 4.0 előtt kevésbé látszanak a szürkéskék jelölők 2.0 0.0 – Nyomtatásnál felesleges „festékpazarlás” 12.9 Közép-Dunántúl 12.0 Nyugat-Magyarország Kerüljük a színes vagy mintás hátteret Közép-Magyarország 74 Forrás: EuroStat Kördiagram: csak abszolút mutatóknál! Nem ajánlott (helyette inkább oszlop diagram) Nehezen mérhető az összetétel változása (perec diagram) 3–4 cikknél nem lehet több (össze kell vonni a kisebb értékeket egyéb kategória) Végképp rossz: – 3D, robbantott kör 75 Jobb kördiagram A GDP megoszlása Magyaraország régiói között 2004-ben (NUTS1-es szinten) 28% 44% Közép-Magyarország Dunántúl Alföld és Észak 28% 76 Forrás: EuroStat Rossz kördiagram (ne legyen 3–4-nél több körcikk) Hibás ábra 1% A GDP koncentrációja Magyarországon 2004-ben (megyei 2% szinten) Budapest 2% 2% 2% 3% 3% 3% 35% 3% 3% 3% 3% 4% 4% 4% 10% 4% Forrás: EuroStat 5% 5% Pest Gyor-Moson-Sopron Borsod-Abauj-Zemplen Fejer Hajdu-Bihar Bacs-Kiskun Komarom-Esztergom Csongrad Szabolcs-Szatmar-Bereg Baranya Veszprem Zala Vas Jasz-Nagykun-Szolnok Bekes Heves Somogy 77 Tolna Nograd Jobb kördiagram: nagyobb elemszámnál aggregálni kell A GDP koncentrációja Magyarországon 2004-ben (megyei szinten) 35% Budapest Pest Többi megye 55% 10% 78 Forrás: EuroStat Optikailag semleges legyen, kerüljük a térhatást (3D-t)! Hibás ábra A GDP megoszlása Magyaraország régiói között 2004-ben (NUTS1-es szinten) Forrás: EuroStat 28% 44% Közép-Magyarország Dunántúl Alföld és Észak 28% Térhatású kördiagram nem jó – Előtérben lévő körcikkek nagyobbnak látszanak – Térhatás komolytalan dizájnolás (oszlopdiagramnál is) 79 Rossz kördiagram (ne legyen térhatású) Hibás ábra A GDP koncentrációja Magyarországon 2004-ben (megyei szinten) 35% Budapest Pest Többi megye 55% 10% 80 Forrás: EuroStat Rossz kördiagram (ne legyen robbantott) Hibás ábra A GDP koncentrációja Magyarországon 2004-ben (megyei szinten) 35% Budapest Pest Többi megye 55% 10% 81 Forrás: EuroStat Jobb kördiagram: színezés A korszerkezet különbségei a Benelux államokban (1998) 13% 16% 14% Hollandia Belgium Luxemburg 31% 30% 30% fiatal <25 középkorú 25-64 idős >=65 56% 54% 56% 82 Ha van az adatsornak irányultsága a szomszédos jelölők Forrás: EuroStat szomszédos színárnyalatok legyenek Pontdiagram: két dimenziós összehasonlítás Az EU tagállamainak csoportosítása két jelzőszám szerint Oszlopdiagram 200 Kördiagram: nem ajánlott 180 Sugárdiagram 160 140 Buborékdiagram 120 Pontdiagram 100 80 Vonaldiagram (grafikon) 60 Háromszögdiagram 40 GDP/fő (PPS, EU15=100%), 2000 L U P O 20 0 45 50 55 60 Aktív népesség aránya (%), 2000 65 83 Forrás: EuroStat Pontdiagram speciális típusa a regressziós diagram új, közcsatornával ellátott lakások lakások aránya (%) Értéktermelő-képesség és az újonann épített lakások Oszlopdiagram csatornával való ellátottságának összefüggése a magyar Kördiagram: nemmegyékben ajánlott(2000) 120 Sugárdiagram 100 Buborékdiagram 80 Pontdiagram 60 y = 0.0181x + 50.145 Vonaldiagram (grafikon) R = 0.3873 40 Háromszögdiagram 2 20 0 0 500 1000 1500 2000 GDP/fő (ezer Ft/fő) 2500 843000 Forrás: KSH T-Star Buborékdiagram: három dimenziós összehasonlítás GDP/fő (PPS, EU15=100%) Az EU csatlakozásra váró országok három jelzőszám tükrében Oszlopdiagram (2000) Kördiagram: nem ajánlott 90 Sugárdiagram 80 CY 70 SL Buborékdiagram 60 MT CZ Pontdiagram 50 HU SK EE 40 Vonaldiagram (grafikon) PL LT LV 30 BG Háromszögdiagram RO jelmagyarázat: 20 10 5 millió fő 1 millió fő 0 0 5 10 15 Munkanélküliségi ráta (%) 20 85 25 Forrás: EuroStat Buborékdiagram sajátos esete a piktogramos térkép Tolna megye népességének települési megoszlása (2000) Oszlopdiagram Budapest (0;0) -60 Kördiagram: nem ajánlott -100 -80 -60 -40 -20 0 20 Sugárdiagram -80 Buborékdiagram Paks -100 Pontdiagram Vonaldiagram (grafikon) -120 Dombóvár Szekszárd Háromszögdiagram jelmagyarázat: 10 000 fő -140 -160 86 Forrás: KSH T-Star Vonaldiagram (grafikon): két dimenziós összehasonlítás (egyik dimenzió az idő) GDP/fő (ezer Ft/fő) Pest megye gazdasági fejlődése (1994-2000) Oszlopdiagram 1200 Kördiagram: nem ajánlott Forrás: KSH Sugárdiagram 1000 Buborékdiagram 800 773 Pontdiagram 653 600 Vonaldiagram (grafikon) 493 400 399 Háromszögdiagram 324 1025 911 200 Azonos időközöknél: Excel: „Grafikon” diagramtípus 0 87 1994 1995 1996 1997 1998 1999 2000 Forrás: EuroStat Vonaldiagram (grafikon): két dimenziós összehasonlítás (egyik dimenzió az idő) százalék (ország=100) Délkelet-Anglia gazdasági fejlődése az egy főre jutó GDP Oszlopdiagram alapján (1950-1996) Kördiagram: nem ajánlott 124 Sugárdiagram 122 Buborékdiagram 120 Pontdiagram 118 Vonaldiagram (grafikon) 116 Háromszögdiagram 114 Eltérő időközöknél: Excel: „Pontdiagram” diagramtípus vonallal 112 összekötni a pontokat 88 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 Forrás: EuroStat Radar- (sugár-)diagram: sok dimenziós összehasonlítás Tolna megye kistérségeinek fejelttsége (2000) (megyei Oszlopdiagram átlag=100%) Kördiagram: nem ajánlott Sugárdiagram Buborékdiagram Pontdiagram Vonaldiagram (grafikon) BONYHÁD Háromszögdiagram egy lakosra jutó jövedelem reciprok munkanélküliek aránya ezer lakosra jutó telefonvonal DOMBÓVÁR PAKS SZEKSZÁRD TAMÁSI Tolna megye ezer lakosra jutó személygépkocsi 89 Forrás: KSH-T-Star Radar- (sugár-)diagram: sok dimenziós összehasonlítás A fejlettség területi egyenlőtlenségei Tolna megyében (2000) (megyei átlag=100%) TAMÁSI DOMBÓVÁR PAKS 140 120 100 80 60 40 20 0 SZEKSZÁRD egy lakosra jutó jövedelem ezer lakosra jutó telefonvonal ezer lakosra jutó személygépkocsi reciprok munkanélküliek aránya BONYHÁD 90 Forrás: KSH-T-Star