Transcript Diasor-6

ÁVF Leíró statisztika
6.
A sztochasztikus kapcsolatok I.
Asszociációs és vegyes kapcsolat
2009 ápr. 13.
1
Az ismérvek összefüggése
1. Van-e köztük kapcsolat?
• Nincs
• Függvényszerű
• Sztochasztikus (véletlenszerű, tendencia-szerű)
3. Milyen jellegű az összefüggés?
2
Az ismérvek közötti kapcsolatok fajtái
• Asszociáció:
két minőségi (nominális skálán mérhető) ismérv közötti
összefüggés.
Pl. iskolai végzettség és lakóhely
• Vegyes kapcsolat: minőségi és mennyiségi ismérv
közötti összefüggés (pl. nem és kor)
• Korreláció: a mennyiségi ismérvek (pl. kor és testsúly)
közötti összefüggés
3
Asszociációs együtthatók I.
A nominális skálán mért ismérvek közötti sztochasztikus
kapcsolat szorosságának mérésére szolgálnak.
Típusaik:
• Cramer-féle asszociációs együttható
• Yule-féle asszociációs együttható (csak alternatív
ismérvek esetén használható)
4
Jelölések a kétdimenziós táblában
Kontingencia-tábla
x1
y1
f11
y2
f12
..
..
x2
f21
f22
..
f2t
..
xs
..
fs1
..
fs2
..
..
..
fst
s
s

f .1 

i 1
f i1
f.2 

i 1
yt
ft
f .t 
fi 2
..
Össz.
t
f1.   f1 j
j 1
t
f 2.   f 2 j
j 1
..
t
f s.   f sj
j 1
s

i 1
f it
n
5
A Cramer-féle asszociációs együttható
Lényege,
hogy a tényleges gyakoriságokat (fij)összehasonlítjuk
azokkal a fiktív gyakoriságokkal (fij*), amelyek a két
ismérv függetlensége esetén alakulnának ki.
Ezeket a peremgyakoriságok alapján számítjuk ki:
f ij * 
f i.  f. j
n
 n  g i . g . j
6
Cramer-együttható

A ténylegesen megfigyelt gyakoriságok (fij) és a
függetlenség esetén adódó gyakoriságok (fij*) eltérését a
s
t
 2  
i 1 j 1
( f ij  f ij *)2
f ij *
(khi négyzet) mutató segítségével mérjük. Ez a négyzetes
eltérések relatív nagyságát fejezi ki.
7
2
A Cramer-féle asszociációs együttható
A Cramer-féle asszociációs együttható a kapcsolat
szorosságát méri:
2
C
,
n  ( s  1)
ha
st
Értéke 0 és 1 közé esik.
• Ha C = 0, akkor nincs kapcsolat
• Ha C = 1, akkor determinisztikus (függvényszerű)
kapcsolat
8
A Yule-féle asszociációs együttható
Akkor használható, ha mindkét ismérv alternatív, vagyis
csak két változata van.
Függetlenség esetén:
f12
f 22


f11
f 21
f 12 f 21  f11  f 22
Ha ez az egyenlőségi feltétel nem teljesül, és
0  f11  f 22  f 12 f 21
akkor a két ismérv között sztochasztikus kapcsolat van.
9
A Yule-együttható II.
A kapcsolat szorosságának mérése:
f11  f 22  f12  f 21
Y
f11  f 22  f12  f 21
• Ha Y=0, a két ismérv független
• Ha Y=1, függvényszerű a kapcsolat
• Ha 0 < |Y| < 1, sztochasztikus a kapcsolat
10
A vegyes kapcsolat
Vegyes kapcsolatról
akkor beszélünk, ha a két vizsgált ismérv egyike minőségi,
a másik pedig mennyiségi.
Például: A hallgatók neme és testmagassága közötti
kapcsolat
11
Elvi szélső esetek
Determinisztikus kapcsolat:
 Minden csoport-átlag más,
 de egy csoporton belül minden érték egyenlő
Nincs kapcsolat, ha:
 Egy csoporton belül az értékek különböznek,
 de minden csoport-átlag ugyanaz.
12
Az eltérésnégyzet-összegek összefüggése
A külső, belső és a teljes
eltérésnégyzet-összegek (varianciák) közötti - már
ismert - összefüggés:
 2   2B   2K
A külső és a teljes variancia aránya, a varianciahányados.
 K
 K
H  2  2

 K   2B
2
2
2
13
Belváros
Külső
kerület
Városkörnyék
360
220
180
400
280
200
400
300
220
440
320
220
520
340
220
520
340
300
560
360
310
640
400
350
Átlag
480
320
250
Szórásnégyzet
8000
2600
3275
PÉLDA
Ezer Ft /
m2
14
Eredmények:
• Belső szórásnégyzet = 4 625
• Külső szórásnégyzet = 9 266,66
• Teljes szórásnégyzet = 13 891,67
• H2 = 66,7 %
Értelmezés:
Az övezethez tartozás 66,7 %-ban ad magyarázatot a
lakásárak alakulására.
15
A varianciahányados és a szóráshányados
A varianciahányados (H2) (a vegyes kapcsolat
szorosságának mérőszáma)
azt mutatja meg, hogy a csoportosító ismérv hány
százalékban magyarázza meg az értékek szóródását.
 K
H  2

2
2
A szóráshányados a variancia-hányados négyzetgyöke, a
vegyes kapcsolat szorosságának mérőszáma.
 K
H
2

2
16