Transcript Diasor-6
ÁVF Leíró statisztika 6. A sztochasztikus kapcsolatok I. Asszociációs és vegyes kapcsolat 2009 ápr. 13. 1 Az ismérvek összefüggése 1. Van-e köztük kapcsolat? • Nincs • Függvényszerű • Sztochasztikus (véletlenszerű, tendencia-szerű) 3. Milyen jellegű az összefüggés? 2 Az ismérvek közötti kapcsolatok fajtái • Asszociáció: két minőségi (nominális skálán mérhető) ismérv közötti összefüggés. Pl. iskolai végzettség és lakóhely • Vegyes kapcsolat: minőségi és mennyiségi ismérv közötti összefüggés (pl. nem és kor) • Korreláció: a mennyiségi ismérvek (pl. kor és testsúly) közötti összefüggés 3 Asszociációs együtthatók I. A nominális skálán mért ismérvek közötti sztochasztikus kapcsolat szorosságának mérésére szolgálnak. Típusaik: • Cramer-féle asszociációs együttható • Yule-féle asszociációs együttható (csak alternatív ismérvek esetén használható) 4 Jelölések a kétdimenziós táblában Kontingencia-tábla x1 y1 f11 y2 f12 .. .. x2 f21 f22 .. f2t .. xs .. fs1 .. fs2 .. .. .. fst s s f .1 i 1 f i1 f.2 i 1 yt ft f .t fi 2 .. Össz. t f1. f1 j j 1 t f 2. f 2 j j 1 .. t f s. f sj j 1 s i 1 f it n 5 A Cramer-féle asszociációs együttható Lényege, hogy a tényleges gyakoriságokat (fij)összehasonlítjuk azokkal a fiktív gyakoriságokkal (fij*), amelyek a két ismérv függetlensége esetén alakulnának ki. Ezeket a peremgyakoriságok alapján számítjuk ki: f ij * f i. f. j n n g i . g . j 6 Cramer-együttható A ténylegesen megfigyelt gyakoriságok (fij) és a függetlenség esetén adódó gyakoriságok (fij*) eltérését a s t 2 i 1 j 1 ( f ij f ij *)2 f ij * (khi négyzet) mutató segítségével mérjük. Ez a négyzetes eltérések relatív nagyságát fejezi ki. 7 2 A Cramer-féle asszociációs együttható A Cramer-féle asszociációs együttható a kapcsolat szorosságát méri: 2 C , n ( s 1) ha st Értéke 0 és 1 közé esik. • Ha C = 0, akkor nincs kapcsolat • Ha C = 1, akkor determinisztikus (függvényszerű) kapcsolat 8 A Yule-féle asszociációs együttható Akkor használható, ha mindkét ismérv alternatív, vagyis csak két változata van. Függetlenség esetén: f12 f 22 f11 f 21 f 12 f 21 f11 f 22 Ha ez az egyenlőségi feltétel nem teljesül, és 0 f11 f 22 f 12 f 21 akkor a két ismérv között sztochasztikus kapcsolat van. 9 A Yule-együttható II. A kapcsolat szorosságának mérése: f11 f 22 f12 f 21 Y f11 f 22 f12 f 21 • Ha Y=0, a két ismérv független • Ha Y=1, függvényszerű a kapcsolat • Ha 0 < |Y| < 1, sztochasztikus a kapcsolat 10 A vegyes kapcsolat Vegyes kapcsolatról akkor beszélünk, ha a két vizsgált ismérv egyike minőségi, a másik pedig mennyiségi. Például: A hallgatók neme és testmagassága közötti kapcsolat 11 Elvi szélső esetek Determinisztikus kapcsolat: Minden csoport-átlag más, de egy csoporton belül minden érték egyenlő Nincs kapcsolat, ha: Egy csoporton belül az értékek különböznek, de minden csoport-átlag ugyanaz. 12 Az eltérésnégyzet-összegek összefüggése A külső, belső és a teljes eltérésnégyzet-összegek (varianciák) közötti - már ismert - összefüggés: 2 2B 2K A külső és a teljes variancia aránya, a varianciahányados. K K H 2 2 K 2B 2 2 2 13 Belváros Külső kerület Városkörnyék 360 220 180 400 280 200 400 300 220 440 320 220 520 340 220 520 340 300 560 360 310 640 400 350 Átlag 480 320 250 Szórásnégyzet 8000 2600 3275 PÉLDA Ezer Ft / m2 14 Eredmények: • Belső szórásnégyzet = 4 625 • Külső szórásnégyzet = 9 266,66 • Teljes szórásnégyzet = 13 891,67 • H2 = 66,7 % Értelmezés: Az övezethez tartozás 66,7 %-ban ad magyarázatot a lakásárak alakulására. 15 A varianciahányados és a szóráshányados A varianciahányados (H2) (a vegyes kapcsolat szorosságának mérőszáma) azt mutatja meg, hogy a csoportosító ismérv hány százalékban magyarázza meg az értékek szóródását. K H 2 2 2 A szóráshányados a variancia-hányados négyzetgyöke, a vegyes kapcsolat szorosságának mérőszáma. K H 2 2 16