5. Poměr šancí - ODDS RATIO - Analýza kvantitativních dat

Download Report

Transcript 5. Poměr šancí - ODDS RATIO - Analýza kvantitativních dat

UK FHS
Historická sociologie
(LS 2012)
Analýza kvantitativních dat II.
Poměr šancí - ODDS RATIO
Vztahy mezi kategorizovanými znaky v kontingenční tabulce
Jiří Šafr
jiri.safr(zavináč)seznam.cz
poslední aktualizace 10.5. 2013
Poměr šancí - ODDS RATIO
Poměr šancí - ODDS RATIO (OR)
• OR ukazuje asociaci v kontingenčních
tabulkách
• šance (O) = poměr pravděpodobnosti jedné
možnosti p1 (událost nastala) ke druhé
p2(událost nenastala) (šance nebo také riziko)
• OR = poměr dvou šancí (odds)
• OR = f11*f22 / f12*f21 =
Vlastnosti poměru šancí (OR)
• OR - podíl šancí výskytu (rizika výskytu) pro dvě
různé hodnoty dvou proměnných.
• OR: A k B a B k A jsou komplementární,
vždy však s opačným směrem 1:3 =0,33 a 1/0,33 =3
• OR je kladné číslo, kdy: >1 vyšší šance a <1 nižší
šance,
ale pozor rozpětí je nesymetrické: 0 až 1 a 1 až ∞
• Proto se také používá přirozený logaritmus
poměru šance LOR <∞;∞>
• OR není citlivé na marginální distribuce (změníme-li
velikost n o konstantu, OR zůstávají stejné)
• Pomocí OR můžeme vyjádřit vztahy mezi kategoriemi v
kontingenční tabulce (a to nejen ve čtyřpolní 2 x 2)
Příklad ODDS RATIO: vztah dvou proměnných
„šance na účast u voleb podle vzdělání (VŠ)“
VŠ - vzdělání
0
Volil 2006
1
Total
0 ne
424
19
443
1 ano
674
68
742
1098
87
1185
Total
OR = f11 f22 / f12 f21 =
f11 f12
f21 f22
OR = (424*68)/(19*674) = 2,25
U vysokoškoláků je v porovnání s ostatními 2,25x vyšší
šance, že půjdou volit.
V CROSSTABS v SPSS pozor na kódování kategorií (nelze nastavit, pouze překódovat).
Vlastnosti ODDS RATIO (příklad)
• Šance nabývá hodnoty 0 – nekonečno, kdy:
 0 – 1 menší šance jevu A (oproti jevu B)
 >1 větší šance na jev A (oproti jevu B)
 1 je stejný výskyt jevu A i B, tj. stejná šance obou
konkurenčních možností, tj. nezávislost
• Šance jsou inverzní
• Odds-Ratio p1<->p2: 2,25
• Inverse p2<->p1: 0,44
Interval spolehlivosti a
standardní chyba ODDS RATIO
Pro Odds-Ratio na výběrových datech lze
odhadnout standardní chybu a interval
spolehlivosti
p1↔p2: 2,25 (~SE: 0,600)
95,0% CI: 1,33 ← 2,25 →3,798 (Wald's)
Inverzně p2 ↔ p1: 0,44 (~SE: 0,118)
95,0% CI: 0,263 ← 0,44 → 0,749 (Wald's)
Kde spočítat ODDS RATIO
CROSSTAB v SPSS pro mikrodata i
tabelární (viz komplikované načtení frekvencí pomocí vah).
Pozor, pouze pro dichotomické proměnné.
v SPSS pozor na kódování kategorií.
CROSSTABS volil BY Praha
/FORMAT=AVALUE TABLES
/STATISTICS=CMH(1).
Nebo lépe v Excelu, kde
zadáme vzoreček do buňky
viz http://metodykv.wz.cz/odds_ratio_volil.xls
SPSS zároveň testuje, zda je OR statisticky významně
odlišné od 1 (tj. stejné šance), nebo jiné zvolené hodnoty.
Kde spočítat ODDS RATIO
V různých apletech/aplikacích, např. SISA
Odds-Ratio p1<->p2: 0,697649
(~SE: 0,140196)
95,0% CI: 0,470523<O.R.<1,034411
(Wald's)
Inverse p2<->p1: 1,433386 (~SE:
0,288046)
95,0% CI:
0,966734<O.R.<2,125296 (Wald's)
Log-odds: -0,360040;
s.e=0,200955
Umí i LOGIT (Log-odds) a
obrácené OR
http://www.quantitativeskills.com/manuals/tablesman.htm
Úkol
•
•
•
•
Procvičit v SPSS
2 x 2 tabulky
Pohlaví a volil v 2006
Pohlaví a Vzdělání
nxn
• Velikost bydliště x Vzdělání
→ sloučení nebo vybraná pole tabulky
ODDS RATIO
v mobilitní tabulce
ODDS RATIO v mobilitní tabulce
• Vzdělanostní mobilita (otec → syn/dcera)
Data ISSP 2007, ČR
ODDS RATIO v mobilitní tabulce
• mobilitní šance potomků vysokoškoláků získat rovněž VŠ
vzdělání oproti tomu, že skončí nanejvýše s výučním listem
v porovnání s šancí potomků rodičů s nanejvýše vyučením
skončit s VŠ vzděláním:
OR = (40/23)/(31/305), nebo (40*305)/(23*31) = 17,1
• Dtto ale pro potomky rodičů s maturitou:
OR = (40/59)/(60/197), nebo (40*305)/(23*31) = 2,3
• Šance na VŠ pro SŠ oproti VYUČ: (60/126)/(31/305) = 4,7
Data: Distinkce a hodnoty 2008 (kohorta 30-34 let) ČR [Šafr a kol. 2012]
OR nyní pro sloučené kategorie (např. VŠ vs. zbytek)
Vzdělání potomka
Šance potomků
vysokoškoláků, že vystudují
VŠ oproti šancím potomků
nejvýše vyučených na VŠ
diplom.
OR
OR
OR
pro VŠ
VŠ/VY
VŠ/SŠ
SŠ/VY
ZŠ+VY
Vzdělání rodičů
VŠ
Total
7,25
2,63
2,76
pro min. SŠ
OR
VŠ/VY
7,02
OR
VŠ/SŠ
2,11
OR
SŠ/VY
3,33
Data: Distinkce a hodnoty 2008 (kohorta 30-34 let) ČR
Zdroj: [Šafr a kol. 2012: 30-31]
ZŠ+VY
SŠ
SŠ
VŠ
Total
305
126
156
197
31
60
492
383
23
59
40
122
454
412
131
997
Mobilitní tabulka (absolutní četnosti)
[Katrňák 2006: 139]
Mobilitní tabulka. A – mobilitní šance
pouze v rámci jedné třídy (kategorie) původu
• Šance VM dostat se do VN /oproti do NN:
• 1043 / 587 = 1,78
[Katrňák 2006: 139, 160]
Mobilitní tabulka. B – porovnání tj.
poměr šancí dvou tříd (kategorií) původu
• mobilitní šance potomků z třídy vyšších nemanuálů (VN) zůstat v
této třídě (VN) oproti tomu, že skončí ve třídě nižších nemanuálů
(NN) v porovnání s šancí potomků z třídy nižších nemanuálů
(NN) skončit ve stejných třídách (VN resp. NN):
OR = (VN=VN / VN→NN) / (NN→VN / NN=NN)
• OR = (1275/364)/(1055/597), nebo (1275*597)/(1055*364) = 1,98
[Katrňák 2006: 139, 161]
Odds Ratio v mobilitní tabulce
• Obecně můžeme vyjádřit OR pro
kterákoliv políčka tabulky (větší než 2x2):
• Fi*Fj / Gi*Gj , kde i = řádky, j= sloupce
třída I.
třída I.
G (rodič) třída II.
třída III.
F (potomek)
třída II.
třída III.
ODDS RATIO v mobilitní tabulce
→ relativní mobilita
• Vlastností poměru šancí je, že jsou
invariantní k marginálním četnostem v
mobilitní tabulce.
• → Vyjadřují relativní mobilitu, nejsou
tedy ovlivněny strukturní mobilitou
(změna ve struktuře vzdělanostních/
profesních kategorií mezi generacemi).