10. Typy dat - Analýza kvantitativních dat

Download Report

Transcript 10. Typy dat - Analýza kvantitativních dat

UK FHS
Historická sociologie, Řízení a supervize
(LS 2013+)
Analýza kvantitativních dat I./II./III.
Typy kvantitativních dat
v sociologickém výzkumu
Jiří Šafr
jiri.safr(AT)seznam.cz
Poslední aktualizace 27/2/2015 (vytvořeno 26/2/2012)
Základní typy dat, která můžeme analyzovat
2-mode (dvourozměrná) data „PŘÍPADY × PROMĚNNÉ“:
Individuální „mikro“ data: Případy x proměnné na individuální úrovni, někdy
označovaná také jako „SPSS data“. Příklad: Důvěra lidí v prezidenta (informace o hodnotě proměnné u
každého respondenta).
• Agregovaná. Agregovaná data do podskupin původně zjišťovaná za jednotlivce (tj. z
mikrodat) nebo oficiálních statistik za celky. Princip „případy x proměnné“ je stejný, jen
máme menší počet případů (a více proměnných). Příklad: Důvěra v prezidenta v zemích EU
(zprůměrovaná proměnná za respondenty z každé země).
• Kombinovaná mikrodata s kontextuálními daty buď na agregované úrovni nebo
jako vnější kontext společný určité skupině individuí.
Příklad: individuální mikrodata: žáci a informace o jejich rodičích, kontextuální data: informace o typu školy společná pro
žáky ze stejných škol a případně také analytické/strukturní data na agregované úrovni: průměrný prospěch ve třídě
(agregováno z individuálních dat žáků konkrétní třídy).
• Panelová mikrodata s opakovaným měřením stejných případů v panelové studii
• Spojená mikrodata z výzkumů v různém čase se stejným designem měření
data z opakovaných průřezových šetření (Cross-Sectional Repeated design)
Tabelární data – dříve publikované výsledky. Vyjadřují pouze dané třídění, proto
možnosti analýzy jsou výrazně omezené (nicméně lze slučovat kategorie, vážit, spočítat
míry asociace, testovat hypotézy o ne/závislosti).
Příklad: mobilitní tabulka (otec x syn) publikovaná v roce 1973
1-mode relační-sítová data – vyjadřují relace pro full-network.
PŘÍPADY × PŘÍPADY pro danou relaci.
Příklad 1: Kdo s kým komunikuje ve třídě (v podstatě mikrodata zjišťovaná pomocí výpovědí v dotazníku či pozorováním)
Příklad 2: Vzájemný obchod mezi státy (z oficiálních statistik vývozu a dovozu)
2
Sem lze také řadit maticová data s distancemi proměnných (např. korelační matice)
Odlišný typ dat (úrovně měření)
vyžaduje použití odlišných
přístupů k analýze,
ale také odlišný způsob
interpretace výsledků
(a její možnosti resp. limity)!
Existují různé typy dat (datových matic), dále se budeme zabývat →
Dvourozměrná datová matice (2-way data): PŘÍPADY × PROMĚNNÉ
Případy
(respondenti
)
Proměnná
Hodnoty
proměnné
4
V SPSS (a jiných obecných statistických programech) se lze setkat se
základními typy dat
2-way
• Mikrodata – individuální data, tj. případy v řádcích (nejčastěji
•
respondenti, ale např. také novinové články, země nebo regiony)
Spojená mikrodata z výzkumů v různém čase se stejným designem měření
• Agregovaná data – analytické/strukturní proměnné =
individuální údaje sumované za určitou jednotku (např. území jako
regiony/ státy nebo časová období) Vznikají agregací mikrodat (sumování,
průměrování).
• Kombinovaná mikrodata s kontextuálními daty buď na
agregované úrovni nebo jako vnější kontext společný určité skupině individuí.
Např. individuální mikrodata: žáci a informace o jejich rodičích + kontextuální data:
informace o typu školy společná pro žáky ze stejných škol + případně také
analytická/strukturní data na agregované úrovni: průměrný prospěch ve třídě (agregováno z
individuálních dat žáků konkrétní třídy) nebo (buď na agregované úrovni nebo jako kontext
společný určité skupině individuí např. z oficiálních statistik nebo jiné formy výzkumu).
• Individuální mikrodata s opakovaným měřením v
panelové studii.
Tabelární data – agregovaná většinou do tabulek
(kontingenční tabulky). Ta vypadají poněkud jinak, proměnné zůstávají, ale
místo případů máme četnosti, které jsou posléze v analýze váženy.
Např. dříve publikované výsledky mobilitní tabulky.
Existují ale jiné uspořádání dat, např. u individuálních mikrodat jako tzv. „člověko-události“ nebo u
agregovaných dat časové řady.
5
1. Mikrodata – individuální data
V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky)
6
2. Agregovaná data
Příklad: 16 znaků podle zemí
7
Příklad prezentace agregovaných dat:
Hodnoty více agregovaných proměnných
8
Dva hlavní typy dat
1-way a 2 - way
• Tradiční přístup → vlastnosti individuí
data: individuum x atributy (2-mode data)
• Analýza sítí → vlastnosti párů individuí (sociální
vztahy)
data: individuum A x individuum B
(1-mode data)
V SPSS pouze omezeně → specializovaný
software, např. UCINET (NetDraw), PAJEK
9
„klasická“ 2 – mode data (SPSS)
10
1-mode data – relace
Sociomatice “Jak často komunikuje s …“
Karla Edita Monika Matej VladimírDaniel Alena David Jirina Lenka Emil Martin Iva
Karla
4
3
2
3
2
3
1
2
1
1
1
Edita
4
3
3
3
3
3
1
3
2
3
1
Monika
4
4
4
4
4
4
1
3
3
4
3
Matej
3
3
4
4
4
4
1
2
2
4
3
Vladimír
3
3
3
3
3
3
1
3
2
3
2
Daniel
2
2
4
4
3
4
4
3
2
4
2
Alena
2
3
4
4
3
4
2
3
3
3
2
David
1
1
1
1
1
3
3
1
1
1
1
Jirina
3
3
3
3
4
4
4
1
4
4
3
Lenka
1
2
2
2
2
2
3
1
4
2
2
Emil
2
4
4
4
4
4
4
1
3
3
4
Martin
2
3
3
3
3
3
3
1
3
3
4
Iva
2
2
3
3
3
4
3
1
3
2
4
3
Jolana
4
4
2
2
2
3
3
1
3
3
4
3
Andrea
3
3
2
2
2
3
3
1
3
3
4
2
Kuba
3
1
3
2
3
3
3
1
3
3
4
1
Judita
0
3
0
0
3
3
3
1
4
3
4
3
Jiří
3
3
1
3
3
4
4
1
3
3
4
1
Vladimír
1
1
1
1
1
1
1
1
1
1
1
1
Karolína
2
2
3
2
3
2
2
1
3
2
3
2
Bernardeta 1
2
1
1
3
2
2
0
2
2
2
1
Lucie
1
1
2
2
2
1
2
1
1
1
1
1
Nataša
0
0
3
2
3
2
1
1
2
1
2
1
Patrika
1
2
3
2
3
2
2
1
3
1
2
1
1. = méně než 1x týdně,
2. = 1x týdně,
2
4
3
3
2
3
3
1
4
2
4
3
3
3
3
3
3
1
2
1
1
1
1
Jolana Andrea Kuba Judita Jiří
3
3
1
0
4
4
4
4
3
3
3
3
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
1
1
1
1
4
4
4
4
3
3
3
3
4
4
4
4
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
3
3
3
1
1
1
1
1
2
2
1
1
2
2
1
1
2
2
2
1
1
1
3
2
1
4
3
1
3
1
4
3
2
3
4
4
3
2
1
1
1
1
1
VladimírKarolínaBernardeta
Lucie Nataša Patrika
1
1
0
1
1
1
1
1
1
1
1
1
2
1
3
3
3
3
1
2
0
2
2
2
1
2
2
2
1
2
1
3
2
2
3
3
1
2
2
2
2
3
1
1
1
1
1
1
1
2
1
2
2
3
1
0
3
1
1
2
1
2
2
2
2
2
1
2
2
2
2
2
1
1
1
1
1
2
1
2
2
2
2
3
1
2
2
2
2
2
1
1
1
1
1
2
1
2
0
0
0
0
1
2
1
1
1
1
1
1
1
1
1
1
4
4
4
4
1
4
4
4
4
1
4
4
4
4
1
4
4
4
4
1
4
4
4
4
3. = více jak 2x týdně,
4. = denně
11
1-mode data – relace: “Jak často komunikuje s …“
Karla
Edita
Monika
Matej
Vladimír
Daniel
Alena
David
Jirina
Lenka
Emil
Martin
Iva
Jolana
Andrea
Kuba
Judita
Jiří
Vladimír
Karolína
Bernardeta
Lucie
Nataša
Patrika
K E M
- - 1 1
1
1
1 1
1 1 1
1 1 1
1 1 1
1 1 1
0 0 0
1 1 1
0 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
0 1 1
1 1 1
0 0 1
1 1 1
0 1 1
0 0 1
0 0 1
0 1 1
M
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
0
1
0
1
1
1
V
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
A
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
D
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
J
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
L
0
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
0
0
1
E
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
M
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
I
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
0
0
0
1
J
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
A
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
K
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
0
0
0
1
J
0
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
0
0
0
0
J
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
V
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
K
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
0
B
0
1
1
0
1
1
1
0
1
1
1
1
0
1
1
0
0
0
0
1
L
0
0
1
1
1
1
1
0
1
0
1
1
0
1
1
0
0
0
0
1
1
N
0
0
1
1
1
1
1
0
1
0
1
1
0
1
1
0
0
0
0
1
1
1
1
1 1
1 1 1
1 1 1 1
P
0
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
12
symetrizace, dichotomizace
1-mode data – relace
Sociogram “Jak často komunikuje s …“
Nataša
Vladimír
Bernardeta
Patrika
Lucie
Lenka
David
Daniel
Vladimír
Monika
Jirina
Alena
Emil
Matej
Martin
Karolína
Jolana
Kuba
Jiří
Edita
Iva
Karla
Judita
Andrea
13
Více o tom, jak s daty
zacházet najdete v:
• Data management v SPSS/PSPP
• Agregace dat
14