Transcript Analýza kvantitativních dat I. Popisné statistiky a grafy
UK FHS Historická sociologie, Řízení a supervize (LS 2011)
Analýza kvantitativních dat I.
Popisné statistiky v grafech 1.
(třídění 1. stupně)
Jiří Šafr jiri.safr(zavináč)seznam.cz
poslední
aktualizace 9. 3. 2011
Lodyhový graf (Stem-and-Leaf Plot )
Ukazuje distribuci dat: hustotu a rozložení; identifikace outlierů (extrémů), Vhodný pouze pro data s menším počtem případů → histogram nebo boxplot
Postup
: hodnoty znaku vzestupně uspořádáme; určíme úroveň dle číslice: lodyha (stem) = např. desítky a listy (leafs) = např. jednotky; vek Stem-and-Leaf Plot Frequency
Stem
&
Leaf
3,00
0
.
668
3,00
1
.
122
1,00
1
.
5
Stem width: 10,00 Each leaf: 1 case(s) 2
Histogram
sloupcový graf, v němž
každé kategorii přiřadíme její četnost (nejde procenta!)
. Zobrazuje
distribuci kategorií numerického- kardinálního (nebo ordinálního) znaku
(proto ho někdy doplňujeme o distribuční křivku normálního rozdělení).
Osa Y znázorňuje počet případů (četnost) v dané kategorii. Osa X – intervaly, ty jsou stejné šířky. Pozor nesprávná šířka intervalu může zkreslovat.
3
Sloupcový graf – Barchart, v %
Pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny).
4
Sloupcový graf – Barchart
,
absolutní četnosti
Pokud ho zadáme v absolutních četnostech, dostaneme vlastně histogram (ale viz rozdíl).
5
Histogram a Sloupcový graf (Barchart) v SPSS Histogram není příliš vhodný pro malý počet případů.
6
Barchart
→ četnosti kategorií kategorizovaného znaku (zde nominální znak
Kraj
) 7
Barchart →
četnosti kategorií kategoriálního znaku
(zde ordinální kategorie
věku
) 8
Histogram
→ četnosti/ hustota kardinálního (numerického – spojitého) znaku (
věk
u dospělé populace ČR) 9
Stem and Leaf
→ četnosti/ hustota kardinálního (numerického – spojitého) znaku (
věk
u dospělé populace ČR) vek Stem-and-Leaf Plot Frequency Stem & Leaf 53,00 1 . 88888888888899999999999999 104,00 2 . 00000000000000011111111111122222222333333333344444 62,00 2 . 555555666667777778888888899999 89,00 3 . 0000000000111111222222222233333333334444444 76,00 3 . 5555555566666667777788888888889999999 95,00 4 . 0000000011112222222222233333333333444444444444 107,00 4 . 5555555555666666666666677777788888888888899999999999 112,00 5 . 0000000000000011111111122222222222233333333334444444444 135,00 5 . 555555555555666666666666777777777778888888888888888999999999999999 112,00 6 . 0000000000000001111111111222222222223333333333333444444 118,00 6 . 5555555555555555666666666677777777777777788888888889999999 75,00 7 . 000000000000011111122222233333444444 84,00 7 . 55555555555666666677777888888888999999999 Stem width: 10 Each leaf: 2 case(s) 10
Barchart
: často pro třídění 2.stupně Příklad:
Zájem o politiku
podle
pohlaví
11
Koláčový graf (Pie chart), v %
12
Syntax pro grafy v SPSS
V rámci příkazu FREQUENCIES: FREQ vek /
HISTO
.
FREQ vek /
BARCHART PERCENT
.
FREQ vek /
BARCHART FREQ
.
FREQ vek /
PIECHART PERCENT
.
Samostatný příkaz GRAPH: GRAPH /
HISTOGRAM
=vek.
GRAPH /
BAR(SIMPLE)
=PCT BY vekkat.
GRAPH /
BAR(SIMPLE)
=PCT BY q14b by s30.
GRAPH /
PIE
=PCT BY vekkat.
Parametr COUNT → absolutní četnosti, PCT → procenta 13
Stem-and-Leaf
V rámci příkazu EXPLORE resp. EXAMINE:
EXAMINE
VARIABLES=vek /PLOT BOXPLOT HISTOGRAM
STEMLEAF
/COMPARE GROUPS /STATISTICS NONE /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.
14