Grafy - třídění 1 st. - Analýza kvantitativních dat

Download Report

Transcript Grafy - třídění 1 st. - Analýza kvantitativních dat

UK FHS Historická sociologie, Řízení a supervize (LS 2011-2014)

Analýza kvantitativních dat I.

Popisné statistiky v grafech 1.

(třídění 1. stupně)

Jiří Šafr jiri.safr(zavináč)seznam.cz

poslední

aktualizace 28. 3. 2014

Lodyhový (cifrový) graf (Stem-and-Leaf Plot )

Ukazuje distribuci dat: hustotu a rozložení; identifikace outlierů (extrémů), Vhodný pouze pro data s menším počtem případů → histogram nebo boxplot

Postup

: hodnoty znaku vzestupně uspořádáme; určíme úroveň dle číslice: lodyha (stem) = např. desítky a listy (leafs) = např. jednotky; vek Stem-and-Leaf Plot Frequency

Stem

&

Leaf

3,00

0

.

668

3,00

1

.

122

1,00

1

.

5

Stem width: 10,00 Each leaf: 1 case(s) 2

Histogram

sloupcový graf, v němž

každé kategorii přiřadíme její četnost (nejde procenta!)

. Zobrazuje

distribuci kategorií numerického- kardinálního (nebo ordinálního) znaku

(proto ho někdy doplňujeme o distribuční křivku normálního rozdělení).

Osa Y znázorňuje počet případů (četnost) v dané kategorii. Osa X – intervaly, ty jsou stejné šířky. Pozor nesprávná šířka intervalu může zkreslovat.

3

Sloupcový graf – Barchart, v %

Pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny).

4

Sloupcový graf – Barchart

,

absolutní četnosti

Pokud ho zadáme v absolutních četnostech, dostaneme vlastně histogram (ale viz rozdíl).

5

Histogram a Sloupcový graf (Barchart) v SPSS Histogram není příliš vhodný pro malý počet případů.

6

Zdroj: ISSP2007, ČR

Barchart

→ četnosti kategorií kategorizovaného znaku (zde nominální znak

Kraj

) 7

Zdroj: ISSP2007, ČR Barchart →

četnosti kategorií kategoriálního znaku

(zde ordinální kategorie

věku

) 8

Histogram

→ četnosti/ hustota kardinálního (numerického – spojitého) znaku (

věk

u dospělé populace ČR) 9 Zdroj: ISSP2007, ČR

Stem and Leaf

→ četnosti/ hustota kardinálního (numerického – spojitého) znaku (

věk

u dospělé populace ČR) vek Stem-and-Leaf Plot Frequency Stem & Leaf 53,00 1 . 88888888888899999999999999 104,00 2 . 00000000000000011111111111122222222333333333344444 62,00 2 . 555555666667777778888888899999 89,00 3 . 0000000000111111222222222233333333334444444 76,00 3 . 5555555566666667777788888888889999999 95,00 4 . 0000000011112222222222233333333333444444444444 107,00 4 . 5555555555666666666666677777788888888888899999999999 112,00 5 . 0000000000000011111111122222222222233333333334444444444 135,00 5 . 555555555555666666666666777777777778888888888888888999999999999999 112,00 6 . 0000000000000001111111111222222222223333333333333444444 118,00 6 . 5555555555555555666666666677777777777777788888888889999999 75,00 7 . 000000000000011111122222233333444444 84,00 7 . 55555555555666666677777888888888999999999 Stem width: 10 Each leaf: 2 case(s) 10

Koláčový graf (Pie chart), v %

Zdroj: ISSP2007, ČR 11

Koláčový graf (Pie chart), v %

12 Zdroj: TV&knihy 2013, studenti FHS

Boxplot

– vousaté krabičky, graf rozptýlení

KVARTILY dělí statistický soubor na desetiny: dolní Q0,25 (Q1) a horní Q0,denní5 (Q3)

medián, kvartily (II. a III.), přilehlá (outliers) a vzdálená (extremes) pozorování

Interkvartilové rozpětí (vnitřní hradby): HH

= horní kvartil + 1,5 násobku interkvartilového rozpětí

DH

= dolní kvartil + 1,5 násobku interkvartilového rozpětí 13

Syntax pro základní grafy v SPSS

Jednoduše v rámci příkazu FREQUENCIES : FREQ vek /

HISTO

.

FREQ vek /

BARCHART PERCENT

.

FREQ vek /

BARCHART FREQ

.

FREQ vek /

PIECHART PERCENT

.

Samostatný příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají rozhraní

Chart Builder

zadávat klikáním přes okna) a

Interactive

, které je v podstatě nutné GRAPH /

HISTOGRAM

=vek.

GRAPH /

BAR(SIMPLE)

=

PCT

BY vekkat.

GRAPH /

BAR(SIMPLE)

=

PCT

BY q14b BY s30.

/*

2. stupeň

:

A

x

B

.

GRAPH /

PIE

=

PCT

BY vekkat.

.

Parametr

COUNT PCT

→ absolutní četnosti, →

procenta

Další grafy pro třídění 2. a 3. stupně viz prezentaci 7. Grafy třídění 2.&3.st. http://metodykv.wz.cz/AKD1_Grafy2.ppt

14

Stem-and-Leaf

V rámci příkazu EXPLORE resp. EXAMINE:

EXAMINE

VARIABLES=vek /PLOT BOXPLOT HISTOGRAM

STEMLEAF

/COMPARE GROUPS /STATISTICS NONE /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

*specifikace STATISTICS=

NONE

vypíná zobrazení výpočtů statistik – tabulek příkazu Explore /STATISTICS=

ALL

naopak zobrazí všechny. 15

BOXPLOT (fousaté krabičky)

EXAMINE

VARIABLES= vek BY vzd4 /PLOT=

BOXPLOT /STATISTICS=NONE

/NOTOTAL.

*pro třídění 2. stupně (věk podle vzdělání).

EXAMINE

VARIABLES= vek BY vzd4 /PLOT=

BOXPLOT /STATISTICS=NONE

/NOTOTAL.

16

Třídění 2. stupně pro kategoriální proměnné

Podrobně viz 7.

Grafy třídění 2. a 3. stupně

http://metodykv.wz.cz/AKD1_Grafy2.ppt

Barchart

: často pro třídění 2.stupně Příklad:

Zájem o politiku

podle

pohlaví

18