8. přednáška

Download Report

Transcript 8. přednáška

8. přednáška
Testování hypotéz (ordinální data)
Početní postupy s procenty
•
•
•
•
Výpočet počtu procent – obvyklá součást
diplomových prací
Počítat procenta u výběrů s rozsahem
menším než 10 nelze
m
výpočet procenta
%  100
n
testování dvou výběrových procentových
hodnot
p1  p2
n1n2
t

n1  n2
ps (100  ps )
Testování
dvou výběrových procentových hodnot
Příklad: Ve třídě A splnilo didaktický test 13 z 20 žáků, ve
třídě B 15 žáků z 19. Je rozdíl mezi třídami statisticky
významný?
H0 Rozdíl v počtu dětí, které ve třídě A a B splnily
požadavky didaktického testu, není statisticky významný.
13
pA 
 100  65,00%
20
13  15
ps 
 100  71,79
39
78,95  65,00
15
pB  100  78,95
19
Srovnáním vypočtené hodnoty t = 0,96
s hodnotou tabulkovou, kde t = 1,96 na hladině
0,05, nemůžeme nulovou hypotézu zamítnout.
20  19 13,97
t


 3,12  0,96
39
45,00
71,79  28,21
Statistické metody
pro analýzu ordinálních dat
Vztahy mezi pedagogickými jevy, změřenými pomocí pořadového
měření - můžeme použít po vhodné kategorizaci všech postupů
uvedených pro nominální data.
Postupy speciálně vytvořené pro ordinální data:
• znaménkový test
– opakované měření týchž souborů
– porovnáme měření u každého subjektu a přiřadíme znaménko „+“, nebo
„–“
– spočítáme, která znaménka se vyskytují řidčeji, a porovnáme
s tabulkovou hodnotou
– není příliš „silný“, neodhalí malé rozdíly
• Wilcoxonův test – podobný předchozímu, účinnější
• U-test Manna a Whitneyho – účinný neparametrický test, pomáhá
rozhodnout, zda dva výběry pocházejí ze stejného souboru – u
malých výběrů snadné, u větších používáme výpočet testového
kritéria U:
n1 (n1  1)
U  n1 n2 
R
2
Statistické
metody pro
analýzu
ordinálních dat
Příklad: V předchozím případě
dosáhli žáci počtu bodů, které
udávají tabulky.
H0 Mezi výsledky žáků ve třídě A
a B nejsou statisticky
významné rozdíly.
HA Mezi výsledky žáků v
didaktickém testu ve třídě A a
B jsou statisticky významné
rozdíly.
Třída A
Třída B
body
body
3
3
3
3
4
3
5
6
5
7
6
7
6
7
7
7
7
7
7
7
8
8
8
8
9
9
10
10
n=20
8
8
8
8
9
9
10
10
10
10
10
n=19
Třída A
Třída B
pořadí
body
Statistické
metody pro
analýzu
ordinálních dat
Příklad: V předchozím případě
dosáhli žáci počtu bodů, které
udávají tabulky.
Doplníme pořadí, vypočítáme
hodnotu R a dosadíme do
vzorce.
n1 (n1  1)
U  n1 n2 
R
2
pořadí
body
3
1
3
1
3
1
3
1
4
6
3
1
5
7
6
9
5
7
7
12
6
9
7
12
6
9
7
12
7
12
7
12
7
12
8
21
7
12
8
21
7
12
8
21
7
12
8
21
8
21
9
29
8
21
9
29
8
21
10
33
8
21
10
33
9
29
10
33
9
29
10
33
10
33
10
33
10
33
n1 = 20
RA= 358
n2 = 19
RB =422
Třída A
Třída B
pořadí
body
Statistické
metody pro
analýzu
ordinálních dat
Příklad: V předchozím případě
dosáhli žáci počtu bodů, které
udávají tabulky.
• Doplníme pořadí
• Vypočítáme součet pořadí
(hodnotu R).
• Dosadíme do vzorce pro A i B:
n1 (n1  1)
U  n1 n2 
R
2
Vypočítáme hodnoty:
UA=232
UB=148
pořadí
body
3
3
3
3
3
3
3
3
4
6
3
3
5
7,5
6
10
5
7,5
7
16
6
10
7
16
6
10
7
16
7
16
7
16
7
16
8
24,5
7
16
8
24,5
7
16
8
24,5
7
16
8
24,5
8
24,5
9
30,5
8
24,5
9
30,5
8
24,5
10
36
8
24,5
10
36
9
30,5
10
36
9
30,5
10
36
10
36
10
36
10
36
n1 = 20
RA= 358
n=19
RB=422
Třída A
Třída B
pořadí
body
Statistické
metody pro
analýzu
ordinálních dat
Příklad: V předchozím případě
dosáhli žáci počtu bodů,
které udávají tabulky.
Výpočet normované hodnoty:
u 
n1  n2
U
2
n1  n2  (n1  n2  1)
12
|u|=0,36
Kritická hodnota |u|=1,96
Nulovou hypotézu nezamítáme.
pořadí
body
3
1
3
1
3
1
3
1
4
6
3
1
5
7
6
9
5
7
7
12
6
9
7
12
6
9
7
12
7
12
7
12
7
12
8
21
7
12
8
21
7
12
8
21
7
12
8
21
8
21
9
29
8
21
9
29
8
21
10
33
8
21
10
33
9
29
10
33
9
29
10
33
10
33
10
33
10
33
n1 = 20
RA= 358
n=19
RB=422
Statistické metody
pro analýzu metrických dat
Při analýze metrických dat je možno používat
všech postupů pro analýzu nominálních nebo
ordinálních dat.
Závislosti mezi jevy:
- funkční
- statistické
Vizualizujeme bodovými diagramy – příklady z
přednášky č. 6.
Závislost mezi výškou žáka a délkou
kroku
70
Délka kromu v cem
Délka kroku v cm
Závislost věku žáků a délky jejich
kroku
60
50
40
30
125
130
135
140
Věk žáků v měsících
145
80
60
40
20
0
120
130
140
150
160
170
Výška žáka v cm
Jak se seskupují body?
• Jsou zcela neuspořádané, vyplňují celou plochu diagramu – obě
náhodné veličiny jsou statisticky nezávislé
• Vyplňují plochu elipsy, rozmístění lze přibližně vystihnout pomocí
přímky – lineární statistická závislosti
– Přímá závislost
– Nepřímá závislost
• Body se kupí tak, že jejich seskupení lze vystihnout určitou obecnou
křivkou – nelineární statistická závislost.
Statistické metody
pro analýzu metrických dat
• Regresní analýza
• Korelační analýza – koeficient korelace,
např.
– Pearsonův
rp 
– studentův t-test
– párový t-test
n x
n xy   x. y
2

 ( x ) 2 . n  y 2  ( y ) 2

Korelace
Koeficient korelace udává míru statistické závislosti dvou znaků.
Je definován vzorcem:
Koeficient korelace je vždy číslo z intervalu <-1,1>.
Koeficient korelace
Interpretace
Koeficient korelace
Interpretace
r=1
naprostá závislost
(funkční závislost)
0,40 > r ≥ 0,20
nízká závislost
1,00 > r ≥ 0,90
velmi vysoká závislost
0,20 > r > 0,00
velmi slabá závislost
0,90 > r ≥ 0,70
vysoká závislost
r=0
naprostá nezávislost
0,70 > r ≥ 0,40
střední závislost