Induktívna štatistika

Download Report

Transcript Induktívna štatistika

Štatistické
spracovanie
a vyhodnotenie dát 2
Induktívna štatistika
Základným predpokladom použitia akejkoľvek induktívnej štatistickej
metódy je náhodný výber, teda výber, ktorý spĺňa dve základné
vlastnosti:


Pravdepodobnosť zaradenia do vzorky je pre všetky štatistické
jednotky nenulová.
Štatistické jednotky sú do vzorky vyberané nezávisle jedna od
druhej.
Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané
náhodným výberom (napr. kvótne výbery) a pre cenzusy
(vyšetrovania celých základných súborov) je nesprávne.
Induktívna štatistika rieši dva typy úloh:


Odhady parametrov.
Testy štatistických hypotéz.
Odhady parametrov
Koľko premenných chcete skúmať súčasne:
 Jednu premennú

Príklad: Možno na základe 30 meraní tvrdiť, že priemerný čas
prečítania jednej strany knihy (X) je menej ako 4 minúty?
 Dve premenné

Príklad: Súvisí počet vyriešených problémových úloh žiakmi (Y)
a množstvo položenia otázok učiteľom žiakom počas vysvetľovania
(X)?
 Tri a viac premenných

Príklad: Existuje vzťah medzi dosiahnutým prospechom žiakov (Y)
a vzdelaním (X1), vekom (X2) a pohlavím (X3) učiteľov?
Odhady parametrov
Intervalový odhad

Testy štatistických hypotéz
Postup testovania hypotéz:





Formulácia nulovej hypotézy (H0)
Formulácia alternatívnej hypotézy (Ha)
Stanovenie hladiny významnosti (α)
Výpočet testovacej štatistiky a pravdepodobnosti
Rozhodnutie
Sila testu a veľkosti vzoriek
Sila testu (pravdepodobnosť zachytenia
existujúceho významného rozdielu) závisí od:




Variability
Veľkosti vzorky
Pravdepodobnosti chyby I. druhu (α)
Veľkosti efektu
Analýza sily (Power Analysis)
Čím je vyššia variabilita hodnôt premennej, tým je nižšia sila testu. Zvýšenie
zvyšných troch faktorov zvyšuje silu testu.
Veľkosť efektu je veľkosť rozdielu parametrov (napr. rozdiel priemerov pri t-teste),
ktorý možno zachytiť napr. experimentom. Na zachytenie veľkého efektu stačí
menšia vzorka ako na zachytenie malého efektu. Voľba vhodnej veľkosti
efektu je často ťažká, pretože je veľmi subjektívna. Voliť sa má vždy taká
veľkosť efektu, ktorá je pre daný výskum užitočná.
Vzťahmi medzi variabilitou, veľkosťou vzorky, alfou, veľkosťou efektu a silou testu
sa zaoberá analýza sily (Power Analysis).
Analýzou sily sa treba zaoberať už pri plánovaní výskumu.


Nedostatočná veľkosť vzorky, môže spôsobiť nezachytenie relevantného
efektu.
Príliš veľká vzorka stojí zbytočne veľa času a peňazí s minimálnym úžitkom.
Nevýhody testovania hypotéz
Výsledok testovania hypotéz je dichotomické rozhodnutie o tom, či zamietnuť
alebo nezamietnuť nulovú hypotézu. Veľmi často je takýto výsledok
nepostačujúci - napr. v prípade testovania efektívnosti novej liečby.
Výskumník sa zaujíma o silu efektu nie o to, či sa efekt rovná presne 0.
Porovnávanie P-hodnôt (aj v rámci jednej štúdie) bez doplňujúcich
informácií a následným vyvodením záverov nemusí byť správne.
Ak napríklad vo viacfaktorovej ANOVA faktor A má P=0,0001 a faktor B
P=0,049, nemôžeme jednoducho povedať, že faktor A má silnejší efekt ako
faktor B. Samotná P-hodnota 0,001 môže v skutočnosti znamenať 3
situácie:



triviálny (z praktického hľadiska nevýznamný) efekt v základnom súbore
zistený z veľkej vzorky,
silný efekt v základnom súbore zistený zo stredne veľkej vzorky,
obrovský efekt v základnom súbore zistený z malej vzorky.
Výhody intervalových odhadov
 odpovedajú na otázku v akých hraniciach možno očakávať skutočný
efekt v základnom súbore. Poskytujú teda viac informácií ako testy
hypotéz.
 V prípade, že chceme zistiť, či je liek proti vysokému krvnému tlaku
účinný, môžeme použiť párový t-test. Vzorke pacientov zmeriame
tlak pred a po podávaní lieku. Ak sa priemerný rozdiel tlakov
významne odlišuje od 0, potom má liek účinok.
 Silu účinku však možno určiť len intervalovým odhadom
priemerného rozdielu. Intervalový odhad nám s danou
spoľahlivosťou (pravdepodobnosťou v %) povie, aký pokles tlaku
môžeme očakávať v základnom súbore tvorenom pacientmi
s vysokým krvným tlakom. Veľkou výhodou intervalových odhadov
je ich výpovedná schopnosť. Z intervalu, ktorý je príliš široký
(vykazuje veľkú chybu) jasne vidno, že veľkosť vzorky je
nedostatočná. Naopak, z intervalu ktorý je úzky, pričom vyjadruje
triviálny efekt vidno, že štatistická významnosť je dosiahnutá veľkou
vzorkou (teda príliš veľkou silou testu).
Usporiadanie základných situácií
štatistického usudzovania
posúdenie výberu
a stredných
hodnôt
parametrické
posúdenie
priemeru
v jednom výbere
neparametrické
posúdenie
priemeru
v dvoch výberoch
v jednom výbere
v dvoch výberoch
nezávislé výbery
nezávislé výbery
závislé výbery
závislé výbery
Rozhodovacia
schéma pre výber
testov stredných
hodnôt
Jednorozmerná induktívna
štatistika - intervalová premenná
 Jednovzorkový Studentov t-test
 na testovanie nulovej štatistickej hypotézy, ktorá tvrdí, že priemer
základného súboru sa rovná zadanej konštante. Test teda odpovedá
na otázku, či možno na základe náhodnej vzorky tvrdiť, že
(neznámy) priemer základného súboru sa rovná zadanému číslu
(resp. či je väčší, príp. menší ako zadané číslo).
 Viac informácií ako samotný test poskytuje Intervalový odhad
priemeru, pretože určuje hranice v ktorých sa s danou
spoľahlivosťou (pravdepodobnosťou – tradične 95 %) nachádza
priemer základného súboru. Studentov t-test aj intervalový odhad
priemeru predpokladajú normálne rozdelenie premennej
v základnom súbore. Ak je vzorka malá (n < 50) a testy normality
zamietnu normálnosť, treba použiť neparametrické alternatívy:
Wilcoxonov test (1945) a znamienkový test, ktoré testujú nulovú
hypotézu o zhode mediánu s konštantou.
Výber štatistického testu pre
porovnanie skupín
premenná
nominálna
nezávislé výbery
χ2 test dobrej zhody
χ2 test homogenity
závislé výbery
McNemarov test
Q test podľa Cochrana
ordinálna
nezávislé výbery
znamienkový poradový test
podľa Wilcoxona
Wilcoxonov test
Mann-Whitneov test
závislé výbery
znamienkový poradový test
podľa Wilcoxona
Friedmanov test
Pageov test
intervalová
nezávislé výbery
t-test pre jeden výber
t-test pre dva výbery
analýza rozptylu
závislé výbery
párový t-test
dvojfaktorová analýza
rozptylu
Viacrozmerné prieskumné
techniky
Porovnanie dvoch nezávislých výberov z normálne rozdelených
základných súborov
 Skúmame tú istú premennú na dvoch nezávislých výberoch.
 podmienky pokusu pre oba výbery sa odlišujú iba v pôsobení
jedného faktora. Rozdiel výberových priemerov môžu podmieňovať
náhodné vplyvy, vtedy nebude signifikantný rozdiel v nameraných
priemeroch. Naopak, ak je rozdiel podmienený istým faktorom, vtedy
zistíme signifikantnosť rozdielu.
 Oprávnenosť použitia t-testu: normálne rozdelenie, oba výbery sú
homogénne, teda variancia oboch súborov je rovnaká (pomocou
kritéria F-testu – testovanie podielu variancií). Ak platí, že variancie
sú v oboch súboroch rovnaké použijeme t-test určený pre takýto
prípad.
 variancie sledovaných súborov štatisticky významne odlišné –
použiť upravený t-test určený pre prípad nehomogénných súborov.
Porovnanie dvoch závislých výberov (v niektorej literatúre
sa označujú aj ako korelujúce výbery) z normálne
rozdelených základných súborov
 test nulovej hypotézy pre závislé výbery, v prípade, keď
rovnaký test použijeme v tom istom súbore dvakrát.
Vznikajú dvojice pozorovaných hodnôt (napríklad vstupný
a výstupný test) – na analýzu použijeme párový t-test
 musí platiť, že ide o normálne rozdelenie.
 testujeme či aritmetický priemer rozdielu vo výsledkoch sa
odlišuje od nuly náhodne alebo štatisticky signifikantne.
 Hodnoty, ktoré premenná nadobúda pri oboch meraniach,
musia pritom navzájom pozitívne korelovať.
Porovnanie dvoch nezávislých výberov
neparametrickými testovacími metódami
 Ak pracujeme s dátami, ktoré nemajú normálne
rozdelenie, musíme zvoliť postup, ktorý je nezávislý od
určitej formy rozdelenia.
 Hypotézy, ktoré testujeme, sa v tomto prípade
nevzťahujú na parametre rozdelení, a preto hovoríme
o neparametrických testoch. Často sa takto používajú
Wilcoxonov test a Kolmogorovov-Smirnov test.
Porovnanie dvoch závislých výberov neparametrickými
testovacími metódami
 Pre malé výbery ťažko dokázať normálnosť rozdelenia
náhodnej premennej. Preto aj pre závislé (korelujúce)
výbery treba siahnuť po neparametrickej testovacej
metóde. V takomto prípade môžeme použiť
znamienkový test (sign test – skúma smer odchýlky
merania od predpokladaného mediánu).