Analiza wariancji

Download Report

Transcript Analiza wariancji

ANALIZA ANOVA - KIEDY?
Wiele przedsięwzięć badawczych zakłada porównanie
pomiędzy średnimi z więcej niż dwóch populacji lub
dwóch warunków eksperymentalnych. Przykładowo
badamy efektywność kilku rodzajów leków lub tez ten
sam podajemy w różnych dawkach.

Jednoczynnikowa analiza wariancji pozwala na
porównanie kilku średnich bez przeprowadzania
kilku testów t

ZADANIE
sobie, że badamy
grupę swoich pacjentów
pod względem poziomu cholesterolu, interesować nas
będzie czy kategoria wieku (pomiar na poziomie
nominalnym): młodzi, średni, starsi wpływa na poziom
cholesterolu?
Wyobraźmy
Najpierw
naszą całą próbę dzielimy na grupy
1 grupa – osoby do 35 roku życia
2 – osoby pomiędzy 35 a 50 rokiem życia
3 – osoby powyżej 50 roku życia
Dane do ćwiczenia znajdują się w pliku kard (plik
EXCEL)
STOSOWANIE PROCEDURY – poziom
podstawowy
ANALIZA->Porównanie
średnich Jednoczynnikowa
ANOVA

Analyze - Compare Means - One-Way ANOVA
DEFINIOWANIE ZMIENNYCH
Wybieramy
zmienną zależną – nas interesuje
cholesterol ZMIENNE ZALEŻNE
Zmienną
niezależną jest wiek, która powinna być w
miejscu CZYNNIK
ONEWAY cholesterol BY wiek
/STATISTICS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC=TUKEY SCHEFFE
ALPHA(0.05).
WYKONYWANIE TESTÓW POST HOC –
PORÓWNANIA NIEPLANOWANE
Po
kliknięciu Opcje możemy dołączyć statystki opisowe
oraz konieczne test jednorodności wariancji
Klikając
pos hoc wybieramy testy – dla braku założenia
o równości wariancji i dla założenie o równości wariancji
Testy
post hoc służą do porównania każdej średniej z każdą –
wielokrotne porównania. Dzięki nim możemy uzyskać
szczegółowe informacje dotyczące różnic pomiędzy
poszczególnymi grupami.
Testy
post hoc, nazywane również porównaniami a
posteriori, możemy wykonywać TYLKO wtedy, gdy analiza
wariancji jest istotna.
RAPORT
Po pierwsze interesuje nas test jednorodności
wariancji – to znaczy czy nie ma istotnych
różnic pomiędzy trzema wariancjami
W
przykładzie F=0,455 zaś >0,05 a więc
zakładamy, ze pomiędzy grupami nie ma
różnic istotnych statystycznie, zakładamy
równość wariancji
ANOVA podsumowanie
Wynik przeprowadzonej analizy wariancji. Widać, że jest istotna.
Konstrukcja tabeli jest prosta: suma kwadratów dzielona przez stopnie
swobody daje nam średni kwadrat, czyli wariancję. Wariancja
międzygrupowa dzielona przez wariancję wewnątrzgrupową daje F.
Stopnie swobody międzygrupowe to:
dfB = k – 1 (liczba grup – 1)
Stopnie swobody wewnątrzgrupowe to:
dfW = N – k (liczba osób – liczba grup)
Oprócz uzyskanych różnic, jest jeszcze jedna miara,
która może nam powiedzieć wiele o wyniku, a
zwłaszcza pozwala porównać wielkość efektu dwóch
analiz. Jest to eta2. Otrzymujemy ją dzieląc
międzygrupową sumę kwadratów praz ogólną sumę
kwadratów. U nas ta miara wynosi: eta2 = 46856,6 /
82313,0 = 0,57. Oznacza to, że zmienność zmiennej
niezależnej wyjaśnia aż 57% wariancji zmiennej
zależnej.
Wynik analizy wariancji
F(2,57) = 37,66; p < 0,001
Najpierw
wpisujemy
liczbę
międzygrupowych stopni swobody,
potem, po przecinku, liczbę
wewnątrzgrupowych.
Wynik testu F. pamiętajmy, że im jest wyższy, tym większy
stosunek wariancji międzygrupowej do wewnątrzgrupowej.
Istotny wynik analizy wariancji mówi nam, że przynajmniej
dwie średni się różnią. Nie wiemy jednak, które. Na to
pytanie odpowiedzą na testy post-hoc.
TESTY POST HOC
Interesować
Test
nas będzie tabela Porównania wielokrotne
porównuje nam ze sobą grupy wskazując
jednocześnie pomiędzy którymi różnica jest istotna
statystycznie i na jakim poziomie
Testy liberalne: NIR, S-N-K, Duncan
Testy konserwatywne: Scheffe, Bonferroni,
Tukey
Testy polecane przy nierównych grupach:
GT2 Hochberga i Gabriel
Testy polecane przy niejednorodnych
wariancjach: Gamesa-Howella (liberalny) i T2Tamahane’a (konserwatywny)
Interesuje nas istotność, jeśli p<0,05
różnica jest istotna statystycznie,
różnice oznaczone są gwiazdkami
Grupa 1 różni się od 2 i od 3
Zaś 2 nie różni się od 3
TESTY POST HOC
Średnie umieszczone w tej samej
kolumnie nie różnią się istotnie.
Umieszczone każda w innej
różnią się między sobą. W tym
przypadku średnia „osoby do 35
roku życia” różni się od 2
pozostałych
a
więc
jest
przedstawiona
w
oddzielnej
kolumnie. Różnice uzyskane
testami post hoc można opisać
słownie,
podając
nazwę
zastosowanego testu i poziom
istotności kolejnych porównań.