Çok Örneklem Testleri

Download Report

Transcript Çok Örneklem Testleri

İKİDEN ÇOK (K) ÖRNEKLEM
TESTLERİ
BAĞIMSIZ GRUPLARA İLİŞKİN
HİPOTEZ TESTLERİ
İKİ ÖRNEKLEM TESTLERİ
BAĞIMSIZ K ÖRNEKLEM TESTLERİ
PARAMETRİK
TESTLER
•
TEK YÖNLÜ VARYANS
ANALİZİ (ANOVA)
PARAMETRİK OLMAYAN
TESTLER
•
KRUSKAL-WALLIS
VARYANS ANALİZİ
•
ÇOK GÖZLÜKİ-KARE
TESTLERİ
TEK YÖNLÜ VARYANS ANALİZİ
• Parametrik test varsayımları sağlandığında,
ölçümle belirtilen bir değişken yönünden
ikiden fazla bağımsız grubun ortalamaları
arasında fark olup olmadığını test etmek için
kullanılır. İki ortalama arasındaki farkın
anlamlılık testi için gerekli varsayımlar varyans
analizi için de geçerlidir.
Varsayımlar
• Karşılaştırılacak gruplar normal dağılım
göstermeli
• Grupların varyansları homojen olmalı
• Gruplar birbirinden bağımsız olmalı
Hipotezler:
H0: 1=  2= 3=...= k
Ha: En az bir i farklıdır.
1
x11
x21
x31
...
x n11
Toplam T.1
Ortalama x.1
Gruplar
...
2
3
k
x12 x13 ... x1k
x22 x23 ... x2k
x32 x33
x3k
...
... ...

x n 2 x n 3 ... x n k
2
T.2
x .2
3
T.3
x .3
k
T.k
x.k
T..
x..
nj
T. j   xij
j. sütunun toplamı
i 1
x. j 
T. j
x.. 
j. sütunun ortalaması
nj
k
N
k
N  nj
j 1
k
nj
T..   T. j   xij
j 1
T..
j 1 i 1
Bütün gözlemlerin toplamı
Genel Kareler Toplamı:
nj
k
nj
k
GnKT   ( xij  x.. )   xij 
2
2
j 1 i 1
j 1 i 1
2
T..
N
Grup İçi Kareler Toplamı:
nj
k
k
nj
k
GIKT   ( xij  x. j )   x  
2
j 1 i 1
2
ij
j 1 i 1
j 1
2
.j
T
nj
Gruplar Arası Kareler Toplamı:
k
k
GAKT   n j ( x. j  x.. )  
2
j 1
j 1
T. j
nj
T / N
2
..
GnKT=GIKT+GAKT
Gruplar Arası Kareler Ortalaması:
GAKO  GAKT/(k  1)
Gruplar İçi Kareler Ortalaması:
GIKO  GIKT/(N  k )
F Hesap İstatistiği:
FH  GAKO/GIKO
ANOVA TABLOSU
Değişim
Kaynağı
Gruplar Arası
Kareler
toplamı
Kareler
Ortalaması
F
GAKT
Ser.
Der.
k-1
GAKO
GAKO/
GIKO
Grup İçi
GIKT
N-k
GIKO
Genel
GnKT
N-1
Varyans Analizi Sonucu Anlamlı Olduğunda Farklı
Grupların Belirlenmesi
Varyans analizi sonucunda gruplar arasında fark yoksa
işlemler sona erer. Ancak, gruplar arasında fark varsa,
farklılığın hangi grup ya da gruplar arasında olduğu farklı
yöntemlerle araştırılabilir. Bu yöntemlere post-hoc testleri
denir. Bu yöntemlerden en çok kullanılanları;
LSD
Sidak
Tukey
Dunnett’s C
Dunnett’s T3
Bonferroni
LSD Testi
Örneklem genişlikleri eşit olduğunda(n1=n2=n3=...=nk=n)
xi  x j  t
2(GIKO)
p<0.05
n
Örneklem genişlikleri eşit olmadığında(n1n2  n3 ...  nk)
xi  x j  t GIKO(
1
ni

1
nj
)
p<0.05
Örnek:
Adölesan dönemindeki 90 kız, yaş gruplarına göre
(11-14, 15-18, 19-24) 3 gruba ayrılmıştır. Günlük
kilo başına tükettikleri kaloriler hesaplanmıştır.
Yaş gruplarına göre tüketilen kaloriler bakımından
farklılık var mıdır?
Toplam
Ortalama
Yaş Grupları
11-14
15-18
19-24
42.45
39.98
43.30
46.81
45.29
42.85
45.62
33.08
32.43
53.82
38.60
46.81
.
.
.
.
.
.
.
.
.
50.68
37.57
35.18
1380.76 1193.82 1105.72 3680.30
46.02
39.79
36.86
40.89
H0: 1=  2= 3
Ha: En az bir i farklıdır.
nj
k
GnKT   xij 
2
j 1 i 1
2
T..
 42.45  46.81    35.18 
2
N
2
2
3680.30
2
90
 154138.01  150495.65
 3642.36
k
GIKT 
nj
T. j
j 1
nj
 xij  
2
j 1 i 1
2
k
2
2
2


1380
.
76
1193
.
82
1105
.
72
2
2
2
 42.45  46.81    35.18  



30
30
30


 2327.31
GAKT=GnKT-GIKT=3642.36-2327.31=1315.05
GIKO=GIKT/(90-3)=2327.31/87=26.75
GAKO=GAKT/(3-1)=1315.05/2=657.53
F=GAKO/GIKO=657.53/26.75=24.58
ANOVA TABLOSU
Gruplar Arası
Grup İçi
Toplam
Kareler
Toplamı
1315.05
2327.31
3642.36
sd
2
87
89
Kareler
Ortalaması
657.53
26.75
F
24.58
P değeri
,000
Grup ortalamaları arasında anlamlı bir farklılık vardır.
Gruplardaki kişi sayıları birbirine eşit olduğu için
xi  x j  t
2(GIKO)
n
46.02  39.79
Hipotezler
LSD
H0: 1= 2
2(26.75)
1.98
İstatistiksel
karar
 2.64
6.23>2.64,
H0 red.
 2.64
9.16>2.64,
H0 red.
 2.64
2.93>2.64,
H0 red.
30
H0: 1= 3
H0: 2= 3
1.98
2(26.75)
30
1.98
2(26.75)
30
KRUSKAL- WALLIS TESTİ
Tek yönlü varyans analizinin parametrik olmayan
karşılığıdır. Veriler ölçümle belirtildiği halde parametrik
test varsayımları sağlanmıyorsa (gözlem sayısı az ya da
gruplar normal dağılmıyor ise) Kruskal-Wallis testi
kullanılır.
Testin aşamaları şu şekilde gerçekleşir:
1. k grubun n1, n2,…, nk gözlemleri tek bir değişken altında
küçükten büyüğe sıralanır. Tüm gözlemlere sıra numarası
verilir.
2. k grubun sıra numaraları ayrı ayrı toplanır(Rj)
3. Test istatistiği
Grup sayısı
KW 
12
n(n  1)
şeklinde hesaplanır.
2
k
Rj
j 1
nj

 3(n  1)
j. gruptaki sıra sayıları
toplamı
j. gruptaki gözlem sayısı
4. Üç grup olduğunda ve her bir grupta beş ve daha az
gözlem olduğunda hesaplanan KW istatistiği, özel
tablolar kullanılarak karşılaştırılır. Bir ya da daha fazla
grupta beşten fazla gözlem olduğunda ise KW, k-1
serbestlik dereceli 2 tablo değeriyle karşılaştırılır.
Test Sonucu Anlamlı Olduğunda Farklı Grupların
Belirlenmesi
ANOVA’da olduğu gibi bu Kruskal-Wallis testi de tüm
gruplar arasında anlamlı bir farklılık olup olmadığını
belirtir. Hangi gruplar arasında farklılık olduğunu vermez.
Bunun için çoklu karşılaştırma yapmak gerekir.
n(n  1) n  1  KW  1
1 


Ri  R j  t

n

12
nk
n
i
j


 p<0.05
Örnek: Üniversite öğrencilerinin çay içme miktarına göre
hemoglobin düzeylerinin değişip değişmediği incelenmek
istenmektedir. Bu amaçla 13 kişi “yemekten 1 saat önce
veya sonra çay içenler”, “yemekten 30 dakika önce ya da
sonra çay içenler” ve “yemekle birlikte çay içenler” olmak
üzere üç gruba ayrılmışlardır ve hemoglobin düzeyleri
ölçülmüştür. Buna göre hemoglobin düzeyi çayın içilme
zamanına göre değişmekte midir?
Hipotezler:
H0: Kitle dağılımları benzerdir.
Ha: En az bir kitle dağılımı diğerlerinden farklıdır.
Grup
I
13.5
Sıra II
Sıra III Sıra
9 12.9 6.5 10.9 1
KW 
12
n(n  1)
Rj
j 1
nj

2
2
 55 2
26
10 





13(13  1)  5
4
4 
10 12.5
5 11.5 4
15.5
13 13
8 11.2 3  10.68
14
11 12.9 6.5 11
14.7
12
Ri
55
 3(13  1)
KW(5,4,4;0.05)=5.657<KW=10.68
p<0.05, H0 red.
26
 3( n  1)
12
13.8
2
2
k
10
I: Yemekten 1 saat önce veya sonra çay içenler
II: Yemekten 30 dakika önce ya da sonra çay içenler
III: Yemekle birlikte çay içenler
Çoklu Karşılaştırma Tablosu
Gruplar R  R
i
j
n(n  1) n  1  KW  1
1 


t

n

12
nk
n
j 
 i
İstatistiksel
Karar
1-2
4.5
2.115
p<0.05
1-3
8.5
2.115
p<0.05
2-3
4
2.229
p<0.05
rxc Ki-KareTesti
Ki-kare testi iki ya da daha fazla gruplarda oran ya da
frekansları karşılaştırmak için de kullanılır. Çok gözlü
ki-kare düzenleri çoğu zaman satır ve sütun sayıları
yardımıyla adlandırılır.
Eğer incelenen herhangi bir nitelik değişken
bakımından 2’den çok grup arasında fark olup
olmadığı
araştırılıyor
ise
bağımsız
değişkenin(grupların)
satırlarda
yer
alması,gerektiğinde yapılacak bazı ileri hesaplamalar
içim daha uygun olacaktır.
İkinci
Ölçüt
1
2
...
c
Toplam
1
G11
G12
...
G1c
G1.
2
G21
G22
...
G2c
G2.
...
...
...
...
...
...
r
Gr1
Gr2
...
Grc
Gr.
Toplam
G.1
G.2
...
G.c
N
Birinci Ölçüt
r
c
χ  
2
i 1 j1
(G ij  B ij )
B ij
2
B ij 
G i.G .j
N
sd = (r-1)(c-1)
Çok gözlü ki-kare düzenlerinde beklenen frekansı
5’ten küçük göz sayısının toplam göz sayısı içinde
payının %20’yi aşmaması istenir.
Örnek:
Beslenme ve diyetetik bölümünü <75, 75-84 ve 85+
not ortalaması ile bitiren öğrencilerin meslekteki
başarı durumları inceleniyor. Sonuçlar;
Meslekteki Başarı
Bitirme
Puanı
Başarılı
Yeterli
Başarısız
Toplam
85+
50
30
25
105
75-84
35
80
25
140
<75
25
90
50
165
Toplam
110
200
100
410
Bitirme puanı ile meslekteki başarı arasında bir
ilişki var mıdır?
Meslekteki Başarı
Bitirme
Puanı
Başarılı
Yeterli
Başarısız
Toplam
85+
50 (28.2)
30 (51.2)
25 (25.6)
105
75-84
35 (37.6)
80 (68.3)
25 (34.1)
140
<75
25 (44.3)
90 (80.5)
50 (40.2)
165
Toplam
110
200
100
410
Hiçbir hücrenin beklenen değeri 5’ten küçük değildir.
H0: Bitirme puanı ve meslekteki başarı bağımsızdır.
Ha: Bitirme puanı ve meslekteki başarı bağımsız değildir.
r
χ 
2
c

(G ij  B ij )
i 1 j1

(50  28.2)
28.2
2
B ij
2

(30  51.2)
51.2
2

(50  40.2)
2
40.2
 42.22
2hesap =42.22 > 2(4,0.05)=9.488, H0 red , p<0.05
Bitirme puanı ile meslekteki başarı arasında bir ilişki
vardır.
Farklılığın hangi gruplardan kaynakladığını bulmak için her bir grup için ayrı
ayrı ki-kare değerleri hesaplanır.
Meslekteki Başarı
Bitirme
Puanı
Başarılı
Yeterli
Başarısız
Toplam
85+
50 (28.2)
30 (51.2)
25 (25.6)
105
2=25.66
75-84
35 (37.6)
80 (68.3)
25 (34.1)
140
2=4.63
<75
25 (44.3)
90 (80.5)
50 (40.2)
165
2=11.93
Toplam
110
200
100
410
2=42.22
Farklılığın hangi gruplar arasında olduğunu bulmak için ki-kare değeri büyük olan grup
(85+) dışarıda bırakılır. Geriye kalan gruplar arasında fark olup olmadığı yeniden ki-kare
analizi yapılarak araştırılır. Buna göre ki-kare değeri 8.60 olarak bulunur. (2-1)x(3-1)=2
Serbestlik dereceli ki-kare tablo istatistiği 5.99 olarak elde edilir ve 2hesap =8.60> 2tablo=5.99
olduğu için Ho hipotezi red edilir. Yani 75-84 ve <75 puan grupları ile meslekteki başarı
arasında anlamlı bir ilişki vardır. Genel bir yorum olarak, tüm bitirme puanları ile meslekteki
başarı arasında anlamlı bir ilişki vardır.
BAĞIMLI GRUPLARA İLİŞKİN
HİPOTEZ TESTLERİ
İKİ ÖRNEKLEM TESTLERİ
BAĞIMLI K ÖRNEKLEM TESTLERİ
PARAMETRİK
TESTLER
•
TEKRARLI
ÖLÇÜMLERDE TEK
YÖNLÜ VARYANS
ANALİZİ
PARAMETRİK OLMAYAN
TESTLER
•
FRIEDMAN TESTİ
•
COCHRAN Q TESTİ
TEKRARLI ÖLÇÜMLERDE
TEK YÖNLÜ VARYANS ANALİZİ
İki eş arasındaki farkın önemlilik testinin
ikiden çok grup için genelleştirilmişidir
Örnek 1.
Kandaki şeker miktarını düşürmek için hazırlanan
bir diyet programının etkinliğini ölçmek için şeker
hastalarının diyetten önce, diyetin 1. ayında ve
diyetin 3. ayında kandaki şeker miktarlarının farklı
olup olmadığının araştırılmasında kullanılabilir.
Örnek 2.
Üç ayrı firmanın ürettiği tansiyon ölçme
araçlarının aynı kişilerin tansiyonunu aynı
değerde
ölçüp
ölçmediğinin
test
edilmesinde kullanılabilir.
Zaman
...
j
x1j ...
...
...
1
... ... ... ...
xi1 ...
xij
i
... ... ... ...
x n1 ... ...
n
... x
Ortalama x
Gözlem
1
x11
.1
.j
k Ortalama
x1k
x1.
... ...
... xik
... ...
... x nk
... x
.k
...
xi.
...
x n.
x..
ÖRNEK:
BKİ>35 olan 30 bireye mide bandı takılmıştır. Bant
takılmadan önce, takıldıktan 3 ay sonra ve takıldıktan 6 ay
sonra beden kitle indeksleri ölçülmüştür. Beden kitle
indeksleri zamana göre değişmekte midir?
Beden Kitle İndeksi
Birey
Bant
Öncesi
1
2
3
4
5
6
7
8
9
.
30
40,45
42,96
42,44
49,10
48,50
50,90
53,21
46,90
51,37
.
43,43
Banttan 3 ay Banttan 6 ay
sonra
sonra
30,04
27,34
31,83
41,86
44,60
42,73
43,17
40,29
46,06
.
39,09
25,23
30,46
25,90
38,45
36,80
40,78
42,05
37,65
41,81
.
36,75
Tanımlayıcı İstatistikler
Zaman
Bant
Öncesi
Banttan 3
ay sonra
Banttan 6
ay sonra
Ortalama
S. Sapma
n
47,71
5,08
30
40,26
5,83
30
36,52
6,16
25
BKİ>35 olan bireylerin zamana göre Beden Kitle
İndekslerine ilişkin
ortalama ve standart sapma grafiği
HİPOTEZLERİN BELİRLENMESİ
H0: Mide bandı takılmadan önceki ve takıldıktan
sonraki zamanlarda BKİ değerleri bakımından fark
yoktur.
H1: Mide bandı takılmadan önceki ve takıldıktan
sonraki zamanlarda BKİ değerleri bakımından fark
vardır.
Karşılaştırma için
F dağılımından yararlanılır.
Hesapla bulunan F istatistiğinin elde edilmesinde
kullanılan bilgiler sıklıkla varyans analizi
tablosunda özetlenir.
BKİ için Varyans Analizi Tablosu
Değişim
Kaynağı
KT
Sd
Genel
4544,86
89
1847,03
2
923,52
2374,85
29
81,89
322,98
58
5,57
Zamanlar
Arası
Denekler
Arası
Hata
KO
F
P
165,80 0.000
BKİ’nin zamanlara göre değişimi önemlidir (p<0.05).
Hangi zamanlar arasında fark olduğu ikişerli
karşılaştırmalarla incelenmelidir.
Tukey HSD testi ile ikişerli karşılaştırmalara bakılacak olursa;
x i  x j  q (  ,k ,GISD )
2(GIKO)
n
GISD: Grup içi serbestlik derecesi
q ( 0.05,3,58)  3.40
P<0.05
q değerleri tablosu
Çoklu Karşılaştırma Tablosu
Gruplar
xi  x j
q ( ,k ,GISD)
2(GIKO)
n
İstatistiksel
Karar
1-2
7.44
2.07
p<0.05
1-3
10.85
2.07
p<0.05
2-3
3.41
2.07
p<0.05
FRIEDMAN TESTİ
Tekrarlı ölçümlerde varyans analizinin
varsayımları yerine gelmediğinde (özellikle
denek sayısı az ve/ya da veriler sayımla
belirtildiğinde ya da sıralama ölçeğinde
olduğu durumlarda) kullanılır.
Friedman testi için 

2
R
2
R
test istatistiği:
 k

2

 R j   3n(k  1)
nk (k  1)  j 1

12
n: Satır sayısı
k: Grup (sütun sayısı)
Rj: Her bir gruba (sütuna) ilişkin sıra numaraları toplamı
İstatistiksel karar için ki-kare ya da F
dağılımından yararlanılabilir (F dağılımından
yararlanılarak
yapılan
çözüme
burada
değinilmeyecektir).

2
R
İstatistiği seçilen yanılma düzeyinde k-1 serbestlik
dereceli ki-kare dağılımı gösterir.
Gruplar arasında fark olması durumunda ikişerli
karşılaştırmalar yapılır.
Örnek :
Tekrarlı ölçümlerde tek yönlü varyans analizi için
verilen örneğin 11 birey üzerinde yapıldığını
düşünelim. Bu durumda Friedman testi için hazırlık
tablosu aşağıdaki gibi olacaktır.
Birey
Bant Banttan Banttan
Öncesi
3 ay
6 ay
sonra
sonra
R(1)
Sıra no
R(2)
R(3)
1
40,45
30,04
25,23
3
2
1
2
42,96
27,34
30,46
3
1
2
3
42,44
31,83
25,90
3
2
1
4
49,10
41,86
38,45
3
2
1
5
48,50
44,60
36,80
3
2
1
6
50,90
42,73
40,78
3
2
1
7
53,21
43,17
42,05
3
2
1
8
46,90
40,29
37,65
3
2
1
9
51,37
46,06
41,81
3
2
1
10
52,44
39,59
25,37
3
2
1
11
45,67
39,60
35,84
3
2
1
Örneğimiz için hipotez:
Ho: BKİ zamana göre değişmemiştir.
Friedman 
 
2
R
2
R
12
11  3  (3  1)
 R2 =20.18

test istatistiği:
2
Tablo
=5.99
(33)
2
 (21)  (12)
2

2
R
 
2
  3  11 (3  1)
2
Tablo
Ho red
COCHRAN Q TESTİ
Cochran Q testi, McNemar bağımlı
örneklerde ki-kare testinin ikiden çok grup
için genelleştirilmişidir.
Cochran Q testinde incelenen değişken, evethayır, yeterli-yetersiz… gibi iki durumludur.
Cochran Q istatistiği:
Q
2
 k

k


2
(k  1) k  C j   C j  


 j 1
 j 1
 

n
n
k  Ri   Ri
2
i 1
Cj: sütun toplamları
Ri: satır toplamları
n: gözlem sayısı
k: grup sayısı
i 1
İstatistiksel karar:
Hesapla bulunan Q istatistiği seçilen alfa
yanılma düzeyinde k-1 serbestlik dereceli kikare tablo istatistiği ile karşılaştırılır.
QHESAP > QTABLO ise Ho Hipotezi reddedilir.
Örnek:
Beslenme ve diyetetik öğrencilerinin geleceğe yönelik
kaygılarının yıllar içinde değişip değişmediğini
incelemek amacıyla düzenlenen ve aynı öğrenciler
üzerinde son 3 öğretim yılı süresince devam eden bir
çalışmada öğrencilere geleceğe yönelik kaygılarının var
olup olmadığı soruluyor ve yanıtlar; geleceğe yönelik
kaygı var için 1, yok için 0 şeklinde kodlanıyor.
Öğrencilerin geleceğe yönelik kaygılarının yıllar içinde
değişip değişmediği Cochran Q testi ile araştırılabilir.
Öğrenci
1
2
3
4
Dönem
II
1
1
1
0
Dönem
III
0
0
1
0
Dönem
IV
1
0
1
0
5
6
7
8
1
1
1
1
0
0
1
0
1
1
1
0
9
10
Cj
1
1
9
1
0
3
1
0
6
Ri
2
1
3
0
2
2
3
1
3
1
18
Q
 k
2
( k  1) k  C j
 j 1

n



 C j 


j

1


k
2




n
k  Ri   Ri
2
i 1



i 1
(3  1) 3(9  3  6  18
2
2
2
2

3(2  1    1)  (2  1    1 )
2
108
2
2
9
12
QHESAP= 9 > 2(2,0.05) =5.99
p<0.05
H0 reddedilir.
Fark önemli olduğu için
ikişerli
karşılaştırmalar
McNemar testi ile yapılabilir.
Kİ-KARE TABLOSU