Güven Aralığı, Hipotez Testleri ve P Değeri

Download Report

Transcript Güven Aralığı, Hipotez Testleri ve P Değeri

GÜVEN ARALIĞI
HİPOTEZ TESTLERİ
P DEĞERİ
Doç. Dr. Turan SET
Karadeniz Teknik Üniversitesi Tıp Fakültesi Aile
Hekimliği Anabilim Dalı
İstatistiksel tahmin
 Örnekler popülasyon hakkında tahmin ve karar vermek için
toplanır.
 Popülasyondan rassal olarak seçilen örneklemden hesaplanan
istatistikle, popülasyonun uyduğu dağılımın parametre
değerlerinin araştırılması da denilebilir.
 Popülasyondan n hacimli rasgele örneklem seçilir
 Tahminlenecek parametre için istatistik hesaplanır
 İstatistiğin örneklem dağılımının özelliklerinden yararlanarak
parametre değeri tahmin edilir.
 Belirli bir popülasyondan alınan n adet örneklemin
ortalaması popülasyonun nokta tahminidir. Ana kütle N sayısı
çok fazla ise çok değişik sayıda nokta tahmini yapılabilir.
İstatistiksel tahmin
 Nokta tahmini aynı popülasyondan alınan N sayıda farklı
örneklemden yakın sonuçlar alınıyorsa güvenilirdir. Gerçekte
bu çok mümkün olmaz.
 Güvenirliği somut bir şekilde ortaya koymak için Güven
Aralığı kavramı geliştirilmiştir.
 Tahmin edilecek parametrenin içinde yer alabileceği simetrik
bir aralığın önceden belirlenmiş olasılıkta alt ve üst sınırının
belirlenmesi gerekir.
Güven aralığı
 Popülasyona ait bir parametrenin örneklem istatistiği
kullanılarak tahmin edilmesine nokta tahmini denir.
 Nokta tahminimizin isabet derecesini çoğu zaman kesin
olarak bilemeyiz.
 Dolayısıyla yaptığımız tahminin ne kadar güvenli olduğunun
ölçüsüne ihtiyaç duyarız.
Örneklem
Ortalaması
Nokta Tahmini
Popülasyon
Ortalaması
Güven aralığı
 Yaptığımız tahmin bir hata payı
da içerir. Bunu etkileyen üç
önemli unsur vardır.
 Değerlendirmemizde ihtiyaç
duyacağımız güven seviyesi
nedir?
 Popülasyonun standart sapması
 Örneklem sayısı
 Hata payını eklemek için
seçtiğimiz güven aralığına göre
Z tablosundan yararlanarak bunu
gösterebiliriz.
 Böylece hata olasılığımızı da
dağılımın teorik özelliklerinden
yararlanarak ifade edebiliriz.
Z TABLOSU VE GÜVEN ARALIĞI
Z
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
.06
.3554
.3770
.3962
.4131
.4279
.4406
.4515
.4608
.4686
.4750
.4803
.07
.3577
.3790
.3980
.4147
.4292
.4418
.4525
.4616
.4693
.4756
.4808
Örnek
 Standart sapması 100 olarak bilinen 25 diyabet
hastasının örneklem kan şekeri ortalaması 520
olarak bulunmuştur. %95 güven aralığına göre
ortalamayı ifade ediniz.
 Hesaplama sonucu diyebiliriz ki %95 güvenle ve %5
hata payı ile hastaların kan şekeri değeri 480.8 ile
559.2 arasında değişmektedir diyebiliriz.
Hipotez testlerinde genel yaklaşım
 Hipotez testleri, araştırmamızın başında sorduğumuz
sorunun ve kurduğumuz hipotezin kabulü veya reddi için ne
kadar kanıt olduğunu anlamamıza yardım eder.
 Hipotez testlerinde kural olarak aşağıdaki 5 aşama izlenir:
1. Sıfır hipotezi (H0) ve alternatif hipotezin (H1) tanımlanması
2. Verilerin toplanması
3. İlgili sıfır hipotezi için test istatistiğinin hesaplanması
4. Test istatistiğinden elde edilen değerin bilinen bir olasılık
dağılımı ile karşılaştırılması
5. P değerinin ve sonuçların yorumlanması
İki yönlü ve tek yönlü hipotez
 Karşılaştırılan grupların herhangi birisinin fazla olabileceği
duruma iki yönlü hipotez (two-tailed) denir.
 Araştırmanın başında bir grubun kesinlikle ötekinden küçük
ya da büyük olacağını çoğunlukla bilemediğimizden genelde
iki yönlü hipotez kurulur.
İki yönlü ve tek yönlü hipotez
 Tek yönlü hipotez ise gruplardan birinin ötekinden
kesinlikle daha düşük (veya yüksek) olamayacağının
bilindiği nadir durumlarda kurulur. Örn:
 AIDS hastalığında A ilacı kullanılması durumunda
hastaların tamamı (%100) bir süre sonra ölmektedir.Yeni bir
B ilacı A ilacıyla karşılaştırılmak isteniyor. Ölümü önlemede
B ilacının A ilacından daha kötü olma olasılığı
olmadığından hipotezimizi tek yönlü kurabiliriz. Bu
durumda H0 şöyle olur:
 “AIDS’ten ölümleri önlemede B ilacı A ilacından daha üstün
değildir.”
İki yönlü ve tek yönlü hipotez
 Aynı şey eşdeğerlik araştırmaları için de geçerlidir.
Piyasada klasik olarak kullanılan bir orijinal amoksisillinklavulonik asit ürünü olduğunu düşünelim.
 Farklı bir ilaç firması aynı etken maddede bir ürünü piyasaya
sürmek istiyor.
 Bu durumda yeni ilacın orijinali kadar etkili olduğunu ispat
etmesi yeterli olacaktır.
 Zaten aynı etken maddesi olduğundan orijinal ilaçtan daha etkili
olduğu gibi bir iddiası yoktur. H0 hipotezimiz şöyle olur:
“Otitis medianın tedavisinde yeni çıkarılan B ilacı orijinal A
ilacından daha az etkili değildir.”
İki yönlü ve tek yönlü hipotez
 İki yönlü hipoteze göre tek yönlü hipotezi test etmenin
daha kolay olacağı ve araştırma için daha az vaka
gerekecektir.
 Hipotez kurulduktan sonra uygun bir istatistik yöntem seçilir ve
istatistik test uygulanır.
 Uygulanacak formülden elde edilecek değer H0 hipotezini
reddetmeye yöneliktir.
𝐻0 ve 𝐻1 hipotezleri
 Yapılması gereken 𝑯𝟎 hipotezini ret edecek kanıt
aramaktır. Kanıt bulunursa 𝑯𝟎 reddedilir 𝑯𝟏 kabul edilir
ve fark vardır denir aksi halde 𝑯𝟎 kabul edilerek
karşılaştırılan değişkenler arasında bir fark yoktur denilir.
 𝑯𝟏 : Tek yönlü ise farklı olup olmadığına aksi halde büyük
ya da küçük olduğuna göre test sonucu değişir ve tek
yönlü karar verilir.
Çift Yönlü
Tek Yönlü
𝑯𝟎 Kabul ve Red Bölgeleri (Çift Yönlü)
𝑯𝟎 Kabul Bölgesi
𝑯𝟎 Red
Bölgesi
𝑯𝟎 Red
Bölgesi
𝛼
1-
𝛼/2
𝛼 /2
A2
A1
0
Z
𝑯𝟎 Kabul ve Red Bölgeleri (tek yönlü büyük)
𝑯𝟎 Kabul Bölgesi
𝑯𝟎 Red
Bölgesi
𝛼
1-
𝛼
A
0
Z
𝑯𝟎 Kabul ve Red Bölgeleri (tek yönlü küçük)
𝑯𝟎 Kabul Bölgesi
𝑯𝟎 Red
Bölgesi
𝛼
1-
𝛼
A
Z
0
Hipotez testleri
 Olasılık dağılımları başlığı altında bahsedildiği gibi,
istatistik testler teorik olasılık dağılımlarına göre
yorumlanırlar.
 Test istatistiğinden elde ettiğimiz değeri teorik
dağılımımızın olasılık yoğunluk fonksiyonunun (çan
eğrisi) iki veya bir ucu ile karşılaştırarak p değerimizi
elde ederiz.
 Bilgisayar programları bu değeri otomatik olarak verir.
 p değeri, değişkenler arasındaki farklılığın şan
eseri olma olasılığını verir.
Örnek
 Veri setimizde kadınlarla erkeklerin boylarını karşılaştırmak




istiyoruz.
Erkeklerin VEYA kadınların boylarının daha uzun
olabileceğini varsayıyoruz. İki yönlü hipotez kurmalıyız
(SPSS’te tek yönlü p değeri sadece özel durumlar için
verilmektedir):
H0: boy uzunluğu açısından kadınlarla erkekler arasında fark
yoktur.
H1: boy uzunluğu açısından kadınlarla erkekler arasında fark vardır.
“boy” numerik bir değişken.“erkekler” ve “kadınlar” olmak üzere
birbirinden bağımsız iki grup var. Konu 1’deki akış şemalarından
da görülebileceği gibi “bağımsız örneklerde t testi” yapmalıyız.
 Analyze > Compare Means > Independent-Samples t test [“Test
variables” kutusuna “height” değişkenini,“Grouping variable”
kutusuna “sex” değişkenini koyalım.“Define Groups” butonunu
tıklayıp “Group 1” için 1,“Group 2” için 2 yazalım > Continue >
OK. Aşağıdaki çıktıyı elde ederiz:
p değerinin yorumlanması
 Sıfır hipotezini kabul veya reddetmemiz için ne kadar kanıta ihtiyacımız





olduğunu önceden belirlemeliyiz.
Sağlık bilimlerindeki çalışmalar için genelde 0,05’ten küçük bir p değeri
anlamlılık için yeterli sayılmaktadır.
Halbuki yanılma payının çok daha önemli olduğu astronomi gibi bilim
dallarında p değerleri için çok daha küçük sınırlar kullanılmaktadır.
Görüldüğü gibi bu sınırın belirlenmesi nispeten subjektiftir. Hata
yaptığımızda ciddi sonuçlar oluşabilecekse p değerini %5 yerine %1
veya binde bir alabiliriz.
Buna testimizin anlamlılık düzeyi deriz ve makalemizde de ‘p
anlamlılık düzeyi %5 alınmıştır’ gibi ifade ederiz.
Verilerimiz normal dağıldığından elde ettiğimiz test istatistiği sonucunu
normal dağılım bilgilerimizi kullanarak yorumlayabiliriz.
Bu amaçla normal dağılım olasılık yoğunluk fonksiyonu eğrisine bir göz
atmak bize fikir verebilir:
 Standart normal dağılımda verilerin %1’i 2,58 standart sapma
sınırındadır.
 Bu durumda bizim bulduğumuz değer %0,1 (p<0,0001)
sınırından da ötededir.
Z
.0
.1
.2
.3
.4
.5
.6
.7
.8
.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
.00
.0000
.0398
.0793
.1179
.1554
.1915
.2257
.2580
.2881
.3159
.3413
.3643
.3849
.4032
.4192
.4332
.4452
.4554
.4641
.4713
.4772
.4821
.4861
.4893
.4918
.4938
.4953
.4965
.4974
.4981
.4987
.01
.0040
.0438
.0832
.1217
.1591
.1950
.2291
.2611
.2910
.3186
.3438
.3665
.3869
.4049
.4207
.4345
.4463
.4564
.4649
.4719
.4778
.4826
.4864
.4896
.4920
.4940
.4955
.4966
.4975
.4982
.4987
.02
.0080
.0578
.0871
.1255
.1628
.1985
.2224
.2642
.2939
.3212
.3461
.3686
.3888
.4066
.4222
.4357
.4474
.4573
.4656
.4726
.4783
.4830
.4868
.4898
.4922
.4941
.4956
.4967
.4976
.4982
.4987
.03
.0120
.0517
.0910
.1293
.1664
.2019
.2357
.2673
.2967
.3238
.3485
.3708
.3907
.4082
.4236
.4370
.4484
.4582
.4664
.4732
.4788
.4834
.4871
.4901
.4925
.4943
.4957
.4968
.4977
.4983
.4988
.04
.0160
.0557
.0948
.1331
.1700
.2054
.2389
.2704
.2995
.3264
.3508
.3729
.3925
.4099
.4251
.4382
.4495
.4591
.4671
.4738
.4793
.4838
.4875
.4904
.4927
.4945
.4959
.4969
.4977
.4984
.4988
.05
.0199
.0596
.0987
.1368
.1736
.2088
.2422
.2734
.3023
.3289
.3531
.3749
.3944
.4115
.4265
.4394
.4505
.4599
.4678
.4744
.4798
.4842
.4878
.4906
.4929
.4946
.4960
.4970
.4978
.4984
.4989
.06
.0239
.0636
.1026
.1406
.1772
.2123
.2454
.2764
.3051
.3315
.3554
.3770
.3962
.4131
.4279
.4406
.4515
.4608
.4686
.4750
.4803
.4846
.4881
.4909
.4931
.4948
.4961
.4971
.4979
.4985
.4989
.07
.0279
.0675
.1064
.1443
.1808
.2157
.2486
.2794
.3078
.3340
.3577
.3790
.3980
.4147
.4292
.4418
.4525
.4616
.4693
.4756
.4808
.4850
.4884
.4911
.4932
.4949
.4962
.4972
.4979
.4985
.4989
.08
.0319
.0714
.1103
.1480
.1844
.2190
.2517
.2823
.3106
.3365
.3599
.3810
.3997
.4162
.4306
.4429
.4535
.4625
.4699
.4761
.4812
.4854
.4887
.4913
.4934
.4951
.4963
.4973
.4980
.4986
.4990
.09
.0359
.0753
.1141
.1517
.1879
.2224
.2549
.2852
.3133
.3389
.3621
.3830
.4015
.4177
.4319
.4441
.4545
.4633
.4706
.4767
.4817
.4857
.4890
.4916
.4936
.4952
.4964
.4974
.4981
.4986
.4990
p değerinin yorumlanması
 Makalede sadece p anlamlılık düzeyini (örneğin p<0,05)
vermek yerine tam olarak p değerini vermek okuyucu için
daha bilgilendirici olacaktır.
 P değeri belirlediğimiz anlamlılık düzeyinden küçükse fark
bulunmuştur. 𝑯𝟎 reddedilir.
 P değeri belirlediğimiz anlamlılık düzeyinden büyükse fark
yoktur. 𝑯𝟎 kabul edilir.
Kaynak
1.
2.
Aktürk Z, Acemoğlu H. Sağlık Çalışanları İçin Araştırma ve Pratik İstatistik.
Anadolu Ofset: İstanbul, 2011.
Prof. Dr. Kemal Turhan. Biyoistatistik ppt. Sunumu.