Ortalamalar için Güven Aralığı

Download Report

Transcript Ortalamalar için Güven Aralığı

İTİCÜ
Mühendislik ve Tasarım
Fakültesi
Endüstri Mühendisliği
Bölümü
İSTATİSTİK VE OLASILIK I
11. Hafta: Tahmin Teorisi
Öğr. Gör. Berk Ayvaz
2013
Nokta Tahmini ve Güven Sınırları






Modern istatistik teorisinin en önemli konusu örnek istatistikleri
yardımıyla anakütle parametrelerinin tahmin edilmesidir.
Anakütleden seçilen belirli büyüklükteki tesadüfi bir örnekten elde edilen
istatistikler anakütle parametrelerinin nokta tahminini sağlar.
Bir örnekten elde edilen X istatistiği anakütle ortalaması 𝝁𝒙 ‘in nokta
tahminidir.
Aynı şekilde, örnekten hesaplanan s istatistiği anakütle standart sapması
𝝈𝒙 ’in; p istatistiği ise anakütle oranı P’nin nokta tahminidir.
Yeterince büyük olmaması veya bir örnekten elde edilen istatistiğin bir başka
örnekten sağlanan istatistikle aynı olmayışı yüzünden anakütle parametresini
bir noktada tahmin etmek yanlış sonuçlar doğurabilir.
Bu yüzden anakütle parametresi belirli bir hata seviyesi göz önüne
alınarak belirli bir aralıkta hesaplanır.
Nokta Tahmini ve Güven Sınırları








Hata terimini 𝜶 ile gösterirsek, 1- 𝜶 güven
seviyesinde aralık tahmini yapabiliriz.
Hata terimi normal eğrinin her iki ucunda eşit
olarak yer alır.
Bu 𝜶 /2 ‘lik hata terimlerine karşı gelen ±Z
değerleri tespit edilerek örnek dağılımının
standart hatası ile çarpıldığında hata payı
elde edilir.
Hata payının örnek istatistiğine eklenip
çıkarılmasıyla aralık tahmini yapılır.
Bu şekilde, anakütle parametresinin belirlenen
aralıkta yer aldığını, 1- 𝛼 güven seviyesinde
söyleyebiliriz.
Güven sınırlarından küçük olanına alt güven
sınırı, büyüğüne ise üst güven sınırı denilir.
Hata terimi küçüldükçe güven aralığı
genişler.
Güven sınırlarının tespit edileceği ihtimal
seviyesine göre Z değeri değişir.
𝛼 2
−𝒛𝜶
𝛼 2
0
𝟐
𝑋 − 𝑧𝛼
2
𝜎𝑥
𝑛
𝒛𝜶
𝟐
𝑋 + 𝑧𝛼
1- 𝜶 güven aralığı
2
𝜎𝑥
𝑛
Bazı (1- 𝛂) değerleri için Z tablo değerleri
1-𝜶
𝒁𝜶
1-𝜶
𝒁𝜶
0.99
2.576
0.80
1.282
0.95
1.960
0.60
0.842
0.90
1.645
0.50
0.674
𝟐
𝟐
Ortalamalar için Güven Aralığı


Bir örnekten elde edilen X istatistiği anakütle ortalaması 𝝁𝒙 ‘in nokta
tahminidir.
Bununla birlikte gerçek anakütle ortalaması, 1- 𝜶 güven seviyesinde,
X − 𝒁𝜶/𝟐



≤ 𝝁𝒙 ≤ X + 𝒁𝜶/𝟐
𝛔𝐱
𝐧
aralığında yer alır.
Anakütle standart sapması bilinmediğinde, örnek standart sapması kullanılır.
Sınırlı anakütleden iadesiz örnekleme yapılmışsa, güven sınırları;
X − 𝒁𝜶/𝟐

𝛔𝐱
𝐧
𝛔𝐱
𝐧
𝑁−𝑛
𝑁−1
formülü ile hesaplanır.
≤ 𝜇𝑥 ≤ X + 𝒁𝜶/𝟐
𝛔𝐱
𝐧
𝑁−𝑛
𝑁−1
Ortalamalar için Güven Aralığı


Formüldeki N, anakütle hacmini göstermektedir.
Aşağıdaki grafik, anakütle ortalamasına ait güven sınırlarını göstermektedir.
𝛼 2
𝛼 2
−𝒛𝜶
𝑿 − 𝒛𝜶
𝟐
𝟐
𝝈𝒙
𝒏
0
𝝁𝒙
1- 𝜶 güven aralığı
𝒛𝜶
𝑿 + 𝒛𝜶
𝟐
𝟐
𝝈𝒙
𝒏
Ortalamalar için Güven Aralığı







%95 güven sınırları tesbit edilirken 𝜶 hatası 1 - 0.95 = 0.05’tir.
Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında 𝛼 /2
= 0.05/2 = 0.025 olur.
Bu alanları belirleyen biri negatif diğeri pozitif iki Z değeri vardır.
Normal eğri alanları tablosunda 0.5 - 0.025 = 0.4750 alanına tekabül
eden Z = ±1-96 değerleri aradığımız Z değerleridir.
%99 güven sınırları tesbit edilirken 𝜶 hatası 1-0.99 = 0.01’dir.
Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında 𝛼 /2
= 0.01/2 = 0.005 bulunur.
Normal eğri alanları tablosunda 0.5 - 0.005 = 0.4950 alanına tekabül
eden -2.58 ve 2.58 değerleri aradığımız Z değerleridir.
Örnek 1
Bir fabrikada üretilen 100 mamulün ortalama ağırlığı 1040 g standart
sapması 25 g bulunmuştur. Bu imalat prosesinde üretilen mamullerin
ortalama ağırlığı %95 güvenle hangi aralıkta yer alır?
Çözüm 1


%95 güven seviyesi için Z değerleri ±1.96’dır.
Güven sınırlarını veren formülde diğer bilinenler de yerine
yazıldığında;
X − 𝑍𝛼/2
σx
n
≤ 𝜇𝑥 ≤ X + 𝑍𝛼/2
1040 − 1,96

25
100
σx
n
≤ 𝜇𝑥 ≤ 1040 + 1,96
25
100
1035.1 ≤ 𝝁𝒙 ≤ 1044.9
Sözkonusu imalat prosesinde üretilen mamullerin ortalama ağırlığının,
%95 güvenle, 1035.1 ile 1044.9 aralığında yer alacağım söyleyebiliriz.
Örnek 2
Konserve bezelye üreten bir fabrikadan, üretim sırasında 64 konserve
kutusundan oluşan rassal bir örneklem seçilmiştir. Bu konserve kutularının
ortalama ağırlığı 492 gr. ve standart sapma 12 gr. olarak belirlenmiştir.
Üretilen konservelerin ortalama ağırlığını %95 güven düzeyinde tahmin
ediniz.
Çözüm 2

n = 64 konserve
X= 492 gr.
s = 12 gr.
G.D. = 1 - 𝛼 = 0.95 dolayısıyla 𝛼 = 0.05 olur.
Örneklem hacmi n = 64 birim (n >30 birimdir, ayrıca anakütle hacmi
sonsuzdur.) olduğu için
X’nın örnekleme bölünmesi normaldir (Merkezi Limit Teoremi).
Bu bilgilere göre Z = ± 1.96 alınır. Buna göre;

X − 𝑍𝛼/2

492-1,96






σx
n
12
64
≤ 𝜇𝑥 ≤ X + 𝑍𝛼/2
≤ 𝜇𝑥 ≤ 492+1,96
σx
n
12
64
489,6 ≤ 𝜇𝑥 ≤ 494,94
Örnek 3
Bir anakütleden rastgele seçilen 50 birimin ortalama ağırlığı 4,98 kg
ve
standart
sapması
0,07
kg
olarak
bulunmuştur.
Anakütle ortalamasının %99 güven sınırlarını bulunuz.
Çözüm 3

%99 güven seviyesi için Z değerleri ±2.58’dir.
X − 𝑍𝛼/2
σx
n
4,98 − 2,58

≤ 𝜇𝑥 ≤ X + 𝑍𝛼/2
0,07
50
σx
n
≤ 𝜇𝑥 ≤ 4,98 − 2,58
0,07
50
4,95 ≤ 𝝁𝒙 ≤ 5,01
Söz konusu anakütle ortalamasının, %99 güvenle, 4.95 kg ile 5.01 kg
arasında olmasını bekleriz.
Oranlar için Güven Aralığı


Örnek oranı p anakütle oranı P’nin nokta tahminidir.
Oranlar için güven aralığını veren formül,
𝐩 − 𝐙𝛂/𝟐



≤ 𝐏 ≤ 𝐩 + 𝐙𝛂/𝟐
𝐩(𝟏−𝐩)
𝐧
Görüldüğü üzere örnek oranı bilindiğinde verilen güven seviyesi
için anakütle oranının aralık tahminini yapabiliriz.
Örnekleme sınırlı bir anakütleden iadesiz olarak yapılıyorsa güven
sınırları,
p − Zα/2

𝐩(𝟏−𝐩)
𝐧
p(1−p)
n
𝑁−𝑛
𝑁−1
≤ P ≤ p + Zα/2
Formülü ile hesaplanır.
N, anakütle hacmini göstermektedir.
p(1−p)
n
𝑁−𝑛
𝑁−1
Oranlar için Güven Aralığı

Aşağıdaki grafik anakütle oranı için güven sınırlarını göstermektedir.
𝜶 𝟐
𝜶 𝟐
−𝒛𝜶
0
𝟐
𝐩 − 𝐙𝛂/𝟐
𝐩(𝟏 − 𝐩)
𝐧
𝐏
1- 𝜶 güven aralığı
𝒛𝜶
𝐩 + 𝐙𝛂/𝟐
𝟐
𝐩(𝟏 − 𝐩)
𝐧
Örnek 4
Bir fabrikanın imalatından tesadüfi olarak 200 mamul seçildiğinde bunların
%70’inin
iyi
kalite
mallardan
oluştuğu
gözlenmiştir.
Buna göre, fabrikada üretilen iyi kalite mal oranının, %95 güvenle,
hangi aralıkta olması beklenir?
Çözüm 4
𝜶 𝟐
𝜶 𝟐
−𝒛𝜶
0
𝟐
p − Zα/2
p(1−p)
n
0,7 − 1,96
≤ P ≤ p + Zα/2
0,7(1−0,7)
200
𝒛𝜶
𝟐
p(1−p)
n
≤ P ≤ 0,7 + 1,96
0,7(1−0,7)
200
0.64 < P < 0.76 aralığında yer almasını bekleriz.
Örnek 5
Bir bölgede yaşıyan kişiler arasından A gazetesi okuru olanların oranı
belirlenmek isteniyor. Bu amaçla rassal olarak 200 kişiden oluşan bir
örneklem seçiliyor ve seçilen 200 kişi arasından 58 kişinin A gazetesi okuru
olduğu belirleniyor. Bu bölgedeki A gazetesi okurlarının oranını %95 güven
düzeyinde tahmin ediniz
Çözüm 5






n = 200 kişi
r = 58 kişi
1 - α = 0.95
α = 0.05
P=?
Z = ± 1.96
p − Zα/2
𝑟
p(1−p)
n
≤ P ≤ p + Zα/2
p(1−p)
n
58
p=𝑛=200=0,29
0,29 − 1,96
0,29(1−0,29)
200
≤ P ≤ 0,29 + 1,96
0,22728 ≤ 𝐏 ≤ 0,35272
0,29(1−0,29)
200
Örnek 6
Bir okulda okuyan 800 öğrenciden 100’ü tesadüfi olarak seçildiğinde
bunların
%20’sinin
başarısız
olduğu
gözlenmiştir.
Bu okulda okuyan başarısız öğrencilerin oranının, %99 güvenle
hangi aralıkta bulunduğunu hesaplayınız.
Çözüm 6
p − Zα/2
p(1−p)
n
0,2 − 2,58
≤ P ≤ p + Zα/2
0,2(1−0,2)
100
p(1−p)
n
≤ P ≤ 0,2 + 2,58
0,2(1−0,2)
100
0.0968 < P < 0.3032 aralığında yer almasını bekleriz.
Standart Sapmalar için Güven Aralığı


Örnek standart sapması s, anakütle standart sapması 𝛼’nın nokta
tahminidir.
Nokta tahmininden hareketle anakütle standart sapmasının güven
aralığı,
s−𝒁𝜶/𝟐

𝒔
𝟐𝒏
𝒔
𝟐𝒏
≤ 𝜶 ≤ s+𝒁𝜶/𝟐
formülü ile hesaplanır.
Aşağıdaki grafik anakütle standart sapmasının güven sınırlarını
göstermektedir.
𝛼 2
𝛼 2
−𝒛𝜶
s−𝒛𝜶
𝒔
𝟐 𝟐𝒏
0
𝟐
s
1- 𝜶 güven aralığı
𝒛𝜶
s − 𝒛𝜶
𝟐
𝒔
𝟐
𝟐𝒏
Örnek 7
Bir ekmek fabrikasında üretilen 200 ekmeğin standart sapması 15 gr’dır.
Anakütle standart sapmasının, %95 güvenle hangi aralıkta olduğunu
bulunuz.
Çözüm 7
𝑠
𝑠
≤ 𝛼 ≤ s+𝑍𝛼/2
2n
2n
15
15
1,96
≤ 𝛼 ≤ 15 + 1,96
400
400
s−𝑍𝛼/2
15 −
13,53 ≤ 𝜶 ≤ 16,47

Daha açık bir ifadeyle, sözkonusu fabrikada üretilen ekmekler içini
anakütle standart sapması, %95 güvenle 13.53 gr ile 16.47 gr
arasındadır.
Örnek 8
Bir fabrikada üretilen 150 adet rulmanın çaplan ölçülmüş ve standart sapma
0.12 mm olarak hesaplanmıştır. Fabrikada üretilen rulmanların çaplarına ait
standart sapmanın, %99 ihtimalle,
Çözüm 8
s−𝑍𝛼/2
𝑠
2n
≤ 𝛼 ≤ s+𝑍𝛼/2
0,12 − 2,58
0,12
2(150)
𝑠
2n
≤ 𝛼 ≤ 0,12 + 2,58
0,12
2(150)
0, 𝟏 ≤ 𝜶 ≤ 0,14

Anakütle standart sapmasının, %99 güvenle, yaklaşık olarak 0.10 mm
ile 0.14 mm arasında olmasını bekleriz.
Ortalamalar Arası Fark için Güven Aralığı

Örnek ortalamalarından büyük olanını 𝑋1
ortalamaları arasındaki farktan hareketle
arasındaki farkın güven sınırlarını,
( 𝑿𝟏 − 𝑿𝟐
)+𝒁𝜶/𝟐

𝒔𝟏 𝟐
𝒏𝟏
)- 𝒁𝜶/𝟐
+
𝒔𝟏 𝟐
𝒏𝟏
+
𝒔𝟐 𝟐
𝒏𝟐
formülüyle hesaplayabiliriz.
𝒔𝟐 𝟐
𝒏𝟐
ile gösterirsek örnek
anakütle ortalamaları
≤ (𝝁𝟏 − 𝝁𝟐 ) ≤
( 𝑿𝟏 − 𝑿𝟐
Ortalamalar Arası Fark için Güven Aralığı
 Aşağıdaki
grafik ortalamalar arası farkların güven
sınırlarını göstermektedir.
𝛼 2
𝛼 2
−𝒛𝜶
(𝑿𝟏 − 𝑿𝟐 )−𝒁𝜶/𝟐
0
𝟐
𝒔𝟏 𝟐
𝒔𝟐 𝟐
+
𝒏𝟏
𝒏𝟐
(𝝁𝟏 − 𝝁𝟐 )
1- 𝜶 güven aralığı
𝒛𝜶
𝟐
(𝑿𝟏 − 𝑿𝟐 )+𝒁𝜶/𝟐
𝒔𝟏 𝟐
𝒔𝟐 𝟐
+
𝒏𝟏
𝒏𝟐
Örnek 9
İki ampul fabrikasının birincisinden tesadüfi olarak 100 ampül seçildiğinde
ortalama dayanma süresi 1315 saat ve standart sapma 43 saat bulunuyor.
Aynı yöntemle diğer fabrikadan 90 ampül seçilerek ortalama dayanma süresi 1300
saat
ve
standart
sapma
32
saat
olarak
hesaplanmıştır.
%95 güvenle, anakütle ortalamaları arasındaki farkın güven aralığını bulunuz.
Çözüm 9
(𝑿𝟏 − 𝑿𝟐 )-𝒁𝜶/𝟐
𝒔𝟏 𝟐
𝒏𝟏
(1315 −1300 )-1,96
)+1,96
432
100
+
+
𝒔𝟐 𝟐
𝒏𝟐
432
100
+
≤ (𝝁𝟏 − 𝝁𝟐 ) ≤ (𝑿𝟏 − 𝑿𝟐 )+𝒁𝜶/𝟐
322
90
≤ (𝜇1 − 𝜇2 ) ≤ (1315 −1300
322
90
4,29≤ (𝝁𝟏 − 𝝁𝟐 ) ≤25,71
𝒔𝟏 𝟐
𝒏𝟏
+
𝒔𝟐 𝟐
𝒏𝟐
Örnek 10
100 deneme sonrasında bir benzin pompası, ortalama 125 ml fazla ölçüm yapmış
ve standart sapma 17 ml olmuştur. Bir başka benzin pompası ise 120 deneme
sonrasında deneme başına ortalama 110 ml fazla benzin ölçümü yapmış ve standart
sapma 19 ml bulunmuştur. Anakütle ortalamaları arasındaki farkın, %99 güvenle,
anakütle ortalamaları arasındaki farkın güven aralığını bulunuz
Çözüm 10
(𝑋1 − 𝑋2 )-𝑍𝛼/2
(125 −110)-2,58
𝑠1 2
𝑛1
𝑠2 2
+
172
100
𝑛2
+
≤ (𝜇1 − 𝜇2 ) ≤ (𝑋1 − 𝑋2 )+𝑍𝛼/2
192
120
𝑠1 2
𝑛1
≤ (𝜇1 − 𝜇2 ) ≤ (125 − 110)−2,58
+
𝑠2 2
𝑛2
172
100
+
192
120
8, 𝟕𝟑 ≤ (𝝁𝟏 − 𝝁𝟐 ) ≤21,27
Yani pompaların fazla ölçümleri arasındaki fark %99 güvenle 8.73 ml ile 21.27 ml
arasındadır.
Oranlar Arası Fark için Güven Aralığı

Örnek oranlarından büyük olanını 𝑝1 ile gösterirsek örnek oranları
arasındaki farktan hareketle anakütle oranları arasındaki farkın;
yani, (P1 − P2 ) farkının güven sınırlarını,
(𝒑𝟏 − 𝒑𝟐 ) ± 𝒁𝜶/𝟐

𝒑𝟏 (𝟏 − 𝒑𝟏 )
𝒑𝟐 (𝟏 − 𝒑𝟐 )
+
𝒏𝟏
𝒏𝟐
formülü yardımıyla hesaplayabiliriz.
Oranlar Arası Fark için Güven Aralığı

Aşağıdaki grafik
göstermektedir.
oranlar
arası
farkların
güven
𝛼 2
𝛼 2
−𝒛𝜶
(𝒑𝟏 − 𝒑𝟐 ) − 𝒁𝜶/𝟐
sınırlarını
𝟐
𝒑𝟏 (𝟏 − 𝒑𝟏 )
𝒑𝟐 (𝟏 − 𝒑𝟐 )
+
𝒏𝟏
𝒏𝟐
0
(P1 − P2 )
1- 𝜶 güven aralığı
𝒛𝜶
𝟐
(𝒑𝟏 − 𝒑𝟐 ) + 𝒁𝜶/𝟐
𝒑𝟏 (𝟏 − 𝒑𝟏 )
𝒑𝟐 (𝟏 − 𝒑𝟐 )
+
𝒏𝟏
𝒏𝟐
Örnek 11
A fabrikasından alınan 40 mamul içerisinde 8 kusurlu gözlenirken, B
fabrikasından alınan 60 mamulden 9’u kusurlu çıkmıştır. Fabrikaların
bütün mamulleri için kusur oranları arasındaki farkın, %95 güvenle
aralığını bulunuz.
Çözüm 11
(𝑝1 − 𝑝2 )±𝑍𝛼/2
𝑝1 (1−𝑝1 )
+
n1
(0,20 − 0,15)±1,96
𝑝2 (1−𝑝2 )
n2
0,20(1−0,20)
+
40
0,15(1−0,15)
60
-0,1034≤ (P1 − P2 ) ≤0,2034 aralığında olmasını bekleriz.
Örnek 12
Bir video kaset kiralayıcısı macera filmi kiralamanın erkek ve kadınlar
itibariyle farklılık gösterip göstermediğini araştırmak istemiş ve belirli bir
zaman periyodu içerisinde dükkanına gelen 40 erkekten 13’ünün ve 70
kadından
14’ünün
macera
filmi
kiraladığını
gözlemiştir.
Erkek ve kadınların macera filmi kiralama oranları arasındaki fark %99
güvenle hangi aralıkta bulunur.
Çözüm 12
(p1 − p2 )±Zα/2
p1 (1−p1 )
+
n1
(0,325 − 0,20)±2,58
p2 (1−p2 )
n2
0,325(1−0,325)
+
40
0,20 (1−0,20)
70
-0,1024≤ (P1 − P2 ) ≤0,3524 aralığında olmasını bekleriz.