(mutlak) Sapma

Download Report

Transcript (mutlak) Sapma

Sapma (Dağılma) ölçüleri
• Mutlak Sapma Ölçüleri
– Değişim aralığı
– Kartil ve Desil aralığı
– Ortalama mutlak sapma
– Standart sapma ve Varyans
• Nispi sapma ölçüleri
– Değişim Katsayısı
II. Sapma ölçüleri
• Bir veri setini meydana getiren elemanlar ortalama değer
etrafında belirli bir dağılış gösterirler. Gözlem değerleri
arasındaki farklılıktan ileri gelen bu durum istatistik olarak
serinin önemli karakteristiklerinden biridir.
• Bilindiği gibi ortalamalar serinin merkezi noktasını
belirlemeye yarayan ölçülerdir. Dağılma ölçüleri ise gözlem
değerlerinin bu merkezi noktadan uzaklaşma durumunu
ortaya koyan ölçülerdir. Aynı ortalamaya sahip seriler farklı
dağılış gösterebilirler. Bu yüzden bir seriyi sadece ortalama
değere göre tanımlamak yanlış olur. Bunun yanı sıra
dağılışının da bilinmesi gerekir.
• Bir seride ortalamanın temsil kabiliyeti ile dağılma ölçüleri
arasında ters bir ilişki vardır. Dağılışı az olan serilerin
ortalamaları daha temsili oldukları halde, dağılışı fazla
olanların ortalamaları seriyi daha az temsil eder. Bu sayede
veri setindeki dağılışın tespiti ortalamanın temsil kabiliyeti
hakkında da bilgi verecektir.
II.1. Mutlak Dağılma Ölçüleri
• Mutlak dağılma ölçüleri ilgili değişkenin kendi ölçüldüğü birim
cinsinden (kg, cm, TL vs) sonuç verir. Bu sebeple mutlak
dağılma ölçüleri olarak adlandırılırlar.
•
• 1.1. Değişim Aralığı
• Gözlem değerlerinin en büyük ve en küçük değeri arasındaki
fark olup, verilerin ne kadarlık bir aralıkta değiştiğini gösterir.
•
R = Xmax – Xmin
• Xi : 12,15,20,30,50,52,58,70,90
• olan bir serinin değişim aralığı R=90-12 =78 olur . Yani gözlem
değerleri 78 birimlik bir aralıkta değişme göstermektedir.
• Bu dağılım ölçüsü oldukça basit ve anlaşılır olmasına karşılık
sadece iki uç değere bağlı olması sebebiyle serideki aşırı
değerlerin etkisi altında kalması zayıf yönünü oluşturur. Sadece
iki uç değeri dikkate alması diğer gözlem değerlerinin
dağılımının hiç dikkate alınmamasına sebep olmaktadır.
•
•
•
•
1.2) Kartil ve Desil Aralığı
Bilindiği gibi değişim aralığı serideki sadece iki uç
değeri dikkate almakta, dolayısıyla aşırı değerlerin
etkisi altında kalmaktadır. Bu durumu ortadan
kaldırmak
için
kartil
ve
desillerden
faydalanılmaktadır. Kartil ve desil aralıkları
kullanılarak gözlem değerleri için daha tutarlı
değişme aralığı belirlenmiş olacaktır.
Kartil aralığı 3. kartil ile 1.kartil arasındaki fark olup
serinin orta bölgesindeki %50’lik gözlem kümesinin
değişim aralığını verir.
Q = Q3 – Q1 şeklinde belirlenir.
Desil aralığı ise 9. desil ile 1.desil arasındaki fark
olup, her iki uçtaki %10 gözlem değeri haricinde
kalan %80 lik gözlem değerinin değişim aralığını
verir.
D = D9 – D1 şeklinde belirlenir.
• Örnek: Bir işletmede belli bir parçayı üreten işçinin bu
•
•
•
•
parçayı üretim süresi gözlemlenmiş ve aşağıdaki veriler elde
edilmiştir. Bu verilere göre parça üretim süresinin;
a) Değişim aralığını
Üretim Süresi Parça Sayısı fi
b) Kartil aralığını
30-35
10
10
35-37
30
40
c) Desil aralığını bulunuz.
37-40
40
80
Çözüm: a) R=Xmax – Xmin
40-42
35
115
R = 60-30 = 30 dakika
42-50
20
135
b) Q = Q3 – Q1 idi
N .h 140 .3
50-60
5
140

 105 . sıradaki
Q3 için
r
4
değer Q3 dür. . Bu değer 40-42 sınıfındadır.
Q3  40 
105  80
* 2  41.43 dakika / parça
35
Benzer şekilde Q1  35 
35  10
* 2  36.67 dakika / parça bulunur.
30
Şu halde kartil aralığı Q = 41,43 - 36.67 = 4,76 dakika olur.
N .h 140 .1

 14olup
r
10
• c) D=D9-D1 idi. D1 için
sınıfındadır. Bu sınıf içindeki değeri;
D1  35 
D1 35-37
14  10
* 2  35.27 dakika / parça
30
N .h 140 .9

 126
r
10
• D9 için
.sıradaki değer olup 42-50 sınıfındadır.
Bu sınıf içindeki D9 değeri şöyle bulunur.
126  115
D9  42 
* 8  46.4 dakika / parça
20
• Desil aralığı ise D = 46,4-35,27 = 11,13 dakika olur.
Burada aşırılıklar yok edildiğinden gözlem değerlerinin ortalamaya
daha yakın dağıldıkları anlaşılmaktadır. Bununla birlikte yukarıda
anlatılan sapma ölçüleri sadece iki değere bağlı olduklarından
serideki bütün değerlerin sapmasını göstermekten uzaktır. Veri
setindeki bütün değerlerin merkez noktadan sapmalarını
gösterecek başka ölçülere ihtiyaç vardır. Bu amaçla ortalama
mutlak sapma ve standart sapma ölçülerinden faydalanılır.
1.3. Ortalama (mutlak) Sapma

• Bilindiği gibi sapmalar serisinin ( ( X i  X )  0)
(aritmetik
ortalamadan sapmalar) toplamı sıfıra eşittir. Bu durumda
sapmalar serisinin ortalaması da sıfır olacağından bir sapma
ölçüsü elde etmek mümkün değildir. Serinin toplamını sıfır
olmaktan kurtarabilmek için mutlak sapmalar dikkate
alınabilir. Çünkü mutlak sapmalar serisinin toplamı sıfırdan
büyük olacaktır ( X i  X  0)
Böylece mutlak sapmalar
serisinin ortalaması alınarak yeni bir sapma ölçüsü elde
edilebilir. Bu sapma ölçüsü diğer iki sapma ölçülerinin aksine
serinin bütün değerlerini dikkate almaktadır. Bu sebeple
daha kullanışlı ve daha temsili bir sapma ölçüsü elde edilmiş
olmaktadır.
Ortalama (mutlak) sapma formülleri
• Ortalama sapmayı şöyle formüle edebiliriz.
• Basit Seride
O.S 
X

i
X
N

• Tasnif Edilmiş Seride
 fi X  X
O.S 
 fi
i

 fi m  X
O.S 
 fi
i
• Gruplanmış Seride
Örnek: Bir atölyede üretim hattında günlük olarak üretilen
mamul sayılarının dağılımı aşağıda verilmiştir. Günlük
üretimin ortalama sapmasını bulunuz.
Mamul
Sayısı
(Xi)
Gün
Sayısı
(fi)
33
2
34
5
35
9
36
30
37
20
38
16
39
5
40
3
Toplam
90
fi.Xi


X i  X fi X i  X
• Aritmetik ortalama
66
-3,5
7

fiXi 3286


 36,5
170
-2,5
12,5 X 
fi
90

315
-1,5
13,5
• Ortalama sapma
1080 -0,5
15

740
0,5
10
 fi Xi  X 105
O.S 

608
1,5
24
fi
90

195
2,5
12,5
OS = 1,167 adet/gün
120
3,5
10,5
3286
105
Örnek:
Bir ağrı kesicinin insanlar üzerinden ne kadar süre ile etkili
olduğunu belirlemek için yapılan araştırmada, ağrı kesicinin
etkinlik süresinin aşağıdaki gibi dağıldığı gözlenmiştir.
Bu verilere göre etkinlik sürenin ortalama sapmasını bulunuz.
• Aritmetik ortalama
Etkin.Sür Hast.Say mi fi.mi

(saat)
mi  X

fi mi  X
2-5
10
3,5
35
-5,8
58
5-8
30
6,5
195
-2,8
84
8 - 12
50
12 - 20
16
Toplam
106
10
16
500
256
986
0,7
6,7
35
107,2
284,2

X 
986
 9,3 saat
106
• Ortalama sapma

 fi m i  X
O.S 
 fi

• OS = 2,68 saat
284,2
106
• Ortalama sapma serinin sapmasını iyi bir şekilde ölçmektedir. Ancak mutlak
işlemler gerektirmesi bu sapma ölçüsünün aritmetik işlemlere elverişsiz
olmasına sebep olmaktadır. Bu sebeple istatistik analizde kullanılması
mümkün olamamaktadır.
1.4-Standart Sapma
• Serideki gözlem değerlerinin aritmetik ortalamadan
sapmaları (sapmalar serisi) toplamı sıfır idi. Bu durumu
daha önce mutlak değer almak suretiyle önlemiş olduk.
Ancak bu yol aritmetik işlemler için elverişli
olmamaktadır. Mutlak işlemler yerine kare alma yolu ile
sapmalar serisi toplamı sıfır olmaktan kurtarılabilir.
Böylece yeni bir sapma ölçüsü elde edilmektedir.
• Standart sapma,
sapmalar serisinin (aritmetik
ortalamadan sapmalar) kareli ortalamasıdır. Yani
gözlem değerlerinin aritmetik ortalamadan sapmalarının
kareli ortalamasına standart sapma denir. Standart
sapmanın karesine varyans adı verilir. Kütle ve örnek
standart sapması için aşağıdaki formüller kullanılır.
Standart sapma formülleri
• Aşağıda farklı seri ve veri türü için standart sapmanın
formülleri verilmiştir.

Basit seri
Tasnif
edilmiş
seri
Gruplanmış
seri
Kütle

 ( Xi  X )

 fi( Xi  X ) Örnek
 fi

Kütle

Örnek S 
 ( Xi  X )
2
 fi(m i  X ) Örnek
 fi
S


fi(m i  X ) 2
( fi)  1

2
S
2
n 1
N

Kütle

2
 fi( Xi  X )
( fi )  1
2
• Yukarıdaki formüllerde örnek verileri için standart sapma
formüllerinde paydada (n-1) serbestlik derecesi kullanılmıştır.
Örnek hacmi büyük olduğunda bu düzeltmeye ihtiyaç kalmaz.
Servis isteği
• Örnek: Bir beyaz eşya
servis merkezine gelen
3
günlük servis isteklerinin
4
dağılımı ile ilgili aşağıdaki
veriler elde edilmiştir. Bu
5
verilere göre servis
7
merkezine gelen günlük
servis isteklerinin
10
aritmetik ortalamasını ve
13
standart sapmasını
bulunuz.
∑Xi=42
• Aritmetik ortalama:
X

X 
n

Xi  X
-4
-3
-2
0
3
6
( X i  X )2
16
9
4
0
9
36
∑74
42
 X 7
6

• Standart sapma
• s = 3,85
S
2
(
Xi

X
)

N 1

74
 14,8
6 1
• Örnek:
Doğru, yanlış şeklinde cevap şıkları olan 10 soruya öğrencilerin
verdikleri doğru cevap sayılarının dağılımı aşağıda verilmiştir. Bu
serinin standart sapmasını ve varyansını bulunuz.
Doğru Cevap.
Sayısı
Öğr. Sayısı
(fi)
fi.Xi
2
2
4
-4,69
43,99
3
4
12
-3,69
54,46
4
5
20
-2,69
36,18
5
10
50
-1,69
28,56
6
20
120
-0,69
9,52
7
30
210
0,31
2,88
8
20
160
1,31
34,32
9
10
90
2,31
53,36
10
3
30
3,31
32,87
Toplam
104
696

Xi  X

fi ( Xi  X ) 2
296,15
• Çözüm: Yukarıdaki verileri kütle verisi olarak kabul ederek
çözelim. Çözüm için önce aritmetik ortalamanın hesaplanması
gerekir.

696
X 
 6,69
104
• Aritmetik ortalamadan farklar serisi oluşturularak standart
sapma elde edilir.



fi ( Xi  X ) 2
 fi
296 ,15
   1,687 varyans :  2  2,847
104

• Yukarıdaki verileri örnek kabul edersek standart sapma şöyle
olur.

S

fi ( Xi  X ) 2
( fi )  1

296 ,15
 S  1,6956 varyans s 2  2,875
103
• Örnek hacmi büyük olduğundan kütle ve örnek varyansları
arasında önemli bir fark çıkmamıştır.
• Örnek: Bir liseden mezun olan ve ÖSS sınavına giren
öğrencilerin puanlarının dağılımı aşağıda verilmiştir. Buna
göre öğrenci puanlarının standart sapmasını bulunuz.


ÖSS Puanları
Öğr.Sayısı
mi
fi.mi
mi  X
fi (m i  X ) 2
90-110
10
100
1000
-37,9
14364,1
110-130
30
120
3600
-17,9
9612,3
130-150
50
140
7000
2,1
220,5
150-170
25
160
4000
22,1
12210,25
170-210
5
190
950
52,1
13572,05
Toplam
120
16550
49979,2
16550
Ortalama : X 
 137 ,9 puan
120
Standart sapma  


fi (mi  X ) 2
 fi

49979 ,2
   20,4 puan
120
Standart sapmanın kısa yoldan hesaplanması
•
•

2 

2
2
(
Xi

X
)

ifadesi açılarak yazılırsa;
N
( Xi


2
 2

 2 X . Xi  X ) şeklinde yazılabilir.
N
2
Xi


Xi N X

 2. X .

2

• Bu ifade ayırarak yazılırsa
N
2
•  Xi
olduğuna göre;
 Xi
2
N
•
K
,
N


N
N
2
olur.
X
 2  K 2  2X . X  X 2  K 2  2X 2  X 2
olur. Buna göre;
• Standart sapma kısa yoldan   K 2  X 2 şeklinde yazılır.
• Şu halde varyans kareli ortalamanın karesinden aritmetik
ortalamanın karesinin farkına eşit olup, bunun kare kökü
standart sapmaya eşit olur.
Örnek: Yukarıdaki ÖSS örneği için standart sapmayı kısa
yoldan hesaplayınız.
• Aritmetik ortalama
22000
X
 146 ,67 puan
150
• Kareli ortalama
3328000
2
K 
 22186 ,67
150
• Standart sapma
  K2  X 2
  22186 ,67  146 ,67
2
ÖSS
Puanları
Öğr.Sa
yısı
mi
fi.mi
fi.mi2
90-110
10
100
1000
100000
110-130
30
120
3600
432000
130-150
50
140
7000
980000
150-170
30
160
4800
768000
170-190
20
180
3600
648000
190-210
10
200
2000
400000
22000
3328000
Toplam
  674,58    25,97puan
150
Standart sapmanın kısa yoldan hesabı
• Kütle verisi için standart sapma (kısa yol formülünün
farklı yazılışı)
2
2
X

N
X
• Basit seride    i
N
• Tasnif edilmiş seride  
• Gruplanmış seride

2
2
f
X

N
X
 i i
f
i
 f m  NX
f
i
2
i
2
i
• Örnek verisi için standart sapma hesaplamak için
payda N-1 serbestlik derecesi ile bölünür.
S
X
2
i
 NX 2
N 1
Örnek:
Bir çekme halatının kopma kuvveti için yapılan
deneyde aşağıdaki sonuçlar elde edilmiştir. Kopma
kuvvetinin standart sapmasını yukarıdaki formülden
hesaplayınız.
Kopma Halat
kuvveti sayısı
5–7
3
7–9
7
9 – 11
10
11 - 13
5
Toplam
25

mi
f i mi
mi2
f i mi 2
6
8
10
18
56
100
36
64
100
108
448
1000
12
60
234
144
720
2276
2
2
f
m

N
X
 i i
N
fm

X
f
i
i
i
234
X
25
X  9,36
2276 25 9,362
85,76


   1,85
25
25
Standart Sapmanın Özellikleri:
• Matematik işlemler için uygun bir dağılma ölçüsüdür. Bu
sebeple en yaygın kullanılan ölçüdür.
• Standart sapmada aritmetik ortalama gibi istatistik analiz
için temel ölçülerden birisidir.
• Genel olarak standart sapma ortalama sapmadan daha
büyüktür. (OS < )
• N1 ve N2 gözlemden oluşan iki serinin ortalamaları aynı ve
sırayla varyansları 12 ve 22 olsun. Bu iki serinin
birleştirilmiş ortak varyansı .
N1 . 1  N 2 . 2
 
N1  N 2
2
•
2
2
şeklinde olur.
II. 2. Nispi sapma ölçüleri
• Mutlak dağılma ölçüleri gözlem değerlerinin ifade edildiği
birimler cinsinden sonuç vermekte idi. Mutlak dağılma
ölçülerinin bu özelliği farklı birimlerle ifade edilen serilerin
değişkenliklerini karşılaştırma imkanı vermemektedir. Diğer
taraftan aynı birimle ifade edilen serilerde bile gözlem değerleri
arttıkça mutlak dağılma ölçüleri de buna paralel olarak
artmaktadır. Bu durumda aynı cins serilerin dağılımlarını da
mutlak sapma ölçüleri ile karşılaştırmak çoğu zaman mümkün
olamamaktadır.
• Nispi dağılma ölçüleri serideki gözlem değerlerinin ölçüldüğü
birim farklılıklarını ortadan kaldırmakta ve değişkenliği yüzde(%)
cinsinden ifade etmektedir. Böylece nisbi dağılma ölçüleri farklı
birimlerle ifade edilen ve farklı büyüklüklerdeki serileri aynı cins
ve büyüklükte ifade etme imkanı tanımaktadır. Nispi sapma
ölçüleri bu özellikleri dolayısıyla farklı birimlerle ölçülmüş, farklı
büyüklük
ve
özelliklerdeki
verilerin
sapmalarının
karşılaştırılmasına imkan sağlamaktadır
2.1. Değişim Katsayısı
• Standart sapmanın ortalamanın bir yüzdesi olarak ifade
edilmesine değişim katsayısı adı verilir. Bu tanıma göre
standart sapmanın büyüklüğü aritmetik ortalamaya göre
ifade edilmektedir.

D.K  .100
X
• Bu ölçü farklı cins ve büyüklüklerdeki serileri aynı cins ve
büyüklükte (yüzde cinsinden) ifade etme imkanı
sağlamaktadır. Ancak bu ölçünün bir dezavantajı bir üst
sınırının olmamasıdır. Yani değişim katsayısı %100 ü
geçen değerler de alabilmesi bu ölçünün zayıf tarafıdır.
Eğer bu ölçünün üst sınırı %100 olsaydı verinin
değişkenliğini daha iyi yorumlamak mümkün olurdu.
Özellikle ortalaması sıfıra yakın seriler için kullanımı pek
uygun değildir.
Örnek:
• Konutlarda tüketilen aylık elektrik ve su miktarları için
aşağıdaki veriler elde edilmiştir. Değişim katsayılarını bularak
hangi grupta değişikliğin daha fazla olduğunu araştırın.
Elekt. Tük.(kw/h) Konut Say.(fi)
mi
fi.mi
fi.mi2
50-100
10
75
750
56250
100-150
20
125
2500
312500
150-200
30
175
5250
918750
200-300
15
250
3750
937500
300-500
5
400
200
800000
• Elektrik Tüketimi İçin:

14250
X 
 178,125
80
 2
K2 
3025000
 37812 ,5
80
  K  X  37812 ,5  178,125 2  6083 ,98  78

78
D
.
K


100

D
.
K

100 DK  %44,8
• Değişim katsayısı:

178,125
X
2
Su Tük.(ton/h)
Konut Say.
mi
fi.mi
fi.mi2
5-15
10
10
100
1000
15-25
30
20
600
12000
25-35
40
30
1200
36000
35-45
20
40
800
32000
45-65
10
55
550
30250
• Su Tüketimi İçin değişim katsayısı;

X 
3250
 29,55
110
K2 
111250
 1011,4
110
 2
  K  X  1011,4  29,55 2  138,16  11,75

11,75
DK  %39,76
2
D.K 

X
.100  D.K 
29,55
.100
• Bu verilere göre elektrik tüketiminin değişkenliği (DK=44,8)
su tüketiminin değişkenliğine göre (DK=39.7) daha fazladır.