Nicel/Nitel verilerde konum ve değişim ölçüleri

Download Report

Transcript Nicel/Nitel verilerde konum ve değişim ölçüleri

Nicel / Nitel Verilerde
Konum ve Değişim Ölçüleri
BBY252 Araştırma Yöntemleri
2012-2013 Bahar Dönemi
5 Nisan 2013
1
Ders İçeriği
•
•
•
•
•
•
•
•
•
•
•
•
Aritmetik ortalama, tepe değeri, ortanca, aralarındaki İlişki
Boxplot
Yüzdelikler, çeyrek değerler, ondalıklar
Ağırlıklı ortalama, geometrik ortalama, harmonik ortalama,
karesel ortalama
Değişim genişliği, çeyrek sapma, mutlak sapma
Varyans ve standart sapma, standart hata, değişim katsayısı
Çarpıklık, basıklık (simetrik, sağa çarpık, sola çarpık
dağılımlar, sivri dağılım, basık dağılım, uniform dağılım,
bimodal dağılım)
Sapan değer
Nicel verilerde sıklık dağılımının normal dağılım ile
karşılaştırılması
Nitel verilerde sıklık oranları ve varyans
Standartlaştırma/dönüştürme (transformation)
2
Tanımlayıcı İstatistikler, Excel ve PASW uygulamaları
Konum ölçüleri
• Merkezi eğilim ölçüleri
• Verilerin ortalamaya göre olan gruplanması
nasıl? Yakın, uzak?
• Aritmetik ortalama
• Ortanca
• Tepe değeri
Stephen and Hornby, 1997, s. 50
3
Değişim ölçüleri
• Dağılım ölçüleri
• Verilerin değişkenliği nasıl?
• Dağılım genişliği
• Standart sapma
Stephen and Hornby, 1997, s. 50
4
En önemlileri
• Aritmetik ortalama
• Standart sapma
• Çıkarsamalı istatistik
Stephen and Hornby, 1997, s. 50
5
Aritmetik ortalama, ortanca, tepe değeri
6
7
8
9
Aritmetik ortalama, ortanca, tepe değeri
• Mean = aritmetik ortalama
• Median = ortanca
• Mode = tepe değeri
10
Tepe değeri
•
•
•
•
Aileler üzerinde bir araştırma
Anket
Soru: Çocuk sayısı: ……
Örnekleme alınan ailelerin ortalama çocuk
sayısı hesaplanması
• Aritmetik ortalama: 2,3
• Tepe değeri: 2
• 0,3 çocuk ?
Stephen and Hornby, 1997, s. 51
11
Tepe değeri
• Uç değerlerden etkilenmez
• Kesikli veriler için en uygun merkezi eğilim
ölçüsü
• Birden çok tepe değeri söz konusuysa merkezi
eğilim ölçüsü olarak aritmetik ortalama ya da
ortancayı kullanmak daha doğru
Stephen and Hornby, 1997, s. 60
12
Tepe değeri
• Bir dağılımda en sık görülen değer
• Aşağıdaki dağılıma ait tepe değeri nedir?
4, 5, 4, 6, 7, 6, 7, 9, 7, 7, 9, 9, 3, 3, 6, 2, 2, 1, 3
• Her sayıdan kaç tane var?
1
2
3
4
5
6
7
8
1 tane 2 tane 3 tane 2 tane 1 tane 3 tane 4 tane Yok
Stephen and Hornby, 1997, s. 51
9
3 tane
13
Tepe değeri
• Her veri türü için hesaplanması mümkün
– aralıklı, oranlı, sıralama, sınıflama
Yaş
Sıklık
Birikimli sıklık
-
-
<50
0
5-9
3
<10
3
10-14
16
<15
19
15-19
17
<20
36
20-24
7
<25
43
25-29
3
<30
46
30-34
2
<35
48
Stephen and Hornby, 1997, s. 51
14
Tepe değeri
• 2 veya daha fazla tepe değeri olursa ?
• 3, 4, 5, 4, 6, 7, 6, 1, 7, 9, 7, 7, 9, 9, 3, 9, 3, 6, 2, 2, 1, 3
1
2
3
4
5
6
7
8
2 tane 2 tane 4 tane 2 tane 1 tane 3 tane 4 tane Yok
9
4 tane
• Böyle durumlarda merkezi eğilim/konum ölçüsü
olarak ortanca kullanılmalı
Stephen and Hornby, 1997, s. 51-52
15
Tepe değeri
• Tekstil sektöründe kullanımı – en çok satılan
bedenden en fazla üretmek
• Merkezi eğilim/konum ölçmede her zaman çok
kesin bir değer olmadığı için ileri
hesaplamalarda kullanımı az
Stephen and Hornby, 1997, s. 52, 59
16
Ortanca
• Veri setinin alt ve üst limitlerinin net olarak
bilinmediği durumlarda yararlı
Ailedeki çocuk sayısı
Aile sayısı
<3
5
3
4
4
4
5
3
>5
1
Stephen and Hornby, 1997, s. 60
17
Ortanca
• Dağılımı 2 eşit parçaya bölen değer
• Sıralanmış veri setleri için
• Ortancanın bulunması için
– Verileri küçükten büyüğe sırala
– Veri sayısı tek ise en ortadaki değer ortanca
– Veri sayısı çift ise en ortadaki iki değerin aritmetik
ortalaması ortanca
• Veri setinin alt ve üst limitlerinin net olarak
bilinmediği durumlarda yararlı
Stephen and Hornby, 1997, s. 52
18
Ortanca
• Alanımız ile ilgili belli 7 kitabın Bilgi ve Belge
Yönetimi Bölümü öğrencileri tarafından
kütüphaneden ödünç alınma sayıları
• 5, 7, 10, 8, 6, 11, 13
• Ortanca?
– Küçükten büyüğe sırala: 5, 6, 7, 8, 10, 11, 13
– 7 tane veri: Tek sayı
– En ortadaki değer: 4. değer = 8
Stephen and Hornby, 1997, s. 52
19
Ortanca
• En ortadaki değer nasıl bulunur?
– Büyük veri setleri söz konusu olduğunda
• (N+1) / 2
• N, veri sayısı
• 7 tane veri varsa
– (7+1)/2 = 4
– En ortadaki değer 4. sıradaki değer
Stephen and Hornby, 1997, s. 52
20
Ortanca
• Veri sayısı çift ise en ortadaki değer nasıl
bulunur?
• 4, 5, 7, 10, 12, 14
– Veri sayısı 6
– (N+1) / 2 = (3+1)/2 = 3,5 ??
– 4, 5, 7, 10, 12, 14
– (N/2 + (N/2 + 1)) / 2
– (3.değer + 4. değer) / 2 = (7 + 10) / 2 = 8,5
– 4, 5, 7, 10, 12, 14
Stephen and Hornby, 1997, s. 53
21
Ortanca
• En önemli avantajı
– Uç / aykırı değerlerden etkilenmez
– Uç /aykırı değer: Dağılımın geneline göre çok
büyük ve çok küçük değerle
• Dağılımdaki tüm değerleri değil en ortadaki bir
ya da iki değeri dikkate alması
– Verilerin dağılımı geniş ise uygun merkezi
eğilim/konum ölçüsü olmayabilir
Stephen and Hornby, 1997, s. 53
22
Ortanca
• Gruplandırılmış veriler için ortanca hesaplama
Yaş
Sıklık
Birikimli sıklık
-
-
<50
0
5-9
3
<10
3
10-14
16
<15
19
15-19
17
<20
36
20-24
7
<25
43
25-29
3
<30
46
30-34
2
<35
48
Stephen and Hornby, 1997, s. 53-54
- Veri sayısı = 48
- Çift
- N/2 = 24
- N/2 +1 = 25
- (24. değer + 25. değer) / 2
- 24. ve 25. değerin yer aldığı
yaş grubu: 15-19
- 24. ve 25. kişi bu gruptaki 5
ve 6. kişiler. Çünkü, 10-14 yaş
grubundaki son kişi 19. kişi ve
24-19=5 ve 25-19=6
- Ortanca yaş: 15 + ((5/17).5)
- 16,47
23
Ortanca
• Ortanca yaş: 15 + ((5/17).5) = - 16,47
– 15: Grup alt sınırı
– 5: 24- 19
Yaş
– 17: Sıklık
5-9
– 5: 19-15
Stephen and Hornby, 1997, s. 54
Sıklık
Birikimli sıklık
-
<50
0
3
<10
3
10-14
16
<15
19
15-19
17
<20
36
20-24
7
<25
43
25-29
3
<30
46
30-34
2
<35
48
24
Aritmetik ortalama
• Anlaşılması ve hesaplanması kolay
• En çok kullanılan merkezi eğilim ölçüsü
– İstatistiksel hesaplamalar için temel oluşturması
• Dağılımdaki tüm değerler hesaplamaya dahil
– Çok büyük ve çok küçük değerlerden etkilenme
– Çok yüksek not alan bir kişinin sınıfın not ortalamasını
yükseltmesi gibi
• Kesikli değişkenler için kullanımı pek uygun değil
– Ailedeki çocuk sayısı 2,3
– Öğrencilerin derse gelmediği gün sayısı 4,4
• Evrenden alınacak farklı örneklemler için en az
değişecek merkezi eğilim ölçüsü
Stephen and Hornby, 1997, s. 54, 59
25
Aritmetik ortalama
• Tüm değerlerin toplamı / Veri sayısı
11, 20, 16, 14, 23, 31, 15, 5, 10, 13, 11, 17, 26, 16, 14, 33, 17, 24, 17, 18,
21, 18, 15, 16, 22, 14, 15, 14, 10, 27, 10, 13, 12, 10, 7, 20, 10, 18, 21, 13,
19, 25, 6, 11, 15, 17, 12, 15
• (11+20+16+ … +17+12+15) / 48 = 16, 3
Stephen and Hornby, 1997, s. 54-55
26
Aritmetik ortalama
• Gruplandırılmış veriler için nasıl hesaplanır?
• Kesikli veri ise (Örn. Ailedeki çocuk sayısı)
–
–
–
–
10-14, 15-19, 20-24, 25-29, etc.
9,5-14,5 ; 14,5-19,5 ; 19,5- 24,5 ; 24,5-29,5 etc.
Orta noktalar: (9,5+14,5) / 2, (14,5+19,5) / 2, …
Orta noktalar: 12, 17, …
• Sürekli veri ise (Örn. Ağırlık)
–
–
–
–
10-14, 15-19, 20-24, 25-29, etc.
10-14,9 ; 15-19,9 ; 20-24,9 etc.
Orta noktalar: (10+15) /2, (15+20) / 2, etc.
Orta noktalar: 12,5 ; 17,5 etc.
Stephen and Hornby, 1997, s. 56-57
27
Aritmetik ortalama
• Orta noktalar bulundu. Aritmetik ortalama ?
Yaş
Sıklık
Orta noktalar
Yaş (orta nokta x sıklık)
5-9
3
7,5
3 x 7,5 = 22,5
10-14
16
12,5
16 x 12,5 = 200
15-19
17
17,5
17 x 17,5 = 297,5
20-24
7
22,5
7 x 22,5 = 157,5
25-29
3
27,5
3 x 27,5 = 82,5
30-34
2
32,5
2 x 32,5 = 65
Toplam 825
Aritmetik ortalama 825 / 48 = 17,19
Stephen and Hornby, 1997, s. 58
28
Aritmetik ortalama
• Gruplandırılmış veriler için aritmetik ortalama
hesaplanması (Özet)
1
2
3
4
5
• Orta noktaların bulunması
• Tablo oluşturulması
• Orta noktalar ile sıklıkların çarpılması
• 3. adımda elde edilen değerlerin toplanması
• Elde edilen toplamın toplam veri sayısına bölünmesi
Stephen and Hornby, 1997, s. 58
29
Aritmetik ortalama, ortanca, tepe değeri
• Her zaman eşit değil
Stephen and Hornby, 1997, s. 54
30
Aritmetik ortalama, ortanca, tepe değeri
• Her zaman eşit değil
• Sağa çarpık (pozitif yönlü, + yöne eğimli)
– Aritmetik ortalama>Ortanca>Tepe Değeri
• Sola çarpık (negatif yönlü, - yöne eğimli)
– Aritmetik ortalama<Ortanca<Tepe Değeri
31
Kaynaklar: Stephen and Hornby, 1997, s. 54; http://hrfiles.blogspot.com/2011_09_01_archive.html
Aritmetik ortalama, ortanca, tepe değeri
• Hangi merkezi eğilim ölçüsü hangi değişken
türü için uygun
Tepe değeri
Ortanca
Aritmetik ortalama
Sınıflama
+
-
-
Sıralama
+
+
-
Aralıklı/Oranlı
+
+
+
Stephen and Hornby, 1997, s. 54
32
Ödev 1
Aşağıdaki verileri kullanarak dağılım için ortalama,
ortanca ve tepe değerini hesaplayınız
16, 23, 21, 11, 18, 20, 17, 19, 18, 14, 23, 18, 13, 22,
19, 22, 5, 21, 24, 13, 22, 11, 20, 13, 14, 22, 12, 8,
21, 13, 24, 18, 20, 17, 22, 23, 25, 16, 22, 12, 28, 20,
13, 21, 16, 15, 22, 20, 22, 18, 19, 20, 29, 7, 21, 21,
26, 25, 18, 13, 5, 20, 17, 12, 20, 19, 23, 28, 16, 10,
10, 15, 13, 15, 19, 21, 20, 5, 11, 23, 19, 20, 19, 16,
14, 16, 20, 13, 14, 24, 20, 7, 12, 14, 12, 14, 17, 15,
16, 19
33
Ödev 2
Ödev 1’deki verileri aşağıdaki biçimde
gruplandırarak (sıklık değerlerini bularak)
ortalama, ortanca ve tepe değerini hesaplayınız.
Grup
Sıklık
1-5
6-10
11-15
16-20
21-25
26-30
34
Karesel ortalama
Denek değerlerinin kareleri toplamı / Denek sayısı
Saraçbaşı ve Kutsal, 1987, s. 62
35
Ağırlıklı ortalama
• Bir işyerinde çalışan 20 işçinin günlük ücreti 25
TL, 30 işçinin 30 TL, 40 işçinin 32 TL ve 10
işçinin de 40 TL’dir. Bu işyerinde ortalama
ücret kaç liradır?
• (20.25+30.30+40.32+10.40) / 100 = 30,8 TL
• 100 - Toplam işçi sayısı
Saraçbaşı ve Kutsal, 1987, s. 63
36
Geometrik ortalama
• Örneklemdeki denek değerleri çarpımının,
denek sayısı kuvvetinden kökü
• Ölçümler arası değişme oranı olduğunda,
gelişme ve büyüme hızı, indeks
hesaplamalarında
• Aritmetik ortalamaya göre dağılım
sınırlarından daha az etkilenir
Saraçbaşı ve Kutsal, 1987, s. 64
37
Geometrik ortalama
• Bir bölgenin nüfusu 2010 yılında 4.254.670,
2012 yılında ise 4.575.470 kişi ise, 2011 yılı
nüfusunu tahmin ediniz.
• Nüfus oransal artış gösterdiğinden 2011 yılı
nüfusu geometrik ortalamadan tahmin edilir
•
4.254.670 x 4.575.470 = 4.412.155
Saraçbaşı ve Kutsal, 1987, s. 65
38
Harmonik ortalama
• Denek değerlerinin terslerinin, ortalamasının
tersi
•
1
1 1 1
(
𝑛 𝑥1 𝑥2
…
1
)
𝑥𝑛
• Ortalama hız, ortalama fiyat hesaplamalarında
• Aritmetik ortalama > Geometrik ortalama >
Harmonik ortalama
Saraçbaşı ve Kutsal, 1987, s. 68
39
Değişim/dağılım ölçüleri
• Verilerin yayılışını/dağılımını ölçmek için
kullanılan yöntemler
•
•
•
•
Dağılım genişliği
Çeyrek değerler
Standart sapma
…
Stephen and Hornby, 1997, s. 64
40
Değişim/dağılım ölçüleri
• Konum ölçüleri: Sıklık dağılımlarının
karşılaştırılması
• Çok yönlü karşılaştırmalar için konum ölçüleri
yeterli değil
• Örneğin 2 farklı sınıfın matematik sınav
ortalamaları aynı (60), notların dağılımı ve
değişimi farklı olabilir
– İlk sınıfta en düşük puan 40, en yüksek puan 80
– İkinci sınıfta en düşük puan 10, en yüksek puan 90
Saraçbaşı ve Kutsal, 1987, s. 69
41
Dağılım genişliği (Range)
• Bir dağılımdaki en büyük değer – en küçük değer
• Bir fast-food zincirinde çalışan kişilerin yıllık
maaşları: 3.000, 4.000, 7.000, 16.000, 30.000,
38.000, 53.000, 61.000, 88.000 TL
• Dağılım genişliği: 88.000 – 3.000 = 85.000
• Aritmetik ortalama = 320.000 / 10 = 32.000 TL
• Ortalama yıllık maaş, 85.000 TL’lik bir dağılım
genişliği ile 32.000 TL
• Dağılım genişliği merkezi eğilim ölçülerinden
(aritmetik ortalama, ortanca, tepe değeri) biriyle
Stephen and Hornby, 1997, s. 64
42
Dağılım genişliği (Range)
• Hesaplanması oldukça kolay
• Dağılım genişliği merkezi eğilim ölçülerinden
(aritmetik ortalama, ortanca, tepe değeri)
biriyle birlikte verilirse dağılımın değişkenliği
hakkında daha net resmi görmek mümkün
• Herhangi bir konum ölçüsünün alacağı değer
daima dağılım sınırları içinde
Saraçbaşı ve Kutsal, 1987, s. 42; Stephen and Hornby, 1997, s. 64
43
44
45
Çeyrek değerler
• Bir dağılımı dört eşit parçaya bölen değerler
– Birinci çeyrek - İlk %25: Q1
– İkinci çeyrek - İkinci %25 (%50- ortanca): Q2
– Üçüncü çeyrek - Üçüncü %25 (%75): Q3
• Çeyrek değerler genişliği
– Q3 - Q1
• Çeyrek değer genişliği ile ölçülen dağılımın ortada
kalan %50 lik kısmının dağılımı
– En alttaki %25’lik kısım ile en üstteki %25’lik kısmın
ihmal edilmesi
– Uç değerlerin dağılıma etkisini azaltma
Saraçbaşı ve Kutsal, 1987, s.59; Stephen and Hornby, 1997, s. 65
46
Yüzdelikler: Çeyrek değerler, Ondalıklar
• Hesaplama yönünden ortancaya çok benzer
• Ortanca, tepe değeri, çeyrek değerler, ondalıklar
ve yüzdeliklerin hesaplanmasında verilerin
bazıları işlem dahilinde, hepsi değil
• Yüzdelik ≠ Yüzde
– %40: Deneklerin 40/100’ü
– 40. yüzdelik: Deneklerin 40/100’ü kendisinden küçük
değerli, 60/100’ü kendisinden büyük değerli olan
nokta
• Ondalıklar: 10 ve 10’un katları olan yüzdelikler
– Dağılımı 10 eşit parçaya ayırır
Saraçbaşı ve Kutsal, 1987, s. 43, 59-60
47
Çeyrek değer
genişliği nedir?
48
Çeyrek sapma
20 kişinin artış sırasıyla kütüphaneden ödünç aldıkları kitaplar
Ödünç alan Ödünç aldığı
kişi no.
kitap sayısı
Ödünç alan Ödünç aldığı
kişi no
kitap sayısı
1
40
11
93
2
41
12
94
3
43
13
95
4
46
14
108
5
50
15
110
6
50
16
110
7
60
17
140
8
65
18
160
9
75
19
185
10
80
20
220
Saraçbaşı ve Kutsal, 1987, s. 70; Stephen and Hornby, 1997, s. 67
Dağılımı eşit 4
parçaya bölen
değerler
Q1= (n+1) / 4 = 21/4 = 5,25
Q3 = 3(n+1) /4 = 15,75
Çift sayıda veri olduğu için
bu yapılıyor (ortanca
hesabını hatırlayın)
5. Kişi – 50 kitap
16. Kişi – 110 kitap
Çeyrek sapma 60
49
Mutlak sapma
• Bir veri dizisindeki değerlerin ortalamadan
farklılıklarının mutlak değerleri ortalaması
•
1. 𝐷𝑒𝑛𝑒𝑘 𝑑𝑒ğ𝑒𝑟𝑖 −𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎 + … +(𝑛.𝑑𝑒𝑛𝑒𝑘 𝑑𝑒ğ𝑒𝑟𝑖 −𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎)
𝐷𝑒𝑛𝑒𝑘 𝑠𝑎𝑦𝚤𝑠𝚤
Saraçbaşı ve Kutsal, 1987, s. 71
50
Varyans
• Bir dağılımı tanımlayan iki değer: ortalama ve
varyans
• Dağılımdaki deneklerin ortalamadan ayrılışlarının
ortalama ölçüsü
• Kitle varyansı: 𝜎 2
• Örneklem varyansı: 𝑆 2
Saraçbaşı ve Kutsal, 1987, s. 72
51
Standart sapma
• En çok kullanılan değişim ölçüsü
• Önemli bir tanımlayıcı istatistik
• Diğer değişim ölçüleri dağılımdaki tüm değerleri
dikkate almaz
– Dağılım genişliği 2 değeri dikkate alır: en büyük ve en
küçük değer
– Çeyrek değerler genişliği dağılımın en ortadaki %50 lik
kısmını dikkate alır
• Standart sapma dağılımdaki değerlerin her birini
dikkate alır
– Aritmetik ortalamada olduğu gibi
Saraçbaşı ve Kutsal, 1987, s. 72; Stephen and Hornby, 1997, s. 68-69
52
Standart sapma
• Anlamak önemli
– Örnekleme kuramındaki kullanımı
• Simetrik ve tek tepeli dağılımlar için bir değişim ölçüsü
• Verilerin ortalama etrafındaki dağılışı
– Aritmetik ortalama
– Dağılım ne kadar genişse, standart sapma o kadar büyük
• Dağılımdaki deneklerin ortalamadan ayrılışlarının
karesel ortalaması
• Varyansın pozitif karekökü
– Kitle standart sapması: 𝜎
– Örneklem standart sapması: S
Saraçbaşı ve Kutsal, 1987, s. 72; Stephen and Hornby, 1997, s. 69
53
Hangisinin standart sapması daha büyük?
Ortalamalar ile ilgili ne söylersiniz?
54
Standart sapma
• Hesaplanması
Örn: 5 hocanın ödünç aldıkları kitap sayıları
– 15, 25, 26, 20, 14
– Aritmetik ortalama = (15+25+26+20+14) / 5 = 20
– Ortalamadan sapmalar: -5, 5, 6, 0, -6
– Sapmaların kareleri: 25, 25, 36, 0, 36
– Bunların toplamı: 122
– 122/5 = 22,4
– 22,4’ün karekökü 4,9
– Standart sapma 4,9 (5 kitap)
Stephen and Hornby, 1997, s. 69
55
-3 ss
-2 ss
-1 ss
1 ss
2 ss
3 ss
56
Standart normal dağılım
• Deneklerin %68,26’sı (%68)
– Ortalama ± 1 standart sapma sınırları içinde
• Deneklerin %95,44’ü (%95)
– Ortalama ± 2 standart sapma sınırları içinde
• Deneklerin %99,74’ü (%99)
– Ortalama ± 3 standart sapma sınırları içinde
• Deneklerin %100’ü
– Ortalama ± 4 standart sapma sınırları içinde
Saraçbaşı ve Kutsal, 1987, s. 78
57
58
59
60
61
Ödev 3
Öğrencilerin haftalık kütüphanede geçirdikleri zaman bilgileri
aşağıda verilmiştir. Bu dağılımın aritmetik ortalamasını, standart
sapmasını ve çeyrek değerler genişliğini bulunuz.
11, 5, 9, 17, 3, 4, 11, 7, 13, 15, 2, 7, 8, 13, 11, 8, 12, 4, 14, 10, 8, 6,
11, 12, 9, 6, 9, 10, 12, 8, 11, 1, 5, 14, 16, 15, 9, 8, 17, 12, 10, 16,
18, 7, 9, 9, 10, 13, 10, 9
62
Ödev 4
Verileri SPSS’e girerek verilen mod (tepe
değeri), medyan (ortanca), açıklık (dağılım
genişliği), çeyrekler açıklığı (çeyrek sapma)
değerlerini SPSS ile elde etmeye çalışın.
63
Standart hata
• Normal dağılım gösteren bir kitleden çekilen
örneklemlerin ortalamalarının gösterdiği
dağılışın standart sapması
• Örneklem ortalamalarının standart hatası
• Standart hata = S / 𝑛
• Örneklem ortalaması standart hatası ile
birlikte verilir
• Örneklemden hesaplanan her istatistik
değerin kendi standart hatası var
Saraçbaşı ve Kutsal, 1987, s. 76
64
Standart hata
• 30 hastanın kandaki alyuvar sayıları ortalaması
5,398 ve standart sapması 0,3928’dir. Alyuvar
sayılarının ortalamasının standart hatası
nedir?
• Standart hata = 0,3928/ 30 = 0,0717
• 5,398 ± 0,0717 = (5,3263; 5,4697)
• Alınacak farklı örneklemlerden bulunacak
örneklem ortalamalarının değişim aralığı
Saraçbaşı ve Kutsal, 1987, s. 76
65
66
67
Ödev 5
a. Fen bilgisi ve Matematik notlarının aritmetik
ortalamalarını ve standart sapmalarını SPSS ile
hesaplayıp, önceki slaytta bulunan standart hata
değerlerinin doğruluğunu test ediniz (Standart
hata=Standart sapma/ 𝑛)
b. Fen bilgisi ve matematik notları için Ortalama
± Standart hata değerlerini bulunuz.
68
Değişim katsayısı
• (Standart sapma / Ortalama).100
• Standart sapmanın ortalamaya yüzdesi
• Denekler arasındaki değişimin azlığı ya da
çokluğu hakkında bilgi
• % olarak gösterim
• Ortalama yerine ortanca kullanılıyorsa değişim
katsayısı = (Çeyrek sapma / Ortanca).100
Saraçbaşı ve Kutsal, 1987, s. 80
69
Ödev 6
• Verilen iki sıklık dağılımını, değişim
katsayılarına göre karşılaştırınız, yorumlamaya
çalışınız.
– Ortalama 30, standart sapma 3
– Ortalama 105, standart sapma 3
70
Çarpıklık Katsayısı
• Çarpıklık: Ortanca, tepe değeri ve aritmetik
ortalama arasındaki bağıntı
• Çarpıklık katsayısı 0 ise dağılım ortalamaya
göre simetrik
• Çarpıklık katsayısı 0’dan küçük (negatif değerli)
ise dağılım – yöne eğimli, sola çarpık
• Çarpıklık katsayısı 0’dan büyük (pozitif değerli)
ise dağılım + yöne eğimli, sağa çarpık
Saraçbaşı ve Kutsal, 1987, s. 81
71
Aritmetik ortalama, ortanca, tepe değeri
• Her zaman eşit değil
• Sağa çarpık (pozitif yönlü, + yöne eğimli)
– Aritmetik ortalama>Ortanca>Tepe Değeri
• Sola çarpık (negatif yönlü, - yöne eğimli)
– Aritmetik ortalama<Ortanca<Tepe Değeri
72
Kaynaklar: Stephen and Hornby, 1997, s. 54; http://hrfiles.blogspot.com/2011_09_01_archive.html
Basıklık Katsayısı
• Verilerin gösterdiği dağılımın standart normal
dağılıma göre yüksekliği
• Sivri dağılım / basık dağılım
• Basıklık katsayısı 0 ise dağılımın yüksekliği
standart normal dağılıma uygun, aynı
• Basıklık katsayısı 0’dan küçük (negatif değerli)
ise dağılım basık
• Basıklık katsayısı 0’dan büyük (pozitif değerli)
ise dağılım sivri
Saraçbaşı ve Kutsal, 1987, s. 82
73
Standart normal dağılım
74
75
Çarpıklık / Basıklık Katsayısı
• Birlikte verilir
• İkisi de 0 değerini alıyor ise dağılım standart
normal dağılıma uygun dağılmakta
Saraçbaşı ve Kutsal, 1987, s. 82
76
77
78
Ödev 7
• Bu sonuca göre okuma dersinden alınan notlara
ilişkin dağılımın standart normal dağılıma göre
basıklık ve çarpıklık durumunu yorumlayınız.
• Çarpıklık katsayısı = Skewness
• Basıklık katsayısı = Kurtosis
79
Sapan değer (uç değer)
• Diğer denek değerlerine farklı olan değer
• 2, 19, 25, 23, 18, 21, 24 veri dizisinin ortalamasını
bulunuz
–
–
–
–
–
2 sapan değer
2 değerini alarak ve almadan ortalama hesabı
2 değeri alındığında ortalama 18,85
2 değeri alınmadığında ortalama 21,66
2 değeri 18-25 aralığında değişen verilerin
ortalamasını küçültmüştür
• Bu tür dağılımlarda ortalama yerine ortanca
Saraçbaşı ve Kutsal, 1987, s. 82-83
80
Nitel verilerde sıklık oranları ve varyans
• Ortalama yerine yüzde ya da sıklık oranları
• Sınıflar birbirinden bağımsız olduğu için diğer
konum ölçüleri kullanılmıyor
• Her sınıf için varyans ve standart sapma ayrı
ayrı hesaplanır
• Standart hata = Standart sapma / 𝑛
Saraçbaşı ve Kutsal, 1987, s. 84-85
81
Nitel verilerde sıklık oranları ve varyans
• 1975 yılı verilerine göre yurtdışından gelen yabancıların
geliş amaçlarına göre dağılımı
Geliş amacı
Sıklık
Turizm
1.120.000
Öğrenim
6.000
Çalışma
5.000
Göç
800
Diğer
16.000
• Sıklık oranları, varyans, standart sapma, standart hata ?
Saraçbaşı ve Kutsal, 1987, s. 85
82
Nitel verilerde sıklık oranları ve varyans
Geliş amacı
Sıklık
Sıklık oranı
Turizm
1.120.000 1.120.000/1.147.800=0,9758
0,9758.(1-0,9758)=0,0236
Öğrenim
6.000
6.000/1.147.800=0,0052
0,0052.(1-0,0052)=0,00517
Çalışma
5.000
5.000/1.147.800=0,0043
0,0043.(1-0,0043)=0,00428
Göç
800
800/1.147.800=0,0007
0,0007.(1-0,0007)=0,00069
Diğer
16.000
16.000/1.147.800=0,0140
0,0140.(1-0,0140)=0,0138
Toplam
1.147.800
Saraçbaşı ve Kutsal, 1987, s. 85-86
Varyans
83
Nitel verilerde sıklık oranları ve varyans
Varyans
Standart sapma
Standart hata
0,9758.(1-0,9758)=0,0236
0,0236 = 0,1536
0,1536/ 1.147.800 =0,00014
0,0052.(1-0,0052)=0,00517
0,00517 = 0,0719
0,0719/ 1.147.800 =0,00006
0,0043.(1-0,0043)=0,00428
0,00428 = 0,0654
0,0654/ 1.147.800 =0,00006
0,0007.(1-0,0007)=0,00069
0,00069 = 0,0262
0,0262/ 1.147.800 =0,00002
0,0140.(1-0,0140)=0,0138
0,0138 = 0,01174
0,01174/ 1.147.800 =0,0001
Saraçbaşı ve Kutsal, 1987, s. 85-86
84
Boxplot
85
Boxplot
86
Boxplot
Kitchens, 2003, s. 50-58
87
En yüksek not
Q3
Q2
Q1
En düşük not
88
Boxplot
• Medyan çizgisi kutucuğun merkezine yakınsa
– Dağılımın ortadaki %50’lik kısmı simetrik
• Medyan çizgisi birinci çeyrek ya da üçüncü
çeyreğe yakınsa
– Dağılım çarpık
• Kuyrukların uzunluğu
– Eşitse, simetrik dağılım
– Eşit değilse, çarpık dağılım
• Sapan değer varsa
Kitchens, 2003, s. 52
89
90
91
92
Uniform dağılım
93
Uniform dağılım
94
Bimodal dağılım
95
Bimodal dağılım
96
Bimodal dağılım
97
98
Dönüştürme
99
100
101
102
• Continue > Ok dendiğinde,
103
104
105
106
107
108
109