(KS dan Chi Square)

Download Report

Transcript (KS dan Chi Square)

Slide 1

PERTEMUAN KE-3

Statistika Nonparametrik

FITRI CATUR LESTARI, M. Si.

2013


Slide 2

Analisis Pembelajaran
KOMPETENSI UMUM
Mahasiswa dapat memahami dan mampu menggunakan metode-metode statistika
nonparametrik dalam analisis data pada kegiatan penelitian dan persoalan-persoalan seharihari.

KK 14

P 14

C3

KK 13

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Cramer Coefficient C dan uji
Konkordansi Kendall W

KK 9

P9

C3

KK 4

P4

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Chi-Squares (two
independent samples test) dan
uji Tanda

KK 5

P 10

C3

KK 11

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Friedman

P5

C3

KK 6

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Wilcoxon sampel
berpasangan dan sampel
independen

KK 2

C3

banyak populasi

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji korelasi Spearman dan
Kendall Tau

KK 10

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Kruskal-Wallis

P 13

korelasi

P2

P 11

C3

KK 12

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Median dan Cochran Q

P6

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Man-Whitney dan uji Mc
Nemar

C3

KK 3

KK 7

P7

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Jonckheere dan uji Page

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Median dan uji Fisher

P3

P 12

KK 8

P8

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Moses dan Uji WaldWolfowitz

2 populasi

C3

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Kolmogorov-Smirnov/uji
Liliefors dan uji Chi-Squares
(goodness of fit test)

Mahasiswa dapat mengerti
kegunaan dan menggunakan
uji Binomial dan uji Runs

1 populasi
KK 1

P1

C2

Mahasiswa dapat mengerti
penggunaan metode statistika
nonparametrik


Slide 3

Sekilas tentang Kenormalan
 Bagaimana mendeteksi kenormalan secara sederhana?
 Boxplot, Histogram, Scatter Plot, Stem and Leaf Plot

 Bagaimana mendeteksi kenormalan secara tidak
sederhana?
 Alat uji

 Bagaimana jika data berdistribusi tidak normal?
 Transformasi, perbanyak data, metode statistik
nonparametrik

 Bisa jadi ketidaknormalan disebabkan oleh outlier.
Bagaimana solusinya?
 Buang outlier, metode anti outlier


Slide 4

UJI KOLMOGOROV-SMIRNOV


Slide 5

Fungsi dan Esensi
Fungsi:
 Membandingkan distribusi frekuensi kumulatif
hasil pengamatan (sampel) dengan distribusi
frekuensi kumulatif yang diharapkan(teoritis)

Esensi
 Apakah sampel yang kita ambil berasal dari
populasi yang memiliki distribusi normal?
-goodness of fit Tidak hanya distribusi normal uniform, poisson, eksponensial

Skala: minimal ordinal (Siegel,51)


Slide 6

Prosedur
a. Urutkan datanya dari yang terkecil sampai
terbesar
b. Buat distribusi frekuensi kumulatif relatifS(X)
c. Hitung zstandarisasi
d. Hitung distribusi frekuensi kumulatif teoritis
(berdasarkan kurve normal)F(X)
e. Hitung selisih poin (b) dengan poin (d)
f. Hitung D=selisih maksimum poin (e) (nilai
paling besar pada poin (e))
g. Bandingkan dengan D tabel(Ho ditolak jika
D>Dtabel)
 Ada juga yang menggunakan simbol T


Slide 7

Contoh
 Suatu perusahaan penerbangan ingin mengetahui
apakah keterlambatan waktu take-off pesawat-pesawat
terbang di pelabuhan udara X berdistribusi normal. Dari
sampel 11 keterlambatan yang terjadi diketahui (dalam
jam):
1

2

3

4

5

6

7

8

9

10

11

2,1 1,9 3,2 2,8 1,0 5,1 0,9 4,2 3,9 3,6 2,7

Dari
studi-studi
pelabuhan
udara
lainnya
dipertimbangkan bahwa keterlambatan take-off di
pelabuhan udara x akan mempunyai mean 3 jam
dengan simpangan baku 1 jam. Apakah data tersebut
berdistribusi normal?
 Bedanya dengan Lilifors


Slide 8

Penyelesaian

SN(Xi)
no
1
2
3
4
5
6
7
8
9
10
11

a
0,9
1,0
1,9
2,1
2,7
2,8
3,2
3,6
3,9
4,2
5,1

b
0,0909
0,1818
0,2727
0,3636
0,4545
0,5455
0,6364
0,7273
0,8182
0,9091
1,0000

F0(Xi)
c
-2,1
-2,0
-1,1
-0,9
-0,3
-0,2
0,2
0,6
0,9
1,2
2,1

d
0,0179
0,0228
0,1357
0,1841
0,3821
0,4207
0,5793
0,7257
0,8159
0,8849
0,9821

e
0,0730
0,1590
0,1370
0,1795
0,0724
0,1248
0,0571
0,0016
0,0023
0,0242
0,0179


= 0,1795 Ho data berdistribusi normal
 Alpha 10%Dtabeln=11 ____ 0,352
 Data menyebar normal


Slide 9

CONTOH LAGI, kalau ada data kembar


Slide 10

CONTOH LAGI
Berdasarkan penelitian tentang intensitas
penerangan alami yang dilakukan terhadap 18
sampel rumah sederhana, rata-rata
pencahayaan alami di beberapa ruangan dalam
rumah pada sore hari sebagai berikut ; 46, 57,
52, 63, 70, 48, 52, 52, 54, 46, 65, 45, 68, 71, 69,
61, 65, 68 lux. Selidikilah dengan α = 5%,
apakah data tersebut di atas diambil dari
populasi yang berdistribusi normal ?


Slide 11

SPSS-Cara 1
Kolmogorov-Smirnov dari menu Analyze >
Descriptive Statistics > Explore


Slide 12


Slide 13


Slide 14

Tests of Normality
Kolmogorov-Smirnov
Statistic
TOTALHSL

df

.107

a

Shapiro-Wilk
Sig.

44

*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

.200*

Statistic
.966

df

Sig.
44

.372


Slide 15

SPSS-Cara 2


Slide 16


Slide 17

One-Sample Kolmogorov-Smirnov Test
TOTALHSL
N
Normal Parameters

a,b

Most Extreme
Differences

KINER JA

MOTIVASI

IKLIM

KOMITMEN

KEPUASAN

KEPEMIMP

44

46

46

46

46

46

46

Mean

2641.43

39.67

38.72

41.70

38.17

37.61

35.46

Std. Deviation

1014.71

3.11

5.46

5.62

3.84

4.16

6.60

Absolute

.107

.110

.143

.130

.132

.129

.098

Positive

.107

.066

.125

.071

.132

.129

.074

Negative

-.043

-.110

-.143

-.130

-.096

-.091

-.098

Kolmogorov-Smirnov Z

.711

.746

.972

.884

.897

.875

.665

As ymp. Sig. (2-tailed)

.693

.634

.301

.416

.397

.429

.769

a. Test distribution is Normal.
b. Calculated from data.


Slide 18

UJI CHI SQUARE


Slide 19

Fungsi dan Esensi
Fungsi:
 Membandingkan fungsi distribusi random
variabel pengamatan dengan fungsi distribusi
normal

Esensi
 Apakah sampel yang kita ambil berasal dari
populasi yang memiliki distribusi normal?
-goodness of fit-

 Tidak hanya distribusi normal


Slide 20

Formula
Ho menyatakan proporsi sebuah obyek jatuh
pada tiap kategori pada populasi yang diduga
pj*=peluang suatu observasi X termasuk dalam
kelas j (j=1,…,c)
Ei= pj*.N tidak boleh kecil nilainya karena
distribusinya cenderung tidak Chi Square
Cohran menyarankan Ei jangan kurang dari 1
dan tidak lebih dari 20% Ei kurang dari 5
Yarnold
O
O  E 
T 

Tolak Ho jika T>X1-alpha
E
E
2

c

j 1

Siegel, 45

j

j

j

2

c

j

j 1

j

N


Slide 21

Siegel
The size of df reflects the number of
“observations” which are free to vary after
certain restrictions have been placed on the
data
df: k-1 dengan Ei=N/k


Slide 22

CONTOH-Uniform
Grup

1

2

3

4

5

6

7

8

Total

Obs

29

19

18

25

17

10

15

11

144

Eksp

18

18

18

18

18

18

18

18

144

 Hipotesis:
 Ho: Data berdistribusi uniform
 H1: Data tdk berdistribusi uniform






Stat uji: X2
Alpha=1%
Distribusi sampling: dist X2 df=k-1=8-1=7
Daerah penolakan:
 Ho ditolak jika prob. Atau p-value <=0.01

 Keputusan:
 X2 hit =16.3 Terima Ho
 Tapi kalau alpha 5% Tolak Ho

Tabel 1%=18.475
Tabel 5%=14.067


Slide 23

CONTOH-Normal
Grup

1

2

3

4

5

6

7

8

9

10

Total

Obs

8

10

13

15

10

14

12

8

7

6

103

Eksp

10.3

10.3

10.3

10.3

10.3

10.3

10.3

10.3

10.3

10.3

103

X2=8.36
X2 tabel=14.07 Terima Ho: data berdistribusi
normal
Catatan: Derajat bebas


Slide 24

Ekspektasi yang terlalu kecil
Df=1 (k=2)minimal Ei=5
Df>1 (k>2) tidak digunakan jika:
 Lebih dari 20% Ei nya <5
 Ada Ei<1

Penggabungan kategori p50
Jika sudah dikombinasikan/gabung masih Ei
nya <5 maka gunakan uji binomial


Slide 25

Contoh
Apakah data di bawah ini berdistribusi normal
dengan mean 30 dan varians 100?
16,7
17,4
18,1
18,2
18,8
19,3
22,4
22,5
24
24,7

25,9
27
35,1
35,8
36,5
37,6
39,8
42,1
43,2
46,2


Slide 26

Penyelesaian
 w0.25 w0.5 w0.75tabel

xp     wp
 X0.25=30+10(-0.6745)=23.255
 X0.50=30
 X0.75=36.745
 Kelas 1 <=23.255
 Kelas 2 23.255 Kelas 3 30 Kelas 4 >36.745


Slide 27

Oj=8,4,3,5
T=2.8
Alpha 0.05tolak Ho jika T>7.815


Slide 28

Rules of Thumbs
Pilih interval dimana Ekspektasinya : N/k
Jumlah kategori ditentukan sedemikian rupa
sehingga Ekspektasinya antara 6-10 untuk
sampel besar (>200)


Slide 29

PERBANDINGAN


Slide 30

 K-S tidak tergantung pada pengelompokan seperti pada
Chi-Square (CS)
 Jika sampel sedikit, maka K-S lebih powerful
 K-S dapat digunakan pada sampel kecil sekalipun
 Chi Square membutuhkan data skala nominal
 K-S membutuhkan data distribusi kontinu
 KS dan CS bisa digunakan untuk data berskala ordinal
 Presisi KS lebih tinggi karena pada CS terdapat
pengelompokan.
 Pada sampel kecil, KS adalah eksak sedangkan CS
hanya pendekatan eksak.


Slide 31

Terdapat beberapa keuntungan dan kerugian
relatif uji kesesuaian Kolmogorov-Smirnov
dibandingkan dengan uji kesesuaian Kai
Kuadrat, yaitu:
 Data dalam Uji Kolmogorov-Smirnov tidak perlu dilakukan
kategorisasi. Dengan demikian semua informasi hasil pengamatan
terpakai.
 Uji Kolmogorov-Smirnov bisa dipakai untuk semua ukuran sampel,
sedang uji Kai Kuadrat membutuhkan ukuran sampel minimum
tertentu.
 Uji Kolmogorov-Smirnov tidak bisa dipakai untuk memperkirakan
parameter populasi. Sebaliknya uji Kai Kuadrat bisa digunakan
untuk memperkirakan parameterpopulasi,dengan cara mengurangi
derajat bebas sebanyak parameter yang diperkirakan.
 Uji Kolmogorov-Smirnov memakai asumsi bahwa distribusi populasi
teoritis bersifat kontinu.

31


Slide 32

Metode Lilliefors Untuk Uji
Normalitas
Uji lilliefors digunakan bila ukuran sampel (n)
lebih kecil dari 30.
Misalkan sampel acak dengan hasil
pengamatan : x1 ,x2 , …,xn. Akan diuji apakah
sampel tersebut berasal dari populasi
berdistribusi normal atau tidak?

32


Slide 33

Langkah-langkah pengujian:
 Rumuskan Hipotesis:
 Ho : sampel berasal dari populasi berdistribusi normal
 H1 : sampel tidak berasal dari populasi berdistribusi normal

 Tentukan α : taraf nyata
 Susun tabel berikut:







Data diurutkan dari terkecil ke terbesar
Cari rata-rata, simpangan baku sampel
Lakukan standarisasi normal (z=(xi–x) /s)
Hitung peluang F(zi ) = P(zi)
Hitung proporsi yang lebih kecil atau sama dengan zi -> S( zi)
Hitung | F(zi) – S(zi) |

 Statistik Uji :
 Nilai terbesar dari | F(zi) -S(zi) |



33

Dengan α tertentu tentukan titik kritis L
Kriteria uji : tolak Ho jika Lo >= Ltabel , terima dalam hal lainya.


Slide 34

PR
Cari soal dan penyelesaian (sebanyak mungkin)
dari buku referensi (cantumkan sumbernya) ttg
uji liliefors.
Kerjakan menurut kelompok bulan lahir:





Kelompok 1: Januari-Maret
Kelompok 2: April-Juni
Kelompok 3: Juli-September
Kelompok 4: Oktober-Desember

Ketik dan kumpulkan lewat email setelah di
compile oleh PJ
Deadline Senin, tgl 8 April 2013


Slide 35

TERIMA KASIH


Slide 36

Uji Kenormalan
Fitri Catur Lestari, M. Si.
2013


Slide 37

Metode Kolmogorov Smirnov
Persyaratan :
•Data berskala interval atau ratio (kuantitatif)
•Data tunggal/belum dikelompokkan pada table
distribusi frekuensi
•Dapat untuk n besar maupun n kecil.
D = max |Fr – Fs|
Tolak Ho jika D > D (α,n)
Fr = nilai Z
Fs = probabilitas kumulatif empiris


Slide 38

Tabel uji Kolmogorov-Smirnov


Slide 39

Soal :
Suatu penerapan tentang berat badan peserta pelatihan
kebugaran fisik/jasmani dengan sampel sebanyak 27
orang diambil secara random, didapatkan data sebagai
berikut : 78, 78, 95, 90, 78, 80, 82, 77, 72, 84, 68, 67,

87, 78, 77, 88, 97, 89, 97, 98, 70, 72, 70, 69, 67, 90, 97
kg. Selidikilah dengan α= 5%, apakah data tersebut
diambil dari populasi yang berdistribusi normal ?


Slide 40

Penyelesaian :
Hipotesis:
Ho : Data berdistribusi normal
H1 : Data tidak berdistribusi normal
α = 0,05
Statistik uji dan hitung:
X = 81,2963
SD = 10,28372
Dhitung: nilai |Fr-Fs| tertinggi sebagai angka
penguji normalitas, yaitu 0, 1440


Slide 41

Dan seterusnya..


Slide 42

Daerah kritis :
Ho ditolak jika Dhitung>Dn(α) = D27(0,05) = 0,254.
Keputusan :
Terima Ho karena 0,1440 < 0,254

Kesimpulan :
Dengan tingkat kepercayaan 95%, dapat diperkirakan
bahwa data berat badan peserta pelatihan kebugaran
diperoleh dari populasi yg berdistribusi normal.


Slide 43

Metode Goodness-of-fit
Metode Chi square atau χ2 untuk uji Goodness of Fit
Distribusi Normal menggunakan pendekatan
penjumlahan penyimpangan data observasi tiap kelas
dengan nilai yang diharapkan.
Rumus :


Slide 44

Tabel :

Persyaratan :
• Data bersusun berkelompok atau dikelompokkan
dalam table distribusi frekuensi
• Cocok untuk data dengan kebanyakan angka besar (n
> 30)
• Setiap sel harus terisi, yang Ei kurang dari 5
digabungkanlebih baik jika ada referensi


Slide 45

Jika χ2 > nilai χ2 tabel, maka Ho ditolak
Contoh :
Data tinggi badan

Selidiki dengan α = 5%, apakah data diatas
berdistribusi normal ?


Slide 46

Penyelesaian :
Hipotesis:
Ho : Data berdistribusi normal
H1 : Data tidak berdistribusi normal
Alpha= 5%
Statistik uji dan hitung:
X = 165,3 ; SD = 10,36


Slide 47

χ2 = 0,1628
Daerah kritis:
Ho ditolak jika χ2hitung > χ2tabel
Df = (k - 3) = (5 – 3) = 2
Nilai table χ20,05; 2 = 5,991
Keputusan:
Karena | 0,1628 | < | 5,991 | maka Ho diterima
Kesimpulan:
Dengan tingkat kepercayaan 95%, dapat diperkirakan
bahwa tinggi badan masyarakat kalimas tahun diambil
dari populasi yang berdistribusi normal.


Slide 48

Thank You