data - MTI09

Download Report

Transcript data - MTI09

Statistika
2
Statistika: Definisi & Tujuan
Statistika adalah ilmu yang berkaitan dengan
 pengumpulan,
 pengolahan,
 presentasi (deskritif), dan
 interpretasi (inferensi) data
Secara ilmiah dalam kerangka proses
 pengambilan keputusan yang berkaitan dengan
adanya ketidakpastian (resiko) dan variasi.
3
Statistika Deskriptif vs Inferensi
 Statistika deskriptif digunakan apabila peneliti hanya
bertujuan mendapatkan ringkasan data yang
dimilikinya. Ringkasan ini meliputi lokasi pemusatan
data, variabilitas data, dan karakteristik umum distribusi
data.
 Statistika inferensi digunakan apabila peneliti ingin
membuat suatu kesimpulan tertentu atas
karakteristik/hubungan antar beberapa variabel dalam
populasi, diberikan jika hanya memiliki data sampel.
4
Statistika Deskriptif vs Inferensi
 Statistik Deskriptif
- Collect
- Organize
- Summarize
- Display
- Analyze
Tidak dilakukan
generalisasi

Statistik Inferensi
- Memperkirakan dan
meramalkan nilai
parameter populasi
- Menguji hipotesis
tentang nilai
parameter populasi
- Membuat keputusan
Inferensi berdasarkan
keterbatasan informasi
sample
5
Statistika Inferensi
• Statistika inferensi:
–
–
–
Menduga dan meramalkan
(estimasi) nilai parameter
populasi...
Menguji hipotesis nilai parameter
populasi...
Mengambil keputusan...
Melakukan
generalisasi terhadap
populasi...
Berdasarkan statistik sampel
yang diambil dari sejumlah
terbatas (tidak lengkap)
informasi sampel
Observasi pada
sebagian populasi
6
Populasi vs Sampel
Oleh karenanya, lingkup ‘data’ dapat dikategorikan
sebagai:
 populasi merupakan kumpulan semua individu dari
jenis objek yang menjadi perhatian penelitian, dan
 sampel adalah bagian dari populasi yang dapat
dikumpulkan oleh peneliti (sebatas kemampuannya
dalam melakukan pengumpulan data).
Besaran populasi disebut parameter, sedangkan besaran sampel
disebut statistik.
7
Statistik vs Parameter
o Statistik adalah
ukuran karakteristik
sampel.
o
Parameter populasi
adalah ukuran
karakteristik populasi.
Statistik sebagai estimator parameter
• Estimator adalah statistik yang digunakan untuk mengestimasi parameter
•
•
populasi.
Estimasi dari sebuah parameter adalah nilai numerik tertentu (dari statistik
sampel) yang diperoleh melalui sampling.
Titik estimasi adalah sebuah nilai yang digunakan untuk mengestimasi
sebuah parameter populasi.
8
Distribusi dan rata-rata
Rata-rata populasi ()
Distribusi frekuensi
populasi
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
Perbedaan antara
rata-rata sampel
dengan rata-rata
populasi disebut bias
Titik sampel
Sample mean ( X )
9
Proses Sampling & Inferensi
Kaitan populasi dan sampel, serta proses sampling, proses
inferensi & statistika deskriptif:
Sampling
Populasi
Sampel
Statistika
Deskriptif
Inferensi
10
Proses Sampling & Inferensi
 Dapat disimpulkan bahwa statistika berkaitan dengan
proses pengambilan sampel (sampling) sehingga dapat
dilakukan penyajian dan peringkasan data (statistika
deskriptif ) atau lebih jauh lagi dilakukan pendugaan
dan pengujian nilai parameter populasi (statistika
inferensi).
11
Sensus vs Sampling
Sebuah metoda survey yang mencakup seluruh anggota
populasi disebut sensus. Sementara teknik untuk
mengumpulkan informasi dari sebagian populasi disebut
sampling.
12
Sampel Random Sederhana
 Sampling dari populasi dilakukan secara random,
sedemikian sehingga setiap sampel berukuran sama
(n) memiliki kesempatan yang sama untuk diambil
atau dipilih
 Sebuah sampel yang diambil dengan cara tersebut
disebut sebuah sampel random sederhana atau sample
random.
13
Pengambilan Sampel
 Pada statistika inferensi, pengambilan sampel
menentukan hasil inferensi.
 Idealnya sampel diambil secara random.
 Pengambilan sampel yang tidak tepat dapat
menyebabkan bias  systematic error
14
Pengambilan Sampel
Setiap data sampel yang diambil dapat mencakup:
 Nilai sebenarnya (true value),
 Kesalahan sistematis, dan
 Kesalahan acak (random).
Data sampel = true value
+ kesalahan sistematis
+ kesalahan acak
15
Pengambilan Sampel
Data sampel = true value
+ kesalahan sistematis
+ kesalahan acak
Statistika membantu peneliti untuk
mengetahui komponen-komponen nilai
data sampel tersebut.
16
Pengambilan Sampel
 Data sampel selalu mengandung kesalahan karena
adanya “ketidak-pastian (error)”,
Ekspektasi [error] = variansi + (bias)2
 Variansi (kesalahan acak) berkaitan dengan masalah
kepresisian.
 Bias (kesalahan sistematis) berkaitan dengan masalah
akurasi.
17
Presisi  ukuran seberapa jauh suatu tools memberi
hasil yang konsisten  variasi data coefficient
standard error/koefisien kesalahan baku
Akurasi: seberapa tepat suatu tools mengukur apa
yang seharusnya diukur jarak yang diukur dari
target ketepatan menentukan sample dalam
menggambarkan karakteristik populasi
Sample akurasi tinggi: kesimpulan dari sample
menggambarkan karakteristik populasi.
18
Representative sample
Sample yang sebesar mungkin mewakili karakteristik
populasi dikatakan sebagai representative sample.
Besarnya dugaan keterwakilan populasi dalam sampel
dinyatakan dengan (1-α).
Notasi α selanjutnya disebut:
 tingkat keyakinan (confidence) dalam melakukan
pendugaan atau estimasi, dan
 tingkat pembedaan (significance) dalam melakukan
pengujian hipotesis nilai parameter populasi (juga
dikenal sebagai kesalahan tipe pertama).
19
Statistika dan permasalahannya
 Kecil kemungkinan karakteristik sampel persis sama
dengan karakteristik populasi.
 Teori probabilitas membantu kita dalam melakukan
penarikan kesimpulan atas dugaan atau hipotetis yang
terkait dengan karakteristik populasi.
20
Statistika dan permasalahannya
 Peran statistika dan teori probabilitas dalam proses deduksi dan
induksi:
Hipotesis 1  Deduksi  Konsekuensi
Modifikasi (hipotesis 2)  Induksi
Fenomena  Eksperimen  Data
21
Statistika dan permasalahannya
Secara alamiah seorang anak dapat memiliki dugaan
(hipotesis 1) bahwa warna merah umumnya panas dan
warna biru umumnya dingin. Kemudian dia mendapat
pengalaman (deduksi) bahwa ternyata api berwarna biru
dari kompor gas lebih panas dari api berwarna merah
(konsekuensi). Hal ini merubah dugaan awalnya
(induksi) sehingga dia memperoleh dugaan baru
(hipotesis 2).
Dengan cara ini manusia belajar secara alamiah dari
pengalaman yang dihadapi.
22
Statistika dan permasalahannya
Proses deduksi & induksi ini dapat “diciptakan” melalui
eksperimen dengan memanfaatkan statistika dan
probabilitas sehingga dapat diperoleh data atau estimasi
untuk mempercepat proses belajar (tidak perlu menunggu
kejadian alamiah).
23
Statistika dan permasalahannya
Kerangka pemikiran kesisteman dan statistika:
Proses  Variasi  Data  Perbaikan
Falsafah
kesisteman
Analisis
Tindakan
& resiko
Kerangka kerja ini dikenal sebagai Statistical Thinking (Statistical
Division ASQ) yang digunakan sebagai acuan dalam implementasi
statistika di dunia nyata.
24
Skala pengukuran
Ada empat type skala, yaitu:
 Nominal
 Ordinal
 Interval
 Ratio
25
Skala pengukuran
 Skala Nominal – group atau kelas
 Jenis kelamin
 Skala Ordinal – urutan
 Ranking
 Skala Interval – perbedaan, selisih, jarak
 Temperatur
 Skala Rasio – perbandingan
 Ongkos per unit
26
Statistika Deskriptif
distribusi frekuensi &
ukuran statistik
27
Presentasi Data
Grafik/diagram  penyampaian informasi data
berupa angka secara visual
 Line Chart/ Diagram Garis
 Histograms/Diagram Batang
 Frequency Polygon/Diagram Frekuensi
 Ogives/Distribusi Frekuensi Kumulatif
 Pie Chart/ Diagram Lingkaran
28
Grafik Histogram
DIAGRAM GARIS
30
25
Frekuensi
Frekuensi
30
20
10
20
15
10
5
0
30.5
40.5
50.5
60.5
70.5
0
80.5
30.5 - 40.5
40.5 - 50.5
Class Boundaries
60.5 - 70.5
70.5 - 80.5
80.5 - 90.5
Class Boundaries
Grafilk Poligon
Kurva Frekuensi
30
30
30
25
25
25
20
20
20
15
15
10
10
5
5
0
0
30.5 - 40.5 40.5 - 50.5 50.5 - 60.5 60.5 - 70.5 70.5 - 80.5 80.5 - 90.5
Frekuensi
Frekuensi
50.5 - 60.5
15
10
5
0
30.5 - 40.5
40.5 - 50.5
Class Boundaries
50.5- 60.5
60.5 - 70.5
70.5- 80.5
80.5 - 90. 5
Class Boundaries
DIAGRAM PASTEL/LINGKARAN
30.5
40.5
50.5
60.5
70.5
80.5
29
Sifat Kelompok Data
 Mutually exclusive
tidak overlapping – sebuah observasi hanya ada dalam
sebuah kelompok
 Exhaustive
setiap observasi ditempatkan dalam sebuah kelompok
 Equal-width (if possible)
kelompok pertama dan terakhir dapat berbeda
30
Distribusi Frekuensi



Frekuensi dari setiap kelompok
• jumlah observasi dalam setiap kelompok
• Jumlah frekuensi adalah jumlah observasi, yaitu
 N untuk populasi
 n untuk sampel
Kelompok midpoint adalah nilai tengah kelompok, kelas
atau interval
Frekuensi relatif adalah prosentase dari total observasi
dalam setiap kelompok
• jumlah frekuensi relatif = 1
31
Distribusi Frekuensi
Waktu operasi perakitan kendaraan bermotor
x
Waktu operasi (menit)
f(x)
Frekuensi (jumlah produk)
f(x)/n
Frekuensi relatif
0 to less than 100
100 to lesss than 200
200 to less than 300
300 to less than 400
400 to less than 500
500 to lesssthan 600
30
38
50
31
22
13
0.163
0.207
0.272
0.168
0.120
0.070
184
1.000
 Contoh frekuensi relatif: 30/184 = 0.163
 Jumlah frekuensi relatif = 1
32
Distribusi Frekuensi Kumulatif
x
Waktu operasi (menit)
f(x)
Frekuensi (jumlah produk)
f(x)/n
Frekuensi relatif
0 to less than 100
100 to less than 200
200 to less than 300
300 to less than 400
400 to less than 500
500 to lesssthan 600
30
68
118
149
171
184
0.163
0.370
0.641
0.810
0.929
1.000
Frekuensi kumulatif dari setiap kelompok adalah jumlah
frekuensi dari kelompok sebelumnya .
33
Distribusi frekuensi
Tahapan penyusunan:
 Menghitung jumlah kelas interval (k), dengan rumus (Sturges) :
k = 1 + 3,3 Log n
dimana : k = Jumlah kelas interval
n = Jumlah data
 Menghitung Rentang Data (R)
R = Nilai data maksimum – Nilai data minimum
 Menghitung Panjang Kelas Interval (p), dengan rumus :
p = R/k
 Tabel Distribusi Frekuensi :
Interval
Kelas
(Limit)
Batas Kelas
(Boundaries)
Mid
Point
(xi)
Frek.
(fi)
Frek.
Kumulatif
(f kum)
fi.xi
(xi)2
fi (xi)2
Jumlah
34
Ukuran Statistik
Ukuran Pemusatan
1. Rata-rata (Mean)
2. Nilai Tengah (Median)
3. Modus
Ukuran Letak
1. Kuartil
2. Desil
3. Persentil
Ukuran Penyebaran
1. Jangkauan (Range)
2. Variasi (Variance)
3. Simpangan Baku
(Standard deviation)
Ukuran Lain
1. Skewness
2. Kurtosis
35
Ukuran Pemusatan – Rata-rata
 Untuk data tunggal
n
x
x 
i
i 1
i  1,2,3,..., n
n
dimana : xi = Nilai dari data
n = Jumlah data atau
banyaknya data didalam
sample
 Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
x 

f
fi x i
i
atau
x  x0

 p


fc
f
i
i
i




dimana :
fi = Frekuensi untuk kelas interval ke-i
xi = Nilai tengah
x0 = Nilai tengah yang akan diberi coding
ci = Variabel coding untuk kelas interval ke-i
p = Panjang kelas interval
36
Ukuran Pemusatan – Median
 Untuk data tunggal
x ( n 1) / 2
bila n ganjil


~
x   x n / 2  x ( n / 2 ) 1
bila n genap

2

dimana:
xi = Nilai tengah dari data
n = Jumlah data atau banyaknya
data didalam sample
 Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
n F
 2
Me  L i 
 f
Median



p


dimana :
Li = Batas bawah kelas median, yaitu kelas
dimana median akan terletak.
p = Panjang kelas interval
n = Jumlah data
F = Frekuensi kumulatif sebelum kelas median
f = Frekuensi kelas berisi median
37
Ukuran Pemusatan – Modus
 Untuk data berkelompok (data yang disusun dalam daftar
distribusi frekuensi) :

b1

Mo  L i  
 b1  b 2

 p


dimana :
Li = Batas bawah kelas modus, yaitu kelas interval dengan frekuensi
terbanyak
p = Panjang kelas interval
b1 = Selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya
b2 = Selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya
38
Ukuran Letak – Kuartil
ukuran letak yang membagi suatu distribusi menjadi 4 bagian yang sama, sesudah
disusun menurut urutan nilainya.
 Untuk data tunggal:
LetakK
i
 datake 
i n  1 
dengan
i  1,2,3
4
 Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
Ki
 in  F 


4
 Li 
 p dengan


f


i  1,2,3
dimana :
Li = Batas bawah kelas Ki, yaitu kelas interval dimana Ki akan terletak
n = Jumlah data
p = Panjang kelas interval
F = Frekuensi kumulatif sebelum kelas Ki
f = Frekuensi kelas Ki
39
Ukuran Letak – Desil
ukuran letak yang membagi suatu distribusi menjadi 10 bagian yang sama
besarnya.
 Untuk data tunggal:
LetakD
i
 datake 
i n  1 
dengan
i  1,2,..., 9
10
 Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
Di  Li
 in
 F 


10

 p dengan


f




i  1,2,..., 9
dimana :
Li = Batas bawah kelas Di, yaitu kelas interval dimana Di akan terletak
n = Jumlah data
p = Panjang kelas interval
F = Frekuensi kumulatif sebelum kelas Di
f = Frekuensi kelas Di
40
Ukuran Letak – Persentil
ukuran letak yang membagi suatu distribusi menjadi 100 bagian yang sama.
 Untuk data tunggal:
LetakP
i
 datake 
i n  1 
dengan
i  1,2,..., 9 9
100
 Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
 in
F 


100
Pi  L i 
 p dengan


f


i  1,2 ,..., 9 9
dimana :
Li = Batas bawah kelas Pi, yaitu kelas interval dimana Pi akan terletak
n = Jumlah data
p = Panjang kelas interval
F = Frekuensi kumulatif sebelum kelas Pi
f = Frekuensi kelas Pi
41
Ukuran Penyebaran – Variansi & Simpangan Baku
•Untuk data tunggal:
 x
n
s
2

i
 x

n
2
i 1
x

n 1
2
i

 n

  xi 
 i 1 
2
n
i 1
n 1
•Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
 f
n
s 
2
i
x x
2
i
i 1
n 1

n

2

f i xi 
2
 n

  f i xi 
 i 1

i 1
Dimana:
xi = Nilai tengah
f = Frekuensi yang sesuai
dengan nilai tengah
n = Jumlah frekuensi
2
n
n 1
Sehingga Standar Deviasi
(Simpangan Baku) adalah :
s s
2
42
Ukuran Lain
Skewness  Ukuran kesimetrisan distribusi data
 Kemiringan atau kecenderungan distribusi data
Kurva Simetris
(0)
Kurva Miring ke Kiri
(-)
Kurva Miring ke Kanan
(+)
Kurtosis  Ukuran kedataran atau keruncingan distribusi data
(A) Leptokurtik
(B) Platikurtik
(C) Mesokurtik
43
Sampling &
distribusi sampling
44
Teknik Penarikan Sampel (Sampling)
Proses mendapatkan sampel dari populasi  mencerminkan
populasi  kesimpulan dari sampel= kesimpulan dari populasi
Masalah dalam bagaimana proses pengambilan sampel
Satuan sampling: segala sesuatu yang dijadikan satuan (unit) yang
nantinya akan menjadi objek penelitian.
Daftar yang berisi satuan-satuan sampling yang ada dalam sebuah
populasi, yang berfungsi sebagai dasar untuk penarikan sample.
45
Metode Penarikan Sample
1. Berdasarkan proses pemilihannya.
a. Sampling with replacements
b. Sampling without replacements
2. Berdasarkan peluang pemilihannya.
a. Probability sampling
b. Non-probability sampling
46
Non-Probability Sampling
1. Convenience/accidental sampling: sample diambil secara
spontanitas  mudah dan murah
2. Judgement/purposive sampling: sample diambil berdasarkan
karakteristik yang ditentukan oleh tujuan penelitian
3. Quota sampling: = (2), kuota (jatah) dan jumlah sample
tertentu  mirip stratified tapi tidak acak
4. Snow ball sampling: =(2), populasi kecil dan spesifik  teknik
berantai (sample berikut ditentukan sample sebelumnya) 
biaya relatif kecil tapi bias/penyimpangan besar.
47
Probability Sampling
Random sampling: sampel
(ni) diambil secara random
dari populasi (Ni).
Systematic sampling: sampel
diambil secara random untuk
pertama kali, dan selanjutnya
diambil secara sistematis.
Random dari 5 titik
sampel pertama
Sistematis setiap 5 titik sampel
48
1
2
3
4
5
6
7
Group
Population Distribution
Sample Distribution
Stratified sampling: sampel
random (ni) dipilih dari
setiap kelompok populasi
(Ni).
Cluster sampling: observasi
dilakukan pada m cluster dari
M cluster populasi.
49
Prosedur Sampling
1. Menentukan populasi target
2. Menentukan area populasi
3. Menentukan ukuran populasi
4. Membuat kerangka sampling
5. Menentukan ukuran sample
6. Menentukan teknik dan rencana pengambilan sample
7. Melakukan pengambilan sample
50
Distribusi Sampling
Distribusi sampling : distribusi peluang suatu statistik 
tergantung ukuran populasi, ukuran sample dan metode
penarikan sample
Distribusi peluang
1.
2.
3.
4.
X
disebut distribusi sampling dari rataan
Distribusi sampling dari rataan
Distribusi Chi Square
Distribusi Student-t
Distribusi F
51
Estimasi Parameter
52
Pendahuluan
•
•
•
x = 550
• Sebuah nilai estimasi yang memberikan sedikit
informasi tentang rata-rata populasi.
Peneliti 99% yakin bahwa ada dalam interval [449,551]
• Sebuah estimasi interval yang sempit dengan tingkat
keyakinan yang besar.
Peneliti 90% yakin bahwa μ ada dalam interval[400,700]
• Sebuah estimasi interval yang sempit dengan tingkat
keyakinan yang kecil.
53
Tipe Estimasi
•
Estimasi Titik
 Estimasi nilai tunggal dari distribusi sampling
 Memberikan informasi tentang parameter populasi.
•
Estimasi interval
 Sebuah interval atau rentang yang diyakini mencakup
nilai parameter populasi yang tidak diketahui.
 Mengukur tingkat keyakinan (confidence) bahwa
interval tersebut sesungguhnya mengandung nilai
parameter yang dicari.
54
Estimator yang baik
 Unbiased
 Efisien
 Konsisten
 (Sufisien)
55
Unbiased
Sebuah estimator dikatakan unbiased jika nilai ekspektasinya sama
dengan nilai parameter populasi.
Jika E(X)=  maka rata-rata sampel adalah estimator unbiased untuk
rata-rata populasi. Rata-rata dari sebuah sampel mungkin tidak sama
dengan rata-rata populasi, tetapi jika dilakukan pengulangan sampel
secara independen akan diperoleh nilai yang sama dengan
parameter populasi.
Setiap penyimpangan (deviation) oleh estimator dari parameter
populasi disebut bias.
56
Unbiased
M isalkan, dari sekum pulan
X ~ f (  ,  2 ) diam bil data-data
variabel
X 1 , X 2 , , X n
random
, m aka
ekspektasi dari nilai rata-rata data adalah :
D alam
dari  .
E ( X )  E  X i / n   1   E ( X i )  1     
n
n
hal ini X adalah estim ator tidak bias (unbiased)
57
{
Estimator Bias & Unbiased
Bias
Estimator unbiased ada tepat pada
target
Estimator biased tidak
berada tepat pada target.
58
Efisien
Sebuah estimator dikatakan efisien jika memiliki variansi
yang relatif kecil.
Estimator efisien berada pada
target dengan sebaran yang
kecil.
Estimator tidak efisien mungkin pada
target dengan sebaran yang besar.
59
Konsisten
Sebuah estimator dikatakan konsisten jika kemungkinan
untuk mendekati parameter populasi semakin besar seiring
dengan meningkatnya ukuran sampel.
Consistency
n = 10
n = 100
60
Sufisien
Sebuah estimator dikatakan sufisien jika mencakup
semua informasi tentang parameter populasi dalam data
sampelnya.
61
Estimasi Titik
Ada tiga metoda estimasi titik (point estimation):
 Metoda Unbiased
 Metoda Momen
 Metoda Maximum Likelihood
62
Estimasi Interval
Estimasi interval adalah rentang yang diyakini akan
mencakup nilai parameter populasi yang tidak diketahui.
Rentang ini juga memberikan besarnya keyakinan bahwa
rentang tersebut mencakup nilai parameter yang diamati.
•
Estimasi interval memiliki 2 komponen, yaitu:
 Sebuah rentang nilai
 Terkait dengan tingkat keyakinan (level of
confidence)
63
Estimasi Interval
Sebuah estim ator akan berada pada suatu rentang atau interval
tertentu jika diterapkan tingkat kepercayaan tertentu. Jika L dan
U adalah batas-batas interval dim ana estim ator akan berada
dengan tingkat kepercayaan 1   , m aka dapat didefinisikan :
P(L    U )  1   ,
untuk estim asi dua sisi
atau
P(L   )  1   ,
untuk estim asi satu sisi
dim ana   L = k dikenal sebagai akurasi (ketelitian) estim asi.
Secara um um , distribusi
sehingga diperoleh
ˆ
m em ungkinkan m enghitung k
P (ˆ  k    ˆ  k )  1   ,
0    1.
64
Estimasi Interval
Interval yang dihitung dari suatu sam pel tertentu
disebut interval keyakinan (1 -)100% . (1-) disebut
koefisien keyakinan , dan titik batas pada ˆ  k dan
ˆ  k disebut batas-batas keyakinan.
65
Estimasi Interval
 Rata-rata dengan variansi diketahui/tidak
 Selisih rata-rata dengan variansi sama/tidak dan
diketahui/tidak
 Variansi tungal dan rasio
 Proporsi
66
Contoh Rumus:
Untuk sampel besar ( n > 30)
 Untuk populasinya tidak terbatas atau terbatas yang pengambilan sampel
dengan pengembalian dan  diketahui, interval kepercayaan (1- )100%
untuk  adalah :
X  Z /2


n
   X  Z /2

n
Untuk populasinya terbatas tanpa pengembalian dan  diketahui,
interval kepercayaan (1- )100% untuk  adalah
X  Z /2

n
N n
N 1
   X  Z /2

n
N n
N 1
67
Contoh Pembacan Tabel Luas di bawah kurva normal
1- = 95%
=5%
/2 = 2.5% (uji dua arah)
X = 1-0.025 = 0.975
Z =……
Z = 1,96
z
1.9
0.00
...
0.06
...
0.09
0.9750
68
Contoh Interpolasi Data:
1- = 96%
=4% (uji satu arah)
X = 0.9600
Z1 = 1.75
Z = ……
Z2 = 1.76
X1 = 0.9599
X = 0.9600
X3 = 0.9608
z
0.00
...
1.7
Z  Z1
Z 2  Z1

1 . 76  1 . 75
Z  1 . 75
0 . 01

0.06
0.9599
0.9608
X  X1
X
Z  1 . 75
0.05
2

 X1
0 . 9600  0 . 9599
0 . 9608  0 . 9599
0 . 0001
0 . 0009
0 . 0009 Z  0 . 001575
 0 . 000001
0 . 0009 Z  0 . 001576
Z  1 . 751
69
 Contoh :
Perusahaan XYZ memiliki karyawan 250 orang. Untuk
keperluan tertentu, ingin diketahui rata-rata jam
kerjanya per minggu. Untuk itu, diambil sampel
sebanyak 35 orang dan diperoleh data bahwa rata-rata
jam kerja karyawan tersebut adalah 39,76 jam per
minggu. Jika simpangan baku rata-rata jam kerjanya
0,93 jam estimasilah dengan tingkat keyakinan 90%,
rata-rata jam kerja karyawan tersebut!
70
Penyelesaian :
 N = 250
 n = 35
 X = 39,76
  = 0,93
 1- = 90%
  = 10%
 Z/2 = Z0.05 = 1,65
X  Z

/2
n
 0 ,93  
39 , 76  (1, 65 ) 


 35  
N n
N 1
   X  Z

/2
n
N n
N 1
250  35 
 0 , 93  
    39 , 76  (1, 65 ) 



250  1 
 35  
250  35 

250  1 
39 ,53    39 ,99
Kesimpulan:
Jadi rata-rata jam kerja karyawan perusahaan XYZ dengan tingkat keyakinan
90% berada antara 39,53 jam sampai 39,99 jam perminggu.
Uji Hipotesis
72
Pengertian Hipotesis Statistik
Hipotesis (Hypothesis)  Greece
Hupo= Sementara, dan Thesis= Pernyataan/Dugaan
Jenis Hipotesis:
1. Hipotesis Penelitian (Research Hypothesis)
 Proporsional (Verbal)  Tidak bisa diuji secara empiris
2. Hipotesis Statistik (Statistical Hyphothesis)
 Berdasarkan data  Dapat diuji secara empiris Suatu
asumsi mengenai parameter fungsi frekuensi peubah acak
Hipotesis Penelitian  Hipotesis Statistik  Dugaan penelitian
dalam H0 dan H1
Pengertian Hipotesis Statistik
Hipotesis Penelitian  Hipotesis Statistik  Dugaan penelitian
dalam H0 dan H1
H0 merupakan hipotesis nol (null hypothesis) dan merupakan
hipotesis yang akan diuji dan yang nantinya akan diterima
atau ditolak tergantung pada hasil eksperimen atau pemilihan
sampelnya.
H1 merupakan hipotesis alternative atau hipotesa tandingan
(alternative hypothesis)
Pengujian Hipotesis
1. Uji Hipotesis Satu Arah (One Tail Test)
a. H 0 :  x  0
H1 : x  0
b. H 0 :  x  0
Jika H0 Benar
H1 : x  0
Jika H0 Benar
Daerah Penolakan
Daerah Penerimaan
Daerah Penerimaan
(1-α)
(1-α)

Titik kritis

Titik kritis
Pengujian Hipotesis
2. Uji Hipotesis Dua Arah (Two Tail Test)
H0 : x  0
H1 : x  0
Jika H0 Benar
Daerah Penerimaan
(1-α)

2
Daerah Penolakan bagi
μyang terlalu kecil

2
Daerah Penolakan bagi
μyang terlalu besar
Kesalahan pada Pengujian Hipotesis
Keputusan
Pengujian
HIPOTESIS
Jika H0 Benar
Jika H0 palsu (H1 Benar)
Terima H0
Keputusan yang benar.
Probabilitas = 1 - α
“Tingkat Keyakinan”
Kesalahan jenis II.
Probabilitas = β
Tolak H0
Kesalahan jenis I.
Probabilitas = α
“Taraf Nyata”
Keputusan yang benar.
Probabilitas =1 - β
“Kuasa Pengujian”
α= Level of Signifinace
1 – α= Level of Confidence
1 – β= Power of the Test
Tahapan Pengujian Hipotesis
1.
2.
3.
4.
5.
6.
7.
8.
Nyatakan hipotesis ststistik (H0 dan H1) yang sesuai dengan
hipotesis penelitian yang diajukan.
Menentukan taraf nyata/ alpha (Level of significance)
Menentukan jumlah sampel.
Mengumpulkan data melalui sampel probabilitas (probability
sample/random sample)
Gunakan statistik uji yang tepat (distribusi z, t, …)
Menentukan titik kritis dan daerah kritis (daerah penolakan) H0
Menghitung nilai statistik uji berdasarkan data yang dikumpulkan.
Perhatikan apakah nilai hitung statistik uji jatuh di daerah
penerimaan atau penolakan.
Berikan kesimpulan statistik (statistical conclusion)
Contoh soal :
Suatu perusahaan pembuat pesawat terbang komersial
menyatakan, bahwa hasil produksinya setelah dipergunakan
dalam waktu 1 tahun diperlukan pengecheckan kembali
selama 11 jam dengan standar deviasi 3,5 jam. Setelah
berselang 3 tahun teknisi pesawat meragukan hipotesis ini,
sehingga perlu dilakukan pengamatan kembali dengan
mengambil sampel sebanyak 49 buah pesawat, ternyata
waktu rata-rata yang diperlukan untuk mengadakan
pemeliharaan ini 12 jam. Teknisi masih percaya bahwa
standar deviasinya tetap tidak berubah. Apakah ada alasan
untuk meragukan bahwa waktu yang diperlukan untuk
pemeliharaan pesawat terbang dalam 1 tahun diperlukan 11
jam, apabila dipergunakan taraf keberartian 10% ?
79
Penyelesaian:
•Formulasi hipotesis :
Ho :  = 11 jam
H1 :   11 jam
Digunakan pengujian dua sisi (two-tailed)
•Taraf keberartian (level of significance)  = 10%, dari tabel
kurva normal diperoleh nilai  Z/2 = 1.645.
•Kriteria pengujian
Ho diterima jika : -1.645  Z  1.645
H1 ditolak jika : Z > 1.645 dan Z < -1.645
•Statistik uji, distribusi Z :
z 
x  0
 /
n

12  11
3 .5 /
49

1
 2
0 .5
80
•Kesimpulan :
Karena nilai Z hitung lebih besar dari nilai Z tabel (+2 > +1.645)
maka Ho ditolak pada level significance 10%, dan dapat
dinyatakan bahwa rata-rata pemeliharaan pesawat terbang
tersebut lebih dari 11 jam. Agar lebih jelas dapat dilihat
dalam gambar dibawah ini
+2
Daerah
Penolakan
Daerah
Penolakan
Daerah
penerimaan
-1.645

+1.645
81