11a. Korelasi Pearson
Download
Report
Transcript 11a. Korelasi Pearson
Koefisien Korelasi Pearson dan
Regresi Linier Sederhana
Topik
Koefisien Korelasi Pearson
Pengertian korelasi dan syarat korelasi
Menghitung dan menguji koefisien korelasi dan
Interpretasi koefisien korelasi
Regresi Linier Sederhana
Pengertian regresi linier sederhana
Menghitung persamaan regresi linier sederhana
Menguji koefisien regresi
Interpretasi persamaan regresi
Dep Biostatistik dan
Kependudukan, FKM-UI
1
Koefisien Korelasi Pearson
Simbol r
Hubungan antara dua variabel numerik (skala pengukuran
minimal interval)
Pola hubungan linier (garis lrus)
Hubungan statistik/probabilistik, bukan hubungan
deterministik atau hubungan sebab-akibat.
Tujuannya: Mengukur adanya atau kuatnya hubungan
antara dua variabel numerik
Apakah ada hubungan antara berat badan bayi saat lahir
dengan lingkar lengan atas bayi (LILA)?
Dst……
Dep Biostatistik dan
Kependudukan, FKM-UI
2
Koefisien Korelasi Pearson
dan korelasi lainnya...
Pearson’s correlation coefficient (Parametrik)
Spearman’s (rank) rho dan Kendall’s tau-b correlation
coefficient (Nonparametrik).
Asumsi dua variabel numerik mengikuti distribusi normal
(bivariate normal).
Besar nilai r sangat berpengaruh terhadap pencilan (outliers)
Spearman’ rho atau Kendall’s tau-b mengukur hubungan antara
dua variabel kualitatif atau kuantitatif yang tidak berdistribusi
normal (skewed) dan atau adanya pencilan
Dep Biostatistik dan
Kependudukan, FKM-UI
3
Koefisien Korelasi Pearson
Sebelum menghitung koefisien korelasi
Periksa terlebih dahulu pola hubungan diantara
kedua variabel
Gunakan scatter plot
Bila pola hubungan cenderung linier (garis lurus)
hitung koefisien korelasi Pearson (r)
Bila tidak linier maka besarnya koefisien korelasi
Pearson ( r ) akan memberikan interpretasi yang
salah
Dep Biostatistik dan
Kependudukan, FKM-UI
4
Scatter Plot
Y
**
*
**
**
*
r =+1
*
*
(a)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
5
Scatter Plot
Y
*
*
*
*
r =-1
*
*
*
*
(b)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
6
Scatter Plot
Y
*
*
* *
*
*
*
*
* * *
*
r = 0.80
* *
(c)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
7
Scatter Plot
Y
*
*
*
*
*
*
*
*
*
*
**
*
*
*
* * r = 0.20
(d)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
8
Koefisien Korelasi Pearson
Rumus menghitung besar dan arah nilai r
r
2
x
xy
x
y
n
x
n
2
2
y
Dep Biostatistik dan
Kependudukan, FKM-UI
y
2
n
9
Koefisien Korelasi Pearson
Uji hipotesis r
Ho : ρ=0
Ha : ρ≠0
Standar error nilai r
SE ( r )
1 r
2
n2
Uji Statistik nilai r
t
df n 2
r0
1 r / n 2
2
Dep Biostatistik dan
Kependudukan, FKM-UI
10
Koefisien Korelasi Pearson
Batasan ( r )
Nilai r berkisar antara 0 s/d 1
Arah hubungan: Negatif atau Positif
Sehingga nilai r berkisar antara -1 s/d 1
Interpretasi nilai r
Hubungan negatif: Bila nilai x bertambah maka nilai y
berkurang tetapi tidak proporsional
Hubungan positif: Bila nilai x bertambah maka nilai y juga
bertambah tetapi tidak proporsional
Dep Biostatistik dan
Kependudukan, FKM-UI
11
Koefisien Korelasi Pearson
Interpretasi nilai r
Colton (1974) mengelompokkan nilai r sbb:
0.0 s/d 0.25 atau -0.25 s/d 0.0 tidak ada hubungan
antara kedua variabel
0.25 s/d 0.50 atau -0.25 s/d -0.50 hubungan dua variabel
rendah
0.50 s/d 0.75 atau -0.50 s/d -0.75 hubungan dua
variabel sedang
Lebih besar 0.75 atau lebih kecil -0.75 hubungan dua
variabel kuat
Dep Biostatistik dan
Kependudukan, FKM-UI
12
Koefisien Korelasi Pearson
x
y
xy
x2
y2
====================================
.40
.17
.07
.16
.03
.54
.09
.05
.29
.01
.85
.01
.01
.72
.00
.95
.04
.04
.90
.00
.81
.09
.08
.66
.01
.26
.23
.06
.07
.05
.90
.01
.01
.81
.00
.95
.01
.01
.90
.00
.83
.01
.01
.69
.00
.83
.15
.12
.69
.02
.85
.01
.01
.72
.00
.83
.01
.00
.69
.00
.65
.05
.03
.42
.00
.98
.02
.02
.96
.00
.47
.19
.09
.22
.04
.74
.09
.07
.55
.01
.75
.01
.01
.56
.00
.97
.01
.01
.94
.00
.79
.04
.03
.62
.00
.91
.03
.02
.83
.00
-----------------------------------------------------------------------4425
r
500 * 123
15
2
2
( 500 )
(123 )
17180
1269
0 . 89
Pagano (hal 364)
X persentase cakupan imunisasi DPT
Y mortalitiy rate
n=20, ∑x=15,16, ∑y=1,24
∑xy=0,73, ∑x2=12,41, ∑y2=0,17
r
xy
2
x
x
x
2
n
0 , 73
y
n
y
2
y
2
n
(15 ,16 )( 1, 24 )
20
r
(12 , 41
Dep Biostatistik dan
Kependudukan, FKM-UI
(15 ,16 )
20
2
)( 0 ,17
0 ,829
(1, 24 )
2
)
20
13
Koefisien Korelasi Pearson
Dep Biostatistik dan
Kependudukan, FKM-UI
14
Koefisien Korelasi Pearson
Uji hipotesis r
Ho : ρ=0
Ha : ρ≠0
Standar error nilai r
SE ( r )
1 ( 0 ,829 )
20 2
2
0 ,132
Uji Statistik nilai r
t
0 ,829
6 , 29 ; df 18
0 ,132
Nila-p <0,001
Dep Biostatistik dan
Kependudukan, FKM-UI
15
Koefisien Korelasi Pearson
Correlations
Imunis asi
DPT
Imunis asi DPT
Pearson Correlation
Mortality Rate
1
Sig. (2-tailed)
.000
N
Mortality Rate
-.829**
20
Pearson Correlation
-.829**
Sig. (2-tailed)
.000
N
20
20
1
20
**. Correlation is significant at the 0.01 level (2-tailed).
Dep Biostatistik dan
Kependudukan, FKM-UI
16
Regresi Linier Sederhana
Ada variabel Dependen dan Independen
Dependen variabel numerik, independen numerik dan
atau kategorik
Sederhana: ada satu variabel independen
Regresi: Mencari garis lurus terbaik yang mewakili
hubungan kedua variabel
Metode: Least-square
Garis regresi tsb digunakan untuk estimasi atau
prediksi perubahan variabel dependen dari variabel
independen
Dep Biostatistik dan
Kependudukan, FKM-UI
17
Regresi Linier Sederhana
Persamaan regresi linier yˆ a bx
yˆ = dependen variabel; x=independen variabel;
b=slope dan a=intercept
Rumus menghitung koefisien b dan a
b
x y / n
x x / n
xy
2
2
a y bx
Dep Biostatistik dan
Kependudukan, FKM-UI
18
Regresi Linier Sederhana
Persamaan regresi y terhadap x
Pagano (hal 364): X persentase cakupan imunisasi DPT (independen), Y mortalitiy
rate (dependen). n=20, ∑x=15,16, ∑y=1,24, ∑xy=0,73, ∑x2=12,41, ∑y2=0,17
b
xy
x
2
x y / n
x / n
2
0 , 73
(15 ,16 )( 1, 24 )
(12 , 41
20
2
(15 ,16 )
0 , 283
)
20
a y bx
1, 24
( 0 , 283 )(
20
Persamaan regresinya adalah
15 ,16
) 0 . 278
20
yˆ 0 , 278 0 , 283 x
Dep Biostatistik dan
Kependudukan, FKM-UI
19
Regresi Linier Sederhana
Model Summary
Model
1
R
Adjusted
R Square
R Square
.829 a
.687
Std. Error of
the Es timate
.670
.03939
a. Predictors: (Constant), Imunisas i DPT
ANOVA b
Mo del
1
Su m o f
Sq uares
df
Me an Sq uare
F
Re gress io n
.061
1
.061
Re sidua l
.028
18
.002
To ta l
.089
19
Sig.
39.5 75
.000 a
t
Sig.
a. Predictors: (Co nstan t), Im u nisa si DPT
b. De pen den t Varia ble: Mortality R ate
Coefficients
Unstandardized
Coefficients
Model
1
B
a
Standardized
Coefficients
Std. Error
(Constant)
.278
.035
Imunis asi DPT
-.283
.045
Beta
-.829
7.848
.000
-6.291
.000
a. Dependent Variable: Mortality R ate
Dep Biostatistik dan
Kependudukan, FKM-UI
20
TUGAS: Gunakan data 15 karyawan
Apakah ada hubungan antara umur dan
lama hari absen 2009?
Jika seorang karyawan berumur 35
tahun, hitunglah perkiraan lama hari
absennya.
Dep Biostatistik dan
Kependudukan, FKM-UI
21