11a. Korelasi Pearson

Download Report

Transcript 11a. Korelasi Pearson

Koefisien Korelasi Pearson dan
Regresi Linier Sederhana

Topik
 Koefisien Korelasi Pearson
 Pengertian korelasi dan syarat korelasi
 Menghitung dan menguji koefisien korelasi dan
 Interpretasi koefisien korelasi
 Regresi Linier Sederhana
 Pengertian regresi linier sederhana
 Menghitung persamaan regresi linier sederhana
 Menguji koefisien regresi
 Interpretasi persamaan regresi
Dep Biostatistik dan
Kependudukan, FKM-UI
1
Koefisien Korelasi Pearson







Simbol r
Hubungan antara dua variabel numerik (skala pengukuran
minimal interval)
Pola hubungan linier (garis lrus)
Hubungan statistik/probabilistik, bukan hubungan
deterministik atau hubungan sebab-akibat.
Tujuannya: Mengukur adanya atau kuatnya hubungan
antara dua variabel numerik
Apakah ada hubungan antara berat badan bayi saat lahir
dengan lingkar lengan atas bayi (LILA)?
Dst……
Dep Biostatistik dan
Kependudukan, FKM-UI
2
Koefisien Korelasi Pearson
dan korelasi lainnya...





Pearson’s correlation coefficient (Parametrik)
Spearman’s (rank) rho dan Kendall’s tau-b correlation
coefficient (Nonparametrik).
Asumsi dua variabel numerik mengikuti distribusi normal
(bivariate normal).
Besar nilai r sangat berpengaruh terhadap pencilan (outliers)
Spearman’ rho atau Kendall’s tau-b mengukur hubungan antara
dua variabel kualitatif atau kuantitatif yang tidak berdistribusi
normal (skewed) dan atau adanya pencilan
Dep Biostatistik dan
Kependudukan, FKM-UI
3
Koefisien Korelasi Pearson
 Sebelum menghitung koefisien korelasi
 Periksa terlebih dahulu pola hubungan diantara
kedua variabel
 Gunakan scatter plot
 Bila pola hubungan cenderung linier (garis lurus)
hitung koefisien korelasi Pearson (r)
 Bila tidak linier maka besarnya koefisien korelasi
Pearson ( r ) akan memberikan interpretasi yang
salah
Dep Biostatistik dan
Kependudukan, FKM-UI
4
Scatter Plot
Y
**
*
**
**
*
r =+1
*
*
(a)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
5
Scatter Plot
Y
*
*
*
*
r =-1
*
*
*
*
(b)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
6
Scatter Plot
Y
*
*
* *
*
*
*
*
* * *
*
r = 0.80
* *
(c)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
7
Scatter Plot
Y
*
*
*
*
*
*
*
*
*
*
**
*
*
*
* * r = 0.20
(d)
Dep Biostatistik dan
Kependudukan, FKM-UI
X
8
Koefisien Korelasi Pearson

Rumus menghitung besar dan arah nilai r
r 


2
 x 


xy 
 x
y
n
 x 
n
2

2
  y 



Dep Biostatistik dan
Kependudukan, FKM-UI
 y 
2
n




9
Koefisien Korelasi Pearson


Uji hipotesis r

Ho : ρ=0

Ha : ρ≠0
Standar error nilai r
SE ( r ) 

1 r
2
n2
Uji Statistik nilai r
t
df  n  2
r0
1  r  / n  2 
2
Dep Biostatistik dan
Kependudukan, FKM-UI
10
Koefisien Korelasi Pearson

Batasan ( r )

Nilai r berkisar antara 0 s/d 1
 Arah hubungan: Negatif atau Positif
 Sehingga nilai r berkisar antara -1 s/d 1
Interpretasi nilai r



Hubungan negatif: Bila nilai x bertambah maka nilai y
berkurang tetapi tidak proporsional
Hubungan positif: Bila nilai x bertambah maka nilai y juga
bertambah tetapi tidak proporsional
Dep Biostatistik dan
Kependudukan, FKM-UI
11
Koefisien Korelasi Pearson

Interpretasi nilai r





Colton (1974) mengelompokkan nilai r sbb:
0.0 s/d 0.25 atau -0.25 s/d 0.0 tidak ada hubungan
antara kedua variabel
0.25 s/d 0.50 atau -0.25 s/d -0.50 hubungan dua variabel
rendah
0.50 s/d 0.75 atau -0.50 s/d -0.75 hubungan dua
variabel sedang
Lebih besar 0.75 atau lebih kecil -0.75 hubungan dua
variabel kuat
Dep Biostatistik dan
Kependudukan, FKM-UI
12
Koefisien Korelasi Pearson
x
y
xy
x2
y2
====================================
.40
.17
.07
.16
.03
.54
.09
.05
.29
.01
.85
.01
.01
.72
.00
.95
.04
.04
.90
.00
.81
.09
.08
.66
.01
.26
.23
.06
.07
.05
.90
.01
.01
.81
.00
.95
.01
.01
.90
.00
.83
.01
.01
.69
.00
.83
.15
.12
.69
.02
.85
.01
.01
.72
.00
.83
.01
.00
.69
.00
.65
.05
.03
.42
.00
.98
.02
.02
.96
.00
.47
.19
.09
.22
.04
.74
.09
.07
.55
.01
.75
.01
.01
.56
.00
.97
.01
.01
.94
.00
.79
.04
.03
.62
.00
.91
.03
.02
.83
.00
-----------------------------------------------------------------------4425 
r 
500 * 123
15
2
2

( 500 ) 
(123 )
17180 
1269 
 0 . 89
Pagano (hal 364)
X persentase cakupan imunisasi DPT
Y mortalitiy rate
n=20, ∑x=15,16, ∑y=1,24
∑xy=0,73, ∑x2=12,41, ∑y2=0,17
r 
 xy 

2
 x 

 x 
 x
2
n
0 , 73 
y
n
 y 

2
  y 
 
2
n



(15 ,16 )( 1, 24 )
20
r 
(12 , 41 
Dep Biostatistik dan
Kependudukan, FKM-UI
(15 ,16 )
20
2
)( 0 ,17 
  0 ,829
(1, 24 )
2
)
20
13
Koefisien Korelasi Pearson
Dep Biostatistik dan
Kependudukan, FKM-UI
14
Koefisien Korelasi Pearson


Uji hipotesis r

Ho : ρ=0

Ha : ρ≠0
Standar error nilai r
SE ( r ) 

1  (  0 ,829 )
20  2
2
 0 ,132
Uji Statistik nilai r
t
 0 ,829
  6 , 29 ; df  18
0 ,132

Nila-p <0,001
Dep Biostatistik dan
Kependudukan, FKM-UI
15
Koefisien Korelasi Pearson
Correlations
Imunis asi
DPT
Imunis asi DPT
Pearson Correlation
Mortality Rate
1
Sig. (2-tailed)
.000
N
Mortality Rate
-.829**
20
Pearson Correlation
-.829**
Sig. (2-tailed)
.000
N
20
20
1
20
**. Correlation is significant at the 0.01 level (2-tailed).
Dep Biostatistik dan
Kependudukan, FKM-UI
16
Regresi Linier Sederhana






Ada variabel Dependen dan Independen
Dependen variabel numerik, independen numerik dan
atau kategorik
Sederhana: ada satu variabel independen
Regresi: Mencari garis lurus terbaik yang mewakili
hubungan kedua variabel
Metode: Least-square
Garis regresi tsb digunakan untuk estimasi atau
prediksi perubahan variabel dependen dari variabel
independen
Dep Biostatistik dan
Kependudukan, FKM-UI
17
Regresi Linier Sederhana



Persamaan regresi linier yˆ  a  bx
yˆ = dependen variabel; x=independen variabel;
b=slope dan a=intercept
Rumus menghitung koefisien b dan a
b 

 x  y  / n
 x   x  / n
xy 
2
2
a  y  bx
Dep Biostatistik dan
Kependudukan, FKM-UI
18
Regresi Linier Sederhana

Persamaan regresi y terhadap x
Pagano (hal 364): X persentase cakupan imunisasi DPT (independen), Y mortalitiy
rate (dependen). n=20, ∑x=15,16, ∑y=1,24, ∑xy=0,73, ∑x2=12,41, ∑y2=0,17
b 

xy 

x
2
 x  y  / n
  x   / n
2
0 , 73 
(15 ,16 )( 1, 24 )

(12 , 41 
20
2
(15 ,16 )
  0 , 283
)
20
a  y  bx 
1, 24
 (  0 , 283 )(
20
Persamaan regresinya adalah
15 ,16
)  0 . 278
20
yˆ  0 , 278  0 , 283 x
Dep Biostatistik dan
Kependudukan, FKM-UI
19
Regresi Linier Sederhana
Model Summary
Model
1
R
Adjusted
R Square
R Square
.829 a
.687
Std. Error of
the Es timate
.670
.03939
a. Predictors: (Constant), Imunisas i DPT
ANOVA b
Mo del
1
Su m o f
Sq uares
df
Me an Sq uare
F
Re gress io n
.061
1
.061
Re sidua l
.028
18
.002
To ta l
.089
19
Sig.
39.5 75
.000 a
t
Sig.
a. Predictors: (Co nstan t), Im u nisa si DPT
b. De pen den t Varia ble: Mortality R ate
Coefficients
Unstandardized
Coefficients
Model
1
B
a
Standardized
Coefficients
Std. Error
(Constant)
.278
.035
Imunis asi DPT
-.283
.045
Beta
-.829
7.848
.000
-6.291
.000
a. Dependent Variable: Mortality R ate
Dep Biostatistik dan
Kependudukan, FKM-UI
20
TUGAS: Gunakan data 15 karyawan


Apakah ada hubungan antara umur dan
lama hari absen 2009?
Jika seorang karyawan berumur 35
tahun, hitunglah perkiraan lama hari
absennya.
Dep Biostatistik dan
Kependudukan, FKM-UI
21