Transcript Korelasi dan Regresi
Oleh: Anwar, Dita, Erna
Program Studi Magister Biomedik Fakultas Kedokteran Universitas Sumatera Utara 2011
Pendahuluan
Beberapa penelitian di bidang kedokteran sering ingin menilai apakah ada hubungan antara dua variabel (dependent dan independent) yang numerik.
contoh : Hubungan Index Massa Tubuh dengan kadar kolesterol.
Hubungan antara KGD dengan Kadar LDL pada pasien DM.
Analisis regresi dapat diketahui bentuk hubungan antara dua variabel (Prediksi dari data yang ada).
Analisis korelasi untuk mengetahui eratnya hubungan antara dua variabel.
Semakin erat hubungannya maka semakin yakin bahwa hubungan dua variabel tersebut adalah hubungan sebab akibat.
Analisis regresi dan korelasi didasarkan atas hubungan yang terjadi antara dua variabel atau lebih.
Variabel yang digunakan untuk meramal disebut variabel bebas (independen). Dapat lebih dari satu variabel.
Variabel yang akan diramal variabel respons (dependen). Terdiri dari satu variabel.
A. Diagram Tebar (Scatter plot)
Diagram tebar adalah diagram dengan memakai garis koordinat dengan axis X dan ordinat Y. Tiap pengamatan diwakili oleh satu titik.
Hubungan antara variabel dapat berupa garis lurus (linier), garis lengkung (kurva linier) atau tdk terlihat pola tertentu.
Dapat berupa garis regresi positif atau negatif.
Contoh
linier positif linier negatif
Kekuatan Hubungan
Bila titik-titik menebar pada satu garis lurus, maka kekuatan hubungan antara kedua variabel tersebut sangat sempurna.
Kekuatan hubungan dapat dikuantifikasi melalui suatu koefisien yaitu koefisien korelasi (r pearson).
Koefisien ini akan berkisar antara 0 – 1.
bila r = 0 tidak ada hubungan linier.
r = 1 hubungan linier sempurna.
0-1 = bila mendekati 1 semakin kuat hubungannya, bila mendekati 0 semakin lemah hubungannya.
Lihat tandanya apakah korelasi positif atau negatif.
Interval Koefisien 0.000 – 0.199
0.200 – 0.399
0.400 – 0.599
0.600 – 0.799
0.800 – 1.000
Tingkat Hubungan Sangat rendah Rendah Sedang Kuat Sangat kuat
Rumus koefisien korelatif
( Pearson ) n(∑XY) – (∑X) (∑Y) r = √[(n∑X2) – (∑X)2] [(n∑Y2) – (∑Y)2] Ket: n = jumlah sampel X = nilai pada ordinat X Y = nilai pada ordinat Y
Contoh..
No X (SGOT) 1.
2.
3.
4.
5.
6.
7.
∑ 12.7
11.3
13.5
15.1
17.9
19.3
15.5
105.3
Y (HDL) 42.2
41.2
42.3
42.8
43.8
44.5
45.5
302.3
n(∑XY) – (∑X) (∑Y) r = √[(n∑X 2 ) – (∑X) 2 ] [(n∑Y 2 ) – (∑Y) 2 ] XY 535.94
465.56
571.05
646.28
784.02
858.85
705.25
4566.95
X 2 161.29
127.69
182.25
228.01
320.41
372.49
240.25
1632.39
7 (4566.95) – (105.3) (302.3) r = √[(7x1632.39) – (105.3) 2 ] [(7x13068.35) – (302) 2 ] = 0.768
Y 2 1780.84
1697.84
1789.29
1831.84
1918.44
1980.25
2070.25
13068.35
Scatter Plot
46 45 44 43 42 41 40 10 Hubungan Kadar SGOT dengan Kadar HDL 12 14 SGOT 16 18 20
Kesimpulan hasil
Dilihat dari besarnya r yang mendekati 1, maka hubungan antara SGOT dengan HDL adalah kuat.
Berpola linier positif Maka makin tinggi SGOT maka akan semakin tinggi kadar HDL.
Koefisien Determinasi
R = r 2 Yaitu besarnya proporsi variasi Y yang dapat dijelaskan oleh variabel X.
Apabila r = 1 maka R = 100% X memegang peranan dalam perubahan Y. bila terjadi perubahan X, maka Y akan berubah.
Pada kasus diatas r = 0.768 maka R = r 2 R= (0.768) 2 = 0.59 59%.
Hal ini berarti HDL dapat dijelaskan oleh Variabel SGOT sebesar 59%.
Uji Hipotesis koefisien Korelasi
Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung dengan uji t. rumusnya: t= r√(n-2) √(1-r 2 ) df= n-2 bila t hitung > t tabel, Ho di tolak bila t hitung < t tabel, Ho diterima
dk 1 2 3 6 7 8
9
4 5 17 18 19 20 10 11 12 13 14 15 16 5% 0,887 0,950 0,878 0,811 0,754 0,707 0,666 0,632 0,602 0,576 0,553 0,532 0,514 0,497 0,482 0,468 0,456 0,444 0.433
0,423 1 % 1,000 0,999 0,959 0,917 0,874 0,834 0,798 0,765 0,735 0./08 0,684 0,661 0,641 0,623 0,606 0,590 0.575
0,561 0,549 0,537 dk .
24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 125 150 200 300 5% 0,388 0,381 0,374 0,367 0,361 0,355 0,349 0,325 0,304 0,288 0,273 0,250 0,323 0,217 0,205 0,195 0,174 0,159 0,138 0,113 1% 0,496 0,487 0,478 0,470 0,463 0,456 0,449 0,418 0,393 0,372 0,354 0,325 0,302 0,283 0,267 0,254 0,228 0,208 0,148 0,148
B. Regresi Linier
Persamaan garis Linier : Y = a + bX Pada persamaan ini harus jelas dan tentukan mana variabel Y (dependen) dan variabel X (independen). Penetapan disesuaikan dengan tujuan analisis.
Biasanya variabel Y Variabel X lebih sulit diukur lebih mudah diukur Mengapa?
Karena dari persamaan garis regresi linier, kita dapat melakukan banyak hal. Contohnya : menduga satu nilai variabel dependen berdasarkan nilai variabel bebasnya.
Dari contoh kasus diatas, SGOT merupakan variabel bebas dan HDL merupakan variabel terikat. Sehingga: HDL = a + b SGOT Garis linier dapat digambarkan bila koefisien a dan b diperoleh.
Metode kuadrat terkecil
b= n(∑XY) – (∑X) (∑Y) n∑(X) 2 – (∑X) 2 Koefisien b = besarnya perubahan nilai variabel Y apakah nilai variabel X berubah sebesar satu unit (satuannya) Koefisien a = nilai awal/intercept variabel Y, bila variabel X = 0 besarnya nilai a = y - bx
Maka dari contoh soal diatas dapat dihitung: b= n(∑XY) – (∑X) (∑Y) n∑(X) 2 – (∑X) 2 b= 7x4566.95 – (105.3x302.3) 7x1632.39 – (105.3) 2 = 0.403
a= y – bX = (302.3/7) – (0.403)(105.3/7) = 37.123
Maka HDL = 37.123 + 0.403 SGOT
Regresi Linier Ganda
Contoh kasus diatas adalah Regresi linier sederhana.
Hubungan 1 variabel dependen biasanya tidak hanya dengan satu variabel saja. Variabel X lebih dari 1.
maka : Y = a + b1X1 + b2X2 + …….+b p X p Hasilnya sudah terkontrol koefisien b terhadap variabel bebas lain yang berada dalam model.
Dalam hal ini koefisien determinasi (R) cukup penting. Untuk menjelaskan variabel X yang kita pilih dapat menjelaskan variasi Y.
soal
sebuah penelitian untuk mengetahui apakah ada hubungan antara Hb'ibu hamil dengan berat badan bayi lahirnya. Peneliti mengumpulkan data sebanyak 20 responden, melalui catatan medik di salah satu rumah sakit di Jogjakarta.
Hasil pengumpulan data kemudian di masukkan pada tabel berikut ini:
No 8 9 10 5 6 7 1 2 3 4 Hb 11.2
11.3
11.5
10.6
10.7
10.5
11.6
11.7
11.3
11.4
BBL 2500 2450 2500 2450 2470 2490 2510 2570 2600 3000 No 11 12 13 14 15 16 17 18 19 20 Hb 10.7
10.1
10.3
11.9
12.1
12.2
11.9
12.5
12.3
12.4
BBL 2700 2560 2600 2700 3200 3400 3000 3200 3400 3400
soal
Tentukan lah : Koefisien korelasi nya dan interpretasi nya Korelasi determinasi nya dan interpretasi nya.
persamaan regresi linier nya Berapa perkiraan nilai BBL jika Hb ibu 11,8
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 X 11.2
11.3
11.5
10.6
10.7
10.5
11.6
11.7
11.3
11.4
10.7
10.1
10.3
11.9
Y 2500 2450 2500 2450 2470 2490 2510 2570 2600 3000 2700 2560 2600 2700 X 2 .
125.44
127.69
132.25
112.36 .
114.49 • 110.25
134.56
136.89
127.69 ' 129.96
114.49
102.01
106.09
141.61
Y* ' 6250000 6002500 ' 6250000.
6002500 6100900 6200100 6300100 6604900 6760000 9000000 7290000 6553600 6760000 7290000 X.Y
28000 27685 28750 25970 26429 26145 29116 30069 29380 34200 28890 25856 26780 32130