Korelasi dan Regresi

Download Report

Transcript Korelasi dan Regresi

Oleh: Anwar, Dita, Erna

Program Studi Magister Biomedik Fakultas Kedokteran Universitas Sumatera Utara 2011

Pendahuluan

Beberapa penelitian di bidang kedokteran sering ingin menilai apakah ada hubungan antara dua variabel (dependent dan independent) yang numerik.

contoh :  Hubungan Index Massa Tubuh dengan kadar kolesterol.

 Hubungan antara KGD dengan Kadar LDL pada pasien DM.

 Analisis regresi  dapat diketahui bentuk hubungan antara dua variabel (Prediksi dari data yang ada).

 Analisis korelasi  untuk mengetahui eratnya hubungan antara dua variabel.

 Semakin erat hubungannya maka semakin yakin bahwa hubungan dua variabel tersebut adalah hubungan sebab akibat.

 Analisis regresi dan korelasi didasarkan atas hubungan yang terjadi antara dua variabel atau lebih.

 Variabel yang digunakan untuk meramal disebut variabel bebas (independen). Dapat lebih dari satu variabel.

 Variabel yang akan diramal  variabel respons (dependen). Terdiri dari satu variabel.

A. Diagram Tebar (Scatter plot)

 Diagram tebar adalah diagram dengan memakai garis koordinat dengan axis X dan ordinat Y.  Tiap pengamatan diwakili oleh satu titik.

 Hubungan antara variabel dapat berupa garis lurus (linier), garis lengkung (kurva linier) atau tdk terlihat pola tertentu.

 Dapat berupa garis regresi positif atau negatif.

Contoh

 linier positif  linier negatif

Kekuatan Hubungan

 Bila titik-titik menebar pada satu garis lurus, maka kekuatan hubungan antara kedua variabel tersebut sangat sempurna.

 Kekuatan hubungan dapat dikuantifikasi melalui suatu koefisien yaitu koefisien korelasi (r pearson).

 Koefisien ini akan berkisar antara 0 – 1.

bila r = 0  tidak ada hubungan linier.

r = 1  hubungan linier sempurna.

0-1 = bila mendekati 1 semakin kuat hubungannya, bila mendekati 0 semakin lemah hubungannya.

 Lihat tandanya apakah korelasi positif atau negatif.

Interval Koefisien 0.000 – 0.199

0.200 – 0.399

0.400 – 0.599

0.600 – 0.799

0.800 – 1.000

Tingkat Hubungan Sangat rendah Rendah Sedang Kuat Sangat kuat

Rumus koefisien korelatif

( Pearson ) n(∑XY) – (∑X) (∑Y) r = √[(n∑X2) – (∑X)2] [(n∑Y2) – (∑Y)2] Ket: n = jumlah sampel X = nilai pada ordinat X Y = nilai pada ordinat Y

Contoh..

No X (SGOT) 1.

2.

3.

4.

5.

6.

7.

∑ 12.7

11.3

13.5

15.1

17.9

19.3

15.5

105.3

Y (HDL) 42.2

41.2

42.3

42.8

43.8

44.5

45.5

302.3

n(∑XY) – (∑X) (∑Y) r = √[(n∑X 2 ) – (∑X) 2 ] [(n∑Y 2 ) – (∑Y) 2 ] XY 535.94

465.56

571.05

646.28

784.02

858.85

705.25

4566.95

X 2 161.29

127.69

182.25

228.01

320.41

372.49

240.25

1632.39

7 (4566.95) – (105.3) (302.3) r = √[(7x1632.39) – (105.3) 2 ] [(7x13068.35) – (302) 2 ] = 0.768

Y 2 1780.84

1697.84

1789.29

1831.84

1918.44

1980.25

2070.25

13068.35

Scatter Plot

46 45 44 43 42 41 40 10 Hubungan Kadar SGOT dengan Kadar HDL 12 14 SGOT 16 18 20

Kesimpulan hasil

 Dilihat dari besarnya r yang mendekati 1, maka hubungan antara SGOT dengan HDL adalah kuat.

 Berpola linier positif  Maka makin tinggi SGOT maka akan semakin tinggi kadar HDL.

Koefisien Determinasi

 R = r 2  Yaitu besarnya proporsi variasi Y yang dapat dijelaskan oleh variabel X.

 Apabila r = 1 maka R = 100%  X memegang peranan dalam perubahan Y. bila terjadi perubahan X, maka Y akan berubah.

Pada kasus diatas r = 0.768 maka R = r 2 R= (0.768) 2 = 0.59  59%.

Hal ini berarti HDL dapat dijelaskan oleh Variabel SGOT sebesar 59%.

Uji Hipotesis koefisien Korelasi

 Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung dengan uji t. rumusnya: t= r√(n-2) √(1-r 2 ) df= n-2 bila t hitung > t tabel, Ho di tolak bila t hitung < t tabel, Ho diterima

dk 1 2 3 6 7 8

9

4 5 17 18 19 20 10 11 12 13 14 15 16 5% 0,887 0,950 0,878 0,811 0,754 0,707 0,666 0,632 0,602 0,576 0,553 0,532 0,514 0,497 0,482 0,468 0,456 0,444 0.433

0,423 1 % 1,000 0,999 0,959 0,917 0,874 0,834 0,798 0,765 0,735 0./08 0,684 0,661 0,641 0,623 0,606 0,590 0.575

0,561 0,549 0,537 dk .

24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 125 150 200 300 5% 0,388 0,381 0,374 0,367 0,361 0,355 0,349 0,325 0,304 0,288 0,273 0,250 0,323 0,217 0,205 0,195 0,174 0,159 0,138 0,113 1% 0,496 0,487 0,478 0,470 0,463 0,456 0,449 0,418 0,393 0,372 0,354 0,325 0,302 0,283 0,267 0,254 0,228 0,208 0,148 0,148

B. Regresi Linier

 Persamaan garis Linier : Y = a + bX    Pada persamaan ini harus jelas dan tentukan mana variabel Y (dependen) dan variabel X (independen). Penetapan disesuaikan dengan tujuan analisis.

Biasanya variabel Y  Variabel X  lebih sulit diukur lebih mudah diukur  Mengapa?

 Karena dari persamaan garis regresi linier, kita dapat melakukan banyak hal. Contohnya : menduga satu nilai variabel dependen berdasarkan nilai variabel bebasnya.

 Dari contoh kasus diatas, SGOT merupakan variabel bebas dan HDL merupakan variabel terikat. Sehingga: HDL = a + b SGOT  Garis linier dapat digambarkan bila koefisien a dan b diperoleh.

Metode kuadrat terkecil

b= n(∑XY) – (∑X) (∑Y) n∑(X) 2 – (∑X) 2 Koefisien b = besarnya perubahan nilai variabel Y apakah nilai variabel X berubah sebesar satu unit (satuannya) Koefisien a = nilai awal/intercept  variabel Y, bila variabel X = 0 besarnya nilai a = y - bx

 Maka dari contoh soal diatas dapat dihitung: b= n(∑XY) – (∑X) (∑Y) n∑(X) 2 – (∑X) 2 b= 7x4566.95 – (105.3x302.3) 7x1632.39 – (105.3) 2 = 0.403

a= y – bX = (302.3/7) – (0.403)(105.3/7) = 37.123

Maka HDL = 37.123 + 0.403 SGOT

Regresi Linier Ganda

 Contoh kasus diatas adalah Regresi linier sederhana.

 Hubungan 1 variabel dependen biasanya tidak hanya dengan satu variabel saja.  Variabel X lebih dari 1.

 maka : Y = a + b1X1 + b2X2 + …….+b p X p Hasilnya sudah terkontrol koefisien b terhadap variabel bebas lain yang berada dalam model.

 Dalam hal ini koefisien determinasi (R) cukup penting. Untuk menjelaskan variabel X yang kita pilih dapat menjelaskan variasi Y.

soal

 sebuah penelitian untuk mengetahui apakah ada hubungan antara Hb'ibu hamil dengan berat badan bayi lahirnya.  Peneliti mengumpulkan data sebanyak 20 responden, melalui catatan medik di salah satu rumah sakit di Jogjakarta.

 Hasil pengumpulan data kemudian di masukkan pada tabel berikut ini:

No 8 9 10 5 6 7 1 2 3 4 Hb 11.2

11.3

11.5

10.6

10.7

10.5

11.6

11.7

11.3

11.4

BBL 2500 2450 2500 2450 2470 2490 2510 2570 2600 3000 No 11 12 13 14 15 16 17 18 19 20 Hb 10.7

10.1

10.3

11.9

12.1

12.2

11.9

12.5

12.3

12.4

BBL 2700 2560 2600 2700 3200 3400 3000 3200 3400 3400

soal

 Tentukan lah :  Koefisien korelasi nya dan interpretasi nya  Korelasi determinasi nya dan interpretasi nya.

 persamaan regresi linier nya  Berapa perkiraan nilai BBL jika Hb ibu 11,8

No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 X 11.2

11.3

11.5

10.6

10.7

10.5

11.6

11.7

11.3

11.4

10.7

10.1

10.3

11.9

Y 2500 2450 2500 2450 2470 2490 2510 2570 2600 3000 2700 2560 2600 2700 X 2 .

125.44

127.69

132.25

112.36 .

114.49 • 110.25

134.56

136.89

127.69 ' 129.96

114.49

102.01

106.09

141.61

Y* ' 6250000 6002500 ' 6250000.

6002500 6100900 6200100 6300100 6604900 6760000 9000000 7290000 6553600 6760000 7290000 X.Y

28000 27685 28750 25970 26429 26145 29116 30069 29380 34200 28890 25856 26780 32130