MULTI REGRESI LOGISTIK

Download Report

Transcript MULTI REGRESI LOGISTIK

ANALISIS
REGRESI GANDA LOGISTIK
Multiple Regression Logistic
Pengertian Regresi Logistik:
 Suatu model matematik yang digunakan untuk mempelajari
hubungan satu atau beberapa variabel independen dengan
satu variabel dependen yang bersifat dikotomi (binary).
Variabel bianry : adalah variabel yang hanya memiliki dua
nilai, misalnya (sakit / sehat), (merokok/ tdk merokok),
(BBLR/ normal) dll
 Variabel Independen (prediktor) sebaiknya kategorik, agar
mudah untuk menginterpretasikan hasil analisisnya.
 Bila variabel prediktor 3 kategori atau lebih, maka dibuat dua
kategori. Caranya ; dummy variabel, kategori ulang sesuai
logika biologik.
Pengertian Regresi Logistik ............................
 Analisis regresi ganda logistik adalah alat statistik yang sangat
kuat untuk menganalisis hubungan antara paparan dan
penyakit dengan serentak mengontrol pengaruh sejumlah
faktor perancu potensial.
 Tujuan analisis regresi ganda logistik yaitu menemukan model
regresi yang paling sesuai, paling irit, sekaligus masuk akal
secara biologik, untuk menggambarkan hubungan antara
variabel dependen dan satu set variabel prediktor dalam
populasi.
 Manfaat analisis regresi ganda : (a) Meramalkan terjadinya
variabel dependen pada individu berdasarkan nilai-nilai
sejumlah variabel prediktor yang ada pada individu tersebut.
Pengertian Regresi Logistik ............................
 Manfaat : (b) Mengukur hubungan antara veriabel respon dan
prediktor, setelah mengontrol pengaruh prediktor (kovariat)
lainnya.
Keistimewaan
Regresi Logistik Ganda
(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi
rasio odds (OR).  OR = exp [bi]
(b) Kemampuan menaksir probabilitas individu untuk sakit
(mengalami event) berdasarkan nilai-nilai sejumlah variabel
prediktor, dengan rumus sebagai berikut :
Macam Regresi logistik :
1.
Regresi logistik sederhana
Untuk mempelajari hubungan antara satu variabel
prediktor dengan satu variabel dependen dikotomus.
2. Regresi logistik ganda (Multiple Regression Logistic)
Untuk mempelajari hubungan antara beberapa variabel
prediktor dengan satu varibel dependen dikotomus.
Model Regresi Ganda Logistik
Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.
Odds : rasio probabilitas suatu peristiwa
untuk terjadi dan probabilitas suatu peristiwa
untuk tidak terjadi
a
= Konstanta ( intersep)
b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)
X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan
diteliti.
p
= probabilitas untuk terjadinya “peristiwa” dari
variabel dependen yg dikotomus.
 Pembangunan model regresi ganda logistik hendaknya tidak
terjebak oleh penggunaan veriabel prediktor yang terlalu
banyak.
 Pemilihan variabel sebaiknya dilakukan dengan cara-cara yang
lebih purposif, dan tidak terpaku pada pendekatan yang
sifatnya deterministik menurut kamaknaan statistik.
 Makin banyak variabel yang dimasukkan dalam model hanya
akan meningfkatkan kesesuaian garis regresi dengan
hubungan antara variabel dependen dan sejumpan variabel
prediktor pada data sampel, tetapi belum tentu
menggambarkan hubungan tersebut pada tingkat populasi.
 Hal itu disebabkan karena, bertambahnya variabel prediktor
(baik yang relevan maupun tidak relevan) hanya akan
menaikkan nilai taksiran kesalahan baku, sehingga membuat
model tersebut sangat tegantung kepada data pengamatan
sampel.
 Kesimpulannya, model tersebut tidak merefleksikan /
meggambarkan hubungan variabel respon dan variabelvariabel prediktor dalam populasi yang sesungguhnya.
PROSEDUR PEMILIHAN VARIABEL
Agar diperoleh model regresi yang baik adalah
sebagai berikut :
Melakukan analisis univariate untuk menyaring
variabel-variabel yang penting.
2. Memasukkan dan/ atau mengeluarkan variabelvariabel dalam model multivariate
3. Memasukkan dan memeriksa kemungkinan ada
interaksi variabel dalam model.
1.
Melakukan analisis univariate
untuk penyaringan awal :
Uji statistik yang dipakai adalah : chi-quadrat
 Jika ada variabel prediktor lebih dari dua kategori,
maka dibuat menjadi dua kategori terlebih dahulu.
Perlu diingat bahwa dalam melakukan recode harus
mempunyai alasan biologik.
 Mickey dan Greenland : variabel variabel yang
mempunyai nilai p= 0,25 dan memiliki kemaknaan
biologik hendaknya dipertimbangkan untuk
dimasukkan ke dalam model multivariate.

Univariate ........
 Batasan P= 0,25, untuk mengantisipasi kemungkinan variabel
yang secara terselubung sesungguhnya penting untuk
dimasukkan dalam model. “Terselubung” kemungkinan
variabel variabel secara kolektif dapat menjadi prediktor
penting, walaupun secara sendiri sendiri merupakan
prediktor lemah.
Memasukkan / mengeluarkan variabel
dalam model regresi :
Beberapa Metode :
1. Enter
2. Stepwise
3. Forward
4. Backward
Conditional, LR (likelihood ratio), Wald
Memeriksa Kemungkinan Interaksi
 Jika dengan uji interaksi menunjukkan kemaknaan statistik,
maka kita katakan interaksi memberikan kontribusi penting
kepada model. Jika suatu interaksi hanya memperbesar
taksiran kesalahan baku (S.E.) dan tidak mengubah taksiran
koefisiens regresi (b1), maka interaksi tersebut mungkin tidak
penting.

Latihan
Sebuah studi Kohor prospektif, meneliti pengaruh aktifitas fisik
(AF) terhadap kejadian infark otot jantung (MI). Variabel lain
yang diukur adalah umur dalam kategori (AGRP) dan
kebiasaan merokok.
Kategorisasi nilai variabel
MI
AF
= 1 : sakit 0 : tidak sakit
= 1 : aktifitas fisik >= 2500 kcal/ hari
0 : aktifitas fisik < 2500 kcal/hari
AGRP
= 1 : umur >= 55 tahun
0 : umur < 55 tahun
Kebiasaan merokok
= 2 : merokok >= 15 btg / hari
1 : merokok < 15 btg /hari
0 : tidak merokok
Varabel rancangan
Kebiasaan merokok
- Jumlah variabel yang dibutuhkan ( k-1)  3-1 : 2
- Sebagai contoh MRK menjadi D1 dan D2
- Sebagai salah satu rancangan pengkodean variabel tersebut,
maka variabel bukan perokok sebagai variabel acuan
(refference)  dengan kode
D1=0 D2=0
- Selanjutnya merokok <15 btg / hari D1=1 D2=0
- Dan merokok >= 15 btg/hari
D1=0 D2=1
Sehingga menjadi :
Variabel asli
MRK
Tidak merokok
Merokok < 15 btg / hari
Merokok >= 15 btg / hari
Variabel rancangan
D1
D2
0
1
0
0
0
1
File download :
http://www.ziddu.com/download/8461706/RegresiLogistik.rar.html
Cek kelayakan variabel untuk dimasukkan dalam model :
Menggunakan chi-square
Kriteria variabel yang masuk p=0,25
Hasil analisis univariate... ?
AF
AGRP
D1
D2
p=0,000
p=0,000
p=0,000
p=0,052
Hasil Regresi Logistik
95,0% C.I.for
EXP(B)
B
Step
1(a)
AF
AGRP
D1
D2
Constant
S.E.
Wald
df
Sig.
Exp(B) Lower
Upper
-2,243
1,019
4,846
1
,028
,106
,014
,782
2,013
,977
4,242
1
,039
7,487
1,102
50,848
2,478
1,084
5,225
1
,022
11,920
1,424
99,793
2,673
1,316
4,130
1
,042
14,490
1,100 190,922
-1,915
,995
3,699
1
,054
,147
Persamaan yg di dapat :
1
P= _________________________________________
- [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2)
1 +e
Variables in the Equation
Step
a
1
AF
AGRP
D1
D2
Constant
B
-2,243
2,013
2,478
2,673
-1,915
S.E.
1,019
,977
1,084
1,316
,995
Wald
4,846
4,242
5,225
4,130
3,699
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.
df
1
1
1
1
1
Sig.
,028
,039
,022
,042
,054
Exp(B)
,106
7,487
11,920
14,490
,147
Meramalkan Probabilitas Individu untuk mengalami sakit
Berdasarkan persamaan tersebut diatas, berapa probabilitas
untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari
Perhitungan :
Variables in the Equation
Step
a
1
AF
AGRP
D1
D2
Constant
B
-2,243
2,013
2,478
2,673
-1,915
S.E.
1,019
,977
1,084
1,316
,995
Wald
4,846
4,242
5,225
4,130
3,699
df
1
1
1
1
1
Sig.
,028
,039
,022
,042
,054
Exp(B)
,106
7,487
11,920
14,490
,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.
1
P= _________________________________________
- [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)]
1 +e
Berdasarkan persamaan tersebut diatas, berapa probabilitas
untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1)
Melakukan aktifitas fisik 2.000 kcal / hari
2)
Berumur 35 tahun
3)
Merokok rata-rata 5 btg / hari
AF = 0 tidak berisiko
Umur = 0 tidak berisikok
Merokok < 15 batang  D1 = 1
D2=0
1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e
Perhitungan :
1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e
= 0,64  64%
In mathematics, the exponential function is the function ex, where e is the number
(approximately 2.718281828)
Interpretasi :
Individu yang berumur 35 tahun dan hanya melakukan aktifitas
fisik sebesar 2.000 kcal / hari, serta membunyai kebiasaan
merokok 5 batang per hari, maka memiliki probabilitas untuk
terkena MI sebesar 64%.
Interaksi
Asumsi adanya Interaksi
1. Logika substantif / biologik
2. Interaksi antara variabel a dan b, terjadi bila efek a terhadap
Y tergantung nilai b, atau efek b terhadap Y tergantung nilai
a.