uji logistik regresi - andan + ners = andaners

Download Report

Transcript uji logistik regresi - andan + ners = andaners

STATISTIK TERAPAN
Oleh :
Dr. dr. Buraerah. H. Abd. Hakim, MSc
( Jurusan : Biostatistik / KKB FKM – UH )
PROGRAM PASCASARJANA UNIVERSITAS HASANUDDIN
Program Magister Epidemiologi Non
Reguler
REGRESSI LINIER
BERGANDA LOGISTIK
REGRESSI LINIER BERGANDA LOGISTIC
MODEL UMUM
p = a + b1x1 + b2x2 + ………………. .. bn xn
 Model tersebut baru dapat dipakai apabila “p”
ditransformasikan dalam bentuk “ logodds “
 “ Logodds “ = logit  ialah logaritme natural dari odds.
 Odds  sendiri adalah rasio antara probabilitas suatu “
peristiwa “ untuk terjadi (sukses) dan probabilitas peristiwa
untuk tidak terjadi (gagal).
p = a + b1x1 + b2x2 + ………………. .. bn xn
KETERANGAN:
Ruas kanan terdiri dari :
►(a) = Konstanta, sejmlah koef regressi (bi), dan variabel prediktor
►Ruas kanan bisa bernilai
prediktor
< 0  apabila konstanta (a) – (bi) x var
►Ruas kanan bisa juga bernilai > 1  apabila konstanta (a) + (bi) x var
prediktor
►ruas kiri adalah (p) atau probability terjadinya peristiwa dan tidak
terjadinya peristiwa :
(p)
------------  nilai selalu berkisar antara 0 - 1
(1-p)
►Ketidak cocokan tersebut adalah petunjuk bahwa persamaan tidak dapat
digunakan
Apabila probabilitas suatu peristiwa untuk terjadi disebut ( p )
maka dengan sendirinya probabilitas suatu peristiwa untuk tidak
terjadi adalah (1 – p )
Dengan demikian “ log odds “ untuk (p) adalah sebagai berikut :
p
Log odds (p) = -----------(1- p)
Nilai ini nanti dapat digunakan apabila ditransformasi kedalam
bentuk nilai logarithma naturalnya.
Dengen demikian rumus umum dari regressi berganda logistik
adalah :
p
Ln ( -------- ) = a + b1x1 + b2x2 + ………… bn xn
1- p
Keterangan :
a
= konstanta (interceps)
b1, b2 … = koefisien korelasi variabel prediktor
atau idependen) yang dikenal dengan “slope
“.(koefisien korelasi variabel indep)
x1, x2, ….xk = variabel prediktor yang akan dilihat
pengaruhnya.
p = probabilitas untuk terjadinya peristiwa dari
variabel respons ( dependen) Y yang berskala
biner (binary) dan berdistribusi normal
PERSAMAAN GARIS REGRESSI
Y = a + bx
Var. Y = (p) / (1- p)
Var. prediktor (xi)
b
a
Slope
Intercept
Var. X
CONTOH PENGGUNAAN
Seorang dokter ingin memperkirakan kemungkinan untuk bertahan hidup dari
seorang bayi baru lahir dengan kesulitan bernapas karena IRDS (Irregular
Respiratory Distress Sindrome) dengan kondisi bayi sbb :
►Nilai APGAR = adalah antara 0 – 10
►Pertolongan yang akan diberikan adalah bantuan pernapasan dengan nilai :
1 = bila diberikan dan 0 bila tidak diberikan.  Kode (RESP)
►Untuk kepentingan tersebut diambil sampel sebanyak 30 bayi dengan hasil
sebagai berikut :
VARIABEL
RESP
APGAR
Constant
B
SE
Wald
DF
Sig
R
Exp(B)
- 2.9468
1.1804
0.3907
7.1379
6.2320
5.8652
5.1570
1
1
1
0.0125
0.0154
0.0232
- 0.3190
0.0525
9.5247
2.2539
- 16.2095
0.3094
Dengan model persamaan :
Y = - 16.2095 – 2.9469 (RESP) + 2.2539 (APGAR)
NOTASI HASIL UJI
B = Koefisien, yang mirip dengan regresi biasa, namun
disini berarti “ ln rasio odds ”. Artinya setiap kenaikan 1unit
variabel APGAR , maka ln rasio odds akan bertambah (+
2.2539) Demikian juga dengan var. RESP maka “ ln rasio
oddsnya akan berkurang ( - 2.9468 )
Wald = adalah kuadrat dari (B) dibagi dengan standar
errornya.  penilaiannya didasarkan atas Degree of
Freedom, dan memberi arti apakan variabel independen
bermakna atau tidak ( acuan ini sifatnya tidak mutlak).
( B )2
------------- = 6.2320 untuk DF 1 = 0.0125 (signif.)
SE
NOTASI HASIL UJI
R = Besarnya kontribusi variabel variabel independen
(RESP) = - 0.3190 dan (APGAR) = 0.3049, bila dimasukkan
kedalam model.  Mirip dengan korelasi partiel dari
regressi liner berganda.
Exp(B) atau  eB. adalah rasio odds dari variabel tersebut setelah
dikontrol dengan variabel lainnya.
Artinya setiap kenaikan 1 unit variabel independen (RESP) maka
rasio odds pernapasan buatan adalah 0.0525.  Oleh karena
exp(B) adalah inversi dari ln rasio odds, maka kemungkinan hidup
bayi bila diberi pernapasan batan adalah : 1/ 0.0525 = 1/19
kalinya.
Sebaliknya setiap nilai APGAR naik 1 unit, maka rasio oddsnya
adalah: 9.5247. artinya kemungkinan hidupnya = 9.5247 kali.
► Apabila bayi yang lahir dengan APGAR = 9 dan
tidak diberi pertolongan pernapasan, maka ln
rasio odds nya adalah :
Y = - 16.2095 – 2.9468 (0) + 2.2539 (9) = 4.0756
sedangkan rasio odd nya menjadi  e4.0756 = 58.89
atau sekitar 59 kali. Atau kemungkinannya untuk
mati adalah 59 kali lipat
TESTING MODEL REGRESSI
LINIER BERGANDA
LOGISTIK
13
2
3
12
ChiSquare
DF
-2 log-likelihood model tanpa variabel bebas (1)
41.59
29
-2 log-likelihood model (2)
21.27
27
0.7735
Model Chi-Square = (1) - (2)
20.32
2
0.0000
Improvement
20.32
2
0.0000
Goodness of Fit
21.04
27
0.7842
Jenis Indeks
Signif.
Baris
Keterangan
Hasil
Sign.
1
Tanpa variabel bebas, maka nilai Chi-Square adalah
41,59
2
Nilai Chi-Square hasil perhitungan
dibandingkan
dengan model sempurna, (bila semua variabel
independen penting untuk memprediksi variabel
dependen dimasukkan ke dalam model.
21,27
0.7735
3
Perbedaan hasil  sebelum dimasukkan variabel
independen dengan
setelah dimasukkan variabel
independen (baris 1 - baris ke 2) dan hasilnya signif.
20,32
0.0000
4
Perbaikan antara 2 model (Improvement)
20,320
0.0000
5
Hasil dari model sempurna dibandingkan dengan
dengan model terakhir
21.04
0.7842
Keistimewaan :
Mampu mengkomversi koefisien regressi (bi) menjadi Rasio
odds sebagai berikut :
OR = Exp (bi)  dengan :
Keterangan :
OR = Rasio Odds variabel prediktor (xi) atau (independen)
terhadap variabel dependennya
bi
= Koefisien regressi variabel prediktor (independen) xi
Exp = Exponensial, atau inversi dari logaritma natural ( ln).
HASIL UJI REGRESSI LINIER
BERGANDA LOGISTIK
Case Processing Summary
Unweig hted Cases
Selected Cases
Unselected Cases
Total
a
N
Included in Analysis
Missing Cases
Total
174
0
174
0
174
a. If weight is in effect, see classification table for the total
number of cases.
Percent
100,0
,0
100,0
,0
100,0
Block 0: Beginning Block
Iteration Historya,b,c
Iteration
Step
1
0
2
-2 Log
likelihood
240,847
240,847
Coefficients
Constant
,092
,092
a. Constant is included in the model.
b. Initial -2 Log Likelihood: 240,847
c. Estimation terminated at iteration number 2 because
parameter estimates changed by less than ,001.
Classification Tablea,b
Predicted
Step 0
Observed
MAMPUY
,00
1,00
Overall Percentage
a. Constant is included in the model.
b. The cut value is ,500
MAMPUY
,00
1,00
0
83
0
91
Percentage
Correct
,0
100,0
52,3
Variables in the Equation
B
Step 0
Constant
,092
S.E.
,152
Wald
,368
df
1
Sig.
,544
Exp(B)
1,096
Variables not in the Equationa
Step
0
Variables
KREDIBY
KREDIY
MANFAY
CONTEY
CLARIY
KONTINUY
CHANELY
Score
74,768
74,768
83,581
93,030
110,026
91,141
101,877
df
a. Residual Chi-Squares are not computed because of redundancies.
1
1
1
1
1
1
1
Sig .
,000
,000
,000
,000
,000
,000
,000
Block 1: Method = Forward Stepwise (Likelihood Ratio)
Omnibus Tests of Model Coefficients
Step 1
Step 2
Step 3
Step
Block
Model
Step
Block
Model
Step
Block
Model
Chi-square
127,110
127,110
127,110
22,586
149,696
149,696
3,522
153,219
153,219
df
1
1
1
1
2
2
1
3
3
Sig .
,000
,000
,000
,000
,000
,000
,061
,000
,000
Model Summary
Step
1
2
3
-2 Log
likelihood
113,737
91,151
87,629
Cox & Snell
R Sq uare
,518
,577
,585
Nag elkerke
R Sq uare
,692
,770
,781
Variables in the Equation
Step
a
1
Step
b
2
Step
c
3
CLARIY
Constant
CLARIY
CHANELY
Constant
CLARIY
KONTINUY
CHANELY
Constant
B
4,528
-2,639
3,266
3,006
S.E.
,550
,463
,612
,663
Wald
67,716
32,502
28,462
20,551
-3,901
,683
2,990
1,296
2,359
-4,090
,633
,667
,750
,731
a. Variable(s) entered on step 1: CLARIY.
b. Variable(s) entered on step 2: CHANELY.
c. Variable(s) entered on step 3: KONTINUY.
df
1
1
1
1
Sig .
,000
,000
,000
,000
Exp(B)
92,615
,071
26,210
20,208
32,602
1
,000
,020
22,292
3,775
9,889
31,288
1
1
1
1
,000
,052
,002
,000
19,894
3,656
10,578
,017
Correlation Matrix
Step
1
Step
2
Step
3
Constant
CLARIY
Constant
CLARIY
CHANELY
Constant
CLARIY
KONTINUY
CHANELY
Constant
1,000
-,841
1,000
-,538
CLARIY
-,841
1,000
-,538
1,000
CHANELY
-,669
-,116
1,000
1,000
-,494
-,220
-,518
-,494
1,000
-,117
-,058
-,518
-,058
-,399
1,000
KONTINUY
-,669
-,116
-,220
-,117
1,000
-,399
Model if Term Removed
Variable
Step 1 CLARIY
Step 2 CLARIY
CHANELY
Step 3
CLARIY
KONTINUY
CHANELY
Model Log
Likelihood
-120,424
-61,650
Chang e in
-2 Log
Likelihood
127,110
32,150
-56,868
-55,807
-45,575
-48,862
1
1
Sig . of the
Chang e
,000
,000
22,586
1
,000
23,986
3,522
10,096
1
1
1
,000
,061
,001
df
Variables not in the Equationa
Step
1
Variables
Step
2
Variables
Step
3
Variables
KREDIBY
KREDIY
MANFAY
CONTEY
KONTINUY
CHANELY
KREDIBY
KREDIY
MANFAY
CONTEY
KONTINUY
KREDIBY
KREDIY
MANFAY
CONTEY
Score
12,738
12,738
9,513
19,272
22,081
33,278
2,935
2,935
,478
1,551
3,915
3,256
3,256
,138
1,553
df
a. Residual Chi-Squares are not computed because of redundancies.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Sig .
,000
,000
,002
,000
,000
,000
,087
,087
,489
,213
,048
,071
,071
,710
,213
Terima kasih
“ Wassalamu Alaikum Wr Wb “