Analisis Regresi - Blog Mahasiswa UI

Download Report

Transcript Analisis Regresi - Blog Mahasiswa UI

ANALISIS REGRESI
Seringkali dalam praktek,ingin diketahui apakah
ada hubungan antara dua variabel atau lebih,
misalnya :
- apakah ada hubungan antara masa
penyembuhan pasien dengan dosis obat yang
diberikan.
- apakah ada hubungan antara hasil panen padi
dengan jumlah pupuk yang digunakan.
- apakah ada hubungan anatara kadar lemak
dalam darah dengan umur,berat badan dan
tekanan darah.
Hubungan antara variabel-variabel tersebut
biasanya dinyatakan dalam bentuk persamaan
matematik dan persamaan tersebut dapat
digunakan untuk tujuan peramalan,yaitu
menentukan nilai suatu variabel bila nilai
variabel lainnya diketahui.
 Studi yang menyangkut masalah semacam ini
disebut : analisis regresi.
 Dalam analisis regresi,dibedakan dua jenis
variabel ,yaitu variabel tak bebas dan variabel
bebas.

REGRESI LINIER SEDERHANA
Dalam regresi linier sederhana, akan dipelajari
hubungan linier antara variabel tak bebas Y
dengan satu variabel bebas X.
 Untuk mendapatkan persamaan regresi/model
regresi antara variabel X dan Y , pertama kali
dibuat plot data  xi , yi  ; i  1, 2, , n pada bidang xy.
 Plot tersebut dinamakan diagram pencar.
 Berdasarkan diagram pencar dapat dicari garis
atau lengkungan yang mendekati titik-titik data
tersebut.

Model regresi linier sederhana:
Yi  0  1 X i   i , i= 1,2,…,n
Dimana :
Yi : variabel tak bebas
X i : variabel bebas
0 , 1 : parameter / koefisien regresi
 i : error diasumsikan saling bebas dan

i
Cat : Linier dalam hal ini adalah linier dalam
parameter (  ,  ).
0
1
N
 0, 
2
Parameter 0 dan 1 tidak diketahui nilainya dan
harus diduga/ditaksir dari data sampel.
 Salah satu cara untuk menduganya/menaksirnya
adalah menggunakan metode kuadrat terkecil,
yaitu suatu metode untuk menaksir parameter
regresi dengan meminimumkan jumlah kuadrat
error.
  i  yi  0  1 xi , Q       y     x 
 Syarat Q minimum :

n
i 1
Q
0
 0
Q
0
1
n
2
i
i 1
2
i
0
1 i
n
 Q  2  y     x   0

i
0
1 i
0
i 1

dan
n
Q
 2 xi  yi  0  1 xi   0
1
i 1
Misalkan b0 dan b1 adalah taksiran untuk
maka :
n
n
1.   yi  b0  b1 xi   0
2.  xi  yi  b0  b1 xi   0
i 1
0 , 1 ,
i 1
Sistem persamaan di atas disebut persamaan
normal

Solusinya :
 n  n 
n xi yi    xi   yi 
 i 1  i 1 
b1  i 1
2
n
n


n xi2    xi 
i 1
 i 1 
n
1 n
y   yi
n i 1

Taksiran garis regresi :
yˆ  b0  b1x
b0  y  b1x
1 n
x   xi
n i 1
INFERENSI MENGENAI KOEFISIEN REGRESI
Salah satu cara untuk memeriksa apakah
taksiran regresi yang diperoleh dari data sampel
baik atau tidak adalah dengan melakukan
analisis residual.
 Residual : selisih nilai antara nilai pengamatan y i
dengan nilai taksirannya yˆ i .
Residual :
ei  yi  yˆi = yi  b0  b1 xi
Jumlah Kuadrat Residual :

n
n
JKe   e   yi  b0  b1 xi 
i 1
2
i
i 1
2
se2 
JKe
n2
Rata-rata jumlah kuadrat residual :
 Asumsi model :  N   sehinnga diperoleh:

0, 2
i
Yi
N  , 2

b0
i
N

i  0  1 xi

2
0 , 0

n


x

i


 2
  n i 1
 n ( x  x )2 
  i

 i 1

 2
0
b1
N  , 2

1
1

 
2
2
1
n
 (x  x )
i 1
2
i
se2 adalah penaksir tak bias untuk  2 .

Untuk inferensi digunakan transformasi
, berdistribusi t dg db = n-2
b 
t
0
0
sb0
t
b1  1
sb1 , berdistribusi t dg db = n-2
Dimana :
n


2
x

i



sb20  se2  n i 1
 n ( x  x )2 
  i

 i 1

dan
s 
2
b1
se2
n
 (x  x )
i 1
2
i
Interval kepercayaan 1  100% untuk 0 adalah :
b0  t ;n2  sb0  0  b0  t ;n2  sb0
2
2

Interval kepercayaan
1  100%
untuk
1
adalah:
b1  t ;n2  sb1  1  b1  t ;n2  sb1
2

2
Uji hipotesis untuk 1
- Hipotesis : H 0 : 1  0
H1 : 1  0
- Pilih tingkat signifikansi 
- Statistik uji : b  
t
s
berdistribusi t dg db = n-1
1
1
b1
- Daerah kritis :
Ho ditolak jika
t  t ;n2
2
atau
t  t  ;n  2
2
Contoh :
Suatu perusahaan perkebunan durian dikota A
melakukan uji coba pemberian pupuk organik
dan diharapkan dapat mempengaruhi produksi
durian.Selama uji coba pada tahun 2003 ,
diperoleh data sebagai berikut :
Jumlah Produksi
Durian
(kilogram) : Y
Banyaknya Pupuk
Organik
(kilogram) : X
100
2
120
2
140
3
150
3
165
3
190
4
200
4
220
5
Tentukan taksiran garis regresi dari data di atas
RUMUS UNTUK PERHITUNGAN
 n 2
n x    xi 
n
1


 i 1 
sx2 
( xi  x ) 2   i 1


n  1  i 1
n  n  1

n
2
2
i
n
 n 2
2
n
y


i
  yi 
n
1


 i 1 
s y2 
( yi  y )2   i 1


n  1  i 1
n  n  1

JKe   n  1  s y2  b12 sx2 
se2 
JKe n  1 2

s y  b12 sx2 

n2 n2
n
s s
2
b0
2
e
x
i 1
s2 
2
i
n  n  1 s
b1
2
x
 n  1 sx2
se2
Model Regresi :
Yi  0  1 X i   i , i = 1,2,…8
Dimana :
Yi : jumlah produksi durian
Xi : jumlah pupuk organik
 ,  : parameter dan

: error yang diasumsikan 
0
1
i
i
N 0, 2



Dari data diperoleh :
x
i 1
8
y
i 1
8
i
 26
 xi2  92
i
 1285
8
8
 xi yi  4465
i 1
x  3, 25
n
2
y
 i  218.225
i 1
y  160, 625
i 1
Sehinnga
 8 4465    26 1285   38,5
b1 
2
 8  92    26 
Persamaan garis regresi :
b0  160,625  83, 25  35,5
yˆ  35,5  38,5x
- Uji hipotesis untuk data di atas :
H 0 : 1  0
H1 : 1  0
-
Pilih  0, 05
-
 8 92    26 
sx2 
8  8  1
se2 
sb1 
-
2

8 218.225  1285
s y2 
1,0714,
8  8  1


7
2
1688,8393   38,5  1, 0714   117,55
6
117,55
 3,825
 7 1, 0714 
Statistik uji :
t
b1  1 38,5  0

 10,065
sb1
3,825
2
 1688,8393
-
Wilayah kritik :
t  t0,025;6 atau t  t0,025;6
t0,025;6  2, 447
Karena t  10,065  2, 447 maka Ho ditolak
- Kesimpulan : ada hubungan linier antara jumlah
pupuk organik dengan jumlah produksi durian
Sehinnga persamaan garis regresi dapat
digunakan untuk menaksir jumlah produksi
durian apabila diketahui jumlah pupuk tertentu.