Transcript BAB 7 Regresi dan Korelasi
BAB 7 Regresi dan Korelasi
A. PENDAHULUAN
Pada Bab 4 dan Bab 5 kita telah mempelajari analisis data mengenai satu variabel yang menggambarkan satu kejadian, kegiatan, dan keruncingan distribusi data termasuk dalam analisis data satu variabel.
Dalam kehidupan sehari-hari seringkali kita menemui kejadian-kejadian, kegiatan-kegiatan, atau masalah masalah yang saling berhubungan satu sama lain. oleh karena itu, kita juga memerlukan analisis hubungan antara kejadian-kejadian tersebut. Berikut ini adalah dua contoh atau lebih berhubungan satu sama.
kejadian yang saling
Permintaan terhadap suatu produk berhubungan dengan harga produk tersebut dan sebaliknya harga suatu produk ditentukan juga oleh banyaknya permintaan terhadap produk tersebut.
Permintaan terhadap suatu produk dipengaruhi oleh meningkatnya pendapatan masyarakat hasil penjualan produk suatu perusahaan ditentukan oleh keberhasilan perusahaan tersebut dalam mengiklankan produk tersebut.
Berat badan seseorang berkaitan dengan tinggi badan orang tersebut persentase kelahiran menurun yang disebabkan oleh meningkatnya peserta KB dan membaiknya kesehatan ibu.
Akan tetapi, ada juga dua atau lebih kejadian yang secara nalar tidak berhubungan satu sama lain, seperti: meningkatnya jumlah penduduk tidak berhubungan dangan banyaknya turis yang datang ke Bali; banyaknya kecelakaan di jakarta tidak dipengaruhi oleh meningkatnya harga kebutuhan pokok; menurunya nilai ekspor tidak ada hubungannya dengan seringnya terjadi demonstrasi di Jakarta.
B. REGRESI LINIER SEDERHANA
Regresi sederhana ada yang bentuknya linier dan ada yang bentuknya tidak linier. Untuk memahami bentuk linier dan bentuk tidak linier ini, perhatikanlah diagram pencar data variabel X dan variabel Y yang mencerminkan dua kejadian berikut.
Gambar 7.1 menunjukkan bahwa pola atau arah hubungan antara variabel X dengan Y adalah searah (positif) dan linier . Artinya bila X naik, maka nilai Y naik dan bila X turun maka Y juga turun. Gambar 7.2 menunjukkan bahwa arah hubungan antara variabel X dengan variabel Y adalah
berlawanan arah (negatif)
dan
linier.
Dalam hal ini bila nilai X naik, maka nilai Y turun, sebaiknya bila nilai X turun, maka nilai Y naik secara linier. Gambar 7.3 menunjukkan hubungan X dan Y tidak linier, tetapi mengikuti bentuk kuadrat.
Gambar 7.4 menujukkan pola tidak teratur, sehingga dikatakan tidak ada hubungan antara variabel X dengan variabel Y.
Garis regresi yang terdapat pada gambar 7.1 dan gambar 7.2 mempunyai persamaan umum sebagai berikut.
Ŷ = a + bX
di mana : Ŷ adalah nilai-nilai taksiran untuk variabel tak bebas Y X adalah nilai-nilai variabel bebas a adalah intersep (pintasan) bilamana X=0 b adalah koefisien arah slope dari garis regresi
dalam hal ini a dan b disebut koefisien regresi tersebut
untuk memperoleh total kuadrat eror yang paling minimum tersebut dipakai
metode kuadrat minimum (least square methode).
dengan metode ini, persamaan regresi linier (7.1) akan mempunyai
total kuadrat eror minimum
bilamana koefisien regresi a dan b dihitung dengan rumus berikut.
Pada rumus tersebut, koefisien regresi a dan b dihitung secara terpisah atau sendiri-sendiri. akan tetapi, bisa juga koeisien b dihitung lebih dahulu dan hasil yang diperoleh dipakai untuk menghitung koefisien a dengan memakai rumus berikut.
Selisih atau error (e) antar nilai-nilai y1,y2,y3,...,yn dari titik titik tersebut dengan nilai taksiranya, yaitu ŷ1,ŷ2, ŷ3,..., ŷn berturut-turut adalah : e1 = y1 e2 = y2 e3 = y3 .
.
en = yn ŷ1 dengan kuadrat e1² = (y1 - ŷ1)² ŷ2 dengan kuadrat e2² = (y2 - ŷ2)² ŷ3 dengan kuadrat e3² = (y3 - ŷ3)² ŷn dengan kuadrat en² = (yn - ŷn)²
C. KESALAHAN BAKU DARI PENAKSIRAN Ŷ= a + bx
Sebelum telah dijelaskan bahwa penaksiran dengan persamaan regresi Ŷ= a + bx memberi total kuadrat eror sebesar : ∑e² = ∑ ( Y - Ŷ )² Bentuk itu disebut juga
total kuadrat kesalahan
dari penaksiran Ŷ = a + bX terhadap nilai-nilai Y sesungguhnya. Bila bentuk itu kita bagi dengan banyaknya pengamatan atau banyaknya data, yaitu
n,
maka kita peroleh rata-rata kesalahan, yaitu: n n Selanjutnya bila diambil
akarnya
maka diperoleh:
Bentuk terakhir ini dinamakan
kesalahan baku dari penaksiran
atau di sebut juga
standard eror of estimate
oleh Ŷ = a + bX. kesalahan ini menunjukkan ukuran menyeluruh dari pencaran titik-titik (x1,y1), (x2,y2), (x3,y3),...,(xn,yn) di sekitar garis regresi tersebut. rumus (7.4) tersebut juga dapat dijabarkan menjadi bentuk yang lebih sederhana, yaitu
D. KOEFISIEN KORELASI
Perumusan koefisien korelasi dilakikan dengan memakai perbandingan antara variasi yang dijelaskan dengan variasi total.
variasi total
dari Y terhadap Ȳ dirumuskan oleh ∑ (Y - Ŷ )², yaitu kuadrat jumlah dari selisih nilai nilai Y dengan Ȳ. perhatikan bentuk manipulasi aljabar berikut.
( Y Ȳ ) - (Y - Ŷ) + ( Y - Ȳ) Sehingga diperoleh bentuk aljabar :
Bentuk aljabar ∑ (Y - Ŷ )² disebut
variasi yang tidak dijelaskan
oleh garis regresi karena
selisih
antara Y dengan Ŷ mempunyai
pola tidak teratur ( tertentu ).
sedangkan bentuk aljabar ∑ (Y Ȳ )² disebut
variasi yang dijelaskan oleh regresi,
karena selisih antara Ŷ dengan Ȳ
mempunyai pola teratur (tertentu)
perbandingan antara variasi yang dijelaskan dengan variasi total, yaitu :
koefisien korelasi (r) adalah akar dari koefisien determinasi ditulis:
Dengan memperhatikan rumus (7.7) dan (7.8), jelas bahwa koefisien korelasi terletak antara -1 dan 1, yaitu 1 ≤ r ≤ 1 , yaitu -1 ≤ r ≤ 1 nilai r = -1, disebut kere;asi linier negatif ( berlawanan arah artinya terdapat hubungan negatif yang sempurna antara variabel X dengan Y; nilai r = 1 disebut korelasi linier (searah); artinya terdapat hubungan positif yang sempurna anatar variabeldengan variabel Y; dan nilai r=0, disebut tidak berkolerasi secara linier; artinya tidak ada hubungan antara variabel x dengan variabel y.
Koefisien korelasi dapat juga dinyatakan dengan rumus berikut.
Rumus koefisien korelasi (7.8) dan (7.9) dapat juga dipakai untuk mengukur kekuatan hubungan yang bentuknya
linier
maupun
tidak linier.
Bila hubungan antara variabel X dengan variabel Y bentuknya
linier
, maka rumus &7.8) dapat dirubah menjadi rumus berikut.
Rumus 7.10 disebut rumus koefisien korelasi produk momen (
product moment formula ).
dengan demikian rumus koefisien korelasi 7.10 dapat di tulis
selanjutnya rumus 7.10 dan 7.11 dapat dinyatakan menjadi bentuk rumus yang sedrhana, yaitu : secara teknis rumus koefisien korelasi 7.12 adalah rumus yang paling mudah dipakai.
arti dari koefisien korelasi r : bila 0.90 < r < 1.00 atau -100 < r < -0.90 ; artinya hubungan yang sangat kuat bila 0.70 < r < 0.90 atau -0.90 < r < -0.90 < r < -0.70 ; artinya hubungan yang kuat bila 0.50 < r < 0.70 atau -0.70 < r < -0.50 ; artinya hubungan yang moderat bila 0.30 < r < 0.50 atau -0.50 < r < -0.30 ; artinya hubungan yang lemah bila 0,0 < r < 0.30 atau -0.30 < r < 0.0 ; artinya hubungan yang sangat lemah