KOMPENDIUM SEKALA LIKERT DALAM KAJIAN LINGKUNGAN

Download Report

Transcript KOMPENDIUM SEKALA LIKERT DALAM KAJIAN LINGKUNGAN

PSL-PPSUB MALANG-2012
SEKALA LIKERT
DALAM ……….
FOTO: smno.kampus.ub.febr2012
SKALA LIKERT
Skala Likert merupakan skala psikometrik yang lazim digunakan dalam
kuesioner, dan merupakan skala yang paling banyak digunakan dalam survei.
Nama skala ini diambil dari nama Rensis Likert, yang mempublikasikan suatu
laporan yang menjelaskan penggunaan sekala ini.
Pada saat menanggapi suatu pertanyaan dalam skala Likert, responden
menentukan tingkat persetujuannya terhadap pernyataan tersebut dengan jalan
memilih salah satu dari pilihan yang tersedia.
Biasanya ada lima pilihan skala dengan format :
1.
2.
3.
4.
5.
Sangat tidak setuju
Tidak setuju
Netral
Setuju
Sangat setuju
Selain pilihan dengan lima skala seperti contoh di atas, kadangkala digunakan
juga skala dengan tujuh atau sembilan tingkat. Suatu studi empiris menemukan
bahwa beberapa karakteristik statistik hasil kuesioner dengan berbagai jumlah
pilihan tersebut ternyata sangat mirip.
Skala Likert merupakan metode skala bipolar yang mengukur baik tanggapan
positif ataupun negatif terhadap suatu pernyataan.
Empat skala pilihan juga kadang digunakan untuk kuesioner skala Likert yang
memaksa orang memilih salah satu kutub karena pilihan "netral" tak tersedia.
Diunduh dari: http://id.wikipedia.org/wiki/Skala_Likert ………….. 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Psikologi adalah ilmu pengetahuan yang mempelajari perilaku
manusia dalam hubungan dengan lingkungannya.
Menurut asalnya katanya, psikologi berasal dari bahasa Yunani
Kuno: "ψυχή" (Psychē yang berarti jiwa) dan "-λογία" (-logia
yang artinya ilmu) sehingga secara etimologis, psikologi dapat
diartikan dengan ilmu yang mempelajari tentang jiwa.
Psikometrik merupakan bidang kajian yang berkaitan dengan
teori dan teknik dalam pengukuran pendidikan dan psikologis,
mencakup pengukuran pengetahuan, kemampuan, sikap, dan
sifat kepribadian. Bidang ini terutama mempelajari perbedaan
antar individu dan antar kelompok.
Penelitiannya terutama pada:
Pembuatan alat dan prosedur pengukuran, dan
Pengembangan dan penyempurnaan pendekatan teoretis
terhadap pengukuran.
Kebanyakan dari kerja awal secara teoretis dan terapan dalam
psikometrik dilakukan dalam upaya mengukur kecerdasan.
Konsep kunci tradisional dalam teori tes klasikal adalah
reliabilitas dan validitas. Alat ukur yang reliabel melakukan
pengukuran dengan konsisten, sementara pengukuran yang valid
adalah yang mengukur apa yang akan diukur.
Diunduh dari:
http://id.wikipedia.org/wiki/Psikometrik………….. 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Apa itu Persepsi?
Persepsi merupakan suatu proses bagaimana seseorang menyeleksi,
mengatur dan menginterpretasikan masukan-masukan informasi dan
pengalaman-pengalaman yang ada dan kemudian menafsirkannya untuk
menciptakan keseluruhan gambaran yang berarti.
Menurut Mangkunegara, persepsi merupakan suatu proses pemberian
arti atau makna terhadap lingkungan. Dalam hal ini persepsi mecakup
penafsiran obyek, penerimaan stimulus (Input), pengorganisasian
stimulus, dan penafsiran terhadap stimulus yang telah diorganisasikan
dengan cara mempengaruhi perilaku dan pembentukan sikap.
Robbins (2003) mendeskripsikan persepsi dalam kaitannya dengan
lingkungan, yaitu sebagai proses di mana individu-individu
mengorganisasikan dan menafsirkan kesan indera mereka agar memberi
makna kepada lingkungan mereka.
Proses persepsi melalui tiga tahap, yaitu:
1. Tahap penerimaan stimulus, baik stimulus fisik maupun stimulus
sosial melalui alat indera manusia, yang dalam proses ini mencakup
pula pengenalan dan pengumpulan informasi tentang stimulus yang
ada.
2. Tahap pengolahan stimulus sosial melalui proses seleksi serta
pengorganisasian informasi.
3. Tahap perubahan stimulus yang diterima individu dalam menanggapi
lingkungan melalui proses kognisi yang dipengaruhi oleh
pengalaman, cakrawala, serta pengetahuan individu.
Diunduh dari: http://www.masbow.com/2009/08/apa-itu-persepsi.html 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Faktor-faktor yang Mempengaruhi Persepsi
Thoha (1993) : persepsi pada umumnya terjadi karena dua faktor, yaitu
faktor internal dan faktor eksternal. Faktor internal berasal dari dlam diri
individu, misalnya sikap, kebiasaan, dan kemauan. Sedangkan faktor
eksternal adalah faktor-faktor yang berasal dari luar individu yang
meliputi stimulus itu sendiri, baik sosial maupun fisik.
Robbins (2003): meskipun individu-individu memandang pada satu
benda yang sama, mereka dapat mempersepsikannya berbeda-beda.
(Robbins, S.P. 2003. Perilaku Organisasi. Jilid I. Jakarta: PT INDEKS
Kelompok Garmedia).
Ada sejumlah faktor yang bekerja untuk membentuk dan terkadang
memutar-balikkan persepsi., yaitu :
1. Pelaku persepsi (perceiver)
2. Objek atau yang dipersepsikan
3. Konteks dari situasi dimana persepsi itu dilakukan.
Diunduh dari:
………….. 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Aspek-aspek Persepsi
“Sikap” merupakan suatu interelasi dari tiga komponen, yaitu:
1. Komponen kognitif, yaitu komponen yang tersusun atas dasar
pengetahuan atau informasi yang dimiliki seseorang tentang obyek
sikapnya. Dari pengetahuan ini kemudian akan terbentuk suatu
keyakinan tertentu tentang obyek sikap tersebut.
2. Komponen Afektif , afektif berhubungan dengan rasa senang dan
tidak senang. Jadi sifatnya evaluatif yang berhubungan erat dengan
nilai-nilai kebudayaan atau sistem nilai yang dimilikinya.
3. Komponen Konatif, yaitu merupakan kesiapan seseorang untuk
bertingkah laku yang berhubungan dengan obyek sikapnya.
Byrne Myers (dalam Gerungan, 1996): “sikap” mengandung tiga
komponen yang membentuk struktur sikap, yaitu:
1. Komponen kognitif (komponen perseptual), yaitu komponen yang
berkaitan dengan pengetahuan, pandangan, keyakinan, yaitu hal-hal
yang berhubungan dengan bagaimana orang mempersepsi terhadap
objek sikap.
2. Komponen afektif (komponen emosional), yaitu komponen yang
berhubungan dengan rasa senang atau tidak senang terhadap objek
sikap. Rasa senang merupakan hal yang positif, sedangkan rasa tidak
senang merupakan hal yang negatif.
3. Komponen konatif (komponen perilaku, atau action component),
yaitu komponen yang berhubungan dengan kecenderungan
bertindak terhadap objek sikap. Komponen ini menunjukkan
intensitas sikap, yaitu menunjukkan besar kecilnya kecenderungan
bertindak atau berperilaku seseorang terhadap objek sikap.
(Gerungan, W. A. 1996. Psikologi Sosial. (edisi kedua). Bandung : PT Refika
Aditama.)
Diunduh dari:
http://www.masbow.com/2009/08/apa-itu-persepsi.html………….. 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Sikap adalah pernyataan evaluatif terhadap objek, orang atau
peristiwa . Hal ini mencerminkan perasaan seseorang terhadap
sesuatu.
Komponen utama sikap
Sikap mempunyai tiga komponen utama: kesadaran, perasaan,
dan perilaku (Breckler, S. J."Empirical Validation of Affect, Behavior, and
Cognition as Distinct Component of Attitude," Journal of Personality and Social
Psychology, Mei 1984, hal. 1191-1205).
Keyakinan bahwa "Diskriminasi itu salah" merupakan sebuah
pernyataan evaluatif.
Opini semacam ini adalah komponen kognitif dari sikap yang
menentukan tingkatan untuk bagian yang lebih penting dari
sebuah sikap -komponen afektifnya.[
Perasaan adalah segmen emosional atau perasaan dari sebuah
sikap dan tercermin dalam pernyataan seperti "Saya tidak
menyukai John karena ia mendiskriminasi orang-orang
minoritas.“
Akhirnya, “perasaan” dapat menimbulkan hasil akhir dari
perilaku.
Komponen perilaku dari sebuah sikap merujuk pada suatu
maksud untuk berperilaku dalam cara tertentu terhadap
seseorang atau sesuatu.
Diunduh dari:
http://id.wikipedia.org/wiki/Sikap………….. 23/8/2012
PSIKOLOGI DAN PSIKOMETRIK
Perilaku manusia merupakan sekumpulan perilaku yang dimiliki oleh manusia dan
dipengaruhi oleh adat, sikap, emosi, nilai, etika, kekuasaan, persuasi, dan/atau
genetika. (Albarracín, Dolores, Blair T. Johnson, & Mark P. Zanna. The Handbook of Attitude.
Routledge, 2005. Hlm. 74-78).
Perilaku seseorang dikelompokkan ke dalam perilaku wajar, perilaku dapat diterima,
perilaku aneh, dan perilaku menyimpang.
Dalam sosiologi, ‘perilaku’ dianggap sebagai sesuatu yang tidak ditujukan kepada
orang lain dan oleh karenanya merupakan suatu tindakan sosial manusia yang
sangat mendasar.
‘Perilaku’ tidak boleh disalahartikan sebagai perilaku sosial, yang merupakan suatu
tindakan dengan tingkat lebih tinggi, karena perilaku sosial adalah perilaku yang
secara khusus ditujukan kepada orang lain.
Penerimaan terhadap perilaku seseorang diukur relatif terhadap norma sosial dan
diatur oleh berbagai kontrol sosial.
Dalam kedokteran perilaku seseorang dan keluarganya dipelajari untuk
mengidentifikasi faktor penyebab, pencetus atau yang memperberat timbulnya
masalah kesehatan. Intervensi terhadap perilaku seringkali dilakukan dalam rangka
penatalaksanaan yang holistik dan komprehensif.
Benjamin Bloom, membedakan adanya tiga bidang perilaku, yakni kognitif,
afektif, dan psikomotor. Kemudian dalam perkembangannya, domain perilaku
yang diklasifikasikan oleh Bloom dibagi menjadi tiga tingkat:
Pengetahuan (knowledge)
Pengetahuan adalah hasil penginderaan manusia, atau hasil tahu seseorang
terhadap obyek melalui indera yang dimilikinya.
Sikap (attitude)
Sikap merupakan respons tertutup seseorang terhadap stimulus atau objek
tertentu, yang sudah melibatkan faktor pendapat dan emosi yang bersangkutan.
Tindakan atau praktik (practice)
Tindakan ini merujuk pada perilaku yang diekspresikan dalam bentuk tindakan,
yang merupakan bentuk nyata dari pengetahuan dan sikap yang telah dimiliki.
Diunduh dari: http://id.wikipedia.org/wiki/Perilaku ………….. 23/8/2012
PENGETAHUAN
Pengetahuan adalah informasi yang diketahui atau disadari oleh seseorang.
Pengetahuan termasuk, tetapi tidak dibatasi pada deskripsi, hipotesis, konsep,
teori, prinsip dan prosedur yang secara Probabilitas Bayesian adalah benar atau
berguna.
Dalam pengertian lain, “pengetahuan” adalah pelbagai gejala yang ditemui dan
diperoleh manusia melalui pengamatan akal.
Pengetahuan muncul ketika seseorang menggunakan akal budinya untuk
mengenali benda atau kejadian tertentu yang belum pernah dilihat atau
dirasakan sebelumnya. Misalnya ketika seseorang mencicipi masakan yang baru
dikenalnya, ia akan mendapatkan pengetahuan tentang bentuk, rasa, dan aroma
masakan tersebut.
“Pengetahuan” adalah informasi yang telah dikombinasikan dengan pemahaman
dan potensi untuk menindaki; yang lantas melekat di benak seseorang. Pada
umumnya, pengetahuan memiliki kemampuan prediktif terhadap sesuatu
sebagai hasil pengenalan atas suatu pola.
Manakala informasi dan data sekedar berkemampuan untuk menginformasikan
atau bahkan menimbulkan kebingungan, maka pengetahuan berkemampuan
untuk mengarahkan tindakan. Hal ini lah yang disebut potensi untuk menindaki.
Pengetahuan empiris
Pengetahuan yang lebih menekankan pengamatan dan pengalaman inderawi
dikenal sebagai pengetahuan empiris atau pengetahuan aposteriori.
Pengetahuan ini bisa diperoleh dengan melakukan pengamatan yang dilakukan
secara empiris dan rasional. Pengetahuan empiris tersebut juga dapat
berkembang menjadi pengetahuan deskriptif bila seseorang dapat melukiskan
dan menggambarkan segala ciri, sifat, dan gejala yang ada pada objek empiris
tersebut. Pengetahuan empiris juga bisa didapatkan melalui pengalaman pribadi
manusia yang terjadi berulangkali.
Misalnya, seseorang yang sering dipilih untuk memimpin organisasi dengan
sendirinya akan mendapatkan pengetahuan tentang manajemen organisasi.
Diunduh dari: http://id.wikipedia.org/wiki/Pengetahuan ………….. 23/8/2012
SURVEI
Survei adalah pemeriksaan atau penelitian secara komprehensif.
Survei yang dilakukan dalam melakukan penelitian biasanya dilakukan dengan
menyebarkan kuesioner atau wawancara, dengan tujuan untuk mengetahui:
siapa mereka, apa yang mereka pikir, rasakan, atau kecenderungan suatu
tindakan.
Dalam penelitian kuantitatif, survei lebih merupakan pertanyaan tertutup,
sementara dalam penelitian kualitatif berupa wawancara mendalam dengan
pertanyaan terbuka.
Survei (survey) atau lengkapnya self-administered survey adalah metode
pengumpulan data primer dengan memberikan pertanyaan-pertanyaan kepada
responden individu.
(Diunduh dari: http://id.wikipedia.org/wiki/Survei)
PEMBUATAN KUESIONER
Tujuannya: untuk memperoleh informasi yang relevan
untuk memperoleh tingkat keandalan (reliability) dan
keabsahan (validity) setinggi mungkin
Tahap awal dari pembuatan kuesioner yang harus
dipersiapkan adalah informasi apa saja yang ingin
didapatkan dari responden, setelah itu baru disusun
responden, pertanyaan.
Diunduh dari:
http://images.iwakcucut.multiply.multiplycontent.com/attachment/0/Sew8pQoKCC0AACXyfmc1/ME
TOD%20SURVEI.pdf?key=iwakcucut:journal:4&nmid=233175371………….. 24/8/2012
METODE SURVEI DALAM METODE PENELITIAN
KUANTITATIF
Survei merupakan istilah yang digunakan dalam bidang sosiologi terutama sejak
publikasi Pittsburg Survei pada tahun 1912.
Survei ini banyak digunakan di Amerika Serikat dan Inggris, tetapi kurang begitu
banyak digunakan di continental Eropa.
Survei merupakan penelitian yang dilakukan untuk memperoleh fakta dan gejalagejala yang ada dan mencari keterangan secara faktual.
Metode survei digunakan sebagai teknik penelitian yang melalui pengamatan
langsung terhadap suatu gejala atau pengumpulan informasi melalui pedoman
wawancara, kuisioner, kuisioner terkirim (mailed questionnaire) atau survei melalui
telepon (telephone survey).
Beberapa kelemahan metode survei:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
Kuisioner yang digunakan dapat menggunakan kuisioner terkirim, dapat juga melalui telepon.
Sehingga tidak ada interaksi langsung dari kedua pihak, peneliti pun tidak dapat mengetahui
ekspresi dari responden.
Kuisioner yang dikirim melalui pos kadang kala tidak dikembalikan ataupun tidak diisi oleh
responden (tidak valid)
Secara sosiologis, metode survey melihat masyarakat sebagai kumpulan individu.
Pendekatan ini dipandang sebagai pendekatan atomistic, dan tidak dipandang sebagai satu
kesatuan sosial yang holostik.
Survey bersifat kaku. Dimana tidak memungkinkan peneliti untuk meneliti hal-hal diluar
rancangan.
Tidak dapat menyajikan gambaran khas mengenai kelompok atau komunitas tertentu dalam
populasi.
Hanya dilakukan pada titik waktu tertentu saja, sehingga tidak mengetahu proses atau
sejarah perkembangan masyarakat.
Tidak cocok untuk masyarakat tradisional.
Sangat rentan adanya kesalahan, sehingga sangat ditentukan oleh besar kecilnya sampling.
Menuntut validitas dan reliabilitas instrument penelitian.
Dapat menghasilkan generalisasi empiris terhadap populasinya apabila menggunakan teknik
sampling yang benar.
Survey dapat dilakukan serempak di berbagai lokasi penelitian.
Bermanfaat untuk menjawab masalah sosial dengan cepat sehingga kebijakan, program, dan
intervensi sosial segera dapat dilakukan.
Dapat menghindari bias peneliti. Karena bersifat obyektif, tanpa memasukkan perasaan
peneliti, dan bebas nilai, dan hasil survey tidak diragukan keabsahannya.
Diunduh dari: http://indudt.blog.fisip.uns.ac.id/2012/03/01/metode-survey-dalam-metodepenelitian-kuantitatif/ ………….. 24/8/2012
KELEBIHAN MENGGUNAKAN METODE SURVEI
1.
2.
3.
4.
5.
Dapat dilakukan untuk menginvestigasi masalah yang terkait dengan kehidupan
manusia tanpa harus melalui riset laboratorium atau melalui perancangan suatu kondisi
tertentu.
Tidak membutuhkan biaya yang besar
Pengumpulan data yang luas dapat dilakukan dengan relatif mudah.
Tidak dibatasi oleh faktor geografi
Data yang telah ada di lapangan memberikan kemudahan survei
1.
Kelebihan Metode Survei
2.
Dalam Survei biasanya dilibatkan banyak orang (sampel) untuk
mencapai generalisasi atau kesimpulan yang bersifat umum yang
dapatdipertanggungjawabkan
Dapat digunakan berbagai teknik pengumpulan data seperti Angket,
Wawancara atau Observasi sesuai kebutuhan.
Sering tampil masalah-masalah yang sebelumnya tidak diketahui
atau diduga, sehingga sekaligus dapat bersifat eksploratif
Dengan survei, peneliti dapat membenarkan atau menolak teori
tertentu.
3.
4.
5.
Metode survei merupakan bagian dari paradigma positivisme.
Ada beberapa kaidah yang perlu dipatuhi dalam menggunakan metode
survei.
1.
2.
3.
4.
Pertama, peneliti harus membangun jarak dengan objek
penelitiannya untuk menghindari bias.
Ke dua, kaidah yang menyangkut hasil penelitian.
Ke tiga, survei dicirikan oleh tahapan riset yang terstruktur.
Ke empat, kaidah yang terkait dengan pemaknaan terhadap
kebenaran.
Diunduh dari: kaskusian.awardspace.biz/.../... ………….. 24/8/2012
SURVEI SOSIAL
Survei sosial mempunyai prinsip-prinsip, diantaranya adalah sebagai berikut :
1.
2.
3.
4.
5.
Menggunakan metode ilmiah dalam mnengatasi suatu masalah di suatu tempat
tertentu dengan memberikan saran yang bermanfaat.
Merupakan proses pengumpulan fakta kuantitatif mengenai aspek sosial dari komposisi
dan kegiatan masyarakat.
Digunakan untuk mempersiapkan suato program pembangunan melalui penelitian
sosial untuk menghikangkan penyakit sosial.
Dimaksudkan untuk dasar bagi pene;itian sosial lebih lanjut guna menghasilkan
hipotesis baru.
Merupakan kegiatan pengumpulan pendapat, sikap dan perilaku dari sebagian besar
orang disuatu wilayah dan waktu tertentu.
Tujuan survei sial adalah untuk menyediakan informasi mengenai suatu masalah. Informasi
yang disajikan ini sangat dibutuhkan oleh orang atau pihak lain yang sedang menpelajari
masalah sosial. Disebut dengan utilitarian, yaitu memberikan informasi yang berkaitan
dengan masalah praktis.
Survey sosial juga bertujuan untuk mendeskripsikan suatu gejala. Dalam hal ini peneliti
melakukan penelitian secara langsung dengan datang ke lokasi dan berhubungan langsung
dengan gejala yang sedang ia teliti. Disini peneliti bertujuan untuk mengumpulkan
informasi, bukan membuktikan suatu gejala. Dengan informasi ini sehingga dapat
menjadikan landasan dalam pembentukan hipotesis berikutnya.
Survei sosial juga dapat dilakukan untuk menjelaskan suatu gejala sosial. Fungsinya lebih
bersifat teoritis, yaitu menguji sejumlah hipotesis yang disarankan oleh teori sosiologi.
Survei juga banyak digunakan untuk menerangkan hubungan antara dua variabel. Survei
juga dapat bersifat umum maupun khusus, sifatnya dapat utilitarian maupun akademis.
Diunduh dari: http://indudt.blog.fisip.uns.ac.id/2012/03/01/metode-survey-dalam-metodepenelitian-kuantitatif/ ………….. 24/8/2012
DATA, SKALA, DAN VARIABEL
Data dapat dimaknai sebagai sekumpulan informasi atau nilai yang diperoleh dari
pengamatan (observasi) suatu obyek, data dapat berupa angka dan dapat pula
merupakan lambang atau sifat. Beberapa macam data antara lain ; data populasi
dan data sampel, data observasi, data primer, dan data sekunder.
Data yang baik adalah data yang bisa dipercaya kebenarannya (reliable), tepat
waktu dan mencakup ruang lingkup yang luas atau bisa memberikan gambaran
tentang suatu masalah secara menyeluruh merupakan data relevan.
Menurut sifatnya, yang selanjutnya dapat dibagi dua :
1. Data Kualitatif yaitu data yang tidak berbentuk angka, misalnya: Kuesioner
Pertanyaan tentang suasana kerja, kualitas pelayanan sebuah restoran atau
gaya kepemimpinan, dsb
2. Data Kuantitatif yaitu data yang berbentuk angka, misalnya: harga saham,
besarnya pendapatan, dsb
Penyusunan skala (perskalaan) adalah menetapkan proposisi atau mengatur
secara seimbang, atau menurut perimbangan nilai pada dimensi variabelvariabel. Penyusunannya dapat dibedakan antara penyusunan indeks variabel
dan penyusunan skala variabel.
Scaling atau perskalaan hanya dapat dikenakan pada gejala kontinum yaitu
menetapkan proporsi atau mengatur menurut pertimbangan (to set in proportion,
to design or regulate to ratio ).
Perskalaan pada gejala – gejala kontinum merupakan akibat logis dari pada
adanya variabilitas tingkatan pada gejala–gejala kontinum itu.
Skala Likert: skala likert digunakan untuk mengukur sikap, pendapat, dan
persepsi seseorang atau sekelompok orang tentang fenomena sosial. Skala
likert bisa 1,2,3, 4, 5, skala tergantung kebutuhan.
Diunduh dari:
http://usupress.usu.ac.id/files/Analisis%20Data%20untuk%20Riset%20dan%20Manajemen%20%20Final%20Cetak_bab%201.pdf ………….. 24/8/2012
Petunjuk membuat pertanyaan
1.
2.
3.
4.
5.
6.
7.
Gunakan kata-kata sederhana, jelas dan khusus
Pertanyaan berlaku bagi semua responden
Berkaitan dengan masalah dan sasaran penelitian
Tidak menggiring
Tidak membuat informasi yang tidak dimiliki responden
Tidak memuat hal yang bersifat pribadi atau peka
Tidak bersifat klise
TEKNIK SKALA
Bertujuan untuk mengetahui ciri-ciri atau karakteristik sesuatu hal
berdasarkan suatu ukuran tertentu, sehingga dapat dibedakan
Sifat Skala
1. Skala Nominal: Membedakan, tanpa tingkatan. Misalnya: Laras,
Tata, Gagas, Kokom dll
2. Skala Ordinal: membedakan dengan suatu urutan, tanpa jarak.
Misalnya: Mhs semester I kodenya 4, Mhs semester II Kodenya 6,
mhs semester III kodenya 8.
3. Skala interval: membedakan dengan tingkatan, ada jarak. Misalnya:
umur fiya 2 tahun, gagas 3 tahun, laras 5 tahun.
4. Skala Ratio: membedakan dengan tingkatan, ada jarak, ada nilai
mutlak. Misalnya IP Tata 4 dan IP Siska 2, jadi prestasi Tata 2 kali
prestasi Siska
Diunduh dari:
http://images.iwakcucut.multiply.multiplycontent.com/attachment/0/Sew8pQoKCC0AACXyfmc1/ME
TOD%20SURVEI.pdf?key=iwakcucut:journal:4&nmid=233175371………….. 24/8/2012
VARIABEL
Variabel adalah sesuatu yang dapat membedakan atau mengubah variasi pada nilai.
Nilai dapat berbeda pada waktu yang berbeda untuk obyek atau orang yang sama,
atau nilai dapat berbeda dalam waktu yang sama untuk obyek atau orang yang
berbeda. Untuk lebih jelasnya bisa dilihat pada bab tiga mengenai proposisi.
1.
2.
3.
4.
Secara konseptual variabel dapat kita bagi menjadi empat, yaitu:
Variabel dependent adalah variabel yang menjadi perhatian utama dalam
sebuah pengamatan. Tujuan penelitian adalah memahami dan membuat
variabel terikat, menjelaskan variabilitasnya atau memprediksinya. Variabel
dependen sering juga disebut dengan variabel terikat atau variabel
terpengaruh.
Variabel independent adalah variabel yang dapat mempengaruhi perubahan
dalam variabel dependen dan mempunyai hubungan yang positif ataupun yang
negatif bagi variabel dependen nantinya. Variasi dalam variabel dependen
merupakan hasil dari variabel independen. Variabel independen sering juga
disebut dengan variabel bebas atau variabel yang mempengaruhi.
Moderating Variable adalah variabel yang mempunyai dampak kontingensi
(contingent effect) yang kuat pada hubungan variabel independen dan variabel
dependen.
Intervening variable adalah faktor yang secara teori berpengaruh pada
fenomena yang diamati tetapi tidak dapat dilihat, diukur, atau dimanipulasi,
namun dampaknya dapat disimpulkan berdasarkan dampak variabel
independen dan moderating terhadap fenomena yang diamati. Intervening
variable ini dapat membantu kita dalam menjelaskan bagaimana mengkonsepsi
hubungan anatar varibel independen dan variabel dependen.
ANALISIS DATA
Analisis data bertujuan untuk menyusun data dalam cara yang bermakna
sehingga dapat dipahami. Para peneliti berpendapat bahwa tidak ada cara
yang paling benar secara absolut untuk mengorganisasi, menganalisis, dan
menginterpretasikan data Karena itu, maka prosedur analisis data dalam
penelitian disesuaikan dengan tujuan penelitian. Untuk memudahkan dalam
analisa data metode yang digunakan adalah metode statistik. Statistika adalah
serangkaian metode yang dipakai untuk mengumpulkan, menganalisa,
menyajikan dan memberi makna, data. Metode statistik mempermudah para
pengambil keputusan memahami informasi mana yang harus dimanfaatkan,
agar keputusan mereka tepat.
Diunduh dari:
http://usupress.usu.ac.id/files/Analisis%20Data%20untuk%20Riset%20dan%20Manajemen%20%20Final%20Cetak_bab%201.pdf ………….. 24/8/2012
Variables
• Independent
– Precedes, influences or predicts results
• Dependent
– Affected by or predicted by the Independent Variable
• Extraneous
– Affected by the D.V., but not controlled or measured.
Causes error
•
Confounding
– An extraneous variable that varies systematically (has a
relationship) with the I.V.
•
Intervening
– Unobservable trait that influences behavior (e.g., effect of new
intervention on self-esteem may be affected by the motivation
level of subjects)
• Control
– Used to eliminate the effect of extraneous variables
• Organismic
– Aka, measured, or assigned
– Characteristics of the subjects that cannot be
manipulated
Diunduh dari:
………….. 23/8/2012
Types of Variables
Nominal Variable
Name or Identity of
particular characteristics
Sex, Ethnicity, Region, Religion,
School, Team, Experimental
Condition
Quantitative Variable
Numbers to indicate the
extent to which a person
possesses a characteristic
of interest.
1.
2.
3.
4.
Perceived Attractiveness,
Number of Siblings
Self-Esteem
Independence/Interdependence
Dalam suatu penelitian sosial, menurut Sofian Effendi, proses pengukuran adalah
rangkaian dari empat aktivitas, yakni :
Menentukan dimensi konsep penelitian
Rumusan ukuran untuk masing-masing dimensi (pertanyaan- pertanyaan yang
relevan dengan dimensi)
Tentukan tingkat ukuran yang akan digunakan (Nominal, Ordinal, Interval, Rasio)
Tentukan tingkat kesahihan dan keajegan dari alat pengukur.
Utuk melakukan pengukuran, maka peneliti perlu menentukan konsep/variabel yang
akan diteliti, menentukan indikator-indikator dari variabel tersebut, menentukan itemitem untuk pengukuran sesuai dengan indikator masing-masing, dan kemudian
melakukan pengujian atas kesahihan (validitas) dan keajegan (reliabilitas) alat ukur
tersebut (Instrumen Penelitian).
DIUNDUH DARI: www.library.upnvj.ac.id/pdf/s1manajemen09/.../BAB%20III.pdf 25/8/2012
Diunduh dari:
………….. 23/8/2012
PENGERTIAN PENGUKURAN
“Pengukuran” merupakan proses yang dilakukan seorang peneliti untuk
menguji hipotesis dan teori. Seorang peneliti menyimpulkan berdasarkan hipotesis
bahwa kondisi tertentu harus ada dalam dunia nyata dan kemudian mereka
melakukan pengukuran untuk konidisi-kondisi nyata tersebut. Hal ini menunjukkan
bahwa hipotesis masih bersifat abstrak yang perlu diterjemahkan secara
operasional dalam bentuk kondisi-kondisi yang dapat diukur di lapangan. Jika
kondisi-kondisi nyata tersebut ditemukan berarti peneliti akan mendukung hipotesis
tersebut, tetapi sebaliknya, jika kondisi-kondisi tersebut tidak ditemukan berarti
hipotesisnya tidak berlaku.
Pertanyaannya adalah apa yang harus diukur?
Banyak definisi pengukuran yang telah disampaikan oleh beberapa ahli, diantaranya
adalah sebagai berikut:
Measurement is the assignment of numerals to represent the properties of material system
other than number, in virtue of the laws governing the properties (Campbells)
Measurement is the assignment of numerals into even or object based on certain rules
(Steven)
Pengukuran dapat diartikan sebagai suatu prosedur untuk mengklasifikasikan kasus
(subyek riset, unit eksperimen, responden, atau secara umum obyek-obyek seperti
orang, perusahaan, benda, dsb) ke dalam kategori-kategori dalam suatu variabel
tertentu. Pengertian tersebut menunjukkan bahwa variabel sangat erat kaitannya
dengan pengertian pengukuran. Variebel adalah setiap karakteristik yang dapat
diklasifikasikan ke dalam sekurang-kurang dua klasifikasi.
Konsep yang digunakan dalam penelitian dapat diklasifikasikan sebagai objek atau
sebagai properti (sifat, ciri, karakteristik). Objek selain meliputi suatu benda yang
berwujud nyata, juga dapat berupa sesuatu yang abstrak, misalnya ketinggian suatu
tempat. Sedangkan properti adalah karateristik dari objek, misalnya sifat fisik
manusia bisa dinyatakan dengan berat atau tinggi badan; sifat psikologis seperti
sikap atau kecerdasasan; serta sifat sosial yang mencakup kepemimpinan atau
status. Karakteristik-karakteristik itulah yang merupakan objek pengukuran dalam
penelitian.
Setiap objek mempunyai ciri yang dapat membedakan objek suatu dengan objek
lainnya. Dalam penelitian, ciri yang diteliti (diperiksa, diamati, diukur, atau dihitung)
disebut “karakteristik”, sedangkan objek yang karakteritiknya diteliti disebut
“satuan pengamatan”.
Diunduh dari: http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf
………….. 24/8/2012
TINGKAT PENGUKURAN
Seorang peneliti menggunakan beberapa bentuk skala dalam melakukan proses
pengukuran. Setiap skala tersebut didasarkan sekumpulan asumsi (aturan-aturan)
mengenai hubungan antara skala tersebut dengan observasi nyatanya.
Konseptualisasi skala tersebut didasarkan pada tiga karakteristik sebagai berikut:
1.
2.
3.
Urutan bilangan, yaitu sebuah bilangan lebih besar, lebih kecil, atau sama
dengan bilangan lain,
Urutan perbedaan antara bilangan, yaitu perbedaan antara sepasang bilangan
bisa lebih besar, lebih kecil atau sama besar dengan perbedaan sepasang
bilangan lainnya,
Titik awal yang unik yang menunjukkan bilangan 0.
Kombinasi ketiga karakteristik tersebut yang mencakup urutan, perbedaan, dan titik
awal, membentuk 4 klasifikasi skala pengukuran sebagai berikut:
Diunduh dari:
http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf…………..
24/8/2012
Types of Variable and Types of Measurement
Number?
No
Yes
Quantitative Variable
Order?
Nominal Variable
Yes
Distance Matters?
No
Ordinal Scale
Yes
True Zero?
No
Interval Scale
Yes
Ratio Scale
Diunduh dari:
………….. 23/8/2012
Nominal Scale
Buddhist
Buddhist
Protestant
Jewish
Jewish
Catholic
Catholic
Protestant
. An aggregation framework to link indicators associated with multifunctional
land use to the stakeholder evaluation of policy options
Maria Luisa Paracchini, Cesare Pacini, M. Laurence M. Jones, Marta Pérez-Soba.
Ecological Indicators. Volume 11, Issue 1, January 2011, Pages 71–80
Options for normalisation of indicators: showing (a) normalisation according to
indicator range, with a nominal 0–10 scale representing increasing sustainability, and
(b) scaling according to equal units of sustainability relative to a sustainability limit,
with a nominal −3 to +3 scale representing increasing sustainability.
Diunduh dari: http://www.sciencedirect.com/science/article/pii/S1470160X09000624 …………..
25/8/2012
Ordinal Scale
1st Born
2nd Born
3rd Born
Elastic Tape
1st Born
2nd Born
3rd Born
1st Born
3rd Born
2nd Born
Temporal changes (1986–1999) in populations of primrose (Primula
vulgaris Huds.) in an agricultural landscape and implications for
conservation
Patrick Endels, Hans Jacquemyn, Rein Brys, Martin Hermy, Geert De Blust.
Biological Conservation. Volume 105, Issue 1, May 2002, Pages 11–25.
Polar scatterplot of
aspect and slope for 64
sites (populations on flat
surface were omitted)
with P. vulgaris
populations in Belgium.
[ordinal scale for the
slope variable: 1, slight
slope (0–30%); 2,
average slope (30–60%);
3, strong slope (>60%)].
Diunduh dari: http://www.sciencedirect.com/science/article/pii/S0006320701001732 …………..
25/8/2012
Interval Scale
0
- 10
10
0
20
10
30
40
50
60
20
30
40
50
0 10 20 30 40 50 60
Introducing wildfire into forest management planning: towards a
conceptual approach
Kostas D. Kalabokidis, Stylianos Gatzojannis, Spyros Galatsidas
Forest Ecology and Management. Volume 158, Issues 1–3, 15 March 2002, Pages 41–50.
Diunduh dari: http://www.sciencedirect.com/science/article/pii/S0378112700007155 …………..
25/8/2012
Ratio Scale
0
10
20
30
40
50
60
- 10
0
10
20
30
40
50
0 10 20 30 40 50 60
Diunduh dari:
………….. 23/8/2012
Menentukan Rentang Skala Likert
Pada dasarnya skala likert merupakan suatu alat, seperti sebuah
penggaris untuk mengukur panjang. Kalau kita ingin mengukur panjang
sebuah meja kecil dapat digunakan penggaris biasa; tetapi kalau kita
ingin mengukur panjang jalan, maka digunakan penggaris yang lebih
panjang.
Apakah penelitian tersebut mengukur preference atau mengukur
kinerja?
Seberapa rinci pengukuran yang akan dilakukan. Satu hal yang perlu
diperhatikan, rentang Skala Likert harus memiliki nilai yang tepat. Lebih
mudahnya perhatikan contoh penelitian berikut:
Setuju vs Tidak Setuju
Ingin diketahui apakah masyarakat setuju akan suatu pernyataan. C
ontoh peryataannya adalah 'Pelebaran sungai diperlukan untuk mengatasi
banjir'.
Maka akan muncul kemunginkan pilihan sebagai berikut:
1. Sangat tidak setuju Agak tidak setuju Agak setuju Sangat setuju
2. Sangat tidak setuju Tidak setuju Ragu2
Setuju Sangat setuju
3. Sangat tdk setuju Tdk setuju Agak tdk setuju
Agak setuju Setuju
Sangat-setuju
4. Dan seterusnya, kita DAPAT membuatnya menjadi 4, 5, 6, atau bahkan 7
pilihan.
Tetapi mana yang terbaik?
Pilihan yang terbaik adalah yang memiliki rentang paling banyak.
Dengan kondisi setiap arti dari skala tersebut memiliki arti yang saling bertolak
belakang dengan skala yang lain.
Misalnya Setuju vs Tidak setuju,
Sangat tidak setuju vs Sangat setuju, dst.
Hal ini menghindari pilihan netral (ragu-ragu), kecuali jika anda ingin
mengetahui apakah ada pihak netral.
Misalkan untuk peryataan seperti berikut 'Pak Abdul layak menjadi Presiden
2014'.
Diunduh dari: http://statisticscafe.blogspot.com/2012/02/menentukan-rentang-skala-likert.html
Measures
No
Self-Report?
Behavioral Measures
Yes
Physiological?
Yes
No
Self-Report Measures
Psychophysiological
Measures
EEG, MRI, fMRI, PET, CAT
Format?
Yes
No
Attitudes?
Yes
No
Free Format
Self-Report
Measures
Fix Format
Self-Report
Measures
Non-Reactive
Measures
IAT
Observational
Measures
Projective Measures
Associative Measures
Think-around Protocols
The Likert Scale
The Semantic
Differential
The Guttman Scale
Diunduh dari:
………….. 23/8/2012
Frequency,
Duration,
Intensity Latency,
Speed
KARAKTERITIK PENGUKURAN YANG BAIK
Proses pengukuran mengggunakan suatu alat ukur. Alat ukur tersebut harus
menghasilkan ukuran yang sesuai dengan karakteristik obyek sesungguhnya.
Kesulitan-kesulitan pengukuran dalam ilmu sosial tersebut bisa menimbulkan
perbedaan-perbedaan hasil pengukuran untuk setiap peneliti yang merancang
sendiri alat ukur, atau disebut juga instrumen penelitian.
1.
2.
3.
4.
Sumber-sumber yang bisa menimbulkan perbedaan hasil pengukuran adalah :
Faktor satuan pengamatan (misalnya responden yang asal-asalan atau tidak
jujur mengisi kuisoner),
Faktor situasional (misalnya tekanan dari orang lain atau enggan diwawancara
secara langsung);
Faktor pihak pengukur (misalnya si pewawancara tidak komunikatif atau terlalu
bertele-tele),
Faktor instrumen penelitian alau alat ukur (misalnya redaksi membingungkan
atau bisa menimbulkan interpretasi yang berbeda-beda).
Bagaimana mengevaluasi baik ATAU tidaknya suatu alat ukur?
Secara umum terdapat tiga karakteristik yang digunakan untuk menilai baik- tidaknya
proses pengukuran, yaitu validitas (validity), reliabilitas (reliability), dan kepraktisan
(practicality).
“Validitas” adalah mengukur apa yang seharusnya diukur, yaitu validitas eksternal
dan validitas internal. Validitas eksternal menunjukkan kemampuan pengukuran
untuk diterapkan secara umum pada berbagai obyek, tempat, dan waktu
pengukuran. Sedangkan validitas internal berkaitan dengan kemampuan instrumen
penelitian untuk mengukur apa yang ingin diukur.
“Reliabiltas” menunjukkan konsistensi pengukuran yang dilakukan yang meliputi
stabilitas (stability), ekivalen (equivalence), dan konsistensi internal (internal
consistency).
Reliabilitas ini sangat erat kaitannya dengan ketepatan dan ketelitian pengukuran.
Pengukuran dikatakan stabil jika pengukuran pada sebuah obyek dilakukan
berulang-ulang pada waktu yang berbeda, menunjukkan hasil yang sama.
Pengukuran dikatakan “ekivalen” jika pengukuran menunjukkan hasil pengukuran
yang sama jika dilakukan peneliti lain atau memakai contoh item lain;
Pengukuran dikatakan “konsisten internal” jika item-item atau indikator yang
digunakan adalah konsisten satu sama lain.
“Kepraktisan” bisa ditinjau dari sudut ekonomi (biaya dan waktu), kemudahan
administrasi atau pengelolaannya, serta hasil yang mudah diinterpresikan oleh pihak
lain.
Diunduh dari:
http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf…………..
24/8/2012
TEKNIK PENSKALAAN
Dalam ilmu sosial, alat ukur yang digunakan untuk mengukur variabel sering tidak
tersedia sehingga harus dirancang dan dikembangkan sendiri oleh peneliti.
Alat ukur (instrumen) harus dapat membeda-bedakan satuan pengamatan sesuai
dengan karakteristik yang diamati dengan menggunakan teknik penskalaan tertentu.
“Penskalaan” merupakan prosedur untuk memberikan bilangan (atau simbol lain)
pada suatu obyek sehingga bilangan tersebut menunjukkan karakteristik obyek
tersebut.
Karakteritik tersebut lebih tepatnya diwakili oleh sejumlah indikator atau item.
Beberapa teknik penskalaan yanh sering digunakan adalah Likert’s Summated
Rating (LSR), Semantic Differential, The Law of Comparative Judgement, Method
of Succesive Interval, dan Method Bsed on Rank Order.
LSR adalah metode pengukuran sikap (attitude) yang banyak digunakan dalam
penelitian sosial karena kesederhanaannya. LSR sangat bermanfaat untuk
membandingkan skor sikap seseorang dengan distribusi skala dari sekelompok
orang lainnya, serta untuk melihat perkembangan atau perubahan sikap sebelum
dan sesudah ekperimen atau kegiatan.
Tahap-tahap perancangan LSR adalah sebagai berikut:
1. Tentukan secara tegas sikap terhadap topik apa yang akan diukur. Contohnya, sikap para
karyawan terhadap sistem pelatihan, sikap para pengusaha kecil terhadap realisasi pemberian
kredit usaha, sikap mahasiswa terhadap liberalisasi perdagangan, dan sebagainya
2. Tentukan secara tegas Dimensi yang menyusun sikap tersebut. Dimensi tersebut pada dasarnya
merupakan faktor-faktor yang mempengaruhi sikap yang menurut Likert terdiri dari dimensi
kognitif (tahu atau tidak tahu), afektif (perasaan terhadap sesuatu), dan konatif (kecenderungan
untuk bertingkat laku). Contoh lain, dimensi tingkat sosial ekonomi meliputi kekayaan,
pendapatan, pendidikan, dan pekerjaan
3. Susun pernyataan-pernyataan atau item yang merupakan alat pengukur dimensi yang menyusun
sikap yang akan diukur sesuai dengan indikator. Banyaknya indiktor biasanya antara 30-40 item
untuk sebuah sikap tertentu. Item-item yang disusun tersebut harus terdiri dari item positif dan
item negatif. Item positif adalah pernyataan yang memberikan isyarat mendukung/menyokong
topik yang sedang diukur, sedangkan item negatif sebaliknya, yaitu melawan topik. Item positif
dan item negatif harus ditempatkan secara acak.
Contoh:
Dua contoh item untuk mengukur sikap para pemilik perusahaan terhadap masuknya investor
asing :
a. Masuknya investor asing akan memperluas jaringan bisnis (item positif)
b. Investor asing akan menyebabkan eksploatasi sumberdaya domestik (Item Negatif)
4.
Diunduh dari:
http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf…………..
24/8/2012
Tahap-tahap perancangan LSR adalah :
4. Setiap item diberi pilihan respon yang bersifat tertutup (closed questionare).
Banyaknya pilihan respon biasanya 3, 5, 7, 9, dan 11. Dalam prakteknya,
jumlah pilihan respon yang paling banyak dipakai adalah 5. Alasannya adalah
jika respon terlalu sedikit maka hasilnya terlalu kasar tetapi jika terlalu banyak
maka responden sulit membedakannya.
Kelima pilihan respon tersebut adalah:
Sangat tidak setuju Tidak setuju
Tidak ada pendapat
Setuju
Sangat setuju
Contoh:
a. Masuknya investor asing akan memperluas jaringan bisnis
[ ] Sangat setuju
[ ] Setuju
[ ] Tidak ada pendapat
[ ] Tidak setuju
[ ] Sangat tidak setuju
b. Investor asing akan menyebabkan eksploitasi sumberdaya alam domestik
[ ] Sangat setuju
[ ] Setuju
[ ] Tidak ada pendapat
[ ] Tidak setuju
[ ] Sangat tidak setuju
5. Untuk setiap pilihan respon, jawaban diberikan skor dengan kriteria apabila item
positif maka angka terbesar diletakkan pada sangat setuju sedangkan jika item
negatif maka angka terbesar diletakkan pada sangat tidak setuju. Skor yang
diberikan pada jawaban untuk setiap item kemudian dijumlahkan.
Contoh skor untuk item negatif dan positif diatas adalah sebagai berikut:
a. Masuknya investor asing akan memperluas jaringan bisnis (item positif)
[5] Sangat setuju
[4] Setuju
[3] Tidak ada pendapat
[2] Tidak setuju
[1] Sangat tidak setuju
b. Investor asing akan menyebabkan eksploatasi sumber daya domestik (item negatif)
[1] Sangat setuju
[2 ] Setuju
[3] Tidak ada pendapat
[4] Tidak setuju
[5] Sangat tidak setuju .
Diunduh dari:
http://elearning.gunadarma.ac.id/docmodul/risetbisnis_pdf/06_bab_4_skala.pdf…………..
24/8/2012
HOW MEANINGFUL ARE DATA FROMLIKERT SCALES? AN EVALUATION OF HOW RATINGS
ARE MADE AND THE ROLEOF THE RESPONSE SHIFT IN THE SOCIALLY DISADVANTAGED.
Jane Ogden and Jessica Lo
Journal of Health Psychology1 –12© The Author(s) 2011
Likert scales relating to quality of life were completed by the homeless (N= 75); first year
students (N= 301)and a town population (N= 72). Participants also completed free text
questions. The scale and free textdata were often contradictory and the results highlighted
three processes to account for these disparities: (i) frame of reference: current salient issues
influenced how questions were interpreted; (ii) within-subjectcomparisons: ratings were
based on expectations given past experiences; (iii) time frame: those with morestable
circumstances showed habituation to their level of deprivation. Likert scale data should be
understoodwithin the context of how ratings are made .
Likert scales. Participants rated the followingusing 5-point Likert scales (not at all (1),
rarely(2), somewhat (3), fairly (4), very much (5)). All items for mood and health status
referred to how participants were feeling ‘right now’.
The quantitative data from the Likert scales wereanalysed using ANOVA and LSD post hoc
tests toexplore differences in mood, health status and sat-isfaction between the three
groups.
Diunduh dari:
http://surrey.academia.edu/JaneOgden/Papers/928422/How_meaningful_are_data_from_Likert_sc
ales_an_evaluation_of_how_ratings_are_made_and_the_role_of_the_response_shift_in_the_socia
lly_disadvantaged………….. 24/8/2012
Levels of Measurements
Four levels of Measurements
• Nominal
– Measures categories
• Ordinal
– Categories + rank and order
• Interval
– Equal distance between any two consecutive measures
• Ratio
– Intervals + meaningful zeros
Metode Pengukuran Sikap
Komponen sikap dijelaskan melalui tiga dimensi:
1.
2.
3.
Afektif, menyatakan refleksi perasaan atau emosi seseorang terhadap suatu
obyek.
Kognitif menunjukkan kesadaran seseorang terhadap pengetahuan mengenai
obyek tertentu
Komponen-komponen perilaku, menggambarkan suatu keingingan,
kecenderungan untuk bertindak.
Skala pengukuran Sikap Terdiri dari:
1.
2.
3.
4.
5.
6.
Skala sederhana
Skala kategori
Skala Likerts
Skala perbedaan semantis
Skala Numeris
Skala Grafis
Skala Sederhana
1. Skala sederhana menggunakan skala nominal misalnya setuju atau tidak setuju,
ya atau tidak.
2. Skala ini digunakan bila kuesionar penelitian berisi relatif banyak butir
pertanyaan, tingkat pendidikan responden rendah atau alasan lain.
Diunduh dari:
ocw.usu.ac.id/.../ekm_2405_slide_skala_pengukuran_dan_instrumen...…………..
24/8/2012
Skala Kategori = Categories of Scales
•
Categorical (ratings)
–
•
Comparative (ranking)
–
•
Score by comparing - Smartest
Preference
–
•
Score without comparison - 1 to 5 scales
Subjective - which do you prefer
Non-preference
–
Objective - which solution is less costly
Skala Kategori
1.
2.
3.
4.
Skala ketegori merupakan metode pengukuran sikap yang berisi beberapa
alternatif kategori pendapat yang emmungkinkan bagi responden untuk
memberikan alternatif penilaian.
Skala ini mengukur lebih sensitif dimensi konstruk dibandingkan dengan skala
sederhana.
Skala ini disebut juga skala butir penelianan, dan dapat dinyatakan dengan
angka.
Skala ini digunakan untuk mengukur sikap responden yang berkaiatan dengan:
1. kualitas, 2. urgensi, 3. menarik, 4. kepuasan, 5. frekuensi
Diunduh dari:
………….. 23/8/2012
Types of Scales
Categories of Scales
•
–
–
•
•
Unidimensional
Involves only one aspect of the
measurement
Measurement by one construct
Multi-dimensional
–
–
Involves several aspects of a
measurement
Uses several dimensions to
measure a single construct
•
Likert/Summated Rating
Scales
Semantic Differential Scales
• Magnitude Scaling
• Thruston Scales
• Guttman Scales
T.F. Wong and Y.Y. Yan . 2012.
Perception of Neighborhood Environments and Self-rated Health in Hong Kong.
The Internet Journal of Public Health. 2012 Volume 2 Number 1. DOI: 10.5580/2b7c.
It is believed that where an individual resides is associated with his health status. This neighborhood and
health relationship is well documented in western countries but receives very little attention in Hong Kong.
The present study attempted to explore the relationship between perception of neighborhood
environments and self-rated health (SRH) in Tin Shui Wai, Hong Kong.
Questionnaire was used to collect people’s perception of neighborhood environments, including the
physical and living environment, service environment and social environment, and their SRH. Binary logistic
regression was employed to explore the neighborhood environment and SRH relationship.
It was discovered that a significant negative association of poor SRH with perceptions of physical and living,
service and social environments. Income and education levels also were significant predictors of SRH.
Perception of neighborhood environment
Neighborhood environments, for this study, include three subscales perceived by the respondents including
(i) physical and living environment; (ii) service environment and (iii) social environment.
For physical and living environment, respondents were asked to evaluate the air quality, noise level,
environmental cleanliness and hygiene and public security of their neighborhood by a five-point Likert scale
ranging from 1, very serious problem to 5, not a problem. A total of 16 questions were asked in this part.
The measurement of service environment was obtained by asking respondents to assess the social services,
social welfare facilities and some neighborhood facilities such as medical, recreational and cultural facilities
in the neighborhood by a five-point Likert scale ranging from 1, very serious problem to 5, not a problem.
Eight questions were administered in this part.
The social environment was represented by asking respondents to rate a total of 20 statements regarding
social participation, social networking, social connectivity, relationship with neighborhoods and sense of
belonging to the neighborhood by using a five-point Likert scale ranging from 1, strongly disagree to 5,
strongly agree.
Responses to the individual items in each subscale were summed to produce the physical and living
environment score, service environment score and social environment score which indicated the overall
assessment of the three neighborhood environments respectively. Higher score demonstrated that a
respondent had better perception of the neighborhood.
Diunduh dari: http://www.ispub.com/journal/the-internet-journal-of-public-health/volume-2-number1/perception-of-neighborhood-environments-and-self-rated-health-in-hong-kong.html………….. 24/8/2012
Likert
Scale
Dr. Rensis
Likert
The original idea for the likert scale is found in Rensis Likert’s
1932 article in Archive of psychology titled “ A technique for the
measurement of Attitudes”.
This idea was expanded by Likert’s 1934 Journal of social
psychology article titled “ A simple and Reliable method of
scoring the Thurstone Attitude Scales”.
A Likert scale ( /ˈlɪkərt/) is a psychometric scale commonly involved in research that
employs questionnaires.
It is the most widely used approach to scaling responses in survey research, such
that the term is often used interchangeably with rating scale, or more accurately the
Likert-type scale, even though the two are not synonymous. The scale is named after
its inventor, psychologist Rensis Likert.
Likert distinguished between a scale proper, which emerges from collective
responses to a set of items (usually eight or more), and the format in which
responses are scored along a range. Technically speaking, a Likert scale refers only to
the former. The difference between these two concepts has to do with the
distinction Likert made between the underlying phenomenon being investigated and
the means of capturing variation that points to the underlying phenomenon.
When responding to a Likert questionnaire item, respondents specify their level of
agreement or disagreement on a symmetric agree-disagree scale for a series of
statements. Thus, the range captures the intensity of their feelings for a given item,
while the results of analysis of multiple items (if the items are developed
appropriately) reveals a pattern that has scaled properties of the kind Likert
identified.
Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale
Diunduh dari:
………….. 23/8/2012
What is Likert scale?
•
•
•
•
•
It is a psychometric scale commonly involved in research that employs
questionnaires.
It is the most widely used approach to scaling responses in survey research.
Likert scales are a non-comparative scaling technique and are one-dimensional
in nature.
When responding to a Likert questionnaire item respondents specify their level
of agreement or disagreement on a symmetric agree-disagree scale for a series
of statements.
Thus, the range captures the intensity of their feelings for a given item, while
the results of analysis of multiple items reveals a pattern that has scaled
properties of the kind Likert identities
SKALA LIKERT
1.
2.
3.
Paling banyak digunakan untuk pengukuran perilaku
Skala yang terdiri dari pernyataan dan disertai jawaban setuju-tidak
setuju, sering-tidak pernah, cepat-lambat, baik-buruk dsb.
(tergantung dari tujuan pengukuran).
C. Bird menyebutnya Method of Sumated Ratings
SKALA LIKERT DIGUNAKAN PADA SAAT:
1. Menggambarkan posisi RELATIF individu dalam kelompoknya
2. Membandingkan skor subyek dengan kelompok normatifnya
3. Menyusun skala pengukuran yang sederhana dan mudah
dibuat.
Skala Likert
1.
2.
3.
4.
Skala likert adalah skala yang mengukur sikap dengan menyatakan setuju atau
ketidak setujuan terhadap subyek, obyek atau kejadian tertentu.
Urutan untuk skala ini umumnya menggunakan lima angka penilaian yaitu (1). Sangat
tidak setuju (2) setuju (3) Netral (tidak pasti) (4) Tidak setuju (5) Sangat Tidak Setuju.
Urutan itu bisa dibalik.
Alternatif angka bisa bervariasi dari 3 sampai dengan 9
Diunduh dari:
http://www.google.co.id/search?q=varimax+rotation&num=10&hl=id&source=lnms&sa=X&ei=_pk1UPCBEMvLrQ
f3y4GYBA&sqi=2&ved=0CAUQ_AUoAA&biw=1272&bih=506#hl=id&sclient=psyab&q=skala+likeret+ordinal&oq=skala+likeret+ordinal&gs_l=serp.3..0i13j0i13i30l3.39393.46279.0.47075.24.24.0
.0.0.15.1278.9326.0j2j7j8j2j1j2j1.23.0...0.0...1c.9oocxdIH4k&pbx=1&bav=on.2,or.r_gc.r_pw.r_qf.&fp=3322fb4802ff5da6&biw=1272&bih=531………….. 24/8/2012
Five – point Likert item
Likert Scale
Difference
Likert item
The Likert scale is a summative
scaling technique developed by
Rensis Likert in the 1930s. Likert
scales are typically 5-point rating
scales ranging from "Strongly
Agree" through "Neither Agree nor
Disagree" to "Strongly Disagree."
An extensive list of possible
statements regarding attitudes to
particular research question is
generated by researchers and the
respondent indicates the extent to
which he/she agrees with the
statement.
Likert scale Disadvantages :
1) Likert scaling is quite tricky to get right. The researcher must be
able to prove that each item of the questionnaire has a similar
psychological 'weight' in the respondent's mind, and that each
item is making a statement about the same construct.
psychometric validation. If this is not accomplished the results of
the scale will be unreliable.
2) Likert scales tend to produce "ceiling effects", where a group
may rate items close to the upper limit of the scale
Diunduh dari:
………….. 23/8/2012
LIKERT ITEM
Likert item is considered symmetric or balanced because there are equal
amounts of positive and negative positions.
Often five ordered response levels are used, although many
psychometricians advocate using seven or nine level, a recent empirical
study found that a 5 or 7 point scale.
Stems and Scales
A familiar method for assessing attitudes is the Likert item.
A Likert item consists of two parts: a stem, which is simply a statement
of an attitude, and a scale on which people express their agreement
with that statement.
For example:
1. Stem: I believe that capital punishment is cruel.
2. Scale:
Disagree strongly
Disagree somewhat
Can't say
Agree somewhat
Agree strongly
A five-point scale of agreement, like the one above, is probably most common, but
longer or shorter scales can be used. Shorter scales are more difficult to get useful
information from, though.
Likert items are easy to use and they can give you useful information. A single
item, however, will rarely give you any useful information, so you are best to use
sets of them. Ideally you would use 40 items or more, but useful information can be
got with fewer.
A single item rarely provides useful information simply because responses to it are
affected by many factors in addition to the one you're interested in. When several
items are used, the consistency of responding produced by an attitude can be
detected.
Diunduh dari: http://www.actualanalysis.com/likert.htm ………….. 24/8/2012
The format of a typical five-level Likert item
1. Strongly disagree
2. Disagree
3. Neither agree nor disagree
4. Agree
5. Strongly agree
Sample question presented using a five-point Likert item
An important distinction must be made between a Likert scale and a Likert item. The
Likert scale is the sum of responses on several Likert items. Because Likert items are
often accompanied by a visual analog scale (e.g., a horizontal line, on which a subject
indicates his or her response by circling or checking tick-marks), the items are
sometimes called scales themselves. This is the source of much confusion; it is better,
therefore, to reserve the term Likert scale to apply to the summed scale, and Likert item
to refer to an individual item.
A Likert item is simply a statement which the respondent is asked to evaluate according
to any kind of subjective or objective criteria; generally the level of agreement or
disagreement is measured. It is considered symmetric or "balanced" because there are
equal amounts of positive and negative positions.
Often five ordered response levels are used, although many psychometricians advocate
using seven or nine levels; a recent empirical study found that a 5- or 7- point scale may
produce slightly higher mean scores relative to the highest possible attainable score,
compared to those produced from a 10-point scale, and this difference was statistically
significant. In terms of the other data characteristics, there was very little difference
among the scale formats in terms of variation about the mean, skewness or kurtosis.
Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale
The format of a typical five-level Likert item, for
example, could be:
1. Strongly disagree
2. Disagree
3. Neither agree nor disagree
4. Agree
5. Strongly agree
CONTOH:
Q.18.Please measure the following affirmative perceptions about your library OPAC and
Web OPAC use .
Codes: 1-strongly disagree, 2- disagree, 3- neutral, 4-agree, 5- strongly agree
S/N
Affirmative perception statements
Codes
(i)
OPAC / Web OPAC was Easier to use 1
than I expected
2
3
4
5
(ii)
It was Fun to use
1
2
3
4
5
(iii)
It was Easy to use
1
2
3
4
5
(iv)
It helped me in finding the
documents faster
1
2
3
4
5
(v)
It is Very difficult to use
1
2
3
4
5
(vi)
It is Very confusing to use
1
2
3
4
5
(vii)
I found more items than expected
1
2
3
4
5
(viii)
I am comfortable with simple search 1
2
3
4
5
(ix)
I am comfortable complex/Advance
search
I am comfortable quick search
1
2
3
4
5
1
2
3
4
5
I am comfortable when using
OPAC/Web OPAC
1
2
3
4
5
(x)
(xi)
Q.19. Please mark your appreciation towards the use of your library OPAC/Web OPAC.
Codes: 1-strongly disagree, 2- disagree, 3- neutral, 4-agree, 5- strongly agree
S/N
Parameters
Codes
(i)
I access OPAC/Web OPAC stand alone
system
1
2
3
4
5
(ii)
I access OPAC/Web OPAC library premises
1
2
3
4
5
(iii)
It is easy to be familiar with this OPAC/Web
OPAC
1
2
3
4
5
(iv)
The OPAC/Web OPAC should have more
flexible interfaces
1
2
3
4
5
(v)
Library searching will be easier and faster
with the Web OPAC
1
2
3
4
5
(vi)
It is easy to read information provided in
the Web OPAC
1
2
3
4
5
A OPAC/Web OPAC search by author is
easy
(viii) A OPAC/ Web OPAC search by call number
is easy
1
2
3
4
5
1
2
3
4
5
(ix)
OPAC/ Web OPAC scanning through a long
display (forward or backward) is easy
1
2
3
4
5
(x)
OPAC/ Web OPAC reducing the result when
too much is retrieved is easy
1
2
3
4
5
(vii)
Diunduh dari:
………….. 23/8/2012
Diunduh dari:
………….. 23/8/2012
The format of a typical Seven-level Likert item
INTERPRETASI SKOR SKALA LIKERT
1.
2.
Tidak dapat dilakukan secara langsung
Harus dibandingkan dengan skor kelompok normatifnya
Diunduh dari:
………….. 23/8/2012
Diunduh dari:
………….. 23/8/2012
TAHAPAN PENYUSUNAN SEKALA LIKERT
TAHAPAN PENYUSUNAN (1)
1. Menentukan dan memahami dengan baik apa yang akan diukur
2. Menyusun Blue Print untuk memandu penyusunan alat ukur
3. Indikator yang secara teoritis-logis memberi kontribusi yang lebih
besar harus diberikan pernyataan yang lebih banyak
4. Pernyataan dibuat Favorable dan Unfavorable.
TAHAPAN PENYUSUNAN (2)
1.
2.
3.
4.
5.
Membuat Item sesuai dengan kaidah
Uji coba item
Memilih item yang baik
Menyusun item terpilih menjadi satu set alat ukur
Menginterpretasikan hasil pengukuran.
MEMILIH PERNYATAAN (1)
1. Memilih dengan nilai t, dengan langkah:
Menghitung dan menjumlahkan skor tiap subyek
Mengelompokkan subyek menjadi dua.
Menggunakan mean atau median jika subyek sedikit, dan
menggunakan percentil 25 - 75 atau 30 - 70 apabila subyek
banyak
MEMILIH PERNYATAAN (2)
Menghitung nilai t dengan rumus:
Diunduh dari:
………….. 23/8/2012
TAHAPAN PENYUSUNAN SEKALA LIKERT
MEMILIH PERNYATAAN (3)
1. Pilihlah 20 – 25 item dengan nilai t yang tinggi dan semua indikator
harus terwakili oleh item Favorable dan Unfovorable
2. Nilai minimal t yang baik adalah 1,75.
MEMILIH PERNYATAAN (4)
1. Memilih dengan nilai r (korelasi), dengan langkah:
Menghitung dan menjumlahkan skor tiap subyek
Mengkorelasikan skor tiap-tiap item dengan skor total yang
diperoleh setiap subyek.
MEMILIH PERNYATAAN (5)
1. Nilai r hitung dibandingkan dengan r tabel. Pilihlah item yang r
hitungnya positif dan lebih besar dari r tabel
2. Biasanya dapat juga menggunakan patokan r minimal 0,3
3. Buang item yang r hitungnya kurang dari r tabel atau kurang dari
0,3 dan hitung kembali korelasinya hingga r hitung semua item
lebih dari r tabel atau lebih dari 0,3
4. Pilihlah 20 – 25 item dengan nilai r yang tinggi dan semua indikator
harus terwakili oleh item Favorable dan Unfovorable.
MENYUSUN PERNYATAAN MENJADI SATU SET SKALA
Penyusunan item terpilih dalam satu set skala harus acak berdasarkan
indikator maupun item Favorable dan Unfavorable.
Diunduh dari:
………….. 23/8/2012
METODE ANALISIS
Depending on how the Likert scale questions are treated a number
of different analysis methods can be applied
1. Analysis methods used for individual questions (ordinal data)
 Bar charts and dot plots
• Not histograms (data is not continuous)
 Central tendency summarised by median and mode
• Not mean
 Variability summarised by range and interquartile range
• Not standard deviation
 Analysed using non-parametric tests
(difference between the medians of comparable groups)
• Mann- whitney U test
• Wilcoxon signed –rank test
• Kruskal – wallis test
Diunduh dari:
………….. 23/8/2012
METODE ANALISIS
2. When multiple Likert question responses are summed together (interval data)
 All questions must use the same Likert scale
 Must be a defendable approximation to an interval scale (i.e. coding indicates
magnitude of difference between items but there is no absolute zero point)
 All items measure are single latent variable (i.e. a variable that is not directly
observed, but rather inferred from other variables that are observed and directly
measured)
 Analyzed using parametric tests
• Analysis of variance (ANOVA)
Kegunaan dan Asumsi
1.
2.
One Way ANOVA digunakan untuk menguji perbedaan rata-rata lebih dari dua
sampel.
Asumsi-asumsi One Way ANOVA:
• Populasi yang akan diuji berdistribusi normal.
• Varians dari populasi-populasi tersebut adalah sama.
• Sampel tidak berhubungan satu dengan yang lain.
Analysis of Variance (ANOVA)
Desain
Blok Lengkap
Acak
ANOVA
1 Arah
Desain
2 Faktor
Dgn. Replikasi
Uji-F
Uji-F
Uji
TukeyKramer
Uji Perbedaan
Signifikan
Fischer Terkecil
Diunduh dari: openstorage.gunadarma.ac.id/handouts/S1.../SLIDE-PE-1.ppt ………….. 24/8/2012
METODE ANALISIS
3. Analysis methods used when reduced to nominal level of agree vs.
disagree
 Chi –square test
 Cochran Q test
McNemar test
Analisis Khi- Kuadrat
Analisis chi-square yang akan digunakan untuk mencari apakah ada
hubungan (asosiasi) antar variabel-variabel kategorik tersebut
Analisis chi-square didasarkan pada tabel kontingensi (sering iuga disebut
tabulasi silang).
Tabel kontingensi adalah tabel yang sel-selnya berisi frekuensi dari
perpotongan baris dan kolom.
Bentuk umum dari tabel kontingensi dengan variabel pertama memiliki m
kategori dan variabel ke dua memiliki k kategori , sebagai berikut.
Tabel kontingensi dua arah:
Diunduh dari:
http://digensia.wordpress.com/2012/03/26/koefisien-korelasi-cramer-c/…………..
24/8/2012
KEUNTUNGAN SEKALA LIKERT
1. Item analysis increases the degree of homogeneity or internal
consistency in the set of statements.
2. Subjects generally find it easy to respond because they have a wide
range of answers(usually five) to choose from instead of only two
alternative responses, i.e., agree or disagree.
3. No outside group of judges is involved in selecting statements and
giving values to them.
KETERBATASAN SEKALA LIKERT
•
•
•
•
•
Ties in ranks occur quite frequently.
The response pattern of an individual is not revealed.
A respondent is required to answer all questions on the scale.
A problem of interpretation arises with this type of scale.
In this scale all statements of a universe are deemed to be of equal
attitude value.
Diunduh dari:
………….. 23/8/2012
Likert Scales
•
•
•
•
A very popular rating scale
Measures the feelings/degree of agreement of the
respondents
Ideally, 4 to 7 points
Examples of 5-point surveys
– Agreement SD
– Satisfaction SD
– Quality
VP
D
D
P
ND/NA
ND/NS
Average
A
S
G
SA
SS
VG
A typical Likert scale looks like this:
Diunduh dari: http://rmsbunkerblog.wordpress.com/2010/09/22/rms-scale-week-2010-likert-scale%E2%80%93-market-research-in-syracuse-ny-upstate-central-new-york-survey-focus-group/
………….. 24/8/2012
Likert Scale
The Likert scale requires the respondents to indicate a degree of agreement or
disagreement with each of a series of statements about the stimulus objects.
Strongly
disagree
1. Sears sells high quality merchandise.
1
Neither
agree nor
disagree
2X
3
2. Sears has poor in-store service.
1
2X
3. I like to shop at Sears.
1
2
•
•
Disagree
Agree
Strongly
agree
4
5
3
4
5
3X
4
5
The analysis can be conducted on an item-by-item basis (profile analysis), or a total
(summated) score can be calculated.
When arriving at a total score, the categories assigned to the negative statements by
the respondents should be scored by reversing the scale.
Using Attitudinal Data to Identify Latent Classes that Vary in Their Preference
for Landscape Preservation
Edward Morey, Mara Thiene, Maria De Salvo and Giovanni Signorello
Forthcoming in Ecological Economics 2008 or 2009
The likelihood of significant heterogeneity in preferences for landscape preservation should
be accounted for when designing WTP questions, estimating WTP, and formulating resulting
policy recommendations. Herein, heterogeneity in preferences for landscape preservation
is investigated in the context of a latent-class model under the assumption of the existence
of some finite number of preference classes/groups. The number of classes is estimated, so
few restrictions are placed on the form of the heterogeneity. One estimates the probability
that individual i belongs to class c where these probabilities are a function of observable
characteristics of the individual (covariates); this is much more flexible than assuming, for
example, that all farmers have the same preferences.
This paper aims to identify preference classes for landscape preservation in the IBLEO, a
rural and beautiful part of Sicily. Estimation of classes is performed using only attitudinal
data consisting of answers to Likert-scale questions about the importance of preservation
and why the respondent thinks preservation is, or is not, important. Summarizing the
results, estimation indicates four distinct preference classes. The classes vary in the level of
importance attached to preservation and the motivation for preservation (e.g. use vs. nonuse motivations), and include one group that has little interest in preservation.
Diunduh dari:
http://www.colorado.edu/economics/morey/papers/MoreyThieneDeSalvoSignorelloEcolEconomics.
pdf ………….. 25/8/2012
Likert Scales: Advantages
(summated rating = real name)
Rensis Likert, 1903–1981
•
•
•
•
•
Easy for respondents to complete, most people familiar with the scale
Relatively easy to construct
Most popular attitudinal measure
Easy to score and analyze
Each item considered to be of equal attitude value (weight) -homogeneous items
Karin Braunsberger, Roger Gates, (2009)
Developing inventories for satisfaction and Likert scales in a service
environment
Journal of Services Marketing, Vol. 23 Iss: 4, pp.219 – 225.
The purpose of this paper is to produce up-to-date inventories for satisfaction and Likert
scales that contain commonly used scale point descriptors and their respective mean scale
values and standard deviations.
All data were collected online using the SSI Survey Spot Panel. This panel is national (USA) in
scope. Thirty-nine satisfaction items and 19 agreement items were tested on a random
sample consisting of individuals 21-65 years old.
The mean value and the standard deviation were calculated for each of these descriptors.
Even though only six of the items that had been tested by Jones and Thurstone (1955) were
included in the list of satisfaction scale descriptors, the semantic meanings of those six have
changed very little over the years.
One limitation might be that scale point descriptor inventories developed within the context
of health insurance might not be valid in other service contexts.
Since the present study focuses on Likert and satisfaction scales which are frequently used
in service environments, the major contribution of this study is to provide services
marketers with quantitative measurement of the meanings of commonly used scale point
descriptors. This permits the development of successive and/or equal interval scales and
thus aids in the analyses of data sets. It will thus help service marketers to develop
questionnaires that more accurately reflect actual consumer satisfaction and opinions.
Diunduh dari:
http://www.emeraldinsight.com/journals.htm?articleid=1800605…………..
24/8/2012
Likert Scale Construction
•
•
•
•
•
•
•
•
Identify the attitudinal object and delimit it quite specifically.
Compose a series of statements about the attitudinal object that are
half positive and half negative and are not extreme, ambiguous, or
neutral.
Establish (a minimum of ) content validity with the help of an expert
panel.
Pilot test the statements to establish reliability (Cronbach’s alpha) for
each domain.
Eliminate statements that negatively affect internal consistency.
Construct the final scale by using the fewest number of items while still
maintaining validity and reliability; create a balance of positive and
negative items [Remember to reverse-code when summing].
Administer the scale and instruct respondents to indicate their level of
agreement with each statement.
Sum each respondent’s item scores to determine attitude.
Diunduh dari:
………….. 23/8/2012
Likert Scale Instrument Construction
•
•
•
•
•
•
Use the general criteria for attitude statements.
Begin with non-threatening, easy items first; demographics last.
Have clear instructions with an example.
Anticipate data entry and analysis.
Anticipate missing data on items.
Use approved layout techniques.
Indoor air quality : perception versus reality in a rural hospital setting
Goddard, Dianna Marie
The objective of this study was to evaluate occupant perception of indoor air quality in a
rural Arkansas hospital.
Three generally accepted standard parameters of indoor air quality were examined---carbon
dioxide levels, temperature, and relative humidity---for comparison to recommended
standards of these values.
A review of the literature revealed a lack of information in the subject of indoor air quality
concerned with perception.
Experimental data was obtained using two real-time monitoring instruments that logged
work environment levels of carbon dioxide, carbon monoxide, relative humidity, and
temperature.
The results were tabulated and graphically formatted for ease of interpretation. In addition,
an occupant survey containing a Likert scale was also used to determine the predictability of
indoor air quality based on the individual responses from the surveys.
Collectively, the data does not provide any conclusive evidence that occupant perception is
a valid indicator of actual indoor air quality.Further investigation in this subject area of
indoor air quality is needed.
A better understanding of how air quality perception relates to actual indoor air quality will
help to simplify the challenges that face air quality practitioners.
Diunduh dari: http://sunzi.lib.hku.hk/ER/detail/hkul/4082419 ………….. 24/8/2012
Scaling of Statements
Response scales vary. Recommend to use an even number of
response categories (no neutral category) and a N/A response
for agreement scales
Label all response categories.
Since this is a summated rating scale, the scale of measurement of
the sum or mean is interval. Never analyze by item. Scale of
measurement of any one item is ordinal.
Anchored scales: frequency, importance, etc. (Odd # = OK)
Pictures, thermometers, etc., may be used as scales
Multiple scales per item may be used.
Greater range in the scales produce more variability in the data: 8
better than 6, 6 better than 4, etc. (Correlations work better.)
Likert scales may be subject to distortion from several causes.
Respondents may avoid using extreme response categories (central
tendency bias); agree with statements as presented (acquiescence
bias); or try to portray themselves or their organization in a more
favorable light (social desirability bias).
Designing a scale with balanced keying (an equal number of
positive and negative statements) can obviate the problem of
acquiescence bias, since acquiescence on positively keyed items
will balance acquiescence on negatively keyed items, but central
tendency and social desirability are somewhat more problematic.
Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale
Diunduh dari:
………….. 23/8/2012
Likert Scaling
•
•
•
•
Even Number of Response Categories
Label all categories
Use N/A if appropriate [No neutral/undecided]
Frequency, Importance, etc. [Anchored]
1
2
3
4
5
6
Strongly
Disagree
Disagre
e
Slightly
Disagre
e
Slightly
Agree
Agree
Strongly
Agree
Costa Rica is a good
location for the AIAEE
conference.
1
2
3
4
Strongly
Disagree
Disagree
Agree
Strongly
Agree
Costa Rica is a good location for the AIAEE
conference.
Likert scaling is a bipolar scaling method, measuring either positive or negative
response to a statement. Sometimes an even-point scale is used, where the middle
option of "Neither agree nor disagree" is not available. This is sometimes called a
"forced choice" method, since the neutral option is removed.
The neutral option can be seen as an easy option to take when a respondent is
unsure, and so whether it is a true neutral option is questionable. It has been shown
that when comparing between a 4-point and a 5-point Likert scale, where the former
has the neutral option unavailable, the overall difference in the response is
negligible.
Diunduh dari: http://en.wikipedia.org/wiki/Likert_scale
Diunduh dari:
………….. 23/8/2012
Summative Ratings
•
•
A number of items collectively measure one construct (Job Satisfaction)
A number of items collectively measure a dimension of a construct and a
collection of dimensions will measure the construct (Self-esteem)
Community Perceptions toward Economic and Environmental Impacts of
Tourism on Local Communities
Fariborz Aref , Ma’rof Redzuan and Sarjit S. Gill
Asian Social Science. July, 2009. Vol. 5, No. 7
This paper investigates the community perceptions toward economic and environmental impacts of tourism
in Shiraz, Iran. Special focus is on the differences in perceptions between the Old and New Districts of
Shiraz.
The study demonstrates that there are broadly similar views among the community leaders and
community residents from both districts of Shiraz.
In fact, a high percentage of the answers obtained highlighted positive aspects environmental and economic
impacts of tourism toward local communities. According to the survey, the strongest and favourable
perceptions toward tourism impacts are found to be linked with environmental aspects and while economic
matters are found to be the least favourable in terms of the perceived impacts on tourism.
T-test analysis of the study indicates that there is no significant difference between community leaders'
perceptions in both districts of Shiraz City.
Results drew from discussion with the target group show that the community residents have positive
perceptions toward economic and environmental impacts of tourism with only minor differences with each
other.
The questionnaire was structured around a Likert scale. The items for community perceptions toward
tourism impacts were taken from these studies. The respondents answered to each statement based on
five scales. The value of each response for these items on the questionnaire is as follows: 1 = strongly
disagree 2 = disagree 3 = not sure 4 = agree 5 = strongly agree.
Ko & Stewart (2002) and Maddox (1985), recommended the use of a Likert type scale in tourism research
due to its high validity. Then, the questionnaire was piloted tested to have its content validated by several
reviewers of Persian background. Statements for tourism impacts were tested for their validity using
Cronbach’s alpha. The participants in the pilot test had relatively diverse demographic characteristics,
especially with regards to community. The t-test was employed to test to determine whether there were
significant differences among group mean totals and item mean scores. Means and standard deviations are
the descriptive statistics used in discussing the distribution of responses gathered during the quantitative
component of this study. To assess the normality of the distribution of the data, the skewness and kurtosis
of each variable were also examined.
According to George & Mallery (2002) if the coefficient of the skewness and kurtosis falls between -0.5 and
+0.5 inclusive, then the distribution appears to be relatively symmetric which in this study skewness was
.254 and Kurtosis -.211.
Diunduh dari:
journal.ccsenet.org/index.php/ass/.../2746………….. 24/8/2012
Summative Likert Scales
•
•
•
•
•
Must contain multiple items
Each individual item must measure something that has an underlying, quantitative
measurement continuum
There can be no right/wrong answers as opposed to multiple-choice questions
Items must be statements to which the respondent assigns a rating
Cannot be used to measure knowledge or ability, but familiarity
J Air Waste Manag Assoc. 2000 Jul ;50 (7):1081-94.
Exposure of chronic obstructive pulmonary disease patients to particulate matter:
relationships between personal and ambient air concentrations.
S. T. Ebelt, A J Petkau, S Vedal, T V Fisher, M Brauer.
Mot time-series studies of particulate air pollution and acute health outcomes assess exposure of the study
population using fixed-site outdoor measurements. To address the issue of exposure misclassification, we
evaluate the relationship between ambient particle concentrations and personal exposures of a population
expected to be at risk of particle health effects.
Sampling was conducted within the Vancouver metropolitan area during April-September 1998. Sixteen
subjects (non-smoking, ages 54-86) with physician-diagnosed chronic obstructive pulmonary disease
(COPD) wore personal PM2.5 monitors for seven 24-hr periods, randomly spaced approximately 1.5 weeks
apart. Time-activity logs and dwelling characteristics data were also obtained for each subject. Daily 24-hr
ambient PM10 and PM2.5 concentrations were measured at five fixed sites spaced throughout the study
region. SO4(2-), which is found almost exclusively in the fine particle fraction and which does not have
major indoor sources, was measured in all PM2.5 samples as an indicator of accumulation mode particulate
matter of ambient origin.
The mean personal and ambient PM2.5 concentrations were 18 micrograms/m3 and 11 micrograms/m3,
respectively. In analyses relating personal and ambient measurements, ambient concentrations were
expressed either as an average of the values obtained from five ambient monitoring sites for each day of
personal sampling, or as the concentration obtained at the ambient site closest to each subject's home. The
mean personal to ambient concentration ratio of all samples was 1.75 (range = 0.24 to 10.60) for PM2.5,
and 0.75 (range = 0.09 to 1.42) for SO4(2-).
Regression analyses were conducted for each subject separately and on pooled data. The median
correlation (Pearson's r) between personal and average ambient PM2.5 concentrations was 0.48 (range =0.68 to 0.83). Using SO4(2-) as the exposure metric, the median r between personal and average ambient
concentrations was 0.96 (range = 0.66 to 1.0). Use of the closest ambient site did not improve the median
correlation of the group for either PM2.5 or SO4(2-). All pooled analyses resulted in lower correlation
coefficients than the median correlation coefficient of individual regressions. Personal SO4(2-) was more
highly correlated with all ambient measures than PM2.5. Inclusion of time-activity and dwelling
characteristics data did not result in a useful predictive regression model for PM2.5 personal exposure, but
improved the model fit from simply regressing against ambient concentration (R2 = 0.27).
The model for SO4(2-) was predictive (R2 = 0.82), as personal exposures were largely explained by ambient
levels. These results indicate a relatively low correlation between personal exposure and ambient PM2.5
that is not improved by assigning exposure to the closest ambient monitor. The correlation between
personal exposure and ambient concentration is high, however, when using SO4(2-), an indicator of
accumulation mode particulate matter of ambient origin.
Diunduh dari: http://lib.bioinfo.pl/paper:10939202 ………….. 24/8/2012
SCALE CONSTRUCTION
•
Define Constructs
– Conceptual/theoretical basis from the literature
– Are their sub-scales (dimensions) to the scale
– Multiple item sub-scales
– Principle of Parsimony (kesederhanaan, kehematan)
• Simplest explanation among a number of equally valid
explanations must be used.
DATA VARIABEL LATENT (KONSTRUK)
Penelitian di bidang ekoilogi-ekonomi dan sering melibatkan variabel yang tidak
dapat diukur secara langsung, disebut variabel latent atau unobservable; misalnya
kepuasan, motivasi dan lainnya. Pengukuran variabel laten menggunakan instrumen
berupa kuisioner akan menghasilkan data dari setiap indikator atau data dari setiap
item. Oleh karena itu, indikator atau item sering disamakan dengan variabel manifest
atau variabel observable.
Untuk memperoleh data dari variabel latent atau variabel unobservable dapat
dilakukan dengan beberapa cara, antara lain:
1. Metode Total Skor
2. Metode Rata-Rata Skor
3. Metode Rescoring
4. Metode Indikator Terkuat
5. Metode Skor Faktor
6. Metode Skor Komponen Utama
Metode pertama berarti menjumlahkan skor semua indikator, shingga diperoleh data
total skor yang merupakan data variabel laten bersangkutan. Sedangkan metode
kedua menggunakan rata-rata skor indikator. Sebagai ilustrasi digunakan data rekaan
di bawah ini (menggunakan skala Likert 1 sampai 5).
Diunduh dari:
http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html…………..
DATA VARIABEL LATENT (KONSTRUK)
Metode Rescoring
Metode ini merubah total skor menjadi skala awal (1 sampai 5). Caranya adalah, untuk data
di atas, sebagai berikut:
- Nilai minimal skor total yang mungkin adalah 3
- Nilai maksimal skor total yang mungkin adalah 15
- Range = 15 – 3 = 12
- Interval kelas (banyaknya skor awal, 1 sampai 5) adalah 5
- Lebar interval kelas = 12/5 = 2.4
Rescoring bernilai 1 jika nilai skor total antara 3 sampai (3 + 2.4) = 5.4
Rescoring bernilai 2 jika nilai skor total antara >5.4 sampai (5.4 + 2.4) = 7.8
Rescoring bernilai 3 jika nilai skor total antara >7.8 sampai 10.2
Rescoring bernilai 4 jika nilai skor total antara >10.2 sampai 12.6
Rescoring bernilai 5 jika nilai skor total antara >12.6 sampai 15
Untuk observasi pertama, nilai skor total adalah 7, di mana 7 berada pada selang
rescoring 2, yaitu >5.4 sampai 7.8. Demikian seterusnya.
Ketiga metode ini bersifat setiap indikator dipandang memiliki bobot yang sama, dan
informasi 100% terpakai atau tercakup dalam variabel latent.
Diunduh dari:
http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html…………..
METODE INDIKATOR TERKUAT
Metode Indikator Terkuat ini menggunakan indikator terkuat.
Indikator terkuat diperoleh dari hasil korelasi antar masing-masing indikator dengan total
skor.
Indikator yang memiliki korelasi terbesar dipandang sebagai indikator terkuat dan
digunakan untuk mewakili variabel latent. Nilai korelasi antara setiap indikator dengan total
skor:
Dari hasil analisis tersebut
diperoleh nilai korelasi antara
indikator 1 dengan skor total
adalah 0.625, indikator 2 dengan
skor total adalah 0.832 dan
indikator 3 dengan skor total
adalah 0.790. Indikator yang
memiliki korelasi tertinggi
adalah indikator 2 (0.832),
sehingga variabel latent yang
digunakan menggunakan skor
indikator 2.
Diunduh dari:
http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html…………..
METODE SKOR FAKTOR &
METODE SKOR KOMPONEN UTAMA
Kedua Metode ini menggunakan analisis faktor dan analisis komponen utama.
Metode ini menghasilkan skor faktor dan skor komponen utama, yang dijadikan sebagai
data untuk variabel latent. Kedua metode ini berbeda dengan ketiga metode pertama yaitu
bobot masing-masing indikator adalah berbeda, dan tidak 100% informasi terpakai atau
tercakup. Kedua metode terakhir ini akan dijelaskan pada sub bab tersendiri pada bab ini.
Perbedaan masing-masing metode dapat dilihat dari gambar berikut:
Pada kedua gambar tampak terlihat perbedaan terletak bagaimana arah hubungan
antara variabel laten dengan indikator. Pada analisis faktor, masing-masing variabel
indikator adalah fungsi dari variabel latent, sedangkan pada analisis komponen
utama, variabel latent adalah fungsi dari seluruh variabel indikator.
Konstruk dengan analisis faktor menganggap bahwa variabel latent adalah refleksi
dari sejumlah indikator, sedangkan konstruk dengan analisis komponen utama
menganggap bahwa variabel latent dibentuk (formasi) dari sejumlah indikator.
Oleh karena itu, pembentukan variabel latent menggunakan analisis faktor
dinamakan bentuk reflektif, sedangkan pembentukan variabel latent menggunakan
analisis komponen utama dinamakan bentuk formatif.
Diunduh dari:
http://anaarisanti.blogspot.com/2010/05/data-variabel-latent.html…………..
ITEM CONSTRUCTION
•
Agreement items
– Write declarative statements
• Death penalty should be abolished
• I like to listen to classical music
– Frequency items (how often)
• I like to read
– Evaluation items
• How well did your team play
• How well does the police serve your community
Prosedur dalam membuat skala Likert adalah sebagai
berikut:
1. Peneliti mengumpulkan bahan-bahan yang relevant dengan masalah
yang sedang diteliti
2. Menyusun Blue Print untuk memandu penyusunan alat ukur
3. Membuat item-item yang akan diuji sesuai dengan panduanUji coba
item kepada sekelompok responden yang cukup representatif dari
populasi yang ingin diteliti. Responden di atas diminta untuk mengecek
tiap item, apakah ia menyenangi (+) atau tidak menyukainya (-).
Respons tersebut dikumpulkan dan jawaban yang memberikan indikasi
menyenangi diberi skor tertinggi. Tidak ada masalah untuk memberikan
angka 5 untuk yang tertinggi dan skor 1 untuk yang terendah atau
sebaliknya. Yang penting adalah konsistensi dari arah sikap yang
diperlihatkan. Demikian juga apakah jawaban “setuju” atau “tidak
setuju” disebut yang disenangi, tergantung dari isi pertanyaan dan isi
dari item-item yang disusun.
4. Setelah item di uji coba kepada responden, lalu diuji tingkat validitas
dan reabilitas dari item-item tersebut. Validitas adalah suatu ukuran
yang menunjukkan tingkatan kevalidan atau kesa hihan suatu instrumen
sedangkan reliabilitas merupakan penilaian tingkat konsistensi terhadap
hasil pengukuran bila dilakukan multiple measurement pada sebuah
variabel suatu alat ukur dikatakan reliabel jika alat ukur tidak berubah.
Diunduh dari: http://kiptykipty.wordpress.com/2010/06/05/skala-likert-dalam-teknik-evaluasiperencanaan/ ………….. 25/8/2012
PENULISAN ITEM
•
•
•
•
•
•
Mutually exclusive and collectively exhaustive items
Use positively and negatively phrased questions
Avoid colloquialism, expressions and jargon
Avoid the use of negatives to reverse the wording of an item
– Don’t use: I am not satisfied with my job
– Use: I hate my job!
Be brief, focused, and clear
Use simple, unbiased questions
Instrumen atau alat pengumpul data adalah alat yang digunakan untuk mengumpulkan data
dalam suatu penelitian. Data yang terkumpul dengan menggunakan instrumen tertentu
akan dideskripsikan dan dilampirkan atau digunakan untuk menguji hipotesis yang diajukan
dalam suatu penelitian.
Alur Penyusunan dan Pengembangan Instrumen:
Variabel
Teori
Berdasarkan sintesis dari teori-teori yang dikaji tentang
suatu konsep dari variabel yang hendak diukur, kemudian
dirumuskan konstruk dari variabel tersebut.
Konstruk
Konstruk pada dasarnya adalah bangun pengertian dari
suatu konsep yang dirumuskan oleh peneliti.
Definisi
Konseptual
Definisi
Operasional
Penetapan Jenis
Instrumen
Menyusun Butir
Ada beberapa jenis instrumen yang biasa digunakan
dalam penelitian, antara lain kuesioner, skala (skala
sikap atau skala penilaian), tes, dan lain-lain.
Kuesioner adalah alat pengumpul data yang berbentuk
pertanyaan yang akan diisi atau dijawab oleh
responden. Beberapa alasan digunakannya kuesioner
adalah :
1. kuesioner terutama dipakai untuk mengukur
variabel yang bersifat faktual,
2. untuk memperoleh informasi yang relevan dengan
tujuan penelitian, dan
3. Untuk memperoleh informasi dengan validitas dan
reliabilitas setinggi mungkin.
Sumber:Instrumen
Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
PENULISAN ITEM (BUTIR –BUTIR TES)
Tipe Pilihan Ganda
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Item hendaklah menanyakan hal yang penting untuk diketahui.
Tulislah item yang berisi pernyataan pasti.
Utamakan item yang mengandung pernyataan umum yang bertahan lama.
Buatlah item yang berisi hanya satu gagasan saja.
Buatlah item yang menyatakan inti pertanyaan dengan jelas. kalimat sederhana
dan tidak berlebih-lebihan.
Sebaiknya item tidak didasari oleh pernyataan negatif.
Gunakan bahasa yang jelas, kata yang sederhana, dan pernyataan yang
langsung.
Item harus memberikan alternatif bagi isi pernyataan yang paling penting.
Berikan alternatif jawaban yang jelas berbeda.
Alternatif yang ditawarkan hendaknya mempunyai struktur dan arti yang sejajar
atau dalam satu kategori.
Penggunaan alternatif yang semata-mata meniadakan atau bertentangan
dengan alternatif yang lain, haruslah dihindari.
Bilamana mungkin, susunlah alternatif jawaban dalam urutan besarnya atau
urutan logisnya.
Penggunaan alternatif “bukan salah-satu di atas” atau “semua yang di atas”
hanya baik apabila kebenaran bersifat mutlak dan bukan semata-mata masalah
lebih dan kurang baik atau masalah kebenaran relatif.
Jangan menjebak siswa dengan menanyakan hal yang tidak ada jawabannya.
Hindari penggunaan kata-kata yang dapat dijadikan petunjuk oleh siswa dalam
menjawab.
Tipe Benar-Salah
Kaidah atau petunjuk penulisan item tipe benar–salah telah dikemukakan oleh
Ebel (1979) sebagaimana berikut ini.
1.
2.
3.
4.
5.
Item haruslah mengungkap ide atau gagasan yang penting.
Item tipe benar-salah hendaknya menguji pemahaman, mengungkap ingatan
mengenai suatu fakta atau hafalan.
Kebenaran atau ketidakbenaran suatu item haruslah bersifat mutlak.
Item harus menguji pengetahuan yang spesifik dan jawabannya tidak jelas bagi
semua orang, kecuali bagi mereka yang menguasai pelajaran.
Item harus dinyatakan secara jelas.
Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
PENULISAN ITEM (BUTIR –BUTIR TES)
Tipe Jawaban Pendek
1.
2.
3.
4.
5.
Pernyataan atau pertanyaan item harus ditulis dengan hati-hati sehingga dapat
dijawab dengan hanya satu jawaban yang pasti.
Sebaiknya rumuskan jawabannya lebih dahulu baru kemudian menulis
pertanyaannya.
Gunakan pertanyaan langsung, kecuali bilamana model kalimat tak selesai akan
memungkinkan jawaban yang lebih jelas.
Usahakan agar dalam pertanyaan tidak terdapat petunjuk yang mungkin
digunakan oleh subjek dalam menjawab item.
Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku.
Tipe Karangan (Esai)
1.
2.
3.
4.
Berikan pertanyaan atau tugas yang mengarahkan penjawab pertanyaan (siswa)
agar dapat menunjukkan penguasaan pengetahuan yang penting.
Buatlah pertanyaan yang arah jawabannya jelas, sehingga para ahli dapat setuju
bahwa satu jawaban akan lebih baik daripada yang lainnya.
Jangan menanyakan sikap atau pendapat.
Sebaiknya pertanyaan diawali oleh kata-kata seperti, “Bandingkan …”, “Berikan
alasan …”, “Jelaskan mengapa …”, “Beri contoh …”, dan semacamnya.
Tipe Pasangan
1.
2.
3.
4.
5.
Premis dan respons hendaknya dibuat dalam jumlah yang tidak sama.
Baik premis maupun respons haruslah berisi hal yang homogen, yaitu
dari sejenis kategori isi.
Usahakan agar premis dan responsnya berisi kalimat-kalimat atau kata
yang pendek.
Buatlah petunjuk pemasangan yang jelas, sehingga penjawab soal atau
pertanyaan mengetahui dasar apakah yang harus digunakan dalam
memasangkan premis dan responsnya.
Sedapat mungkin susunlah premis dan respons masing-masing secara
alfabetik atau menurut besaran kuantitatifnya.
Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
PENULISAN ITEM UNTUK SKALA LIKERT
Untuk menulis pernyataan sikap yang bermutu, penyusun skala harus menuruti
suatu kaidah atau pedoman penulisan pernyataan agar ciri-ciri pernyataan sikap
tidak terlupakan dan agar setiap pernyataan mempunyai kemampuan membedakan
antara kelompok responden yang setuju dengan kelompok responden yang tidak
setuju terhadap objek sikap.
Beberapa petunjuk untuk menyusun skala Likert di antaranya :
1. Tentukan objek yang dituju, kemudian tetapkan variabel yang akan diukur
dengan skala tersebut.
2. Lakukan analisis variabel tersebut menjadi beberapa sub variabel atau dimensi
variabel, lalu kembangkan indikator setiap dimensi tersebut.
3. Dari setiap indikator di atas, tentukan ruang lingkup pernyataan sikap yang
berkenaan dengan aspek kognisi, afeksi, dan konasi terhadap objek sikap.
4. Susunlah pernyataan untuk masing-masing aspek tersebut dalam dua kategori,
yakni pernyataan positif dan pernyataan negatif, secara seimbang banyaknya.
Edwards (1957) meramu berbagai saran dan petunjuk dari para ahli menjadi suatu pedoman atau
kriteria penulisan pernyataan sikap. Beberapa kriteria yang dimaksud adalah sebagai berikut.
1. Jangan menulis pernyataan yang membicarakan mengenai kejadian yang telah lewat kecuali
kalau objek sikapnya berkaitan dengan masa lalu.
2. Jangan menulis pernyataan yang berupa fakta atau dapat ditafsirkan sebagai fakta.
3. Jangan menulis pernyataan yang dapat menimbulkan lebih dari satu penfsiran.
4. Jangan menulis pernyataan yang tidak relevan dengan objek psikologisnya.
5. Jangan menulis pernyataan yang sangat besar kemungkinannya akan disetujui oleh hampir
semua orang atau bahkan hampir tak seorang pun yang akan menyetujuinya.
6. Pilihlah pernyataan-pernyataan yang diperkirakan akan mencakup keseluruhan liputan skala
afektif yang diinginkan.
7. Usahakan agar setiap pernyataan ditulis dalam bahasa yang sederhana, jelas, dan langsung.
Jangan menuliskan pernyataan dengan menggunakan kalimat- kalimat yang rumit.
8. Setiap pernyataan hendaknya ditulis ringkas dengan menghindari kata-kata yang tidak
diperlukan dan yang tidak akan memperjelas isi pernyataan.
9. Setiap pernyataan harus berisi hanya satu ide (gagasan) yang lengkap.
10. Pernyataan yang berisi unsur universal seperti “tidak pernah”, “semuanya”, “selalu”, “tak
seorang pun”, dan semacamnya, seringkali menimbulkan penafsiran yang berbeda-beda dan
karenanya sedapat mungkin hendaklah dihindari.
11. Kata-kata seperti “hanya”, “sekedar”, “semata-mata”, dan semacamnya harus digunakan
seperlunya untuk menghindari kesalahan penafsiran isi pernyataan.
12. Jangan menggunakan kata atau istilah yang mungkin tidak dapat dimengerti oleh para
responden.
13. Hindarilah pernyataan yang berisi kata negatif ganda.
Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
PENULISAN BUTIR UNTUK KUESIONER
Cara menyusun kuesioner beserta butir-butir yang tercantum di dalamnya haruslah
tetap mengacu pada pedoman penyusunan instrumen secara umum, sehingga
berlaku pula langkah-langkah sebagaimana telah dijelaskan di bagian terdahulu.
Dimulai dengan analisis variabel, pembuatan kisi-kisi, dan kemudian sampai pada
penyusunan pertanyaan untuk kuesioner.
Secara lebih teknis, petunjuk untuk membuat kuesioner adalah sebagai berikut.
1.
Mulai dengan pengantar yang isinya berupa permohonan mengisi kuesioner
sambil menjelaskan maksud dan tujuannya.
2. Jelaskan petunjuk atau cara mengisinya supaya tidak salah. berikan contoh
pengisiannya.
3. Mulai dengan pertanyaan untuk mengungkapkan identitas responden. Dalam
identitas ini sebaiknya tidak diminta mengisi nama. Identitas cukup
mengungkapkan jenis kelamin, usia, pendidikan, pekerjaan, pengalaman, dan
lain-lain yang ada kaitannya dengan tujuan kuesioner.
4. Isi pertanyaan sebaiknya dibuat beberapa kategori atau bagian sesuai dengan
variabel yang diungkapkan, sehingga mudah mengolahnya.
5. Rumusan pertanyaan dibuat singkat, tetapi membingungkan dan menimbulkan
salah penafsiran.
6. Hubungan antara pertanyaan yang satu dengan pertanyaan lainnya harus dijaga
sehingga tampak keterkaitan logikanya dalam satu rangkaian yang sistematis.
Hindari penggolongan pertanyaan terhadap indikator atau persoalan yang sama.
7. Usahakan agar jawaban, yakni kalimat atau rumusannya tidak lebih panjang
daripada pertanyaan.
8. Kuesioner yang terlalu banyak atau terlalu panjang akan melelahkan dan
membosankan responden sehingga pengisiannya tidak objektif lagi.
9. Ada baiknya kuesioner diakhiri dengan tanda tangan si pengisi untuk menjamin
keabsahan jawabannya.
10. Untuk melihat validitas jawaban kuesioner, ada baiknya kuesioner diberikan
kepada beberapa responden secara acak dan dilakukan wawancara dengan
pertanyaan yang identik dengan isi kuesioner yang telah diisinya.
Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
SUMBER KESALAHAN
• Social desirability
– Giving politically correct answers
• Response sets
– All yes, or all no responses
• Acquiescence
– Telling you what you want to hear
• Personal bias
– Wants to send a message
• Response order
– Recency - Respondent stops reading once s/he gets
to the response s/he likes
– Primacy - Remember better the initial choices
– Fatigue
• Item order
– Answers to later items may be affected by earlier
items (simple, factual items first)
– Respondent may not know how to answer earlier
questions
Diunduh dari:
………….. 23/8/2012
MENILAI INSTRUMENT
• Three issues to consider
– Validity: Does the instrument measure what its
supposed to measure
– Reliability: Does it consistently repeat the same
measurement
– Practicality: Is this a practical instrument
Proses Validasi Konsep Melalui Panel
1. Memeriksa instrumen mulai dari konstruk sampai penyusunan butir
Dalam kaitan ini, beberapa hal yang perlu diperhatikan antara lain :
1. Apakah dimensi yang dirumuskan sudah merupakan jabaran yang tepat dari
konstruk yang telah dirumuskan dan sesuai untuk mengukur konstruk dari
variabel yang hendak diukur ?
2. Apakah indikator yang dirumuskan sudah merupakan jabaran yang tepat dari
dimensi yang telah dirumuskan dan sesuai untuk mengukur konstruk dari
variabel yang hendak diukur ?
3. Apakah butir-butir instrumen yang dibuat telah sesuai untuk mengukur
indikator-indikator dari variabel yang hendak diukur ?
2. Menilai butir Item
Butir yang sudah dibuat diberikan kepada sekelompok panel untuk dinilai dengan
tetap mengacu pada tolok ukur di atas.
Metode penilaian butir dapat dilakukan dengan beberapa cara, misalnya dengan Metode
Thurstone dan Pair Comparison.
Sumber: Dr.Ir. Pudji Muljono, Msi. Disampaikan pada Lokakarya Peningkatan Suasana Akademik
Jurusan Ekonomi FIS-UNJ tanggal 5 sampai dengan 9 Agustus 2002
Diunduh dari:
https://docs.google.com/viewer?a=v&q=cache:k1SsN7H88fAJ:repository.ipb.ac.id/bitstream/handle/
TIPE-TIPE VALIDITAS
•
•
Face validity
– Does the instrument, on its face, appear to measure what it is
supposed to measure
Content validity
– Degree to which the content of the items adequately represent
the universe of all relevant items under study
– Generally arrived at through a panel of experts
Content validity
“Validity refers to the degree to which evidence and theory support the
interpretations of test scores entailed by proposed uses of tests
(AERA/APA/NCME, 1999).
Content validity refers to the degree to which the content of the items
reflects the content domain of interest (APA, 1954)
Content validity addresses the adequacy and representativeness of the
items to the domain of testing purposes
Content validity is not usually quantified possibly due to :
1.) subsuming it within construct validity;
2.) ignoring it as important; and/or
3.) relying on accepted expert agreement procedures
Diunduh dari: plaza.ufl.edu/.../CONTENT%20VALIDITY.p... 25/8/2012
TIPE-TIPE VALIDITAS
•
Criterion related
– Degree to which the predictor is adequate in capturing the
relevant aspects of criterion
– Uses Correlation analysis
– Concurrent validity
• Criterion data is available at the same time as predictor scorerequires high correlation between the two
– Predictive validity
• Criterion is measured after the passage of time
• Retrospective look at the validity of the measurement
• Known-groups
•
Criterion related
– Degree to which the predictor is adequate in capturing the
relevant aspects of criterion
– Uses Correlation analysis
– Concurrent validity
• Criterion data is available at the same time as predictor scorerequires high correlation between the two
– Predictive validity
• Criterion is measured after the passage of time
• Retrospective look at the validity of the measurement
• Known-groups
Diunduh dari:
………….. 23/8/2012
TIPE-TIPE RELIABILITAS
• Stability
– Test-retest: Same test is administered twice to the same
subjects over a short interval (3 weeks to 6 months)
– Look for high correlation between the test and retest
– Situational factors must be minimized
•
Equivalence
– Degree to which alternative forms of the same measure
produce same or similar results
– Give parallel forms of the same test to the same group
with a short delay to avoid fatigue
– Look for high correlation between the scores of the two
forms of the test
– Inter-rater reliability
• Internal Consistency
– Degree to which instrument items are homogeneous
and reflect the same underlying constructs
– Split-half testing where the test is split into two halves
that contain the same types of questions
– Uses Cronbach’s alpha to determine internal
consistency. Only one administration of the test is
required
– Kuder-Richardson (KR20) for items with right and wrong
answers
Diunduh dari:
………….. 23/8/2012
PRAKTIKALITAS
•
•
•
Is the survey economical
• Cost of producing and administering the survey
• Time requirement
• Common sense!
Convenience
• Adequacy of instructions
• Easy to administer
Can the measurement be interpreted by others
• Scoring keys
• Evidence of validity and reliability
• Established norms
A comparison of Likert scale and traditional measures of self-efficacy.
By Maurer, Todd J.; Pierce, Heather R.
Journal of Applied Psychology, Vol 83(2), Apr 1998, 324-329.
This study addressed whether a Likert-type measurement format can be used as
an alternative to the traditional format for measuring self-efficacy. Classical
reliability, observed correlations with relevant criteria, and confirmatory factor
analyses were used to assess the similarity of the two formats in a sample of 128
college students.
The results indicated that Likert-type and traditional measures of self-efficacy have
similar reliability–error variance, provide equivalent levels of prediction, and have
similar factor structure and similar discriminability.
Overall, considering both practicality and the apparent similarity of empirical
results from the two methods, a Likert scale seems to offer an acceptable
alternative method of measuring self-efficacy.
Limitations and suggestions for future research are discussed.
Diunduh dari:
………….. 23/8/2012
Development of a Multi-item Scale
Develop Theory
Generate Initial Pool of Items: Theory, Secondary Data, and
Qualitative Research
Select a Reduced Set of Items Based on Qualitative Judgement
Collect Data from a Large Pretest Sample
Statistical Analysis
Develop Purified Scale
Collect More Data from a Different Sample
Evaluate Scale Reliability, Validity, and Generalizability
Final Scale
Diunduh dari:
………….. 23/8/2012
EVALUASI SEKALA
Scale Evaluation
Reliability
Test/
Retest
Alternative
Forms
Validity
Internal
Consistency
Content
Convergent
Diunduh dari:
Criterion
Generalizability
Construct
Discriminant
………….. 23/8/2012
Nomological
Transformasi data ordinal ke interval dengan Method of
Succesive Interval (MSI)
Untuk dapat diolah menjadi analisis regresi, data ordinal yang biasanya didapat dengan
menggunakan skala likert, dll (skor kuesioner), maka terlebih dahulu data ini harus
ditrasformasikan menjadi data interval salah satu cara yang dapat digunakan adalah Method
of Succesive Interval (MSI).
Sepintas memang terlihat sangat susah karena kita harus membuat frekuensi, kemudian
menentukan proporsi, membuat proporsi komulatif dst.
Langkah-langkah Method of Succesive Interval (MSI).sebagai berikut:
1.
2.
3.
4.
5.
Membuat ferkuensi dari setiap butir jawaban pada masing-masing kategori pertanyaan.
Membuat proporsi dengan cara membagi frekuensi dari setiap butir jawaban dengan
seluruh jumlah responden.
Membuat proporsi kumulatif
Menentukan nilai z untuk setiap butir jawaban berdasarkan nilai frekuensi yang telah
diperoleh dengan bantuan tabel z riil.
Menghitung nilai skala, dengan rumus:
6. Penyertaan nilai skala
Nilai penyertaan inilah yang disebut skala interval dan dapat digunakan dalam perhitungan
analisis regresi.
Diunduh dari: http://jurnal-sdm.blogspot.com/2007/12/transformasi-data-ordinal-ke-interval.html
………….. 24/8/2012
TRANSFORMASI DATA ORDINAL MENJADI INTERVAL
Data primer adalah data yang direspon langsung oleh responden berdasarkan
wawancara ataup daftar pertanyaan yang dirancang, disusun, dan disajikan dalam
bentuk skala; baik skala nominal, ordinal, interval maupun ratio.
Teknik pengumpulan data seperti ini lazim digunakan karena selain bisa langsung
menentukan skala pengukuranya, juga dapat melengkapi hasil wawancara yang
dilakukan dengan responden.
Melakukan manipulasi data dengan cara transformasi “skala” dari ordinal menjadi
interval, selain bertujuan untuk tidak melanggar kelaziman, juga untuk mengubah
agar syarat distribusi normal dapat dipenuhi ketika menggunakan statistika
parametrik. Menurut Sambas Ali Muhidin dan Maman Abdurahman, “salah satu
metode transformasi yang sering digunakan adalah metode succesive interval
(MSI)”.
Ada dua pendapat berbeda tentang bagaimana skor-skor yang diberikan terhadap
alternatif jawaban pada skala pengukuran Likert.
Pendapat pertama mengatakan bahwa skor 1, 2, 3, 4, dan 5 adalah data interval.
Pendapat ke dua, menyatakan bahwa jenis skala pengukuran Likert adalah ordinal.
Alasannya skala Likert merupakan Skala Interval adalah karena skala sikap
merupakan dan menempatkan kedudukan sikap seseorang pada kesatuan perasaan
kontinum yang berkisar dari sikap “sangat positif”, artinya mendukung terhadap
suatu objek psikologis terhadap objek penelitian, dan sikap “sangat negatif”, yang
tidak mendukung sama sekali terhadap objek penelitian.
Ciri spesifik yang dimiliki oleh data yang diperoleh dengan skala pengukuran ordinal,
adalah bahwa, data ordinal merupakan jenis data kualitatif, bukan numerik, berupa
kata-kata atau kalimat, seperti misalnya sangat setuju, kurang setuju, dan tidak
setuju, jika pertanyaannya ditujukan terhadap persetujuan tentang suatu event.
Atau bisa juga respon terhadap keberadaan suatu Bank “PQR” dalam suatu daerah
yang bisa dimulai dari sangat tidak setuju, tidak setuju, ragu-ragu, Setuju, dan
sangat setuju.
Data interval adalah termasuk data kuantitatif, berbentuk numerik, berupa angka,
bukan terdiri dari kata-kata, atau kalimat. Peneliti melakukan penelitian dengan
menggunakan pendekatan kuantitatif, termasuk di dalamnya adalah data interval,
data yang diperoleh dari hasil pengumpulan data bisa langsung diolah dengan
menggunakan model statistika. Akan tetapi data yang diperoleh dengan pengukuran
skala ordinal, berbentuk kata-kata, kalimat, penyataan, sebelum diolah, perlu
memberikan kode numerik, atau simbol berupa angka dalam setiap jawaban.
Diunduh dari:
myunanto.staff.gunadarma.ac.id/.../Transformasi+Data+Ordinal+Men...………….. 24/8/2012
PERLUKAH DATA ORDINAL DI TRANSFORMASI KE INTERVAL DENGAN MSI?
Posted by: Muji Gunarto on: 25 Desember 2008
Data ordinal dengan Skala Likert STS(1), TS(2), R(3), S(4), SS(5) jika diubah
skalanya menjadi interval maka skore interval akan mirip sama urutannya dengan skore asli
ordinal dan berkorelasi sebesar 99%.
Jadi data asli ordinal sama dengan interval dan dapat dianggap interval.
Hal yang membedakan adalah interpretasi model dari hasil analisis anatara data ordinal
dengan data interval.
Misalkan ada model regresi sebagai berikut:
Y = a + b1X1 +b2X2
Y = 0.50 +0.25X1 +0.30X2
Jika data interval misal Y = Produksi padi (ton/Ha), X1 = Pupuk UREA (kg/Ha) dan X2 = Bibit
(kg/Ha), maka interpretasinya adalah kalau pupuk dinaikan 10% maka produksi padi akan
naik 2.5%, kalau bibit naik 10%, maka produksi padi naik 3%.
Kalau data ordinal (kualitatif) misalnya Y= kepuasan kerja, X1=Komitmen, X2=motivasi, maka
tidak bisa diinterpretasikan jika komitmen naik 10% maka kepuasan naik 2.5% (karena
datanya kualitatif) jadi hanya bisa dikatakan bahwa komitmen berpengaruh (signifikan)
terhadap kepuasan kerja seberapa besar pengaruhnya tidak tahu (karena kualiatif).
Walaupun data ordinal tadi sudah menjadi interval tetap saja kita tidak bisa interpretasi
seperti data kuantitatif karena data aslinya adalah kualitatif.
Diunduh dari:
http://mujigunarto.wordpress.com/2008/12/25/perlukah-data-ordinal-ditransformasi-ke-interval-dengan-msi/………….. 24/8/2012
Questionnaire design
For a questionnaire to fulfill a researcher’s purposes, the questions must meet the
basic criteria of relevance and accuracy. To achieve these ends, a researcher who
is systematically planning a questionnaire’s design will be required to make several
decisions—typically, but not necessarily, in the following order:
1.
2.
3.
4.
5.
What should be asked?
How should questions be phrased?
In what sequence should the questions be arranged?
What questionnaire layout will best serve the research objectives?
How should the questionnaire be pretested? Does the questionnaire need to be
revised?
What Should Be Asked?
Certain decisions made during the early stages of the research process will influence
the questionnaire design. The preceding chapters stressed good problem definition
and clear research questions.
This leads to specific research hypotheses that, in turn, clearly indicate what must be
measured.
Different types of questions may be better at measuring certain things than are
others. In addition, the communication medium used for data collection—that is,
telephone interview, personal interview, or self-administered questionnaire—must be
determined.
This decision is another forward linkage that influences the structure and content of
the questionnaire. Therefore, the specific questions to be asked will be a function of
previous decisions made in the research process.
At the same time, the latter stages of the research process will also have an
important impact on questionnaire wording and measurement.
For example, when designing the questionnaire, the researcher should consider the
types of statistical analysis that will be conducted.
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
Questionnaire design
A survey is only as good as the questions it asks
Langkah-Langkah Pembuatan Quesioner:
Langkah 1:
• Menentukan Hipotesis
• Menentukan tipe survey yang akan digunakan
• Menentukan pertanyaan-pertanyaan survey
• Menentukan kategori jawaban
• mendesain letak survey
Langkah 2:
• Rencanakan bagaimana data akan dikumpulkan
• Uji awal alat pengukuran
Langkah 3:
• tentukan target populasi
• tentukan teknik sampling (random sampling, non random sampling)
• tentukan ukuran sampel
• pilih sampel
Langkah 4:
• Temukan responden
• lakukan interview/wawancara
• kumpulkan data dengan teliti
Langkah 5:
• Masukkan data kedalam komputer
• periksa ulang seluruh data
• lakukan analisis statistik pada data yang diperoleh
Langkah 6:
• Jelaskan metode dan penemuan dalam laporan penelitian
• Presentasikan untuk mendapatkan masukan dan evaluasi
Diunduh dari:
http://jurnal-sdm.blogspot.com/2011/06/penyusunan-kuesionerpenelitian.html………….. 24/8/2012
What should you ask?
•
•
The questions asked are a function of previous decisions
The questions asked are a function of future decisions (such as statistical
analysis)
Ecosystem services (also called environmental services or nature’s services) are benefits
provided by ecosystems to humans, that contribute to making human life both possible and
worth living. Many of these goods and services are traditionally viewed as free benefits to
society, or "public goods" - wildlife habitat and diversity, watershed services, carbon storage,
and scenic landscapes, for example. Lacking a formal market, these natural assets are
traditionally absent from society’s balance sheet; their critical contributions are often
overlooked in public, corporate, and individual decision-making.
Diunduh dari: http://www.trunity.net/oceanresource/topics/view/55385/ …………..
25/8/2012
Key criteria
•
Questionnaire relevancy
–
•
No unnecessary information is collected and only information needed to
solve the problem is obtained. Be specific about your data needs; tie
each question to an objective
Questionnaire accuracy
–
Information is both reliable and valid
What is LCA?
In the context of environmental challenges and the need for more sustainable production
modes, Life Cycle Assessment (LCA) has been brought forward as an important and
comprehensive method for analyzing the environmental impact of products and services.
While its has long been used in the industry, LCA has only been applied to agricultural
systems for the last 10 years. (http://lca-rice.cirad.fr/what_is_lca)
LCA is defined and framed by ISO standards. It involves 4 typical phases:
1. Goal and scope definition (where system is delineated, indicators are chosen,
functional unit is selected, ways of presenting results are decided upon, etc.)
2. Inventory analysis (where all inputs and resources used are inventoried and quantified,
related to the given functional unit; it is a kind of mass and energy balance, focused on
environmentally relevant flows)
3. Impact assessment (where environmental impact indicators are calculated, involving
classification and characterization stages)
4. Interpretation and presentation of results (with necessary caution regarding indicators uncertainty and errors should be considered, sensitivity analysis should be carried out).
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
Questionnaire Relevancy
A questionnaire is relevant to the extent that all information collected addresses a
research question that will help the decision maker address the current business
problem. Asking a wrong question or an irrelevant question is a common pitfall. If the
task is to pinpoint store image problems, questions asking for political opinions are
likely irrelevant. The researcher should be specific about data needs and have a
rationale for each item requesting information. Irrelevant questions are more than a
nuisance because they make the survey needlessly long. In a study where two
samples of the same group of businesses received either a one-page or a threepage questionnaire, the response rate was nearly twice as high for the one-page
survey.
Conversely, many researchers, after conducting surveys, find that they omitted some
important questions. Therefore, when planning the questionnaire design, researchers
must think about possible omissions. Is information on the relevant demographic and
psychographic variables being collected?
Would certain questions help clarify the answers to other questions? Will the results
of the study provide the answer to the manager’s problem?
Questionnaire Accuracy
Once a researcher decides what should be asked, the criterion of accuracy becomes
the primary concern. Accuracy means that the information is reliable and valid.
While experienced researchers generally believe that questionnaires should use
simple, understandable, unbiased, unambiguous, and nonirritating words, no stepby-step procedure for ensuring accuracy in question writing can be generalized
across projects. Obtaining accurate answers from respondents depends strongly on
the researcher’s ability to design a questionnaire that will facilitate recall and
motivate respondents to cooperate. Respondents tend to be more cooperative when
the subject of the research interests them. When questions are not lengthy, difficult to
answer, or ego threatening, there is a higher probability of obtaining unbiased
answers.
Question wording and sequence also substantially influence accuracy, which can be
particularly challenging when designing a survey for technical audiences. The
Department of Treasury commissioned a survey of insurance companies to evaluate
their offering of terrorism insurance as required by the government’s terrorism
reinsurance program. But industry members complained that the survey misused
terms such as “contract” and “high risk,” which have precise meanings for insurers,
and asked for policy information “to date,” without specifying which date. These
questions caused confusion and left room for interpretation, calling the survey results
into question.
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
Phrasing Questions
•
Open ended response versus fixed alternative questions
“?”
•
Decision criteria: type of research; time; method of delivery;
budget; concerns regarding researcher bias
Open-ended response questions pose some problem or topic and ask respondents to
answer in their own words. If the question is asked in a personal interview, the
interviewer may probe for more information, as in the following examples:
1.
2.
3.
4.
5.
6.
7.
8.
What names of local banks can you think of?
What comes to mind when you look at this advertisement?
In what way, if any, could this product be changed or improved? I’d like you to tell
me anything you can
think of, no matter how minor it seems.
What things do you like most about working for Federal Express? What do you
like least?
Why do you buy more of your clothing in Nordstrom than in other stores?
How would you describe your supervisor’s management style?
Please tell us how our stores can better serve your needs.
Open-ended response questions are free-answer questions.
The fixed-alternative questions—sometimes called closed-ended questions—
which give respondents specific limited-alternative responses and ask them to
choose the one closest to their own viewpoints.
For example:
Did you use any commercial feed or supplement for livestock or poultry in
2010?
Yes
No
Would you say that the labor quality in Japan is higher, about the same, or not
as good as it was 10 years ago?
Higher
About the same
Not as good
Diunduh dari:
………….. 25/8/2012
Avoid
•
•
•
•
•
•
•
Leading questions (pertanyaan yang “menggiring”)
Overly complex questions
Use of jargon
Loaded questions (can use a counterbiasing statement)
Ambiguity
Double barreled questions
Making assumptions
Avoid Leading and Loaded Questions
leading question = A question that suggests or implies certain answers.
Leading and loaded questions are a major source of bias in question wording. A leading
question suggests or implies certain answers.
A study of the dry cleaning industry asked this question:
Many people are using dry cleaning less because of improved wash-and-wear clothes.
How do you feel wash-and-wear clothes have affected your use of dry cleaning
facilities in the past 4 years?
Use less
No change
Use more
It should be clear that this question leads the respondent to report lower usage of dry
cleaning. The potential “bandwagon effect” implied in this question threatens the
study’s validity.
loaded question = A question that suggests a socially desirable answer or is
emotionally charged.
A loaded question suggests a socially desirable answer or is emotionally charged.
Consider the following question from a survey about media influence on politics:
What most influences your vote in major elections?
1. My own informed opinion
2. Major media outlets such as CNN
3. Newspaper endorsements
4. Popular celebrity opinions
5. Candidate’s physical attractiveness
6. Family or friends
7. Video advertising (television or Web video)
8. Other
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
Order?
•
Order bias results from an alternative answer’s position in a
set of answers or from the sequencing of questions
– Funneling technique: general to specific helps understand the
frame of reference first
•
Anchoring effect: the first concept measured tends to
become a comparison point from which subsequent
evaluations are made
COUNTERBIASING STATEMENT
An introductory statement or preamble to a potentially embarrassing question
that reduces a respondent’s reluctance to answer by suggesting that certain
behavior is not unusual.
An introductory counterbiasing statement or preamble to a question that
reassures respondents that their “embarrassing” behavior is not abnormal may
yield truthful responses:
Some people have time to brush three times daily but others do not. How
often did you brush your teeth yesterday?
If a question embarrasses the respondent, it may elicit no answer or a biased
response. This is particularly true with respect to personal or classification data
such as income or education. The problem may be mitigated by introducing
the section of the questionnaire with a statement such as this:
To help classify your answers, we’d like to ask you a few questions. Again,
your answers will be kept in strict confidence.
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
AVOID AMBIGUITY: BE AS SPECIFIC AS POSSIBLE
Items on questionnaires often are ambiguous because they are too general.
Consider such indefinite words as often, occasionally, regularly, frequently, many,
good, and poor. Each of these words has many different meanings.
For one consumer, frequent reading of Fortune magazine may be reading all 25 issues in a
year, while another might think 12, or even 6 issues a year is frequent. Earlier, we used the
following question as an example of a checklist question:
Please check which, if any, of the following sources of information about investments you
regularly use.
What exactly does regularly mean? It can certainly vary from respondent to respondent.
How exactly does hardly any differ from occasionally? Where is the cutoff? It is much better
to use specific time periods whenever possible.
A brewing industry study on point-of-purchase advertising (store displays) asked their
distributors:
How often does the company shut down production for sanitary maintenance?
1. Annually (once a year)
2. Semiannually (once every six months)
3. Quarterly (about every three months)
4. At least once monthly
5. Less frequently (less often than once a year)
Here the researchers clarified the terms permanent, semipermanent, and temporary by defining them for
the respondent. However, the question remained somewhat ambiguous. Beer marketers often use a
variety of point-of-purchase devices to serve different purposes—in this case, what is the purpose? In
addition, analysis was difficult because respondents were merely asked to indicate a preference rather than
a degree of preference. Thus, the meaning of a question may not be clear because the frame of reference
is inadequate for interpreting the context of the question.
A student research group asked this question: What media do you rely on most?
1.
Television
2.
Radio
3.
Internet
4.
Newspapers
This question is ambiguous because it does not provide information about the context.
“Rely on most” for what—news, sports, entertainment? When—while getting dressed in
the morning, driving to work, at home in the evening? Knowing the specific circumstance
can affect the choice made.
Diunduh dari:
http://www.cengage.com/marketing/book_content/1439080674_zikmund/book/ch15.pdf …………..
25/8/2012
Decisions
•
•
•
•
•
Ranking, sorting, rating or choice?
How many categories or response positions?
Balanced or unbalanced?
Forced choice or nonforced choice?
Single measure or index?
The Air Quality Index (AQI) is an index for reporting daily air quality. The Environmental
Protection Agency calculates the AQI for five major air pollutants regulated by the Clean Air
Act: ground-level ozone, particle pollution (also known as particulate matter), carbon
monoxide, sulfur dioxide and nitrogen dioxide. The higher the AQI value, the greater the
level of air pollution and the greater the health concern.
Diunduh dari: http://aapnews.aappublications.org/content/25/6/279.2.full …………..
25/8/2012
Types of fixed alternative questions…
• Single dichotomy or dichotomous-alternative
questions
“Are you currently registered in a course at the
University of Lethbridge?
Yes____ No____”
• Respondent chooses one of two alternatives
(yes/no; male/female)
• What scale would this data create?
• Multi-choice alternative
– Respondent chooses from several
alternatives
– Many types…
Diunduh dari:
………….. 23/8/2012
Multi-choice alternative questions…
• Determinant choice
– Choose only one from several possible responses
“Which faculty are you currently registered in at
the University of Lethbridge?
Management ___
Education ____
Arts/Science____
Health sciences____
Combined degree____
• What type of scale would these data create?
• Frequency determination
– Asks for an answer about frequency of
occurrence
In a typical week, how often do you purchase
chocolate chip cookies?
__never
__ once
__ 2 or more times
What type of scale would these data create?
Diunduh dari:
………….. 23/8/2012
CHECK LIST
•
Check list
– Provide multiple answers to a single question
– Should be mutually exclusive and exhaustive
“What brands of chocolate chip cookies have you, to the best of your
memory, purchased in the past month (check all that apply?)”
__ Dare
__ Chips A’hoy
__ Presidents Choice Decadent etc. etc.
• What type of scale would these data create?
The checklist question allows the respondent to provide multiple answers to a single
question. The respondent indicates past experience, preference, and the like merely
by checking off items. In many cases the choices are adjectives that describe a
particular object.
A typical checklist question might ask the following:
Please check which, if any, of the following sources of information about investments
you regularly use.
1.
2.
3.
4.
5.
6.
7.
8.
Personal advice of your broker(s)
Brokerage newsletters
Brokerage research reports
Investment advisory service(s)
Conversations with other investors
Web page(s)
None of these
Other (please specify) __________
Diunduh dari:
………….. 23/8/2012
ATTITUDE RATING SCALES
Attitude:
An enduring disposition to consistently respond to various aspect of the world,
including persons, events and objects
Typically seen as having three components:
– Cognitive
– Affective
– Behavioural
Scaling Techniques for Measuring Data Gathered from Respondents
The term scaling is applied to the attempts to measure the attitude objectively. Attitude is a
resultant of number of external and internal factors. Depending upon the attitude to be
measured, appropriate scales are designed. Scaling is a technique used for measuring
qualitative responses of respondents such as those related to their feelings, perception,
likes, dislikes, interests and preferences.
Nominal Scale
This is a very simple scale. It consists of assignment of facts/choices to various alternative
categories which are usually exhaustive as well mutually exclusive. These scales are just
numerical and are the least restrictive of all the scales. Instances of Nominal Scale are credit card numbers, bank account numbers, employee id numbers etc. It is simple and
widely used when relationship between two variables is to be studied. In a Nominal Scale
numbers are no more than labels and are used specifically to identify different categories of
responses.
How do you stock items at present?
[ ] By product category
[ ] At a centralized store
[ ] Department wise
[ ] Single warehouse.
Ordinal Scale
Ordinal scales are the simplest attitude measuring scale used in Marketing Research. It is
more powerful than a nominal scale in that the numbers possess the property of rank order.
The ranking of certain product attributes/benefits as deemed important by the respondents
is obtained through the scale.
Rank the following attributes (1 - 5), on their importance in a microwave oven.
a. Company Name
b. Functions
c. Price
d. Comfort
e. Design
Diunduh dari:
http://www.managementstudyguide.com/attitude-scales.htm………….. 24/8/2012
Affective
The feelings or emotions toward an object
Cognitive
Knowledge and beliefs
Behavioral
Predisposition to action
Intentions
Behavioral expectations
Diunduh dari:
………….. 23/8/2012
Attitude Scales: Scaling Defined
The term scaling refers to procedures for attempting to
determine quantitative measures of subjective and
sometimes abstract concepts.
It is defined as a procedure for the assignment of numbers
to a property of objects in order to impart some of the
characteristics of numbers to the properties in question.
Unidimensional
Scaling
Multidimensional
Scaling
Procedures
designed to
measure only
one attribute of
a respondent or
object
Procedures
designed to
measure several
dimensions of a
respondent or
object
Diunduh dari:
………….. 23/8/2012
PROSES MENGUKUR ATTITUDE
•
•
•
•
Ranking
Rating
Sorting
Choice
A ranking is a relationship between a set of items such that, for any two items, the
first is either 'ranked higher than', 'ranked lower than' or 'ranked equal to' the
second.
In mathematics, this is known as a weak order or total preorder of objects. It is not
necessarily a total order of objects because two different objects can have the
same ranking.
The rankings themselves are totally ordered. For example, materials are totally
preordered by hardness, while degrees of hardness are totally ordered.
By reducing detailed measures to a sequence of ordinal numbers, rankings make
it possible to evaluate complex information according to certain criteria. Thus, for
example, an Internet search engine may rank the pages it finds according to an
estimation of their relevance, making it possible for the user quickly to select the
pages they are likely to want to see.
Analysis of data obtained by ranking commonly requires non-parametric statistics.
In statistics, "ranking" refers to the data transformation in which numerical or
ordinal values are replaced by their rank when the data are sorted. For example,
the numerical data 3.4, 5.1, 2.6, 7.3 are observed, the ranks of these data items
would be 2, 3, 1 and 4 respectively.
For example, the ordinal data hot, cold, warm would be replaced by 3, 1, 2. In
these examples, the ranks are assigned to values in ascending order. (In some
other cases, descending ranks are used.) Ranks are related to the indexed list of
order statistics, which consists of the original dataset rearranged into ascending
order.
Some kinds of statistical tests employ calculations based on ranks:
Friedman test
Kruskal-Wallis test
Rank products
Spearman's rank correlation coefficient
Wilcoxon rank-sum test
Wilcoxon signed-rank test.
Ranks can sometimes have non-integer values for tied data values. Thus, in one way of treating
tied data values, when there is an even number of copies of the same data value, the statistical
rank (being the median rank of the tied data) can end in ½.
Diunduh dari: http://en.wikipedia.org/wiki/Ranking ………….. 24/8/2012
Types of attitude scales
•
•
•
Simple attitude scales
Most basic form – respondent responds to a single question
Do not allow for fine distinctions or placement on continua
–
You are at a company party and are feeling nervous, but you are obligated to be
there. Do you:
__ find someone you know to buddy up with
__ take it as an opportunity to meet new people
What type of scale would these data create?
Attitude Scales
An attitude scale is a special type of questionnaire designed to produce scores
indicating the intensity and direction (for or against) of a person's feelings about an
object or event. There are several types of scales that can be constructed, but the most
common is the Likert -type. The scale is constructed so that all its questions concern a
single issue.
Attitude scales are often used in attitude change experiments. One group of people is
asked to fill out the scale twice, once before some event, such as reading a persuasive
argument, and again afterward. A control group fills out the scale twice without reading
the argument. The control group is used to measure exposure or practice effects. The
change in the scores of the experimental group relative to the control group, whether
their attitudes have become more or less favorable, indicates the effects of the
argument.
Likert-type Scale
A Likert -type scale, named for Rensis Likert (1932) who developed this type of attitude
measurement, presents a list of statements on an issue to which the respondent
indicates degree of agreement using categories such as :
Strongly Agree, Agree, Undecided, Disagree, and Strongly Disagree.
Diunduh dari:
http://famusoa.net/mpowers/trandp/docs/14%20Attitude%20and%20Rating%20Scales%20by%20S
ommer.pdf ………….. 24/8/2012
CATEGORY SCALES
•
Category scales
– More sensitive; provides more information
– Overall, how satisfied are you with the high speed performance of your Mercedes:
__ very satisfied
__ somewhat satisfied
__ neither satisfied nor dissatisfied
__ somewhat dissatisfied
__ very dissatisfied
If you could choose, how long would each term be?
___26 weeks __ 13 weeks __ 6 weeks ___4 weeks
What type of scale would these data create?
RATIO SCALES AND CATEGORY SCALES OF ODOUR INTENSITY
J. R. PIGGOTT and R. HARPER.
Chem. Senses (1975) 1 (3): 307-316. doi: 10.1093/chemse/1.3.307
The relation between a ratio scale obtained by magnitude estimation and a category scale of the
odour intensity of 1-butanol was studied, together with individual variations in the ratio scale.
Series of solutions of butanol in water in small bottles were presented to a panel for judgement,
half using the method of magnitude estimation, the other half a category scale. Plots were made
of the category scale against the ratio scale, and the ratio scales of individual members of the
panel were analysed.
A power function exponent of 0.48 was found for the panel's ratio scale, with individual values
ranging from 0.25 to 0.49.
The category scale was curved relative to the ratio scale; variability of the magnitude estimates
was approximately proportional to the magnitude estimates; and a small time-order error was
found.
Odour intensity exhibits the three tested characteristics of a prothetic continuum, and the
variability of individual exponents was not as great as sometimes suggested.
Diunduh dari:
http://chemse.oxfordjournals.org/content/1/3/307.abstract………….. 24/8/2012
Summated rating scales – the Likert scale
•
Summated rating scales – the Likert scale
–
Respondents indicate their attitudes by checking how strongly they agree
or disagree with statements
–
Chocolate chip cookies are my preferred variety of cookie
Strongly disagree Disagree Uncertain
(1)
(2)
(3)
Agree
(4)
Strongly Agree
(5)
What type of scale would these data create?
Ratio scales, category scales, and variability in the production of loudness and
softness.
Bruce Schneider, and Harlan Lane.
J. Acoust. Soc. Am. Volume 35, Issue 12, pp. 1953-1961 (December 1963).
Several studies have shown that category scales are nonlinearly related to ratio scales of subjective
magnitude.
A variability model has been proposed previously to account for this departure from linearity.
This article examines the model in the light of the empirical relations that enter into it: the ratio scale of
subjective magnitude, the corresponding category scale, and the variability of judgments in both physical
and psychological units.
These relations are determined, through repeated measurement with a single observer, for the
psychological continuum, loudness, and its inverse, softness. The ratio scales are shown to be reciprocals,
and the category scales complements. The category scale of softness is more concave downward, relative
to its magnitude scale, than is the category scale of loudness.
This outcome is also derived mathematically from the empirical equations relating the four scales to
physical magnitude.
Variability is found to increase with increasing stimulus magnitude at the same rate for both loudness and
softness productions, expressed either in physical units or in psychological units.
Hence, the variability model is found not to accord with the observed difference in concavity between
softness and loudness category scales relative to their respective psychological magnitude scales.
Diunduh dari:
http://iris.lib.neu.edu/psych_fac_pubs/15/………….. 24/8/2012
SEMANTIC DIFFERENTIAL RATING SCALE
Semantic Differential Rating scale
– An attitude measure consisting of a series of seven-point bipolar
rating scales allowing response to a “concept”
Think of your favorite type of cookie. Rate it on each of the following continua:
Hard------------------------------------------------------Soft
Lots of chips---------------------------------------Fewer chips
Crispy---------------------------------------------------chewy
What type of scale would these data create?
Journal of Marketing Management, Vol. 9:3, Winter 1999, 114-123. ©1999
RATING THE RATING SCALES
Hershey H. Friedman, and Taiwo Amoo
Rating scales are used quite frequently in research, especially in surveys. Typically, an
itemized rating scale asks subjects to choose one response category from several arranged
in hierarchical order.
Dishonest researchers can, of course, purposefully manipulate the outcome of their
research, if they wish, but such biasing may also be totally unintentional.
This paper examines issues involved in creating a relatively unbiased rating scale. These
include: (1) Connotations of category labels; (2) Response alternative effects; (3) Implicit
assumptions of the question; (4) Forced-choice vs. non-forced-choice rating scales; (5)
Unbalanced and balanced rating scales; (6) Order effects; (7) Direction of comparison; (8)
Optimal number of points; (9) Context effects; (10) Rating approach, e.g., improvement
needed, performance, comparison to expectations, comparison to ideal, etc.
Diunduh dari:
http://academic.brooklyn.cuny.edu/economic/friedman/rateratingscales.htm………….. 24/8/2012
NUMERICAL RATING SCALE
Numerical Rating scale
–
Similar to a semantic differential except that it uses numbers as response
options to identify response positions instead of verbal descriptions
Think of your favorite type of cookie. Rate it on each of the following continua:
Hard------------------------------------------------------------------------Soft
8
2
7
1
6
5
4
3
This scale is called an 8 point numerical scale, why?
What type of scale would these data create?
Numerical rating scale
“A scale used for the subjective measurement of a clinical sign/syndrome, in which
numerical scores are given (e.g. 0-4).
A description is given for each score. The observer chooses, for each individual observed,
the number on the scale which they consider most closely matches that individual.“
This system groups information in discrete units, which may place a constraint on the
observer.
The NRS can also be used without a descriptor for each score, but is improved by the
addition of the descriptions.
Validation of the numerical rating scale for pain intensity and unpleasantness in
pediatric acute postoperative pain: sensitivity to change over time
Pagé, M. Gabrielle; Katz, Joel; Stinson, Jennifer; Isaac, Lisa; Martin-Pichora, Andrea L.; Campbell, Fiona.
Journal of Pain, 13(4), 359-369. (2012) Date: 2012.
This study evaluates the construct validity (including sensitivity to change) of the numerical rating scale
(NRS) for pain intensity (I) and unpleasantness (U) and participant pain scale preferences in
children/adolescents with acute postoperative pain.
Eighty-three children aged 8 to 18 years (mean = 13.8, SD = 2.4) completed 3 pain scales including NRS,
Verbal Rating Scale (VRS), and faces scales (Faces Pain Scale-Revised [FPS-R] and Facial Affective Scale
[FAS], respectively) for pain intensity (I) and unpleasantness (U) 48 to 72 hours after major surgery, and
the NRS, VRS and Functional Disability Index (FDI) 2 weeks after surgery. As predicted, the NRSI correlated
highly with the VRSI and FPS-R and the NRSU correlated highly with the VRSU and FAS 48 to 72 hours
after surgery.
The FDI correlated moderately with the NRS at both time points. Scores on the NRSI and NRSU at 48 to 72
hours were significantly higher than at 2 weeks after surgery. Children found the faces scales the easiest
to use while the VRS was liked the least and was the hardest to use. The NRS has adequate evidence of
construct validity including sensitivity for both pain intensity and unpleasantness. This study further
supports the validity of the NRS as a tool to measure both intensity and unpleasantness of acute pain in
children.
Diunduh dari: http://pi.library.yorku.ca/dspace/handle/10315/14340
Diunduh dari:
CONSTANT SUM SCALES
Constant Sum Scales
–
Attributes based on their importance to the person. Respondents are asked
to divide a constant sum to indicate the relative importance of attributes
Example: Suppose the photocopy budget per professor was $100 per month.
How much should be allocated to the following. Divide the $100 according
to your preference:
____ photocopying for student needs;
____ photocopying for research needs;
____ photocopying for committee needs.
====
$100 TOTAL
Constant-Sum Scales
A scale that helps the researcher discover proportions is the constant-sum scale.
1.
2.
With this scale, the participant allocates points to more than one attribute or
propertyindicant, such that they total a constant sum, usually 100 or 10.
In the Exhibit 13-2 example, two categories are presented that must sum to 100.
In the restaurant example, the participant distributes 100 points among four
categories to indicate the relative importance of each attribute:
_____ Food Quality
_____ Atmosphere
_____ Service
_____ Price
100
TOTAL
3.
Up to 10 categories may be used, but both participant precision and patience suffer
when toomany stimuli are proportioned and summed.
1. A participant’s ability to add is also taxed in some situations; this is not a
responsestrategy that can be effectively used with children or the uneducated.
2. The advantage of the scale is its compatibility with percent (100 percent) and
the fact thatalternatives that are perceived to be equal can be so scored—
unlike most ranking scales.
3. The scale is used to record attitudes, behavior, and behavioral intent.
4. The constant-sum scale produces interval data.
Diunduh dari: http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales …………..
24/8/2012
GRAPHIC RATING SCALES
Graphic Rating Scales
– An attitude measure consisting of a graphic continuum that
allows respondents to rate an object by choosing any point on
the continuum
GRAPHIC RATING SCALES
1. The graphic rating scale was originally created to enable researchers to discern fine
differences.
Theoretically, an infinite number of ratings are possible if participants are
sophisticatedenough to differentiate and record them.
2. They are instructed to mark their response at any point along a continuum.
Usually, the score is a measure of length (millimeters) from either endpoint.
The results are treated as interval data.
3. The difficulty is in coding and analysis; this scale requires more time than scales
with predetermined categories.
Never __X___________ Always
4. Other graphic rating scales use pictures, icons, or other visuals to communicate with the
rater and represent a variety of data types.
5. Graphic scales are often used with children, whose more limited vocabulary prevents the
useof scales anchored with words
Diunduh dari:
http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales…………..
24/8/2012
Rank-Order Scales
Scales in which the respondent compares one item with another or a group
of items against each other and ranks them.
A Rank Order scale gives the respondent a set of items and asks them to put the items
in some form of order.
The measure of 'order' can include such as preference, importance, liking, effectiveness and
so on.
The order is often a simple ordinal structure (A is higher than B). It can also be done by
relative position (A scores 10 whilst B scores 6).
Example
Please write a letter next to the four evening activities below to show your preference. Use
A for your most preferred activity, B for the next preferred, then C for the next and then D
for the least preferred.
__ Staying in and watching television
__ Going bowling
__ Going out for a meal
__ Going to a bar with a friend
1.
2.
3.
4.
5.
6.
Discussion
Sorting of ordinal data can be done in several ways:
Priority sorting looks for the most important first, then the next most important and so
on.
Block sorting sorts items in to sub groups and then sorts the sub-groups (this is more
important, that is less important -- then sort the 'more important' group).
Score sorting gives an absolute score to each item.
Pairwise sorting compares pairs of items, moving the more important item higher or
giving it a higher score.
Q-Sorting is done by writing items on cards (Q-cards) and asking the subject to place
these in order.
Swap-sorting uses pairwise comparison on cards or Post-It Notes in a vertical column,
swapping each pair in turn until the whole column is in order.
Rank order items are analyzed using Spearman or Kendall correlation.
The Rank Order scale is also known as the Ranking scale.
Diunduh dari:
http://changingminds.org/explanations/research/measurement/rank_ordering.htm
………….. 23/8/2012
LIKERT SCALE
The Likert scale is the most frequently used variation of the summated rating
scale.
Summated rating scales consist of statements that express either a favorable or
anunfavorable attitude toward the object of interest.
1.
2.
3.
The participant is asked to agree or disagree with each statement.
Each response is given a numerical score to reflect its degree of attitudinal
favorableness,and the scores may be summed to measure the participant’s
overall attitude.
Summation is not necessary and in some instances may actually be
misleading.
The participant chooses one of five levels of agreement.
1.
2.
The numbers indicate the value to be assigned to each possible answer, with 1
the leastfavorable impression of Internet superiority and 5 the most favorable.
Likert scales also use 7 and 9 scale points.
The Likert scale has many advantages that account for its popularity.
1.
2.
3.
It is easy and quick to construct.
It is more reliable and provides more data than many other scales.
It produces interval data.
Originally, creating a Likert scale involved a procedure know as item analysis.
•
•
•
•
•
•
•
In the first step, a large number of statements were collected that met two criteria:
Each statement was relevant to the attitude being studied;
Each reflected a favorable or unfavorable position on that attitude.
People similar to those who are going to be studied were asked to read each
statementand to state the level of their agreement with it, using a 5-point scale.
A scale value of 1 indicated a strongly unfavorable attitude (strongly disagree). Theother
intensities were 2 (disagree), 3 (neither agree nor disagree), 4 (agree), and 5(strongly
agree), a strongly favorable attitude.
To ensure consistent results, the assigned numerical values are reversed if thestatement
is worded negatively (1 is always strongly unfavorable and 5 is alwaysstrongly favorable).
Each person’s responses are then added to secure a total score.
The next step is to array these total scores and select some portion representing
thehighest and lowest total scores (generally the top and bottom 10 to 25 percent).
The middle group (50 to 80 percent of participants) are excluded from the
subsequentanalysis.
Diunduh dari: http://www.scribd.com/doc/82071910/157/Constant-Sum-Scales …………..
24/8/2012
Using Angler Characteristics and Attitudinal Data to Identify
Environmental Preference Classes: A Latent-Class Model
EDWARD MOREY, JENNIFER THACHER, and WILLIAM BREFFLE
Environmental & Resource Economics (2006) 34: 91–115
A latent-class model of environmental preference groups is developed and
estimated with only the answers to a set of attitudinal questions.
Economists do not typically use this type of data in estimation. Group
membership is latent/unobserved. The intent is to identify and characterize
heterogeneity in the preferences for environmental amenities in terms of a
small number of preference groups. The application is to preferences over the
fishing characteristics of Green Bay. Anglers answered a number of attitudinal
questions, including the importance of boat fees, species catch rates, and fish
consumption advisories on site choice.
The results suggest that Green Bay anglers separate into a small number of
distinct classes with varying preferences and willingness to pay for a PCB-free
Green Bay.
The probability that an angler belongs to each class is estimated as function
of observable characteristics of the individual.
Estimation is with the expectation–maximization (E–M) algorithm, a technique
new to environmental economics that can be used to do maximum-likelihood
estimation with incomplete information.
As explained, a latent-class model estimated with attitudinal data can be
melded with a latent-class choice model.
Diunduh dari: http://www.colorado.edu/economics/morey/papers/MoreyThacherBreffle2006.pdf
………….. 25/8/2012
Relating Environmental Ethical Attitudes and Contingent Valuation Responses
Using Cluster Analysis, Latent Class Analysis, and the NEP: A Comparison
G. Aldrich, K. Grimsrud, J. THACHER, and M. Kotchen
September 1, 2005
Environmental ethics and attitudes may be an important source of
heterogeneity when considering the welfare effects and equity
implications of policy changes dealing with environment and natural
resources.
The New Ecological Paradigm (NEP) Scale is a set of 15 likert questions
and is intended to indicate whether an individual holds pro-environmental
or anti-environmental beliefs.
This paper provide an overview and comparison of three methodologies
that may be applied to NEP survey data to detect environmental ethics
groups: total NEP score, latent class analaysis, and cluster analysis
methods.
We find that while environmental attitudes do not significantly affect
average willingness to pay measures, there are significant differences in
willingness to pay across environmental attitude groups.
The willingness to pay estimates for each attitudinal group are consistent
across the different analystical measures.
Diunduh dari: http://www2.bren.ucsb.edu/~kolstad/events/OccWkshp/Aldrich.pdf …………..
25/8/2012
Environmental and Resource Economics 14: 95–117, 1999.
The Validity of Environmental Benefits Transfer: Further Empirical
Testing
ROY BROUWER and FRANK A. SPANINKS.
1
This paper provides further empirical evidence of the validity of environmental
benefits transfer based on CV studies by expanding the analysis to include control
factors which have not been accounted for in previous studies. These factors refer to
differences in respondent attitudes.
Questionnaires complying with Dillman’s (1978) ‘total design method’formail
surveys were sent to randomly selected households. Since management
agreements in peat meadow areas usually concentrate on the protection of meadow
birds and ditch-side vegetation, these elements received most attention in the
questionnaires. Except for some minor differences in wording, both studies used the
same valuation scenarios.
Traditional population characteristics were taken into account, but these variables do
not explain why respondents from the same socio-economic group may still hold
different beliefs, norms or values and hence have different attitudes and
consequently state different WTP amounts.
The test results are mixed. The function transfer approach is valid in one case, but is
rejected in the 3 other cases investigated in this paper. We provide further evidence
that in the case of statistically valid benefits transfer, the function approach results in
a more robust benefits transfer than the unit value approach.
We also show that the equality of coefficient estimates is a necessary, but insufficient
condition for valid benefit function transfer and discuss the implications for previous
and future validity testing.
Diunduh dari: http://www.fnu.zmaw.de/fileadmin/fnu-files/courses/ere4_val/erebouwerspaninks.pdf
Sekala LIKERT
DALAM KAJIAN LINGKUNGAN
Foto:smno.kampus.ub.febr2012