Penyelenggaraan Tes dan Pemberian Skor Tes

Download Report

Transcript Penyelenggaraan Tes dan Pemberian Skor Tes

Penyelenggaraan Tes dan Pemberian Skor Tes

• • • •

Tujuan

Mendeskripsikan tugas penguji sebelum dan setelah tes.

Memahami strategi peningkatan skor tes, apa yang dimaksud dengan “testwiseness” dan bagaimana melawannya.

Memahami prinsip dasar dan strategi pengetesan pada penggunaan khusus.

Memahami pertimbangan dalam pemberian skor : strategi meminimalkan kesalahan dalam tes esai, strategi pemberian skor tes objektif, pemberian bobot skor tes pilihan ganda, koreksi atas menebak, strategi pemberian skor tes lisan dan memberi bobot skor akhir.

• Tidak peduli seberapa hati-hati tes disusun, hasilnya tidak berharga kecuali jika diselenggarakan dan diberi skor dengan tepat.

• Buku Standard of Educational dan Psychological Testing (American Educational Research Association, American Psychological Association & National Council on Measurement in Education, 1999), kumpulan

264 standard penyusunan, evaluasi, pengelolaan dan pemberian skor dan instrument psikometrik lain serta menginterpretasi dan menggunakan hasilnya.

• Prosedur yang diikuti dalam menyelenggarakan tes atau instrument psikometri lain tergantung pada jenis intrumen (individu atau kelompok, dibatasi waktu atau tidak, kognitif atau afektif) serta usia kronologis, pendidikan, latar belakang budaya dan status fisik serta mental para peserta tes.

• Tidak hanya persiapan, testwiseness, dan motivasi peserta tes tetapi juga penampilan dan perilaku penguji serta perilaku penguji serta pengetesan dapat mempengaruhi kinerja tes.

Tugas Penguji sebelum tes

• • •

Penjadualan

Ketika membuat jadual tes, penguji harus mempertimbangkan kondisi peserta tes.

Misalnya, evaluasi hukum harus dilaksanakan sangat dekat dengan penampilan di pengadilan (court appearance) karena kemungkinan meningkatnya kegelisahan akan berpengaruh pada hasil. Tidak bijaksana untuk mengetes anak-anak sekolah selama jam makan siang, jam bermain, ketika aktifitas menyenangkan lainnya yang biasanya terjadi atau diantisipasi atau bahkan ketika peristiwa menyenangkan atau menggembirakan dilakukan (seperti segera setelah liburan).

• Berkenaan dengan tes di kelas, siswa harus diberitahu sebelumnya dengan jelas kapan dan di mana tes akan berlangsung, apa isi subjek yang dimasukkan, jenis tes apa (objektif, esai, lisan) yang akan diujikan dan berapa lama waktu yang diberikan.

• Jika guru merasa bahwa kuis pop membantu menyakinkan bahwa siswa menguasai materi pelajaran, kuis semacam itu seharusnya tidak memiliki bobot yang sama dengan ujian regular.

• Persetujuan yang diberikan Di banyak negara bagian, penyelenggaraan tes kecerdasan atau instrument psikodiagnostik lain kepada anak kecil membutuhkan persetujuan yang diberitahukan oleh orang tua, wali atau orang lain yang secara legal bertanggung jawab terhadap anak.

• Menjadi akrab dengan Tes Agar mendapatkan keakraban , direkomendasikan agar penguji tes mengikuti tes sebelum mengelola tes itu pada orang lain. Buklet tes, lembar jawab dan materi tes harus dicek dan dihitung sebelumnya.

• Ketika anak kecil atau orang dewasa dirujuk untuk melaksanakan ujian psikologi individual oleh agensi di luar atau orang lain, seperti dokter atau hakim pengadilan , tes dan prosedur psikodiagnostik lain akan tergantung pada jenis informasi yang diminta oleh sumber yang ditunjuk (referral) dan tujuan penggunaan informasi.

• Memastikan kondisi pengetesan Memuaskan Para penguji harus memastikan bahwa tempat duduk, pencahayaan, ventilasi, tingkat kegaduhan dan kondisi fisik lain di lingkungan tes harus memuaskan.

• Meminimalkan Menyontek Sebelum tes, pengaturan tempat duduk yang nyaman dan meminimalkan menyontek harus disusun. Meskipun lebih disukai, duduk dengan dipisahkan satu kursi bagi para peserta tes tidak selalu memungkinkan mereka menyontek menjadi sulit.

• Kemungkinan lain untuk menggunakan berbagai lembar jawab, yakni lembar jawab yang memiliki layout berbeda.

• Meminimalkan Berpura-pura baik atau Berpura-pura Buruk Pada konteks hukum dan ketenagakerjaan tertentu, para peserta tes berusaha mengubah respons tes. Misalnya, seseorang berpura-pura mengalami masalah memori dengan harapan mereka menerima kompensasi dalam kasus yang merugikan diri sendiri (personal injuri case). Sebaliknya , pelamar kerja akan membesar-besarkan kualitas diri positif untuk meningkatkan peluang dipekerjakan.

Tugas Penguji Selama Tes

• Mengikuti Petunjuk Tes Petunjuk tes yang dipersiapkan dengan saksama yang dibaca pelan dan jelas ketika disampaikan secara lisan, member informasi pada para peserta tes tujuan tes dan cara menunjukkan jawaban.

• Para penguji pada konteks klinis dan pendidikan kadangkala berada di luar petunjuk tes dan berusaha “ mengetes batas” kemampuan atau karakteristik pribadi peserta tes.

• Ini dilakukan dengan menggunakan prosedur dinamis atau otentik untuk memperoleh petunjuk tambahan dengan tujuan interpretasi atau diagnosis. • Ilustrasi pemeriksaan dinamis berupa pemeriksaan potensial pembelajaran (learning potential assessment) menurut Feuerstein. • Pemeriksaan potensi pembelajaran ini melibatkan format tes-mengajar-tes yang dengannya peserta dites, diberi latihan pada materi tes dan kemudian dites lagi.

• Senantiasa Siap Ketika menyelenggarakan tes kelompok, baik yang terstandardisasi ataupun yang tidak, penguji harus siap akan adanya tindakan menyontek dan juga berbicara dan suara gaduh tak perlu lainnya.

• Membangun Hubungan Pada tes individu maupun kelompok, perilaku penguji memiliki dampak signifikan pada motivasi dan perilaku peserta tes. Kadangkala, senyum ramah telah memberikan cukup dorongan pada peserta tes yang gelisah atau tidak cukup mempersiapkan diri sehingga mereka tetap tenang dan mengerjakan tes dengan optimal.

• Menyiapkan diri akan adanya Masalah Khusus Pada beberapa keadaan, para penguji perlu benar-benar aktif dan termotivasi. Tes pada subjek yang secara tradisional sulit seperti sains atau, terutama, matematika dapat menciptakan sejumlah ketegangan pada hamper semua orang dan kadang-kadang menjadi sangat gelisah.

• Penguji tidak hanya terbiasa dengan materi tes, tetapi juga harus selalu siap, fleksibel, hangat dan obyektif. Kualitas tersebut tidak mudah diajarkan tetapi pengalaman pada berbagai situasi tes memainkan peran penting dalam memperolehnya.

• Fleksibilitas Pada pengetesan dengan ukuran ini, kepekaan dan kesabaran penguji memberikan kesempatan yang lebih baik bagi individu cacat dan individu dengan problema khusus untuk menunjukkan kemampuannya.

• • Prosedur lain yang direkomendasi dan telah diadaptasi dari teknik instruksional terkenal sebagai berikut : Menyediakan banyak waktu bagi para peserta tes untuk merespons materi tes.

Memberikan latihan yang cukup pada item sampel.

• • • • • Menggunakan periode waktu tes yang relatif pendek.

Memperhatikan kelelahan dan kegelisahan serta mempertimbangkannya.

Menyadari dan membuat ketetapan mengenai kerusakan visual, pendengaran dan indera perceptual-motorik lain.

Menggunakan banyak dorongan dan penguatan positif.

Jangan memaksa para peserta tes merespon ketika mereka secara berulang-ulang menolak melakukannya.

Pengetesan Lisan

• • Siswa sering kali memandang ujian lisan dengan perasaan campur aduk dan ketakutan yang pantas dipertimbangkan.

Penguji yang membuat upaya khusus untuk membangun hubungan dengan para peserta tes mengungkapkan bahwa para peserta tes akhirnya bahkan menikmati tes lisan.

Mengikuti Tes • Pada umumnya , kuis pop tidak dianggap adil. Siswa pantas mendapat kesempatan untuk menyiapkan diri dalam menghadapi tes.

• Hasil studi di kelas menunjukkan bahwa mengumumkan di awal bahwa tes objektif akan diberikan cenderung menghasilkan skor lebih tinggi pada tes pilihan ganda, benar salah dan tes pengenalan lain.

• Kotak 3.1 merupakan 15 saran yang dapat meningkatkan testwiseness dan meningkatkan skor ketika dipraktikan sebelum dan selama tes.

Testwiseness

Kadangkala tes memilih jawaban benar pada item pilihan ganda tanpa harus membaca materi yang menjadi dasar pertanyaan. • Jawaban benar pada item pilihan-ganda juga dapat terungkap dengan bunyi awal (alliterative associations) sama, opsi nyata sekali tidak bertalian atau tidak relevan, bahasa sudah tercantum (inclusionary language), opsi kunci lebih tepat daripada opsi lain, kata penunjuk (determiners) khusus (“semua, tidak seorang pun, setiap orang”) dan pemberian yang dijawab pada item lain.

• Anak laki-laki tampak lebih testwise (bijaksana dalam tes) daripada anak perempuan dan item bahasa/verbal cenderung lebih peka dari pada item angka pada testwiseness.

• Mengubah Jawaban Hasil sejumlah investigasi menunjukkan ahwa para peserta tes cenderung mendapat skor tinggi ketika mereka mempertimbangkan kembali jawaban mereka dan mengubahnya setelah berpikir dua kali.

• Menebak Dapat dipahami, para peserta tes hanya sedikit menebak ketika mereka diberitahu bahwa hukuman karena menebak akan dikurangkan dari skor mereka, daripada ketika tidak ada petunjuk terkait dengan menebak atau ketika mereka diberitahu untuk menebak ketika ragu-ragu.

Tugas Penguji Setelah Tes

Setelah tes individu diselenggarakan, penguji mengumpulkan dan mengamankan semua materi tes. • Penguji harus menyakinkan orang yang memberi perhatian dan berjanji mengkomonikasikan hasil dan interpretasi tes kepada individu atau agensi yang tepat dan merekomendasikan tindakan selanjutnya.

• Dengan mengikuti administrasi tes kelompok, penguji harus mengumpulkan materi tes (buklet, lembar jawab, kertas corat-coret, pensil dan lain-lain). • Berkaitan dengan tes terstandardisasi, buklet tes dan lembar jawab harus dihitung dan dibandingkan dengan sebelum tes, serta semua materi lain yang dikumpulkan harus dicek untuk memastikan bahwa tak ada yang hilang. • Hanya setelah para peserta tes keluar atau siap dengan aktifitas berikutnya, lembar jawab disusun untuk pemberian skor.

• •

Pengetesan dan Penyesuaian Diri

Mengadaptasi isi tes dengan tingkat kemampuan peserta tes menghapuskan perlunya mengelola banyak item yang sangat mudah atau sangat sulit, oleh karena itu menghemat waktu dan tenaga.

Bank item atau kumpulan item untuk tes penyesuaian diri dapat dirakit dengan computer yang diprogram untuk mengikuti salah satu metodologi respons-item.

• Asumsi tertentu pada item response theory (IRT) yang harus dipenuhi dalam pengetesan penyesuaian diri , meliputi (1) seluruh item pada kumpulan item mengukur kecakapan atau dimensi pencapaian tunggal dan (2) item berdiri sendiri yaitu respons seseorang pada satu item tidak bergantung pada respons item lain.

• Tidak seperti prosedur pengetesan tradisional, pada tes penyesuaian diri para peserta tes biasanya tidak diperbolehkan melompati item atau meninjau ulang atau mengubah respons mereka.

• Keamanan tes lebih mudah dijaga dalam kasus tes penyesuaian diri dengan dibantu komputer (computer-assisted adaptive test).

• Pada tes yang dibuat guru yang terdiri dari berbagai bagian berkaitan dengan isi berbeda atau jenis item berbeda, guru berharap memperoleh skor terpisah pada berbagai bagian dan skor composite pada tes secara keseluruhan.

Pemberian Skor Tes Esai

Pertanyaan esai lebih efektif ketika tugas disusun dengan jelas sehingga interpretasi pertanyaan dari orang ke orang tidak bervariasi.

• Pemberian skor berbasis keahlian menulis bukan kualitas jawaban, menjadi sangat umum (leniency error) dan member skor tinggi pada jawaban hanya karena peserta tes mendapat skor tinggi pada item lain (halo effect) merupakan kesalahan yang dapat mempengaruhi skor pada item esai.

• Penentu skor harus memutuskan apakah memberikan skor pada pertanyaan secara keseluruhan atau memberikan bobot terpisah pada komponen terpisah.

• Ketika penunjuk tes menentukan agar jawaban yang diberikan sepanjang setengah halaman, item itu harus diberi bobot lebih rendah daripada ketika jawaban satu halaman penuh ditentukan.

• Kapan pun bobot skor ditentukan pada pertanyaan dan jawaban tertentu, disarankan pada perancang tes menyiapkan jawaban ideal atas pertanyaan itu sebelumnya.

• Nama para peserta tes diblok sebelum meneliti lembar jawaban tes sehingga dapat diberi skor tanpa melihat namanya.

Rekomendasi lain : • • • • • Beri skor semua jawaban pada satu pertanyaan sebelum melanjutkan ke pertanyaan berikutnya.

Beri skor semua jawaban pada pertanyaan khusus selama periode waktu pemberian skor sama.

Jika gaya (mekanis, kualitas tulisan) dan isi diberi skor, evaluasi keduanya secara terpisah.

Ada orang kedua yang member skor juga pada setiap kertas dan buatlah skor juga pada setiap kertas dan buatlah skor akhir rata-rata yang diberikan oleh dua pemberi skor tersebut.

Tulislah komentar di dekat respons peserta tes dan tandai koreksi pada lembar jawab tes.

• Koreksi dan komentar yang ditulis di lembar jawab merupakan suplemen sangat berharga pada anka poin atau nilai yang diberikan. • Siswa akan belajar sesuatu jika respons tes dikoreksi dan diberi komentar, bukan hanya diberi nilai.

• •

Pemberian Skor pada Tes Obyektif

Keunggulan unik tes objektif adalah efisiensi dan akurasi dalam pemberian skor.

Pemberian skor tes esai lazimnya menghabiskan banyak waktu membaca jawaban dan mengevaluasi koreksi mereka, namun petugas administrasi dapat member skor dengan cepat dan akurat.

Mesin Pemberi Skor • Meskipun mayoritas lembar jawab untuk tes yang didistribusikan secara komersial dapat diberi skor dengan tangan ataupun dengan mesin, tetapi lembar jawab yang didistribusikan oleh organisasi khusus hanya dapat diberi skor dengan mesin.

• Komputer tidak dibutuhkan oleh pemberi skor yang cepat dan efisien tetapi komputer memberikan fleksibilitas dan analisis statistik lebih lanjut, interpretasi dan penyimpanan skor tes dan data personal lain.

• Jumlah pemrograman yang diperlukan untuk menggunakan cukup sederhana dandesktop optical scanner meliputi cakupan fitur yang luas seperti menghitung bobot item, member skor bagian tes, menganalisis dan merosotkan (flagging) item; serta cetakan berbagai jenis data, statistik dan grafik.

Kesalahan Pemberian Skor Karena Manusia

• Dibandingkan dengan pemberian skor tulis tangan, angka kesalahan pemberian skor komputer jumlahnya kecil.

• Dengan mempertimbangkan kenyataan bahwa petunjuk pemberian skor pada tes kecerdasan dan kepribadian individual tidak selalu jelas dan objektif maka tidak mengherankan jika kadangkala skor berbeda diberikan pada respons yang sama.

• Variabilitas skor barangkali lebih tinggi karena pemberi skor kurang berpengalaman, namun pemberi skor sangat berpengalaman pun membuat kesalahan juga. • Studi lain menemukan bahwa pemberian skor dipengaruhi oleh rasa suka penguji atau pemberi skor pada peserta tes. Persepsi peserta tes sebagai orang yang hangat atau cerdas atau bodoh juga mempengaruhi pemberian skor pada tes individual.

Item Pemeringkatan Pemberian Skor

• Seperti pada item pilihan-ganda dan benar salah, maka jawaban-pendek dan pencocokan dapat diberi skor dengan memberikan 1 poin atas respons benar dan 0 poin atas respons salah atau penghilangan.

• Dengan berdasarkan pada tabel diperoleh c = 5, d = 10 dan j = 1 sehingga dengan berdasarkan pada rumus (3.1.a) diperoleh 5[1 – 2(10)/(5 2 -1)] = 1 Sedangkan bila digunakan rumus (3.1.b) diperoleh 5[1 – 3(28)/(5(5 2 -1))] = 1,5 = 2.

Hasil tersebut berbeda. Kedua rumus memuaskan, namun tergantung pada pemberi skor apakah memilih untuk memberikan hukuman tambahan pada respons yang sangat berbeda dari skor yang sudah dibuat kuncinya.

• Pada peristiwa apa pun, tidak ada metode tunggal dalam pemberian skor item tes yang paling baik dalam segala hal : ini tergantung pada filosofi dan tujuan evaluator.

Koreksi karena menebak

Setelah skor mentah total pada tes objektif ditentukan , pertanyaan muncul mengenai apakah skor merupakan indikator akurat peserta tes mengenai pengetahuan bidang sesungguhnya atau apakah skor tersebut telah ditingkatkan karena menebak dengan benar. • Menebak jawaban pada banyak item memiliki dampak yang lebih serius pada skor tes benar salah daripada skor tes pilihan-ganda.

• Mengoreksi sebagai dampak menebak pada tes terstandardisasi tertentu perlu mengurangi porsi jumlah salah dari jumlah jawaban benar.

Skor konversi

Mengubah skor mentah tes objektif dengan pembobotan item diferensial atau dengan rumus koreksi karena menebak biasanya tidak bermanfaat, namun skor sering diubah dengan cara berkebalikan untuk membuat skor tersebut lebih bermakna.

Deteksi dan Pemberian Skor Karena Menyontek

Seperti didokumentasikan pada berbagai sumber (Cizak, 1999), menyontek selama tes terjadi di sepanjang tingkat sekolah, perguruan tinggi dan sekolah professional.

• • Hal ini terjadi di semua negara, baik laki-laki maupun perempuan dan semua kelompok etnik.

Siswa yang menyontek sering menemukan atau menciptakan cara yang banyak akal tetapi tidak layak untuk dilakukan.

• Metode untuk menghalangi menyontek, seperti pengaturan khusus tempat duduk selama tes, bentuk tes atau lembar jawab alternative dengan menggunakan jumlah proktor keliling yang cukup selama ujian, dan menjaga pertanyaan tes tetap aman baik sebelum dan sesudah tes cukup efektif dalam mengurangi menyontek.

• Prosedur statistik khusus kadangkala diterapkan di tes objektif di kelas dan strategi berbasis komputer untuk menjiplak (mengkopi) telah digunakan dalam mendeteksi menyontek.

• Pemberian Skor Tes Lisan Meskipun kesalahan sering kali terjadi dalam memberikan skor pada respons pertanyaan lisan daripada tertulis, bentuk khusus dalam membuat peringkat kinerja dapat meningkatkan objektivitas pemberian skor tes lisan.

Formulir untuk Mengevaluasi Laporan Lisan

• • •

Evaluasi dan Pemberian Urutan Skor

Setelah tes diselenggarakan dan diberi skor, skor tersebut harus dievaluasi dengan beberapa cara. Pada beberapa kasus tes pencapaian pretasi yang dibuat oleh guru, evaluasi skor biasanya menyiratkan pemberian huruf pengurut atau penanda. Pemberian urutan merupakan proses yang cukup subjektif, tidak hanya bergantung pada tes itu sendiri, tetapi juga pada ekspektasi evaluator dan skor yang diperoleh siswa lain.

• Mayoritas guru menggunakan kombinasi kurva dan pengurutan standard tetap. Pada prosedur pengurutan kombinasi kurva dan pengurutan standard tetap. • Pada prosedur pengurutan berdasarkan kurva, Metode Cajori, A ditetapkan pada peringkat 7 % teratas pada tes dengan menggunakan kertas , B 24 % berikutnya, C 38 % berikutnya, D 24 % berikutnya dan F pada peringkat 7 % paling rendah. • Skor pengurutan tradisional, yang mana A dianggap paling baik atau unggul, B di atas rata-rata atau bagus, C rata-rata, D di bawah rata-rata atau buruk dan F gagal merupakan jenis skor atau evaluasi kinerja.

• Hukuman karena menerima evaluasi negatif terdiri dari pekerjaan remidi, penurunan pangkat, pengasingan atau bahkan pemecatan. • Penghargaan untuk evaluasi bagus meliputi hadiah, perlakuan khusus dan promosi.