การวัดและประเมินผลการเรียน

Download Report

Transcript การวัดและประเมินผลการเรียน

การประเมินผลการศึกษาในชัน้ เรี ยน
ดร.สงบ ลักษณะ
Ph.D. in Measurement & Statistics
University of Iowa
[email protected]
ไทยได้ คะแนนต่ากว่ า Mean OECD จากการวัดและประเมินผล
Reading, Mathematics and Science ในปี 2012

PISA (Programme for International Student
Assessment) เป็ นโครงการประเมินผลนักเรี ยนนานาชาติ
ที่วดั ความรู ้และทักษะของนักเรี ยนอายุ 15 ปี ในด้านการอ่าน
คณิ ตศาสตร์ และวิทยาศาสตร์
 PISA มีการประเมินต่อเนื่ องทุกๆ 3 ปี แต่ละครั้งประเมิน
ครอบคลุมทั้งสามด้านแต่ให้น้ าหนักด้านใดด้านหนึ่งเป็ นหลัก
และอีกสองวิชาเป็ นวิชารอง
 PISA 2012 เน้นคณิ ตศาสตร์ PISA 2015 เน้นวิทยาศาสตร์
และ PISA 2018 เน้นการอ่าน
จุดเน้ นของการสนทนา
1.
2.
3.
4.
อะไรเกีย่ วข้ องกับคุณภาพของการเรียนการสอน?
ทาไมจึงต้ องให้ ความสาคัญกับการวัดและประเมินผล
การเรียนการสอน?
อะไรคือข้ อบกพร่ องสาคัญของการวัดและประเมินผล
การเรียนการสอน?
มีวธิ ีเพิม่ คุณภาพของการวัดและประเมินผลการเรียน
การสอนได้ อย่ างไร?
แนวความคิดเบือ้ งต้ น
การวัดผล (Measurement) การแสดงปริมาณของสิ่ งทีว่ ดั ได้
 การประเมินผล (Evaluation) การตัดสิ นความเหมาะสมดีงาม
ของสิ่ งทีไ่ ด้ จากการวัดผล
 การวัดและประเมินผล (Assessment) กระบวนการทีร่ วมทั้ง
การวัดผลและประเมินผล การหาข้ อมูลเพือ่ ตัดสิ นใจในระดับ
ของการเกิดขึน้ และระดับของความเหมาะสม
 เครื่องมือวัดและประเมินผล เช่น แบบทดสอบ (Test), แบบสังเกต,
แบบสัมภาษณ์, แบบประเมินตนเองโดยตอบแบบสอบถาม,
แบบประเมินโดยผูอ้ ื่น

ระบบคุณภาพการเรียนการสอน
เนือ้ หาสาระและวัตถุประสงค์ การเรียนรู้ จากหลักสู ตร
กิจกรรมกระบวนการเรียนการสอน
การวัดและประเมินผลระหว่ างการเรียนสอน (Formative Assessment)
การวัดและประเมินผลการเรียน (Summative Assessment)
การวัดและประเมินผลการเรียนรู้ของผู้เรี ยน
คุณลักษณะทีต่ ้ องการวัดและประเมิน
Knowledge
เครื่ องมือ
Intellectual abilities
Stimulus
(Test)
Skills
Attitudes
Student Response
(speak, write, do)
Values
Interpret
Inference to characteristics
ความสาคัญของการวัดและประเมินผล
การวัดและประเมินผลเป็ นองค์ ประกอบสาคัญของการควบคุม
มาตรฐานคุณภาพของการจัดการศึกษา
 การวัดและประเมินผลเป็ นกลไกการติดตามผลการเรี ยนรู้ รายบุคคล
เพือ่ การช่ วยเหลือให้ ปรับปรุงการเรียนรู้ไปสู่ ความสาเร็จตาม
มาตรฐานคุณภาพทีม่ ุ่งหวัง
 การวัดและประเมินผลช่ วยให้ ข้อมูลชี้นาการปรั บปรุ งหลักสู ตร
การเรียนการสอนตามมาตรฐานคุณภาพทีป่ รารถนา
 การวัดและประเมินผลช่ วยเป็ นหลักฐานตัดสิ นการวิจัยพัฒนา

จุดอ่ อนของการวัดและประเมินผลที่มักเกิดขึน้













วัดความรู้ผวิ เผิน เน้นความรู้ความจาตามเนื้อหาวิชา เช่น วัด ability to know, not ability to do
ไม่สามารถวัดความสามารถระดับสูง เช่น ความเข้าใจ, การนาไปใช้, การวิเคราะห์, การสังเคระห์,
การแก้ปัญหา เป็ นต้น
วัดความสามารถด้านต่าง ๆ ไม่ครบถ้วน และไม่เต็มมาตรฐานของหลักสูตร
มักวัดผลลัพธ์สุดท้ายโดยละเลยการวัดกระบวนการปฏิบตั ิ
มักละเลยการวัดความรู้ความคิดที่แตกต่างหลากหลาย divergent thinking
วัดความสามารถในเชิงแยกส่วนมากกว่าการวัดการบูรณาการของความรู้
มักวัดความรู้ตามตารามากกว่าการวัดการใช้ความรู้ในสถานการณ์ชีวิตจริ ง
ใช้เครื่ องมือที่ดอ้ ยคุณภาพ ไม่สามารถวัดได้ถูกต้องตรงความเป็ นจริ ง, ผูไ้ ม่มีความสามารถก็ได้คะแนนสูงได้
ตัดสิ นการให้คะแนนโดยใช้ความเห็นของตนเองมากกว่าเหตุผลเชิงปรนัย
การมอบหมายงานการศึกษาค้นคว้าหรื อให้ผเู้ รี ยนปฏิบตั ิในสิ่ งที่ไม่ตรงกับผลการเรี ยนรู้ที่คาดหวัง
ตัดสิ นผลการเรี ยนให้เกรดจากการวัดและประเมินผลที่จากัด ไม่มีผลการวัดและประเมินผลจากวิธีการ
หลายอย่าง Triangulation
การตัดสิ นผลการเรี ยนไม่ตรงกับสภาพความเป็ นจริ งของผูเ้ รี ยนและไม่สอดคล้องกับมาตรฐานคุณภาพ
การวัดและประเมินผลไม่สามารถจาแนกคนเก่ง คนดี ออกจากคนไม่เก่ง คนไม่ดี หรื อ ไม่สามารถชี้คนที่
ไม่เก่ง คนที่ไม่ดี
คุณภาพของการวัดและประเมินผลที่พงึ ปรารถนา







ออกแบบเครื่ องมือการวัดให้ตรงและครบถ้วนในมาตรฐานความรู้ความาสามารถของวิชา
นั้น ๆ หรื อ วัดได้ตรงและครบถ้วนตามมาตรฐานความรู ้ความสามารถและจุดประสงค์
การเรี ยนรู้ในหลักสู ตรวิชานั้น
ออกแบบเครื่ องมือจากการวัดความสามารถระดับพื้นฐานไปสู่ความสามารถระดับสู ง
เช่น ความรู้ ความเข้าใจ การนาไปใช้ การวิเคราะห์ การสังเคราะห์ และการแก้ปัญหา
พิถีพิถนั ออกแบบเครื่ องมือการวัดให้มีคุณภาพ ด้านความตรง และความเป็ นปรนัย
ออกแบบเครื่ องมือให้สามารถวัดความรู้ความสามารถในสถานการณ์จริ ง
ออกแบบให้มีเครื่ องมือการวัดที่หลากหลายตามลักษณะTriangulation
ใช้ขอ้ มูลที่กว้างขวางและแม่นตรงต่อความรู ้ความสามารถที่แท้จริ งของผูเ้ รี ยน เพื่อการ
ตัดสิ นผลการเรี ยน (Grade)
ใช้ผลการวัดและประเมินผลเพื่อการพัฒนาผูเ้ รี ยน และพัฒนามาตรฐานหลักสูตรการเรี ยน
การสอน
กระบวนการสร้ างเครื่องมือวัดและประเมินผล





วิเคราะห์หลักสูตรเพื่อกาหนดขอบเขตของความรู้ความสามารถที่เป็ นผลการเรี ยนรู้
ที่คาดหวัง
วางแผนวัดจุดประสงค์การเรี ยนรู ้ดว้ ยเครื่ องมือและวิธีการต่าง ๆ เช่น
1. วัดความรู้ความเข้าใจพื้นฐาน โดย แบบทดสอบแบบเลือกตอบ
2. วัดความสามารถในการนาความรู้ไปใช้ การวิเคราะห์ สังเคราะห์ โดย แบบทดสอบ
แบบเขียนตอบ
3. วัดความสามารถในการนาความรู ้ไปใช้ การวิเคราะห์ แก้ปัญหา โดย การวัดเชิง
ปฏิบตั ิจริ ง เช่น การทดลองในห้องปฏิบตั ิการณ์ การทาโครงงาน
ให้น้ าหนักกับการวัดแลประเมินผลแบบต่าง ๆ
ดาเนินการวัดและเก็บข้อมูลด้วยวิธีที่เที่ยงตรงเป็ นปรนัย
ประมวลผลการวิเคราะห์ขอ้ มูลตัดสิ นผลการเรี ยนแบบอิงเกณฑ์มาตรฐาน
Taxonomy of Cognitive Abilities
ระดับความสามารถทางความรู้ความคิด
Level 1.00 Knowledge ความสามารถด้านความรู้
Level 2.00 Comprehension ความสามารถด้านความเข้าใจ
Level 3.00 Application ความสามารถด้านการนาไปใช้
Level 4.00 Analysis ความสามารถด้านการวิเคราะห์
Level 5.00 Synthesis ความสามารถในการสังเคราะห์
Level 6.00 Evaluation ความสามารถด้านการประเมินค่า
แบบทดสอบ (Test)
1. แบบทดสอบข้อเขียน Paper and Pencil Test
* Multiple-Choice Test
* Short Answer Test
* Essay Test
2. แบบทดสอบโดยการพูดตอบ Oral Test
3. แบบทดสอบภาคปฏิบตั ิหรื อการวัดที่แท้จริ ง Performance Authentic Test
* Process Test
* Product Test
คาถามด้ านความรู้ :
The ability to recall, recognize, remember, the specific facts, concepts,
terminology, principles, theories, methodology, criteria, categories,
trends, conventions, etc.
 มีวิธีการอย่างไรที่ใช้ในการทดสอบสมมติฐานการวิจยั
 ความหมายของการตลาดเชิงรุ กคืออะไร
 จงอธิ บายจุดเน้นของ “นโยบาย”, “วิสยั ทัศน์” , “พันธกิจ”
 จงระบุตวั ชี้วดั การเจริ ญเติบโตทางเศรษฐกิจ
 อะไรคือหลักการสาคัญของทฤษฎี Thermodynamic Physics
 จงอธิ บายกระบวนการชะลอการเติบโตของมะเร็ งระยะที่ 1
คาถามด้ านความเข้ าใจ : แปลความ ตีความ ขยายความ







จงอธิ บายความแตกต่างระหว่าง CEO, Manager, Administrator
อะไรคือสาระสาคัญของ พ.ร.บ.นิรโทษกรรมที่เสนอโดยพรรคการเมืองหนึ่ ง
จงยกตัวอย่างของพฤติกรรมที่แสดงถึง “ความเป็ นผูน้ า”
จากคาอภิปรายของผูน้ าฝ่ ายค้านในรัฐสภา แสดงถึงข้อบกพร่ องอะไรของ
รัฐบาล
จากอาการของคนไข้ มีความใกล้เคียงกับอาการของการเจ็บป่ วยประเภทใด
จากตัวเลขการขายข้าวของรัฐบาลในระบบ G to G ใน ปี ที่ผา่ นมา อะไรคือ
แนวโน้มของการส่ งออกข้าวในไตรมาสที่สามของปี นี้
Global Warming มาจากสาเหตุใด
คาถามด้ านการนาไปใช้







ความสามารถในการประยุกต์ความรู ้ในสถานการณ์ใหม่
เน้นการถามถึงการนาความรู ้ไปใช้ ถามให้นาวิธีการที่เรี ยนรู ้ไปใช้
แก้ปัญหา ถามให้จาแนก จัดลาดับ ให้สาธิต
จงใช้โปรแกรมทางสถิติในคอมพิวเตอร์วิเคราะห์ขอ้ มูล เสนอผล และ
แปลผลการวิเคระห์
จากทฤษฎี Personality จงระบุคุณลักษณะทางบุคลิกภาพที่ควรนามา
เป็ นเกณฑ์ในการคัดเลือกผูบ้ ริ หารหน่วยงาน
ควรใช้หลักการอะไรจากความรู ้ทางศาสนาอิสลามเพื่อนาไปใช้แก้ปัญหา
ความรุ นแรงในจังหวัดชายแดนภาคใต้
คนที่มีขอ้ บกพร่ องทางกระดูกควรมีรายการอาหารประจาวันอย่างไร
ควรรณรงค์แก้ปัญหา Global Warming อย่างไร
คาถามด้ านการวิเคราะห์







ความสามารถในการจาแนกแยกแยะส่ วนรวมออกเป็ นส่ วนย่อย สามารถ
มองเห็นความสัมพันธ์ของส่ วนย่อย ๆ
เป็ นการถามให้ระบุจุดประเด็นสาคัญ ให้วิจารณ์ ให้หาความสัมพันธ์
จงเปรี ยบเทียบความเปลี่ยนแปลงที่มีความสาคัญต่อสิ ทธิ มนุษยชนของ
นโยบายการปกครองในยุโรปสมัยกลาง และสมัยปัจจุบนั
อะไรเป็ นปัจจัยสาคัญที่ทาให้การจัดการศึกษาในสิ งคโปร์มีความเป็ นเลิศ
จงระบุความได้เปรี ยบและเสี ยเปรี ยบเมื่อไทยเข้าสู่ ประชาคมอาเซี ยน
ในปี 2558
เมื่อกาหนดสถานการณ์ให้ จงระบุสิ่งที่เป็ นปั ญหา สิ่ งที่เป็ นสาเหตุของปัญหา
สิ่ งที่ควรเป็ นจุดหมายของการแก้ปัญหา
เมื่อได้ฟังการนาเสนอผลงานวิจยั ผูฟ้ ังสามารถวิจารณ์จุดเด่น และจุดด้อย
ของผลงานได้
คาถามด้ านการสังเคราะห์




ความสามารถในการออกแบบ ริ เริ่ ม สร้างสรรค์ พัฒนา ผลิตวางแผน กาหนด
แนวทางใหม่ ๆ
เมื่อกาหนดสถานการณ์การตกต่าทางเศรษฐกิจให้สามารถระบุปัญหา สาเหตุ
ของปั ญหา จุดหมาย ผลกระทบของปั ญหา เป้ าหมายของการแก้ปัญหา
แนวทางการแก้ ดาเนินการเพื่อแก้ปัญหา ตัวชี้วดั ของความสาเร็ จของการ
แก้ปัญหา
จากข้อมูลแหล่งต่าง ๆ ผูเ้ รี ยนสามารถประมวลผลเป็ นความรู ้ ความคิดใหม่ ๆ ได้
เมื่อกาหนดความต้องการของลูกค้าด้านที่อยูอ่ าศัย ผูเ้ รี ยนสามารถออกแบบบ้าน
และ ส่ วนประกอบภายในบ้านให้สนองความต้องการของลูกค้าได้
คาถามด้ านการประเมินค่ า :
ใช้ เกณฑ์ มาตรฐานในการตัดสิน
ถามให้ตดั สิ นระดับคุณค่าของงานศิลปะ
 ถามให้คดั เลือกสิ่ งที่นาเสนอที่เหมาะสมตามเกณฑ์คุณภาพ
 ถามให้วิจารณ์คุณภาพของสิ่ งต่าง ๆ ที่นาเสนอ
 ถามให้ตดั สิ นแผนดาเนิ นงานที่มีประสิ ทธิ ผลและประสิ ทธิ ภาพตาม
วัตถุประสงค์ที่กาหนด
 เมื่อผูเ้ รี ยนไปศึกษาดูงานแล้วจงรายงานสิ่ งที่น่าพึงพอใจและสิ่ งที่
น่าจะมีการปรับปรุ งแก้ไขตามเกณฑ์คุณภาพ
 ให้กาหนดเกณฑ์และวิธีการในการคัดเลือกโครงงานดีเด่นเพื่อรับ
รางวัล

การวัดแนวใหม่ : การวัดที่แท้ จริง
(Authentic Assessment)
วัดจากกระบวนการปฏิบตั ิจริ ง วัดจากผลงานการปฏิบตั ิจริ ง
 วัดความสามารถตั้งแต่การนาไปใช้ วิเคราะห์ สังเคราะห์และ
ประเมินค่า
 ให้คะแนนกระบวนการปฏิบตั ิและผลงานการปฏิบตั ิ
 จัดทาเกณฑ์การให้คะแนน (Scoring Rubric) เพื่อรักษาความเป็ น
ปรนัยของการวัดและประเมินผล

รูปแบบของการวัด








Written Test
Identification Test
Structured Performance Test
Unstructured Performance Test
Simulation Test
Work Sample Test
Extended Research Project
Portfolio Assessment
ตัวอย่ างการวัดที่แท้ จริง
ผูเ้ รี ยนแสดงกระบวนการคิดคานวณแก้ปัญหาคณิ ตศาสตร์
 ผูเ้ รี ยนปฏิบตั ิการทดลองทางวิทยาศาสตร์ บันทึกผลการทดลองและ
รายงานผลการทดลอง
 ผูเ้ รี ยนเขียนจดหมายเพื่อสมัครงาน, เขียนจดหมายตอบโต้ขอ้ เขียน
ในหนังสื อพิมพ์, เขียนบทความทางธุรกิจ
 ผูเ้ รี ยนออกแบบเขียน Script ของบทละครเวที
 ผูเ้ รี ยนออกแบบการพิมพ์ที่สอดคล้องกับจุดมุ่งหมาย

ตัวอย่ างการวัดที่แท้ จริง (ต่ อ)
การสาธิต เช่น การปฐมพยาบาล, การประกอบอาหาร, การพูด
เป็ นพิธีกรในมหกรรมทางธุรกิจ, การจอดรถในสถานการณ์
ที่จากัด
 การทาโครงงานทางการพิมพ์, โครงงานจัดเลี้ยงอาหาร, โครงงาน
อาหารสาหรับผูฟ้ ้ื นจากการเจ็บป่ วย, โครงงานนิทรรศการ
ศิลปะการแสดงร่ วมสมัย, โครงงานประชาสัมพันธ์กิจกรรม
หนึ่งตาบลหนึ่งผลิตภัณฑ์ เป็ นภาษาอังกฤษ

ตัวอย่ างการวัดและประเมินกระบวนการปฏิบัติ
Students are required to use the microscope for bioculturing.
The score is 1 if the performance is observed, and 0 if not
--- Wipes slide with lens paper
--- Places one drop or two of culture on slide
--- Adds few drops of water
--- Places slide on stage
--- Turns to low power
--- Looks through eyepiece with one eye
--- Adjusts mirror
--- Turns to high power
--- Adjusts for maximum enlargement and resolution
Scoring Rubric ของการเขียน
คะแนนระดับดี : ข้อเขียนชัดเจน แสดงประเด็นสาคัญ อธิบายชัดเจน
มีเหตุผลหลักการหรื อหลักฐานอ้างอิงประกอบ การนาเสนอมีการ
เชื่อมโยงความสัมพันธ์ของเรื่ องได้ดี
คะแนนระดับพอใช้ : ข้อเขียนชัดเจน แสดงประเด็นสาคัญ แต่การ
อธิบายไม่ชดั ขาดเหตุผลหลักการหรื อหลักฐานประกอบที่เหมาะสม
การเชื่อมโยงไม่ดี
คะแนนระดับต่า: ข้อเขียนไม่ตรง กล่าวประเด็นต่าง ๆ สับสน
ขาดเหตุผลหลักการหรื อหลักฐานประกอบ การเชื่อมโยงไม่ดี
เกณฑ์ การให้ คะแนนการปฏิบัตติ รวจสอบแก้ ไขเครื่องพิมพ์
แสดงวิธีการและใช้เครื องมือตรวจสอบส่ วนประกอบต่าง ๆ ของ
เครื่ องพิมพ์เป็ นขั้นตอนครบถ้วน
 ระบุสิ่งที่ขดั ข้องใช้การไม่ได้
 แก้ไขข้อบกพร่ องหรื อหาชิ้นส่ วนมาเปลี่ยนได้เหมาะสม
 ปฏิบตั ิในการถอดชิ้นส่ วนเดิมออก ใส่ ชิ้นส่ วนใหม่แทนที่ ถูกต้อง
เหมาะสม
 ระมัดระวังรักษาความปลอดภัยในระหว่างการปฏิบตั ิงาน
 จัดเก็บอุปกรณ์เครื่ องมือบารุ งรักษา ดูแลความสะอาดถูกต้อง

วัดและประเมินผลโครงงาน
รายการวัดและประเมิน
1. ระบุปัญหา สาเหตุ ผลกระทบ ชัดเจน
2. กาหนดวัตถุประสงค์ เป้ าหมายของการแก้ปัญหาเหมาะสม
3. วิเคราะห์ทางเลือกที่นาไปสู่ การบรรลุวตั ถุประสงค์ของการ
แก้ปัญหา
4. เลือกแนวทางแก้ปัญหา วางแผนกระบวนการดาเนินการได้ดี
5. ดาเนินการตามแผนได้ครบถ้วน ใช้วธิ ีการที่แม่นตรงในการ
เก็บรวบรวมข้อมูล
6. วิเคราะห์ขอ้ มูล นาเสนอรายงานผลได้ชดั เจนครบถ้วน
1 2 3 4 5
การตัดสินผลการเรี ยนโดยใช้ คะแนนจากหลายแหล่ ง
Course Evaluation
Assessment
Full
Score
Weight
John Adjusted Score
= Score × {weight/100}
Quiz 1
50
10
John
Score
50
Quiz 2
50
10
50
10
Midterm Test
100
20
100
20
Project
Report
Final Exam
100
20
80
16
100
40
70
28
400
100
Total
350(87.5
%)
10
84 (B+)
Grade Standard


Student’s final grade should reflect student’s true ability responding to
expected learning outcome.
Student grade is determined by comparing his/her performance to the
standard – the percent of points earned. For example:
A
A-B+
B
B-C+
C
C-D
F
=
=
=
=
=
=
=
=
=
=
90-100
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
00-49
.
ขอบคุณครับ
Have A Nice Day