ความยากของข้อสอบ

Download Report

Transcript ความยากของข้อสอบ

การตรวจสอบคุณภาพเครื่องมือ
คุณภาพของแบบทดสอบ
ในการใช้ เครื่องมือวัดผลนั้น จาเป็ นที่จะต้ องมีการตรวจสอบคุณภาพ
เครื่องมือเสียก่อน เพื่อให้ แน่ใจว่าเครื่องมือที่ใช้ มคี ณ
ุ ภาพเพียงพอที่
สามารถเก็บรวบรวมข้ อมูลได้ ตรงตามความต้ องการของผู้สอน และข้ อมูลที่
เก็บได้ มคี วามน่าเชื่อถือ กรณีเป็ นแบบทดสอบ มีคุณภาพที่ต้องพิจารณาคือ
คุณภาพรายข้ อ หรือเรียกว่า “การวิเคราะห์ข้อสอบ” เป็ นเทคนิคในการ
ปรับปรุงคุณภาพของข้ อสอบให้ ดีข้ นึ โดยทัว่ ไปมีจุดประสงค์ในการปรับปรุง
เกี่ยวกับ 1) ความกากวมของภาษาในข้ อสอบ 2) การเฉลยผิด 3) ความ
ยากและง่ายเกินไปของข้ อสอบ 4) ข้ อที่ไม่สามารถจาแนกความสามารถของ
กลุ่มผู้สอบให้ เห็นได้ ชัดเจน และ 5) ช่วยปรับปรุงเทคนิคการสอนหรือการ
จัดกิจกรรมการเรียนรู้ของผู้สอน ช่วยค้ นพบข้ อบกพร่องต่าง ๆ ของผู้เรียน
โดยพิจารณาว่ายังอ่อนในเนื้อหาใด
การวิเคราะห์ขอ้ สอบ
การวิเคราะห์ขอ้ สอบ ประกอบด้วย
1. การวิเคราะห์ความยากของข้อสอบ
(Difficulty Analysis)
2. การวิเคราะห์อานาจจาแนกของข้อสอบ
(Discriminant Analysis)
การวิเคราะห์ความยาก
ความยากของข้อสอบ คือ เปอร์เซ็นต์ของจานวนผูส้ อบที่
สามารถทาข้อสอบข้อนั้นได้ถูกต้อง ถ้าข้อสอบข้อใดมีเปอร์เซ็นต์
ของจานวนผูต้ อบข้อสอบถูกมาก แสดงว่าข้อสอบข้อนั้นง่าย ถ้า
ข้อสอบข้อใดมีเปอร์เซ็นต์ของจานวนผูต้ อบข้อสอบถูกน้อย
แสดงว่าข้อสอบข้อนั้นยาก
สาหรับการคานวณหาความยากนั้นสามารถทาได้โดยการ
นาจานวนของผูส้ อบทีต่ อบข้อสอบข้อนั้นถูกมาหารด้วยจานวนผู ้
เข้าสอบทั้งหมด ผลการคานวณทีไ่ ด้จะใช้สญ
ั ลักษณ์ว่า p และจะ
เรียกสัญลักษณ์ p นี้ ว่า ความยากของข้อสอบ
ข้อสอบข้อใดที่มีผูต้ อบถูก 85% ของจานวนผูเ้ ข้าสอบ
ทั้งหมดหรือค่า p เท่ากับ .85 แสดงว่าข้อสอบข้อนั้นง่าย
และข้อสอบข้อใดมีผูต้ อบถูก 50% ของจานวนผูเ้ ข้าสอบ
ทั้งหมดแสดงว่าข้อสอบข้อนั้นมีความยากในระดับปานกลาง
หรือค่า p เท่ากับ .50
ค่า p สามารถประยุกต์ใช้ได้ 2 ลักษณะคือ ใช้บอก
คุณลักษณะของข้อสอบว่ายากหรือง่าย พร้อมทั้งยังบอก
คุณลักษณะของกลุ่มผูส้ อบได้อีกด้วย เช่น ข้อสอบวิชา
ภาษาอังกฤษเมือ่ สอบกับเด็กชั้นประถมศึกษาข้อสอบอาจจะ
ยากมากแต่เมือ่ ใช้กบั เด็กมัธยมศึกษาอาจกลายเป็ นข้อสอบที่
ง่ายมาก
ค่าของ p มีลกั ษณะต่อเนือ่ งตั้งแต่ 0 จนถึง 1 เมือ่
ข้อสอบข้อหนึง่ ไม่มีใครตอบถูก ค่า p จะมีค่า 0 และถ้าผูเ้ ข้า
สอบทุกคนตอบถูกหมด ค่า p จะมีค่า 1
ในการวิเคราะห์ขอ้ สอบนั้น อาจแบ่งกลุ่มผูส้ อบออกเป็ น
กลุ่มสูงและกลุ่มตา่ แต่จะแบ่งจานวนเท่าใด ขึ้ นอยู่กบั ผู ้
วิเคราะห์และขนาดของกลุ่มผูส้ อบ กรณีผูส้ อบมีจานวนน้อย
ๆ อาจจะแบ่งครึ่ง 50% แต่ถา้ กลุ่มผูส้ อบมีจานวนมากขึ้ น
อาจจะแบ่งกลุ่มสูงกลุ่มตา่ ออกเป็ นกลุ่มละ 33% หรือ 27%
หรือ 25% ขึ้ นอยู่กบั จานวนของผูส้ อบว่ามีขนาดมากเท่าใด
ลองพิจารณาจากตัวอย่างข้างล่างนี้ มีจานวนผูส้ อบ 30 คน
และได้แบ่งกลุ่มสูงกลุ่มตา่ กลุ่มละ 50%
กลุ่ม
ผลการตอบ
ก
ข
*ค
กลุ่มสูง
4
5
0
กลุ่มต่า
2
6
0
ความยากของข้อสอบ = (0 + 0)/30 = .00
อานาจจาแนกของข้อสอบ = (0 – 0)/15 = .00
กลุ่ม
กลุ่มสูง
กลุ่มต่า
ก
0
0
ผลการตอบ
ข
*ค
0
15
0
15
ความยากของข้อสอบ = (15 + 15)/30 = 1.00
อานาจจาแนกของข้อสอบ = (15 – 15)/15 = .00
ง
6
7
ง
0
0
การคานวณความยากของข้ อสอบอาจเขียนเป็ นสมการได้ ว่า
p
=
RH  RL
NH  NL
ข้ อสอบที่มีคุณภาพควรมีค่าความยากอยู่ระหว่าง 0.20 ถึง
0.80 ถ้ าความยากมีค่าเกิน 0.80 ถือว่าข้ อสอบง่ายเกินไป ไม่ว่า
เพราะไม่ว่าเด็กจะเก่งหรือจะอ่อนก็สามารถตอบถูกได้ แต่ถ้า
ข้ อสอบมีความยากต่ากว่า 0.20 ถือว่าข้ อสอบยากเกินไป ไม่ว่าเด็ก
จะอ่อนหรือจะเก่งเพียงใดก็ไม่สามารถตอบข้ อสอบได้ ถูก แต่เกณฑ์
ของข้ อสอบที่มีคุณภาพนี้ สามารถปรับเปลี่ยนได้ ตามความ
เหมาะสม เช่นการสอบแบบอิงเกณฑ์ท่เี น้ นให้ ผ้ ูเรียนเกิดความรอบ
รู้ อาจจะลดความยากของข้ อสอบลงมาให้ อยู่ระหว่าง 0.40 ถึง
0.80 ก็ได้
ค่าความยากของตัวเลือกถูกถือเป็ นค่าความยากประจา
ข้อสอบข้อนั้น นอกจากเราจะวิเคราะห์ความยากของ
ตัวเลือกถูกแล้ว ตัวลวงเองก็จาเป็ นต้องวิเคราะห์เหมือนกัน
เพือ่ พิจารณาดูว่าตัวลวงที่ออกไปนั้น มีประสิทธิภาพในการ
ลวงผูส้ อบได้มากน้อยเพียงใด โดยใช้วิธีการคานวณ
เหมือนกับตัวเลือกถูก แต่เกณฑ์ประสิทธิภาพของตัวลวงนั้น
ควรมีค่าไม่ตา่ กว่า 0.05 จึ งจะถือว่ามีประสิทธิภาพในการ
ลวงผูส้ อบได้ดี
การวิเคราะห์อานาจจาแนก
อานาจจาแนกของข้ อสอบ คือ ข้ อสอบข้ อเดียวกันนาไปใช้ สอบกับเด็ก
กลุ่มเก่งและกลุ่มอ่อน เด็กกลุ่มเก่งควรจะตอบข้ อสอบข้ อนั้นได้ ถูกต้ อง
มากกว่าเด็กกลุ่มอ่อน สัญลักษณ์ท่ใี ช้ สาหรับค่าอานาจจาแนกคือ r หรือ
เรียกว่าสัมประสิทธิ์การจาแนก
ค่าอานาจจาแนกมีช่วงอยู่ระหว่าง –1.00 ถึง 1.00 ถ้ าอานาจจาแนกมี
ค่า –1.00 หมายถึงเด็กกลุ่มอ่อนตอบข้ อสอบข้ อนั้นได้ ถูกต้ องหมดทุกคน
ส่วนเด็กกลุ่มกลุ่มตอบข้ อสอบข้ อนั้นผิดหมดทุกคน จะเรียกว่าข้ อสอบข้ อนั้น
จาแนกผิด ถ้ าอานาจจาแนกมีค่า 0.00 หมายถึงเด็กกลุ่มอ่อนและเด็กกลุ่ม
เก่งตอบข้ อสอบข้ อนั้นได้ ถูกต้ องเท่ากัน จะเรียกว่าข้ อสอบข้ อนั้นไม่สามารถ
จาแนกได้ ถ้ าอานาจจาแนกมีค่า 1.00 หมายถึงเด็กกลุ่มอ่อนตอบข้ อสอบข้ อ
นั้นผิดหมดทุกคน ส่วนเด็กลุ่มเก่งตอบข้ อสอบข้ อนั้นถูกต้ องหมดทุกคน จะ
เรียกว่าข้ อสอบข้ อนั้นจาแนกได้ อย่างสมบูรณ์ ตัวอย่างต่อไปนี้ มีกลุ่มผู้สอบ
40 คน และได้ แบ่งกลุ่มสูงกลุ่มต่ากลุ่มละ 50%
กลุ่ม
กลุ่มสูง
กลุ่มตา่
ก
3
12
ผลการตอบ
ข
*ค
2
15
3
3
ง
0
2
ความยากของข้อสอบ = (15 + 3)/40 = .45
อานาจจาแนกของข้อสอบ = (15 – 3)/20 = .60
กลุ่ม
กลุ่มสูง
กลุ่มตา่
ก
8
0
ผลการตอบ
ข
*ค
8
0
0
20
ความยากของข้อสอบ = (0 + 20)/40 = .50
อานาจจาแนกของข้อสอบ = (0 – 20)/20 = -1.0
ง
4
0
ค่าอานาจจาแนกที่มีค่าติดลบจะสะท้ อนความเที่ยงตรงของข้ อสอบ
ได้ ด้วย แบบทดสอบที่มีค่าอานาจจาแนกติดลบหลาย ๆ ข้ อจะเป็ นการ
ลดความเที่ยงตรงของแบบทดสอบ
อานาจจาแนกของข้ อสอบสามารถเขียนเป็ นสมการได้ ว่า
r
=
RH  RL
NH
หรือ
RH  RL
NL
ค่าอานาจจาแนกยิ่งมีค่ามาก จะบ่งบอกถึงอานาจในการจาแนก
ผู้สอบออกเป็ นกลุ่มเก่งและกลุ่มอ่อนได้ มาก ถ้ ามีค่าน้ อยข้ อสอบจะมี
อานาจในการจาแนกผู้สอบออกเป็ นกลุ่มเก่งและกลุ่มอ่อนได้ น้อย
ข้ อสอบที่ถอื ว่ามีคุณภาพคือข้ อสอบที่มีค่าอานาจจาแนกตั้งแต่ 0.20 ขึ้น
ไป ถ้ าค่าอานาจจาแนกต่ากว่า 0.20 เป็ นข้ อสอบที่จาแนกได้ ต่า ควร
นามาปรับปรุงใหม่ แต่ถ้ามีค่าติดลบควรพิจารณาดูว่าเฉลยผิดหรือไม่
ถ้ าเฉลยถูกต้ องก็ควรตัดทิ้ง
ส่วนค่าอานาจจาแนกของตัวลวงนั้น มีความหมายว่า ตัว
ลวงที่ดคี วรลวงกลุ่มอ่อนไปตอบมากกว่าลวงกลุ่มเก่ง ดังนั้น
สมการในการคานวณตัวลวงจึงมีว่า
r
=
RL  RH
NH
หรือ
RL  RH
NL
ตัวลวงที่ดคี วรมีค่าอานาจจาแนกไม่ต่ากว่า 0.05
อำนำจจำแนกโดยใช้ สหสัมพันธ์ ระหว่ ำงคะแนนรำยข้ อกับคะแนนรวม
ค่าอานาจจาแนกอีกวิธหี นึ่งก็คือการหาความสัมพันธ์ระหว่าง
คะแนนของข้ อสอบข้ อนั้นกับคะแนนรวม ค่าสหสัมพันธ์ท่คี านวณที่ได้
ก็คือค่าอานาจจาแนกของข้ อสอบข้ อนั้น มีอยู่ 2 สูตรคือ
1. สหสัมพันธ์พอยท์ไบซีเรียล (Point Biserial Correlation)
2. สหสัมพันธ์ไบซีเรียล (Biserial Correlation)
อานาจจาแนกแบบพอยท์ไบซีเรียลควรใช้เมือ่ กลุ่มผูส้ อบมี
จานวนน้อย การกระจายของคะแนนไม่เป็ นโค้งปกติ แต่อานาจ
จาแนกแบบไบซีเรียลนั้นคะแนนควรมีการแจกแจงเป็ นโค้งปกติ
หรือกลุ่มผูส้ อบมีจานวนมาก ๆ
การวิเคราะห์ขอ้ สอบอัตนัย
การวิเคราะห์ขอ้ สอบอัตนัยยังคงใช้ค่าความยากและอานาจจาแนก
เหมือนกับแบบทดสอบเลือกตอบ แต่มีสมการในการคานวณค่าความยาก
และอานาจจาแนกดังนี้
S H  S L  ( 2 NX min )
ความยากของข้อสอบ
p
=
2 N( X max  X min )
SH  SL
อานาจจาแนกของข้อสอบ
เมือ่
SH
แทน
SL
แทน
N
แทน
Xmax แทน
Xmin แทน
r
= N( X max  X min )
ผลรวมของคะแนนในกลุ่มสูง
ผลรวมของคะแนนในกลุ่มตา่
จานวนผูส้ อบในกลุ่มเก่งหรือกลุ่มอ่อน
คะแนนสูงสุดในข้อนั้น
คะแนนตา่ สุดในข้อนั้น
ส่วนเกณฑ์ในการพิจารณาเกีย่ วกับคุณภาพของข้อสอบ
อัตนัยใช้เกณฑ์เดียวกับข้อสอบเลือกตอบ คือข้อสอบที่มี
คุณภาพจะมีค่าความยากอยู่ระหว่าง 0.20 ถึง 0.80 และ
ค่าอานาจจาแนกมีค่าตั้งแต่ 0.20 ขึ้ นไป
การวิเคราะห์ข้อสอบอิงเกณฑ์
ที่ผ่านมาเป็ นการวิเคราะห์ข้อสอบแบบอิงกลุ่ม ต่อไปนี้จะ
กล่าวถึงการวิเคราะห์ข้อสอบอิงเกณฑ์ ซึ่งจะไม่เน้ นหาค่าความยาก
ของข้ อสอบ ขอเพียงให้ ผ้ ูสอบสามารถทาข้ อสอบได้ ถงึ เกณฑ์ก ็
เพียงพอแล้ ว ดังนั้นการวิเคราะห์ข้อสอบแบบอิงเกณฑ์จะเน้ นที่ค่า
อานาจจาแนก ที่สามารถจาแนกผู้สอบออกเป็ นกลุ่มรอบรู้และไม่
รอบรู้ได้ อย่างถูกต้ อง
อานาจจาแนกของข้ อสอบอิงเกณฑ์ คือประสิทธิภาพของ
ข้ อสอบแต่ละข้ อที่สามารถจาแนกกลุ่มผู้เรียนออกเป็ นกลุ่มรอบรู้
และไม่รอบรู้ วิธกี ารคานวณหาอานาจจาแนกมีอยู่หลายวิธี แต่ท่ี
นิยมใช้ คือดัชนี B
ดัชนี B ของเบรนนอน (Brennan)
เบรนนอน ได้ พัฒนาสูตรอานาจจาแนกเรียกว่า Discrimination Index
B มีสตู รดังนี้
H
L

B
=
NH
NL
เมื่อ B คือดัชนีค่าอานาจจาแนก
H คือจานวนนักเรียนในกลุ่มผู้รอบรู้ท่ตี อบข้ อสอบข้ อนั้นถูก
L คือจานวนนักเรียนในกลุ่มไม่รอบรู้ท่ตี อบข้ อสอบข้ อนั้นถูก
NH คือจานวนนักเรียนในกลุ่มรอบรู้ท้งั หมด
NL คือจานวนนักเรียนในกลุ่มไม่รอบรู้ท้งั หมด
การแบ่งกลุ่มผู้เรียนออกเป็ นกลุ่มรอบรู้และไม่รอบรู้ ให้ ยึดคะแนน
จุดตัดเป็ นหลัก และแน่นอนว่าจานวนนักเรียนในกลุ่มรอบรู้และไม่รอบรู้อาจ
ไม่เท่ากันได้
คุณภาพรายข้อของมาตราส่วนประมาณค่า
ในกรณีทีม่ ีแบบสอบถามแบบมาตราส่วนประมาณค่า เราสามารถ
วิเคราะห์หาอานาจจาแนกของข้อสอบแต่ละข้อ ได้โดยอาศัยหลัก
ทีว่ ่า ข้อคาถามทีด่ ีควรแยกได้ว่าใครมีความเห็นในทางบวก (หรือ
ลบ) มากน้อยกว่ากัน การหาค่าอานาจจาแนกดังกล่าวหาได้โดย
การทดสอบด้วย t-test ซึ่งมีข้ นั ตอนดังนี้
1.
นาแบบสอบถามทีจ่ ะวิเคราะห์มาตรวจให้คะแนนตาม
สเกลทีก่ าหนดไว้ เช่น ในแต่ละข้อมีคะแนนเป็ น 1, 2, 3, 4, 5
และตามลักษณะการตอบไม่เห็นด้วยอย่างยิง่ ไม่เห็นด้วย เฉลย ๆ
เห็นด้วย และเห็นด้วยอย่างยิง่
2.
รวมคะแนนของทุกข้อ (ของแต่ละคน) เข้า
ด้วยกัน
3.
เรียงลาดับคะแนนจากคนทีต่ อบได้คะแนนสูงสุด
จนถึงตา่ สุด
4.
แบ่งกลุ่มผูส้ อบเป็ นสองกลุ่ม คือกลุ่มสูงและกลุ่ม
ตา่ การแบ่งนี้ ควรใช้วิธี 25% บน และ 25% ล่าง คือเอากลุ่มที่
ได้คะแนนสูงสุดมา 1 ใน 4 และตา่ สุดอีก 1 ใน 4 เป็ นกลุ่มสูง
และกลุ่มตา่ ตามลาดับ ถ้าหากมีกลุ่มผูส้ อบน้อย ๆ อาจแบ่ง
เป็ นกลุ่มสูงและกลุ่มตา่ กลุ่มละ 50%
5.
ในแต่ละข้อของแบบสอบถามให้นบั ดูว่า มีคนในกลุ่ม
ทีไ่ ด้คะแนนสูงและตา่ ทาคะแนนในแต่ละข้อได้เท่าไร แล้วนา
คะแนนของทุกคนในแต่ละกลุ่มไปหาค่าเฉลีย่ และความแปรปรวน
สาหรับแบบสอบถามแต่ละข้อต้องหาค่าทั้งสองนี้ จนหมดทุกข้อทั้ง
สองกลุ่ม ดังนั้น ในแต่ละข้อจึ งมีค่าเฉลีย่ 2 ค่า ของกลุ่มผูไ้ ด้
คะแนนสูง 1 ค่าและของกลุ่มตา่ 1 ค่า และค่าความแปรปรวนก็
ทานองเดียวกัน
6.
นาค่าเฉลีย่ และความแปรปรวนในแต่ละข้อไปคานวณ
ด้วยสูตร t-test
t 
X
H
 X
2
SH
n
H
L
2

SL
n
L
เมื่อ X คือ คะแนนเฉลี่ยของกลุ่มได้ คะแนนสูง
X L คือ
คะแนนเฉลี่ยของกลุ่มได้ คะแนนต่า
2
S H คือ
ความแปรปรวนของกลุ่มได้ คะแนนสูง
2
ความแปรปรวนของกลุ่มได้ คะแนนต่า
S L คือ
2
2
N  fX  (  fX )
2
S
=
N ( N  1)
nH, nL คือ จานวนผู้ตอบแบบสอบถามในกลุ่มสูงและกลุ่มต่า
ตามลาดับ
H
7.
แบบสอบถามข้อทีม่ ีค่า t ตั้งแต่ 1.96 ขึ้ นไปถือว่ามี
ค่าอานาจจาแนกอยู่ในเกณฑ์ทีใ่ ช้ได้
ตัวอย่างคานวณ
กลุ่มต่า (L)
F
fX
2
8
3
9
20 40
15 15
10
0
50 72
ระดับคาตอบ
เห็นด้ วยอย่างยิ่ง
เห็นด้ วย
เฉย ๆ
ไม่เห็นด้ วย
ไม่เห็นด้ วยอย่างยิ่ง
ผลรวม
X
4
3
2
1
0
XL 
2
SL 
72
fX2
32
27
80
15
0
154
50
50 ( 49 )
X
4
3
2
1
0
XH 
 1 . 44
50 (154 )  ( 72 )
กลุ่มสูง (H)
F
fX
15 60
20 60
10 20
4
4
1
0
50 144
2
 1 . 03
2
SH 
144
 2 . 88
50
50 ( 464 )  (144 )
50 ( 49 )
2
 1 . 01
fX2
240
180
40
4
0
464
t 
2 . 88  1 . 44
1 . 03
50

 7 . 13
1 . 01
50
ตามตัวอย่างนี้ ได้ค่า t มากกว่า 1.96 จึ งถึอว่าข้อคาถาม
ข้อนี้ อยู่ในเกณฑ์ทีใ่ ช้ได้
ในการคานวณหาค่าอานาจจาแนกสามารถทาได้อีกวิธี
หนึง่ การหาค่าสหสัมพันธ์ (Correlation) ระหว่างคะแนนแต่ละ
ข้อกับคะแนนรวมทั้งฉบับทีห่ กั ข้อนั้นออก
การตรวจสอบคุณภาพของเครื่องมือวัดทั้งฉบับ
ทีก่ ล่าวมาทั้งหมดนี้ เป็ นการตรวจสอบคุณภาพเป็ นราย
ข้อ ซึ่งเมือ่ ตรวจสอบจนแน่ใจแล้วว่ามีคุณภาพดี ควร
ดาเนินการตรวจคุณภาพของเครือ่ งมือวัดทั้งฉบับด้วย
ซึ่งจะตรวจสอบใน 2 ลักษณะคือ
1. ความเทีย่ งตรง
2. ความเชื่อมัน่
ความเที่ยงตรงของแบบทดสอบจะบ่งบอกว่าแบบทดสอบนั้น
มีความสามารถในการวัดในสิง่ ที่ตอ้ งการวัดได้เพียงใด
ประเภทความเที่ยงตรง
ความเที่ยงตรงแบ่งได้เป็ น 3 ประเภทคือ ความเที่ยงตรง
ตามเนื้ อหา ความเที่ยงตรงตามโครงสร้างและความเที่ยงตรง
ตามเกณฑ์สมั พันธ์ ซึ่งมีรายละเอียดดังนี้
1.
ความเทีย่ งตรงตามเนื้ อหา (Content
Validity)
คือการตรวจสอบอย่างเป็ นระบบในเนื้ อหาของ
แบบทดสอบสร้างขึ้ น ว่าครอบคลุมขอบเขตเนื้ อหาของสิ่งที่
ต้องการจะวัดหรือไม่ ความเที่ยงตรงตามเนื้ อหามีชื่อเรียกอีก
มากมายเช่น logical validity, course validity, curricular
validity และ textbook validity
ความเที่ยงตรงตามเนื้ อหา มีความสาคัญกับเครื่องมือวัด
อื่น ๆ ทุกชนิด ความเที่ยงตรงตามเนื้ อหาอาจจาแนกได้เป็ น
ประเภทย่อยได้ดงั นี้
1.1 Face Validity
สมมติว่ามีแบบวัดความสามารถทางคณิตศาสตร์อยู่ เมื่ออ่านข้ อคาถาม
และตัดสินใจว่า ข้ อนี้วัดความสามารถทางคณิตศาสตร์ หรือมีแบบวัดเจตคติ
ต่ออาหารเสริมเพื่อสุขภาพ แล้ วสรุปว่า ข้ อนี้สามารถวัดเจตคติได้ แน่นอน
Face Validity เป็ นวิธกี ารที่มีหลักฐานแสดงความเที่ยงตรงที่อ่อนที่สดุ
เพราะว่าเป็ นการตัดสินใจที่ข้ นึ อยู่กบั บุคคล และบุคคลที่จะมาตัดสินว่าข้ อ
คาถามวัดคุณลักษณะนั้น ๆ ควรจะเป็ นผู้ตัดสินที่มีความน่าเชื่อถือ เรา
สามารถดาเนินการให้ Face Validity น่าเชื่อถือโดยการคัดเลือกผู้เชี่ยวชาญที่
น่าเชื่อถือ ซึ่งผู้สร้ างแบบวัดได้ คัดเลือกผู้เชี่ยวชาญมาอย่างพิถีพิถันเพื่อ
ตรวจสอบและตัดสินแบบวัดนั้น และเมื่อผลจากการตัดสินของผู้เชี่ยวชาญถูก
ส่งกลับมาและปรับแก้ ไขตามผู้เชี่ยวชาญเรียบร้ อยแล้ ว แบบวัดฉบับนั้นก็จะ
เป็ นแบบวัดที่ดี
1.2 ความเทีย่ งตรงเชิงเหตุผล (Logical Validity)
เป็ นความเที่ยงตรงที่ให้ ผ้ ูเชี่ยวชาญพิจารณาว่าข้ อสอบแต่ละ
ข้ อนั้นวัดได้ ตรงตามตารางวิเคราะห์หลักสูตร หรือไม่ คือ
ผู้เชี่ยวชาญทางสาขาวิชานั้นจะต้ องพิจารณาว่าแบบทดสอบฉบับ
นั้นมีข้อสอบแต่ละข้ อตรงตามพฤติกรรมที่จะวัดและจานวนข้ อ
สอดคล้ องกับตารางวิเคราะห์หลักสูตรหรือไม่ ถ้ าผู้เชี่ยวชาญบอก
ว่าข้ อสอบแต่ละข้ อวัดได้ สอดคล้ องตรงตามตารางวิเคราะห์
หลักสูตร แสดงว่ามีความเที่ยงตรงตามโครงสร้ าง ถ้ าข้ อใดไม่
สอดคล้ อง ต้ องมีการปรับแก้ ตามที่ผ้ ูเชี่ยวชาญชี้แนะ
2.
ความเทีย่ งตรงตามโครงสร้าง (Construct
Validity)
คือความสามารถของแบบทดสอบที่สามารถวัดโครงสร้ างทฤษฎีหรือ
คุณลักษณะ เช่น โครงสร้ างของเชาวน์ปัญญา, ความถนัดทางช่างกล, ความ
คล่องแคล่วทางภาษา หรือความวิตกกังวล เป็ นต้ น
หลักฐานที่แสดงให้ เห็นถึงความเที่ยงตรงเชิงโครงสร้ างนั้น ประการแรก
ผู้สร้ างแบบวัดจะต้ องตั้งสมมติฐานโครงสร้ างเชิงทฤษฎี (Hypothetical
Construct) เช่น “เชาวน์อารมณ์” การสร้ างสมมติฐานโครงสร้ างเชิงทฤษฎี
จะต้ องตั้งอยู่บนพื้นฐานของเอกสารและงานวิจัยที่เกี่ยวข้ อง ประการสอง
พัฒนาแบบทดสอบให้ วัดตามโครงสร้ างที่กาหนด อาจตั้งชื่อของแบบวัดว่า
แบบวัดเชาวน์อารมณ์ เช่น เราอาจจะสร้ างแบบวัด 30 ข้ อสาหรับวัด “เชาวน์
อารมณ์” ผู้ท่ไี ด้ คะแนนสูงในแบบวัดนี้จะบ่งชี้ว่าเป็ นผู้มีเชาวน์อารมณ์สงู และ
ผู้ท่ไี ด้ คะแนนต่าจะบ่งชี้ว่าเป็ นผู้มีเชาวน์อารมณ์ต่า
2.1 ความเทีย่ งตรงเชิงเหมือน (Convergent Validity)
เป็ นระดับของความคล้ายคลึงกันของแบบวัดที่ควรจะ
คล้ายคลึงกันตามทฤษฎี ตัวอย่างเช่น ความเที่ยงตรงเชิง
เหมือนของแบบทดสอบวัดความสามารถทางคณิตศาสตร์
เราอาจจะไปสัมพันธ์คะแนนของแบบวัดความสามารถทาง
คานวณฉบับอื่น ๆ ที่มีจุดมุ่งหมายเพือ่ วัดความสามารถทาง
คณิตศาสตร์เหมือนกันฉบับที่เราสร้าง เมือ่ เราหาสหสัมพันธ์
ระหว่างคะแนนของแบบวัดทั้ง 2 ฉบับแล้วมีความสัมพันธ์
กันสูงก็เป็ นหลักฐานบ่งชี้ ว่ามีความเที่ยงตรงเชิ งเหมือน
2.2 ความเทีย่ งตรงเชิงจาแนก (Discriminant
Validity)
เป็ นระดับของความแตกต่างกันของแบบวัดทีค่ วรจะ
แตกต่างกันตามทฤษฎี ตัวอย่างเช่น ความเทีย่ งตรงเชิง
จาแนกของแบบทดสอบวัดความสามารถทางคานวณ เรา
อาจจะไปหาความสัมพันธ์กบั คะแนนของแบบวัด
ความสามารถทางภาษา เมือ่ แบบวัดทั้งฉบับนี้ มี
ความสัมพันธ์ตา่ ก็เป็ นหลักฐานบ่งชี้ ว่ามีความเทีย่ งตรง
เชิงจาแนก
3. ความเทีย่ งตรงตามเกณฑ์สมั พันธ์
(Criterion-Related Validity)
เป็ นกระบวนการที่ช้ ีให้ เห็นถึงความสามารถของแบบทดสอบ
ในการทานายพฤติกรรมของบุคคลในสถานการณ์เฉพาะ โดยอาจ
ตรวจสอบความเที่ยงตรงโดยใช้ เครื่องมือวัดหรือการวัดอื่น ๆ
เป็ นเกณฑ์ (criterion) ตัวอย่างเช่น แบบทดสอบวัดความถนัดทาง
ช่างกล เกณฑ์อาจจะเป็ นผลของการปฏิบัติได้ เหมือนช่างโดยใช้
แบบประเมินหรือแบบสังเกตไปสอบวัดการปฏิบัติทางช่าง หรือ
สาหรับแบบทดสอบความถนัดทางวิชาการ อาจจะใช้ เกรดเฉลี่ย
หรือ การวัดบุคลิกภาพอาจจะใช้ การประเมินที่พิจารณาจาก
พฤติกรรมการแสดงออกของแต่ละบุคคลในชีวิตประจาวัน
3.1 ความเทีย่ งตรงตามสภาพ (Concurrent Validity)
เป็ นการประเมินความสามารถที่แตกต่างระหว่างกลุ่ม
ตามทฤษฎี ตัวอย่างเช่น ถ้าเรามีแบบทดสอบวัดความ
ซึ มเศร้า แบบวัดนั้นควรจะสามารถจาแนกความแตกต่าง
ระหว่างบุคคลที่วินิจฉัยแล้วว่ามีความซึ มเศร้าและบุคคลที่
วินิจฉัยแล้วว่าไม่ซึมเศร้า ผลที่ได้จะยิง่ เชื่อถือว่ามีความ
เที่ยงตรงเชิงสภาพสูงมาก ถ้าแบบวัดนั้นสามารถจาแนก
ความแตกต่างระหว่างกลุ่ม 2 กลุ่มที่มีคุณลักษณะใกล้เคียง
กันได้
3.2 ความเทีย่ งตรงตามทานาย (Predictive Validity)
เป็ นการประเมินความสามารถเพือ่ ทานายบางอย่างในเชิง
ทฤษฎี เช่น เราอาจจะมีทฤษฎีว่าการวัดความสามารถทาง
คณิตศาสตร์ควรจะสามารถทานายความสามารถทางวิศวกรรม
ของบุคคลได้ดี เราควรจะใช้การวัดความสามารถทาง
คณิตศาสตร์ไปสัมพันธ์กบั ความสามารถทางวิศวกรรม และหาก
มีความสัมพันธ์กนั สูงระหว่างการวัดความสามารถทาง
คณิตศาสตร์กบั ความสามารถทางวิศวกรรม ความสัมพันธ์กนั
สูงนี้ ควรจะเป็ นหลักฐานแสดงความเทีย่ งตรงเชิงทานาย แสดง
ว่าการวัดของเรานั้นมีความถูกต้องสามารถทานายได้จริงตาม
ทฤษฎี
ความเชื่อมั่นของเครื่องมือวัด
ความเชื่อมั่น (Reliability) เป็ นคุณภาพของ
เครื่องมือที่มีความน่าเชื่อถือในการวัด นั่นคือ เมื่อ
นาเครื่องมือไปสอบวัดซา้ กับผู้สอบกลุ่มเดิม ลาดับ
ที่ของคะแนนสอบจะไม่เปลี่ยนแปลง
ประเภทของความเชื่อมั่น
ความเชื่อมั่นมีหลายวิธใี นการวิเคราะห์ แต่วิธีท่นี ิยมใช้ กนั
มีดังนี้
1.ความเชื่อมั่นแบบสอบซา้ (test-retest)
2. แบบแบ่งครึ่งฉบับ
3.Kuder-Richardson 20 (KR-20)
4. Kuder-Richardson 21 (KR-21)
5.Alpha Coefficient (a-Coefficient)
1. ความเชื่อมันแบบสอบซ
่
้า
เป็ นการใช้ แบบทดสอบฉบับเดิมไปสอบซา้ กับกลุ่มตัวอย่างกลุ่มเดิม
แล้ วนาผลการสอบทั้งสองครั้งมาหาความสัมพันธ์ ค่าความสัมพันธ์ท่ี
ได้ คือค่าความเชื่อมั่นของแบบทดสอบ
สูตรในการหาความสัมพันธ์มีดังนี้
N  XY  (  X )(  Y )
r
=
[ N X
2
2
 (  X ) ][ N  Y
เมื่อ X แทนผลการสอบครั้งที่ 1
Y แทนผลการสอบครั้งที่ 2
2
2
 (  Y) ]
ตัวอย่างการหาความเชื่อมั่นแบบสอบซา้
คนที่
1
2
3
4
5
6
7
8
9
10
รวม
สอบครั้งที่ 1 (X)
1
2
2
3
4
5
6
8
9
10
50
สอบครั้งที่ 2 (Y)
2
3
2
5
5
7
5
6
7
8
50
X2
1
4
4
9
16
25
36
64
81
100
340
Y2
4
9
4
25
25
49
25
36
49
64
290
XY
2
6
4
15
20
35
30
48
63
80
303
แทนค่าในสูตรหาความสัมพันธ์
r
10 ( 303 )  ( 50 )( 50 )

2
2
[10 ( 340 )  ( 50 ) ][ 10 ( 290 )  ( 50 ) ]

530
( 900 )( 400 )
= 530/600
= 0.883
2. แบบแบ่งครึ่งฉบับ
เป็ นการหาความเชื่อมั่นกรณีท่มี ีแบบทดสอบฉบับเดียว
สอบเพียงครั้งเดียว แล้ วนาผลการสอบมาแบ่งครึ่งฉบับ
อาจแบ่งเป็ นข้ อคู่ ข้ อคี่ จะได้ คะแนนรวมที่ได้ จากการแบ่ง 2
ชุด มาหาความสัมพันธ์กนั โดยใช้ สตู รสหสัมพันธ์แบบเพียร์
สัน ค่าสหสัมพันธ์ท่ไี ด้ คือค่าความเชื่อมั่นครึ่งฉบับของ
แบบทดสอบ แล้ วนามาปรับขยายเป็ นความเชื่อมั่นฉบับเต็ม
ด้ วยสูตรสเปี ยร์แมน-บราวน์
r tt 
2 r1 / 2
1  r1 / 2
เมื่อ rtt
แทน ค่าความเชื่อมั่นของเครื่องมือวัดทั้งฉบับ
r1/2 แทน ค่าความเชื่อมั่นของเครื่องมือวัดครึ่งฉบับ
3. Kuder-Richardson 20
เป็ นการใช้ แบบทดสอบฉบับเดียวสอบเพียงครั้งเดียว แล้ ว
นามาคานวณหาความเชื่อมั่นด้ วยสูตร KR-20 โดยสูตรใช้ ได้ กบั
แบบทดสอบที่มีการให้ คะแนนเป็ นแบบ 0 และ 1 เท่านั้น
มีสตู รคานวณคือ
N


p
(
1

p
)
 i
i 

 k 
i 1
KR 20  
1




2
sX
 k  1



ตัวอย่างการหาความเชื่อมันแบบ
่
KR-20
ข้อที่
คนที่
รวม
1
2
3
4
5
6
7
8
9
10
p
1
1
0
1
1
1
0
1
1
1
1
0.8
2
1
1
0
1
1
1
1
1
1
1
0.9
3
1
1
1
0
1
0
0
0
1
1
0.6
4
0
0
1
1
1
0
1
1
1
1
0.7
5
1
0
0
1
0
1
1
0
1
1
0.6
6
1
1
0
1
0
0
0
1
1
1
0.6
1-p
p(1-p)
0.2
0.16
0.1
0.09
0.4
0.24
0.3
0.21
0.4
0.24
0.4
0.24
5
3
3
5
4
2
4
4
6
6
1.18
แทนค่าในสูตรหา KR-20
KR-20
1 . 18 


1

6 1 
1 . 56 
6
 0 . 38 
 1 .2 

1
.
56


= 0.29
4. Kuder-Richardson 21
เป็ นสูตรที่ไม่ได้ ใช้ ผลการสอบมาคานวณทุกข้ อ ใช้ แค่เพียงค่าเฉลี่ย
และความแปรปรวนของคะแนนรวมเท่านั้น จึงหยาบกว่าวิธี KR-20
X (N  X ) 
 k 
KR 21  
1 


2
Ns X
 k  1  

ทั้ง KR-20 และ KR-21 นี้จะมีค่าเท่ากันเมื่อความยากง่ายของ
ข้ อสอบเท่ากันทุกข้ อ ถ้ าข้ อสอบมีค่าความยากง่ายไม่เท่ากันแล้ ว
KR21 จะประมาณค่าได้ ต่ากว่า KR20 และเป็ นการประมาณค่า
ความเชื่อมั่นที่ต่ากว่าความเป็ นจริง
5. Alpha-Coefficient
เป็ นการใช้ แบบทดสอบฉบับเดียวสอบเพียงครั้งเดียว แล้ ว
นามาคานวณหาความเชื่อมั่นด้ วยสูตร Alpha โดยสูตรใช้ ได้ กบั
แบบทดสอบที่มีการให้ คะแนนเป็ นแบบใดก็ได้
มีสตู รคานวณคือ
N

2
s

i
 k 
i 1
a  
1



2
k

1
sX








เมื่อ k
2
si
2
sX
แทน จานวนข้ อสอบทั้งหมดของเครื่องมือวัด
แทน ความแปรปรวนของคะแนนเป็ นรายข้ อ
แทน ความแปรปรวนของคะแนนทั้งฉบับ
ข้อตกลงบางประการในการหาความเชื่อมัน่
1. การหาค่าความเชื่อมั่นของเครื่องมือด้ วยวิธสี อบซา้ จะเป็ นความ
คงที่ของคะแนนสอบ (stability) ส่วนวิธอี ่นื ๆ จะเป็ นวิธหี าความ
สอดคล้ องภายใน (internal consistency) ของการตอบเครื่องมือนั้น
2. ค่าความเชื่อมั่นที่หาได้ โดยวิธแี บ่งครึ่ง จะให้ ค่าสูงกว่าวิธอี ่นื ๆ
ส่วนการใช้ สตู รของคูเดอร์-ริชาร์ดสัน จะให้ ค่าความเชื่อมั่นต่ากว่าวิธี
อื่น ๆ โดยเฉพาะ KR-21 จะให้ ค่าต่ากว่า KR-20
3. การหาความเชื่อมั่นของเครื่องมือวัดแต่ละชนิด จะต้ องเลือกใช้ วิธี
ที่เหมาะสมกับคุณลักษณะของเครื่องมือนั้น
4. ค่าความเชื่อมั่นที่ได้ จะเป็ นเครื่องชี้ถงึ ความมั่นใจในคะแนนที่ได้ จาก
การสอบวัด ถ้ าความเชื่อมั่นสูง แสดงว่าความคลาดเคลื่อนของคะแนนมีน้อย
ในทางตรงข้ ามถ้ าความเชื่อมั่นต่า ความคลาดเคลื่อนจะมีสงู ความคลาด
เคลื่อนในการวัดแต่ละครั้งจะแปรผันตามระดับค่าความเชื่อมั่น ความคลาด
เคลื่อนมาตรฐานของการวัด (standard error of measurement ใช้
สัญลักษณ์ว่า SEmeas) คานวนได้ จากสูตร
SEmeas = s 1  r tt
เมื่อ SEmeas แทน ความคลาดเคลื่อนมาตรฐานของการวัด
s
แทน ความเบี่ยงเบนมาตรฐานของคะแนน
rtt
แทน ค่าความเชื่อมั่น
จะเห็นว่า ถ้ าใช้ เครื่องมือที่มคี วามเชื่อมั่น 1.00 ความคลาดเคลื่อนของการ
วัดจะมีค่าเป็ น 0 และความเชื่อมั่นยิ่งน้ อยลง ๆ ค่าความคลาดเคลื่อนของ
การวัดก็จะยิ่งมากขึ้น