האוניברסיטה הפתוחה ניתוח פריטים חלק א' : מודלים קלאסיים של ניתוח פריטים מבחנים פסיכולוגים : תיאוריה ומעשה
Download
Report
Transcript האוניברסיטה הפתוחה ניתוח פריטים חלק א' : מודלים קלאסיים של ניתוח פריטים מבחנים פסיכולוגים : תיאוריה ומעשה
האוניברסיטה הפתוחה
ניתוח פריטים
חלק א' :מודלים קלאסיים של ניתוח פריטים
מבחנים פסיכולוגים :תיאוריה ומעשה
נושאי הלימוד
2
חלק א' :מודלים קלאסיים לניתוח פריטים
מדדי קושי הפריט
שיעור המשיבים נכונה ()p
סולם רווחים ()Z
סולם דלתא ()
השפעת ניחוש מדד כללי :התפלגות ציוני המבחן קשר בין קושי הפריט לבין מטרת המבחן
נושאי הלימוד
(המשך)
3
מדדי הבחנה
מדד D
מתאם ביסריאלי ()rbis
מתאם פי
הקשר בין pלבין D
סוגי קריטריונים לניתוח פריטים
ניתוח מסיחים
חומר הלימוד
4
הגדרת תחום הדיון
5
איכותו הפסיכומטרית של כלי המדידה תלויה במאפייני
הפריטים הנכללים בו
במהלך פיתוח מבחן חשוב לערוך ניתוח פריטים,
המתמקד בפריט הבודד
מטרתו לסייע לבנות מבחנים בעלי איכות פסיכומטרית
גבוהה יותר
יתרונות ניתוח פריטים
מאפשר לשפר את מהימנות ותוקף המדידה ,ובו זמנית
לקצר את אורכה
תיאוריית המהימנות הקלאסית מניחה כי כל פרטי המבחן
מודדים אותו הדבר (נוסחת ספירמן-בראון)
בניתוח הפריטים קיצור המבחן אינו אקראי ,אלא מבוסס
על בדיקת תרומתם למדידה
7
.1מדדי קושי הפריט
מדד קושי הפריט p
8
הגדרה :שיעור המשיבים נכונה על הפריט
איזה פריט קשה יותר?
p2=0.7
סולם סדר
p1=0.5
סולמות רווחים ()Z
9
מתאים לשימוש רק כאשר התכונה הנמדדת מתפלגת נורמלית.
פריט )p=0.84(ׁ1
84%
)P(16
)z(-1
סולם דלתא ()
10
סולם רווח ,הבנוי כטרנספורמציה ליניארית נוספת על
בסיס סולם Z
4 zx 13
מהו ממוצע סולם דלתא?
טווח ערכי סולם דלתא נע בין 1-25
מדדי קושי הפריט
(סיכום)
שעור המשיבים נכונה ()P
סולמות רווחים ()Z
סולם דלתא ()
2
3
נוסחת
המרה
Z
1
טבלה
מאון
p
השפעת ניחוש על מדדי קושי הפריט
(הדגמה)
12
האם הפריטים שקולים?
פריט סגור
פריט פתוח
P=0.6
P=0.6
מדד כללי :התפלגות ציוני המבחן
13
מדד כוללני
מתאים לשימוש כאשר ניתן להניח כי:
המדגם מייצג נכונה את האוכלוסייה
התכונה הנחקרת מתפלגת נורמלית.
קשר בין קושי הפריטים לבין יכולת ההבחנה בין
נבדקים.
מדד כללי :התפלגות ציוני המבחן
(המחשה סכמתית )1
14
הפריטים במבחן קשים ("תקרה גבוהה")
ציוני המבחן
הבחנה רגישה בחלק העליון של טווח הציונים
מדד כללי :התפלגות ציוני המבחן
(המחשה סכמתית )2
15
15
הפריטים במבחן קלים ("רצפה נמוכה")
ציוני המבחן
הבחנה רגישה בחלק התחתון של טווח הציונים
16
.2קושי הפריט ומטרת המבחן
סוגי מבחנים
מבחנים הדורשים הבחנה בטווח רחב של רמות היכולת
הנחקרת.
מבחן סף (ברירה)
18
.3מדדי הבחנה
מדד D
עוסק בשאלה עד כמה פריט מסוגל להבחין בין נבדקים
ברמות שונות של יכולת בתכונה הנחקרת
הגדרה :ההפרש בין אחוז העונים נכונה על הפריט
בקבוצות קריטריון מנוגדות
מה יהיו גבולות מדד ?D
= D אפס ,מה משמעות הדבר?
חישוב מדד D
(הדגמה)
נתונים ,80=N :ג'= ,45נ'=35
שכיחות המשיבים נכונה על פריט 1
ג'
נ'
27
14
D
?
מדדי הבחנה המחושבים כמתאמים
21
מתאם פי ()
מתאם ביסריאלי ()rbis
פריט דיכוטומי
פריט דיכוטומי
קריטריון דיכוטומי
קריטריון רציף
מתאם פי
פריט
קריטריון
עבר
נכשל
עבר
a
b
)(a+b
נכשל
c
d
)(c+d
)(a+c
)(b+d
נוסחת מקדם פי:
ad bc
) (a b)(c d )(a c)(b d
מתאם פי
(תרגול)
מבחן ידע מרחבי הועבר ל 80 -נבדקים 53 ,בלבד הצליחו במבחן .על פריט
1השיבו נכון 40איש 31 ,מבניהם עברו את המבחן בהצלחה .מהי יכולת
ההבחנה של פריט ?1
פריט
נכשל
עבר
עבר
=a
=)(a+b
=b
קריטריון
נכשל
נוסחת מקדם פי:
=c
=d
=)(a+c
=)(b+d
ad bc
) (a b)(c d )(a c)(b d
=)(c+d
מקדם ביסריאלי
פריט
ממוצע
קריטריון
נכשל
עבר
X0
X1
מקדם ביסריאלי
pq
(נוסחה)
x1 x 0
rbis
Sx
X1
ממוצע בקריטריון של קבוצת המצליחים בפריט
X0
ממוצע בקריטריון של קבוצת הנכשלים בפריט
p
שעור המצליחים בפריט
q
שעור הנכשלים בפריט
Sx
סטיית התקן של הקבוצה בקריטריון
מקדם ביסריאלי
(תרגול)
בקורס מבחנים פסיכולוגים נבחנו 20תלמידים ,ציוני המבחן
כולו התפלגו עם ממוצע ( ,)70.75וסטית תקן (.)11.23
על פריט 2השיבו נכון 10בלבד .בטבלה להלן מפורטים ציוני
הנבדקים במבחן כולו.
מהי יכולת ההבחנה של הפריט ?2
pq
x1 x 0
Sx
rbis
פריט
נכשל
72
70
70
70
66
64
62
62
60
56
עבר
90
88
87
86
84
82
72
60
58
56
X1=76.3 X0=65.2
27
.4הקשר בין קושי הפריט ( )pלבין D
קשר בין קושי הפריט לבין יכולת הבחנה ()D
קושי הפריט ()p
100
90
70
50
30
10
0
ערך מקסימאלי של D
0
20
60
100
60
20
0
חישוב מדד Dעבור פריט ברמת קושי 0.9
מה יהיה ערך Dהמקסימאלי?
נתוןn=100 :
גבוהי יכולת ()n=50
נמוכי יכולת ()n=50
= D
(הדגמה)
חישוב מדד Dעבור פריט ברמת קושי 0.9
האם יתכן כי ערך Dיהיה אפס?
נתוןn=100 :
גבוהי יכולת ()n=50
נמוכי יכולת ()n=50
= D
(הדגמה)
חישוב מדד Dעבור פריט ברמת קושי 0.9
מה יהיה ערך Dהמינימאלי?
נתוןn=100 :
גבוהי יכולת ()n=50
נמוכי יכולת ()n=50
D=-
(הדגמה)
קשר בין קושי הפריט לבין יכולת הבחנה
(סיכום)
קיימת תלות בין קושי הפריט ( )pובין יכולת ההבחנה
שלו (.)D
לפריטים בעלי רמת קושי זהה יתכנו מדדי הבחנה
שונים.
33
.5סוגי קריטריונים לניתוח פריטים
סוגי קריטריונים והשלכות השימוש בהם
יכולת הבחנה של פריט :המידה בה פריט מסוגל
להבחין בין נבדקים ברמות שונות של יכולת בתכונה
הנחקרת
מול מה נשווה את הביצוע בפריט?
קריטריון פנימי -העלאת הומוגניות המבחן
קריטריון חיצוני -העלאת תוקף המבחן מול קריטריון
35
.6ניתוח מסיחים
ניתוח מסיחים
במבחן הכולל פריטים רבי-ברירה ניתן לערוך ניתוח
כמותי ואיכותי נוסף של פריטים ,המכונה ניתוח מסיחים
בדיקת התפלגות תשובות הנבחנים לכלל אפשרויות
התשובה ,ובכלל זה לתשובות השגויות (מסיחים)
ניתן לערוך ניתוח מסיחים על ידי חלוקת הנבדקים
לקבוצות קריטריון מנוגדות (גבוהים/נמוכים)
שלבים בניתוח מסיחים
בפריטים סגורים :בדיקת התפלגות התגובות לכלל
אפשרויות התשובה ,וניסיון לזהות מסיח בעייתי.
הסבר איכותי לממצאים הכמותיים (על סמך ניתוח
איכותי).
סיכום והמלצה.
ניתוח פריט
(תרגול)
מבחן הסקה לוגית ,מיועד לשימוש באוכלוסייה הרחבה.
נדרשת הבחנה בין נבדקים בטווח השלם
אפשרויות התשובה
1
*2
3
4
5
הישג גבוה
0
25
14
0
1
הישג נמוך
0
15
8
8
9
ניתוח פריט
(תרגול)
חישוב הפרמטרים של הפריט והערכתם
,P=0.5קושי הפריט ממוצע ,רצוי בד"כ למבחנים הדורשים הבחנה בטווח רחב
של רמות יכולת.
,D=0.25רמת הבחנה נמוכה ,בפרט כשמדובר בפריט ברמת קושי בינונית.
ניתוח מסיחים
מסיח 3בעייתי" ,מושך" שעור גבוה של נבדקים גבוהי יכולת ( ,)35%מסיח 1
בעייתי ,לא נבחר על ידי איש.
ניתן לערוך ניתוח איכותי לבחון האם השאלה מנוסחת באופן רב משמעי ,כך
שדווקא עבור נבדקים השולטים בחומר מסיח 3נראה כאפשרות מתאימה.
יש לתקן את ניסוחו של מסיח ,1שכן הוא קל מאוד לפסילה (אינו "מתפקד"
כמסיח).
מסקנה
הפריט לא מומלץ לשימוש במתכונתו הנוכחית