מדדי פיזור - אוניברסיטת בר אילן

Download Report

Transcript מדדי פיזור - אוניברסיטת בר אילן

‫סטטיסטיקה‬
‫‪3‬‬
‫מדדי פיזור‬
‫מדדי מיקום יחסי‬
‫ענבל שפירא לוץ‪ ,‬אריאל גלעד‪ ,‬אסנת בר שירה‪ ,‬המחלקה למדעי המוח אוניברסיטת בר אילן ©‬
‫מדדי פיזור‬
‫מדדי פיזור‬
‫• מדדים ל'מידת השוני' או ה'גיוון' של הנתונים בקבוצה‪.‬‬
‫– מדדי הפיזור בנויים בחלקם על פונקציות ההפסד שראינו‪,‬‬
‫כך ניתן לאמוד את הפיזור של הערכים‪.‬‬
‫• מדדי הפיזור צריכים לקיים‪:‬‬
‫– מקבלים רק ערכים אי שליליים (שכן מבוססים על מרחק‬
‫ואין "מרחק שלילי")‬
‫– אם כל המדידות זהות הפיזור יהיה אפס‬
‫– הוספת קבוע לכל הנתונים לא תשנה את ערכו של מדד‬
‫הפיזור‪.‬‬
‫טווח‪/‬תחום ‪Rang‬‬
‫• ההפרש (המרחק) בין הערך הגבוה לנמוך ביותר‬
‫‪R  x max  x min‬‬
‫– מושפע רק מקצוות ההתפלגות לכן רגיש לערכים‬
‫קיצוניים‬
‫– לא משקף את מידת הפיזור במרכז ההתפלגות‬
‫– מתאים למשתנים מסולם רווח ומעלה‬
‫דוגמאות‬
‫הטווח‪/‬התחום הבין רבעוני‬
‫• הטווח של ‪ 50%‬מערכי ההתפלגות הנמצאים‬
‫במרכז ההתפלגות‬
‫– ‪ 25%‬הגבוהים ביותר או הנמוכים ביותר הינם בגדר‬
‫"חריגים"‪.‬‬
‫– מחושב כהפרש בין הרבעון העליון לתחתון‬
‫– אינו רגיש לערכים קיצוניים‬
‫– מתאים למשתנים מסולם רווח ומעלה‬
‫• שימו לב כי נקח‬
‫את הערך של‬
‫המשתנה לשם‬
‫חישובינו‬
‫‪IQR  Q 3  Q1‬‬
‫דוגמאות‬
‫• נתונה סדרת ערכים‪ ,‬מהו התחום הבין רבעוני‬
‫שלה?‬
‫‪3 , 4 , 6 , 7 , 8 , 10 , 11 , 12 , 31‬‬
‫דוגמא ‪2‬‬
‫• חשבו את הטווח הבין רבעוני‬
‫דוגמא ‪3‬‬
‫שונות וסטיית תקן‬
‫• הפיזור הממוצע של התצפיות סביב הממוצע‬
‫– נמדד ע"י ממוצע סכום הסטיות הריבועיות מהממוצע‬
‫‪2‬‬
‫‪ x‬‬
‫‪ x‬‬
‫‪n‬‬
‫‪i‬‬
‫‪i 1‬‬
‫‪S ‬‬
‫‪2‬‬
‫‪n‬‬
‫– בגלל העלאה בריבוע‪ ,‬יחידות השונות הינן ריבוע‬
‫יחידות הערכים המקוריים‪ ,‬על כן נוציא שורש לקבלת‬
‫היחידות המקוריות (זוהי סטיית התקן)‪2 .‬‬
‫‪n‬‬
‫‪ i 1  x i  x ‬‬
‫ומעלה‬
‫רווח‬
‫מסולם‬
‫משמשים‬
‫–‬
‫‪n‬‬
‫– רגישים לערכים קיצוניים (כי אלו נכנסים לחישוב)‬
‫‪S ‬‬
‫דוגמאות‬
‫• חשב את הממוצע‪ ,‬השונות וסטיית התקן של‪:‬‬
‫‪1,3,5‬‬
‫דוגמא ‪2‬‬
‫• נשים לב כי‬
‫• חשב את הממוצע והשונות בטבלה שלהלן‬
‫טרנספורמציות‬
‫• נתונה סדרת המספרים ‪ 5 4 3 2 1‬חשבו את מדדי‬
‫הפיזור שלמדנו‪.‬‬
‫הכפלה בקבוע ‪b‬‬
‫נניח שכפלנו את אברי הסדרה פי ‪25 20 15 10 5 :5‬‬
‫מה יקרה לטווח‪ ,‬לתחום הבין רבעוני‪,‬לשונות‪ ,‬לסטיית‬
‫התקן?‬
‫הוספת קבוע‬
‫• נניח כי הוספנו ‪ 5‬לסדרה המקורית‪10 9 8 7 6 :‬‬
‫מה יקרה לטווח‪ ,‬לתחום הבין רבעוני‪ ,‬לשונות‪,‬‬
‫לסטיית התקן?‬
‫נסכם‪...‬‬
‫מדדים לתאור התפלגות‬
‫מדדים לתאור התפלגות‬
‫נפתור קצת תרגילים‪...‬‬
‫• תרגילי כתה‬
‫• תרגילים מתוקשבים‬
‫מדדי מיקום יחסי‬
‫מהם מדדי מיקום יחסי?‬
‫מיקום תצפית נמדד ע"י השוואתה לשאר התצפיות בהתפלגות‪.‬‬
‫המיקום היחסי של תצפית בודדת ביחס לשאר התצפיות הינו מדד‬
‫למיקום יחסי‪.‬‬
‫יש לעבור ליחידות יחסיות כלומר ערכים יחסיים (למדדים האופיניים‬
‫של ההתפלגות) וטהורים (בלתי תלויים ביחידות המדידה)‬
‫• למה זה טוב?‬
‫– מדדים לצורך השוואת תצפיות מהתפלגויות שונות‪ ,‬שאינן בהכרח מאותו‬
‫סוג‬
‫• האם ריח הפרח שונה מגובה הפרח?‬
‫• האם אדם גבוה יהיה רזה?‬
‫• האם סטודנט טוב בהסתברות יצלח גם קורס בסטטיסטיקה?‬
‫אחוזונים (מאונים ‪) Cx‬‬
‫• אחוז התצפיות הקטנות מ ‪ X‬או שוות לו‪ ,‬למשל‪:‬‬
‫– חציון = מאון ‪ 50‬או אחוזון ‪50‬‬
‫– רבעון תחתון = אחוזון ‪25‬‬
‫– רבעון עליון = אחוזון ‪75‬‬
‫• זהו המיקום היחסי של תצפית על בסיס השכיחות‬
‫המצטברת‪.‬‬
‫שאלות שישאלו בהקשר של אחוזונים‬
‫‪ .1‬מהו האחוזון המתאים לערך מסויים ‪ X‬בהתפלגות?‬
‫•‬
‫נניח שסטודנט קיבל במבחן ‪ ,80‬מהו האחוזון של ‪( 80‬כלומר מהו‬
‫‪ )C80‬כמה אחוז מהווים הערכים הקטנים או שווים ל ‪?80‬‬
‫‪  x  L0 ‬‬
‫‪ 100‬‬
‫‪Cx  ‬‬
‫‪ f  x m   F  x m  1  ‬‬
‫‪  L1  L 0 ‬‬
‫‪ n‬‬
‫‪ .2‬מהו הערך המתאים לאחוזון ‪ Cx‬מסויים?‬
‫•‬
‫מהו הציון שעד אליו (כולל) יש ‪ 40%‬מכלל הציונים?‬
‫‪ n‬מספר מקרים‬
‫‪ Xm‬המחלקה בה נמצא האחוזון‬
‫‪ L1‬גבול אמיתי עליון של ‪Xm‬‬
‫‪ L0‬גבול אמיתי תחתון של ‪Xm‬‬
‫‪ Xm-1‬המחלקה הקודמת ל ‪Xm‬‬
‫‪ F  x m 1 ‬‬
‫‪100‬‬
‫‪  L1  L 0 ‬‬
‫‪f xm ‬‬
‫‪n c‬‬
‫‪xc  L0 ‬‬
‫דוגמא‬
‫‪ .1‬מהו האחוזון המתאים לציונו של שרק (‪? )650‬‬
  x  L0 
 100
Cx  
 f  x m   F  x m  1  
  L1  L 0 
 n
C 650
 650  600 
 100
 
 500  2700  
 700  600 
 3400
C 650
 50
 1
 
 500  2700  
 100
 34
C 650  2950
34
 86.7647  86.8
‫ מספר מקרים‬n
‫ המחלקה בה נמצא האחוזון‬Xm
Xm ‫ גבול אמיתי עליון של‬L1
Xm ‫ גבול אמיתי תחתון של‬L0
Xm ‫ המחלקה הקודמת ל‬Xm-1
‫‪ .2‬מהו האחוזון המתאים ליופיו של שרק (דורג כ ‪?)7‬‬
  x  L0 
 100
Cx  
 f  x m   F  x m  1  
  L1  L 0 
 n
 7  6 
 100
C7  
 200  3200  
 10  6 
 3400
C 7  50  3200  
C 7  3250
34
1
34
 95.5882  95.6
-‫• מסקנה‬
‫• שרק יפה יותר‬
.‫מאשר חכם‬
‫‪ .3‬מהו ציון הפסיכומטרי ש ‪ 90%‬מהאוכלוסיה קיבלו‬
‫ציון נמוך או שווה לו?‬
‫• נחשב תחילה באיזו מחלקה נמצא האחוזון ה ‪90‬‬
‫‪ 90  3060‬‬
‫‪3400‬‬
‫‪C ‬‬
‫‪100‬‬
‫כעת נשתמש בנוסחא לחישוב‬
‫כלומר ‪ 672‬הינו הציון‬
‫ש ‪ 90%‬מהאוכלוסיה‬
‫קיבלו ציון נמוך או שווה‬
‫לו‬
‫‪n‬‬
‫‪100‬‬
‫‪ F  x m 1 ‬‬
‫‪100‬‬
‫‪  L1  L 0 ‬‬
‫‪f xm ‬‬
‫‪‬‬
‫‪ 700  600‬‬
‫‪ 2700‬‬
‫‪ 672‬‬
‫‪n c‬‬
‫‪xc  L0 ‬‬
‫‪3400  90‬‬
‫‪100‬‬
‫‪500‬‬
‫‪x 90  600 ‬‬
‫‪3060  2700‬‬
‫‪5‬‬
‫‪x 90  600 ‬‬
‫ציוני תקן‬
‫• זהו המרחק של ‪ X‬מממוצע ההתפלגות‪ ,‬ביחידות‬
‫‪xx‬‬
‫של סטיות תקן‪.‬‬
‫‪sx‬‬
‫‪Zx ‬‬
‫– יחידותיו המקוריות של המשתנה הצטמצמו שכן הופיעו‬
‫גם במונה וגם במכנה‬
‫– גודל ציון התקן מעיד עד כמה ‪ X‬רחוק מהממוצע‬
‫– סימן ציון התקן מעיד האם ‪ X‬קטן או גדול מהממוצע‬
‫שאלה‬
‫• בעיר א' הטמפרטורה הממוצעת באוגוסט הינה ‪28‬‬
‫וסטיית התקן הינה ‪( 2‬מעלות צלזיוס)‬
‫• בעיר ב' הטמפרטורה הממוצעת באוגוסט הינה ‪30‬‬
‫וסטיית התקן הינה ‪( 0.5‬מעלות צלזיוס)‬
‫– ביום מסויים נרשמה טמפרטורה של ‪ 32‬מעלות בשתי‬
‫הערים‪ .‬היכן טמפרטורה זו חריגה יותר?‬
‫בעיר ב' הטמפרטורה חריגה יותר‬
‫‪2‬‬
‫‪32  28‬‬
‫‪2‬‬
‫‪4‬‬
‫‪32  30‬‬
‫‪0 .5‬‬
‫‪ ‬א‪z‬‬
‫‪ ‬ב‪z‬‬
‫התפלגות ציוני תקן‬
‫אם נמיר את ההתפלגות המקורית להתפלגות ציוני‬
‫התקן נראה כי‪:‬‬
‫‪ .1‬הממוצע תמיד שווה לאפס‪.‬‬
‫‪ .2‬סטיית התקן והשונות תמיד יהיו ‪.1‬‬
‫‪ .3‬צורתה המקורית של ההתפלגות נשמרת‪.‬‬
‫נפתור קצת תרגילים‪...‬‬
‫• תרגילי כתה‬
‫• תרגילים מתוקשבים‬