Lecture10

Transcript Lecture10

‫המחלקה לניהול תעשייתי‬
‫סמסטר א'‪ ,‬תשע"ב‬
‫רגרסיה לינארית‪ ,‬ניתוח שונות ותכנון‬
‫ניסויים סטטיסטיים‬
‫הרצאה ‪10‬‬
‫‪ )1‬חלוקה לקבוצות הומוגניות‬
‫(השוואות מרובות)‬
‫‪ )2‬תכנון בבלוקים אקראיים‬
‫דוגמה ‪ 1‬משיעור קודם‬
‫‪2‬‬
‫דוגמה ‪ :1‬חישוב סכומי הריבועים‬
‫אחוז כותנה‪/‬חזרות‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫ממוצעי טיפולים‬
‫‪15%‬‬
‫‪7‬‬
‫‪7‬‬
‫‪15‬‬
‫‪11‬‬
‫‪9‬‬
‫‪9.8‬‬
‫‪20%‬‬
‫‪12‬‬
‫‪17‬‬
‫‪12‬‬
‫‪18‬‬
‫‪18‬‬
‫‪15.4‬‬
‫‪25%‬‬
‫‪14‬‬
‫‪18‬‬
‫‪18‬‬
‫‪19‬‬
‫‪19‬‬
‫‪17.6‬‬
‫‪30%‬‬
‫‪19‬‬
‫‪25‬‬
‫‪22‬‬
‫‪19‬‬
‫‪23‬‬
‫‪21.6‬‬
‫‪35%‬‬
‫‪7‬‬
‫‪10‬‬
‫‪11‬‬
‫‪15‬‬
‫‪11‬‬
‫‪10.8‬‬
‫שונות בין הטיפולים‪ B2 =19.0304 :‬‬
‫שונות בין התצפיות‪ T2 =25.4784 :‬‬
‫‪ k  5‬מספר הטיפולים‬
‫‪ n j  n  5‬מספר תצפיות בכל טיפול‬
‫‪ N  5*5  25‬סה"כ מספר תצפיות במדגם‬
‫סכומי ריבועים‪:‬‬
‫‪SST  N  T2  25 25.4784  636.96‬‬
‫‪SSB  N  B2  25 19.0304  475.76‬‬
‫‪SSW  SST  SSB  636.96-475.76  161.2‬‬
‫‪3‬‬
‫‪j‬‬
‫‪y‬‬
‫דוגמה ‪ :1‬טבלת ‪ANOVA‬‬
‫‪ F P-Value‬קריטי‬
‫‪0.0000‬‬
‫‪F(4,20,‬‬
‫‪0.05)=2.866‬‬
‫‪F‬‬
‫ססטיסטי‬
‫‪14.76‬‬
‫‪ SS‬מקור‬
‫(‪)Source‬‬
‫‪ MS=SS/‬דרגות‬
‫‪ df‬חופש‬
‫(‪)df‬‬
‫‪118.94‬‬
‫‪4‬‬
‫‪ 475.76‬טיפולים‬
‫(אחוזי‬
‫כותנה)‬
‫‪8.06‬‬
‫‪20‬‬
‫‪ 161.2‬שגיאות‬
‫‪24‬‬
‫‪ 636.96‬סה"כ‬
‫ערך סטטיסטי גדול מערך קריטי‪ ,‬לכן נדחה את השערת האפס‬
‫ונאמר שלפחות אחד מהטיפולים שונה מאחרים‪ .‬כלומר אחוז כותנה‬
‫משפיע של חוזק הבד‪.‬‬
‫‪4‬‬
‫ פלט אקסל‬:‫דוגמה‬
Anova: Single Factor
Variance Average Sum
11.2
9.8
49
9.8
15.4
77
4.3
17.6
88
6.8
21.6 108
8.2
10.8
54
F crit
P-value
F
MS
2.8660814 9.13E-06 14.75682 118.94
8.06
SUMMARY
Count
Groups
5Row 1
5Row 2
5Row 3
5Row 4
5Row 5
ANOVA
Source of
df
SS
Variation
Between
4 475.76
Groups
20 161.2Within Groups
24 636.96Total
5
‫חלוקה לקבוצות הומוגניות‪ :‬השוואות מרובות‬
‫• קבוצה הומוגנית‪ :‬קבוצה של טיפולים שביניהם לא‬
‫קיים הבדל מובהק סטטיסטי‪.‬‬
‫• מתי מבצעים חלוקה לקבוצות הומוגניות?‬
‫כאשר בניתוח שונות דחינו את השערת האפס‪:‬‬
‫‪H 0 : 1  2  3  k‬‬
‫)‪H1 : i   j for at least one pair (i,j‬‬
‫כלומר‪ ,‬התקבל כי לפחות אחד מהטיפולים שונה מהשאר‪.‬‬
‫• מטרה של חלוקה לקבוצות הומוגניות‪:‬‬
‫למצוא קבוצות של טיפולים שביניהם אין הבדל מובהק‬
‫‪6‬‬
‫חלוקה לקבוצות הומוגניות‪ :‬השוואות מרובות‬
‫• איך נבצע?‬
‫• נבצע סדרה של השוואות זוגיות‪ ,‬כאשר לכל זוג הטיפולים‬
‫נבדוק השערות הבאות‪:‬‬
‫‪H 0 : i   j‬‬
‫‪H 0 : i   j  0‬‬
‫‪‬‬
‫‪H1 : i   j‬‬
‫‪H1 : i   j  0‬‬
‫לכל זוג טיפולים ‪ ,i≠j‬כאשר ‪j=1,2,…,k ,i=1,2,..,k‬‬
‫סה"כ מספר השוואות זוגיות שנצטרך לבצע בינתן ‪k‬‬
‫טיפולים‪:‬‬
‫‪ k  k  k  1‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪ 2‬‬
‫סטטיסטי שבעזרתו נאמוד הפרש בין התוחלות הינו הפרש‬
‫מוחלט בין ממוצעים של זוג הטיפולים‪:‬‬
‫‪yi  y j‬‬
‫‪7‬‬
‫חלוקה לקבוצות הומוגניות‪ :‬השוואות מרובות‬
‫• את הבדיקה של סדרת ההשערות נבצע בעזרת מבחן מיוחד‬
‫הנקרא מבחן ‪.)Least Significant Difference( LSD‬‬
‫• במבחן ‪ LSD‬נשווה בין ערך הסטטיסטי (הפרש מוחלט בין‬
‫ממוצעים של זוג הטיפולים) לערך הקריטי שמחושב כך‪:‬‬
‫עבור מערך מאוזן (כאשר מספר תצפיות בכל טיפול שווה ‪:)n‬‬
‫‪2* MSE‬‬
‫‪n‬‬
‫‪‬‬
‫‪2‬‬
‫‪N k ,‬‬
‫‪LSD  t‬‬
‫מערך לא מאוזן (כאשר מספר תצפיות בכל טיפול שונה)‪:‬‬
‫‪1 1‬‬
‫‪MSE   ‬‬
‫‪n n ‬‬
‫‪j ‬‬
‫‪ i‬‬
‫• איזור דחייה‪:‬‬
‫‪8‬‬
‫‪ LSD‬‬
‫‪j‬‬
‫‪‬‬
‫‪2‬‬
‫‪N k ,‬‬
‫‪LSD  t‬‬
‫‪yi y‬‬
‫חלוקה לקבוצות הומוגניות‪ :‬השוואות מרובות‬
‫• שלבים בביצוע חלוקה לקבוצות הומוגניות‪:‬‬
‫‪ k  k  k  1‬‬
‫• לחשב מספר השוואות זוגיות‪:‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪ ‬‬
‫• לבנות טבלה של הפרשים מוחלטים בין הממוצעים‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫בשורות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם‬
‫(מלמעלה למטה)‪.‬‬
‫בעמודות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם‬
‫(משמאל לימין)‪.‬‬
‫בכל תא ‪ ij‬של טבלה נשים הפרש בערך מוחלט בין ממוצע שנמצא‬
‫בשורה ‪ i‬לבין ממוצע שנמצא בשורה ‪.j‬‬
‫נמלא רק משולש התחתון של טבלה (מתחת לאלכסון הראשי)‪.‬‬
‫• אם ערך הסטטיסטי בתא מסויים גדול מערך הקריטי‬
‫של ‪ ,LSD‬אז נדחה השערת האפס ונאמר כי קיים‬
‫הבדל מובהק בין שני הטיפולים‬
‫‪9‬‬
‫דוגמה ‪ :1‬חלוקה לקבוצות הומוגניות‬
‫נחשב ערך קריטי של מבחן ‪:LSD‬‬
‫‪2* MSE‬‬
‫‪2*8.06‬‬
‫‪2*8.06‬‬
‫‪ t 0.05‬‬
‫‪ 2.086‬‬
‫‪ 3.7454‬‬
‫‪20,‬‬
‫‪n‬‬
‫‪5‬‬
‫‪5‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪N k ,‬‬
‫‪LSD  t‬‬
‫מספר השוואות זוגיות שצריך לבצע‪.(5*4)/2=10 :‬‬
‫נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים‪:‬‬
‫‪y 1  9.8‬‬
‫‪y 4  21.6 y 3  17.6 y 2  15.4 y 5  10.8‬‬
‫‪y 4  21.6‬‬
‫‪10‬‬
‫‪1‬‬
‫‪17.6  21.6  4‬‬
‫‪y 3  17.6‬‬
‫‪2.2‬‬
‫‪15.4  21.6  6.2‬‬
‫‪y 2  15.4‬‬
‫‪4.6‬‬
‫‪6.8‬‬
‫‪10.8‬‬
‫‪y 5  10.8‬‬
‫‪5.6‬‬
‫‪7.8‬‬
‫‪11.8‬‬
‫‪y 1  9.8‬‬
‫דוגמה ‪ :1‬חלוקה לקבוצות הומוגניות‬
‫כעת נשווה כל הפרש בטבלה עם ערך הקריטי ‪LSD  3.7454‬‬
‫אם ערך סטטיסטי גדול מערך הקריטי‪ ,‬נסמן אותו בכוכבית (דחייה של השערת‬
‫ה‪.)0-‬‬
‫‪y  21.6‬‬
‫‪y  17.6 y  15.4 y  10.8‬‬
‫‪y  9.8‬‬
‫‪1‬‬
‫‪5‬‬
‫‪2‬‬
‫‪4‬‬
‫‪3‬‬
‫‪y 4  21.6‬‬
‫‪4*>3.74‬‬
‫‪1<3.74‬‬
‫‪y 3  17.6‬‬
‫‪2.2‬‬
‫‪6.2*>3.74‬‬
‫*‪4.6‬‬
‫*‪6.8‬‬
‫*‪10.8‬‬
‫‪y 5  10.8‬‬
‫*‪5.6‬‬
‫*‪7.8‬‬
‫*‪11.8‬‬
‫‪y 1  9.8‬‬
‫‪y 2  15.4‬‬
‫ניתוח תוצאות‪ :‬התקבלו קבוצות הומוגניות הבאות‪:‬‬
‫קבוצה ‪ :1‬טיפולים ‪ 2‬ו‪( 3-‬ביניהם אין הבדל מובהק)‬
‫קבוצה ‪ :2‬טיפולים ‪ 1‬ו‪( 5-‬ביניהם אין הבדל מובהק)‬
‫קבוצה ‪ :3‬טיפול ‪( 4‬שונה מובהק מכל שאר הטיפולים)‬
‫מסקנה‪ :‬אם מהנדס רוצה לקבל חוזק בד גבוה ביותר‪ ,‬נמליץ לו להשתמש ב‪ 30% -‬כותנה‬
‫(טיפול ‪ 4‬בעל ממוצע הכי גבוה‪ ,‬נמצא לבד בקבוצה)‬
‫‪11‬‬
‫דוגמה ‪ 2‬משיעור קודם‬
‫‪12‬‬
‫דוגמה ‪ 2‬פתרון‬
‫אטמים‪/‬טיפולים‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫ממוצעי טיפולים‬
‫‪1‬‬
‫‪17.5‬‬
‫‪16.9‬‬
‫‪15.8‬‬
‫‪18.6‬‬
‫‪j‬‬
‫‪17.2 y‬‬
‫‪2‬‬
‫שונות בין הטיפולים ‪0.222431  B‬‬
‫‪2‬‬
‫שונות בין התצפיות ‪2.832431  T‬‬
‫‪24=N‬‬
‫‪6=k‬‬
‫‪4=nj‬‬
‫‪13‬‬
‫‪2‬‬
‫‪16.4‬‬
‫‪19.2‬‬
‫‪17.7‬‬
‫‪15.4‬‬
‫‪3‬‬
‫‪20.3‬‬
‫‪15.7‬‬
‫‪17.8‬‬
‫‪18.9‬‬
‫‪4‬‬
‫‪14.6‬‬
‫‪16.7‬‬
‫‪20.8‬‬
‫‪18.9‬‬
‫‪5‬‬
‫‪17.5‬‬
‫‪19.2‬‬
‫‪16.5‬‬
‫‪20.5‬‬
‫‪6‬‬
‫‪18.3‬‬
‫‪16.2‬‬
‫‪17.5‬‬
‫‪20.1‬‬
‫‪17.175‬‬
‫‪18.175‬‬
‫‪17.75‬‬
‫‪18.425‬‬
‫‪18.025‬‬
‫פלט אקסל‪:‬‬
‫‪Anova: Single Factor‬‬
‫‪SUMMARY‬‬
‫‪Groups‬‬
‫‪Sum‬‬
‫‪Count‬‬
‫‪Average‬‬
‫‪Variance‬‬
‫‪1‬‬
‫‪4‬‬
‫‪68.8‬‬
‫‪17.2‬‬
‫‪1.366667‬‬
‫‪2‬‬
‫‪4‬‬
‫‪68.7‬‬
‫‪17.175‬‬
‫‪2.709167‬‬
‫‪3‬‬
‫‪4‬‬
‫‪72.7‬‬
‫‪18.175‬‬
‫‪3.769167‬‬
‫‪4‬‬
‫‪4‬‬
‫‪71‬‬
‫‪17.75‬‬
‫‪7.216667‬‬
‫‪5‬‬
‫‪4‬‬
‫‪73.7‬‬
‫‪18.425‬‬
‫‪3.155833‬‬
‫‪6‬‬
‫‪4‬‬
‫‪72.1‬‬
‫‪18.025‬‬
‫‪2.6625‬‬
‫דוגמה ‪:2‬‬
‫בנית‬
‫‪ANOVA‬‬
‫‪ANOVA‬‬
‫‪MS‬‬
‫‪F‬‬
‫‪P-value‬‬
‫‪F crit‬‬
‫‪Source of Variation‬‬
‫‪SS‬‬
‫‪5.338333 Between Groups‬‬
‫‪5‬‬
‫‪1.067667‬‬
‫‪0.306801‬‬
‫‪0.902421‬‬
‫‪2.772853‬‬
‫‪62.64 Within Groups‬‬
‫‪18‬‬
‫‪3.48‬‬
‫‪67.97833 Total‬‬
‫‪df‬‬
‫‪23‬‬
‫מסקנה‪ :‬מאחר וקיבלנו שסטטיסטי קטן מ‪ F -‬טבלה לא נדחה את השערת‬
‫האפס ז"א אין הבדל בין התוחלות של הטיפולים‪ .‬כלומר מכונות לא שונות‬
‫מהותית מבחינת חוזק אטמי הגומי‪ .‬אין צורך לבצע חלוקה לקבוצות הומוגניות‪,‬‬
‫היות וגם כך קיבלנו שאין הבדל בין הטיפולים‪ ,‬כלומר כל הטיפולים שייכים‬
‫‪14‬‬
‫לאותה קבוצה‪.‬‬
‫תכנון בבלוקים אקראים‬
‫• מתי משתמשים?‬
‫– עד עתה התייחסנו לכל יחידות הניסוי כהומוגניות (כלומר‪,‬‬
‫אין הבדלים מובהקים בין יחידות) והקצאנו טיפולים בין‬
‫היחידות בצורה אקראית‪.‬‬
‫– מה קורה כאשר יחידות הניסוי מתחלקות למספר קבוצות‬
‫הומוגניות?‬
‫– לדוגמה‪ :‬רוצים לבצע ניסוי שמטרתו לבדוק השפעה של ‪3‬‬
‫שיטות דיאטה על רמת ההרזיה‪ .‬את הנבדקים שנבחרו‬
‫לניסוי (יחידות ניסוי) ניתן לחלק ל‪ 4-‬קבוצות לפי משקלם‬
‫ההתחלתי‪ :‬בעלי משקל עודף גבוה‪ ,‬בעלי משקל עודף‬
‫בינוני‪ ,‬בעלי משקל עודף נמוך‪ ,‬ללא משקל עודף‪.‬‬
‫‪15‬‬
‫תכנון בבלוקים אקראים‬
‫–אם נחלק את הטיפולים ליחידות הניסוי בצורה אקראית ללא‬
‫התייחסות להבדלים במשקלם‪ ,‬אזי יתכן שלא נהיה מסוגלים‬
‫להסיק מסקנות חד‪-‬משמעיות מניתוח תוצאות הניסוי‪.‬‬
‫–כלומר‪ ,‬אם מניתוח שונות והשוואות זוגיות התקבל ששיטת‬
‫דיאטה מס' ‪ 1‬מביאה להורדת משקל הכי גבוהה‪ ,‬לא נהיה‬
‫בטוחים‪ ,‬האם תוצאה זו נובעת אכן מטיב דיאטה מס' ‪ 1‬או‬
‫מסיבות אחרות שקשורות להבדלים במשקל ההתחלתי בין‬
‫הקבוצות‪ .‬למשל‪ ,‬יתכן טיפול ‪ 1‬ניתן לרוב לנבדקים מקבוצה‬
‫של בעלי משקל עודף‪.‬‬
‫–על מנת למנוע מצב כזה‪ ,‬במקרה של אי‪-‬הומוגניות ביחידות‬
‫הניסוי משתמשים בתכנון ניסוי בבלקוים אקראים‪.‬‬
‫–(בתכנון זה נדאג שכל קבוצת משקל תקבל כל סוגים של‬
‫דיאטה)‬
‫‪16‬‬
‫תכנון בבלוקים אקראים‬
‫• איך משתמשים?‬
‫– בתכנון ניסויים בבלוקים אקראים מחלקים כל קבוצה של‬
‫יחידות הניסוי ל‪ b-‬קבוצות הומוגניות‪.‬‬
‫– הקבוצות ההומוגניות האלו נקראות בלוקים‪.‬‬
‫– את הטיפולים מקציאים באופן אקראי ליחידות הניסוי בכל‬
‫בלוק – טיפול אחד לכל יחידת ניסוי בכל בלוק‪.‬‬
‫– מטרת הניסוי נשארת אותה מטרה כמו בתכנון חד‪-‬כיווני‬
‫רגיל‪ ,‬כלומר ללמצוא הבדלים בין הטיפולים‪ ,‬אך תכנון‬
‫הניסוי שונה‪.‬‬
‫‪17‬‬
‫דוגמה‬
‫בניסוי נעשה השוואה בין ‪ 3‬סוגים של תמיסות לחומרי‬
‫ניקוי‪ .‬השוואה נעשית על מנת לחקור את מידת‬
‫ההצלחה של כל חומר ניקוי במניעת גידול החיידקים‬
‫במיכלי חלב תעשייתיים של ‪ 20‬ליטר‪.‬‬
‫את הניסוי מבצעים במעבדה וקיימת מגבלה של מספר‬
‫חזרות שניתן לעשות ביום – ‪ 3‬חזרות‪ .‬מכיוון שימים‬
‫עלולים להוות מקור פוטנציאלי נוסף לשונות‪ ,‬המהנדס‬
‫החליט לתכנן ניסוי לפי בלוקים אקראים‪ ,‬כאשר ימים‬
‫הינם בלוקים‪ .‬בכל יום עושים בדיקה של כל ‪ 3‬חומרי‬
‫ניקוי‪.‬‬
‫‪18‬‬
‫דוגמה‪ :‬נתונים‬
‫‪19‬‬
‫תכנון בבלוקים אקראים ‪ -‬מודל‬
‫‪20‬‬
‫פירוק סכום הריבועים‬
‫‪SST    y  y  ‬‬
‫‪2‬‬
‫‪ij‬‬
‫‪i‬‬
‫‪2‬‬
‫‪‬‬
‫‪yjy‬‬
‫‪    yij  yi‬‬
‫‪2‬‬
‫‪j‬‬
‫‪SSE=SSW‬‬
‫‪ k   yi  y‬‬
‫‪i‬‬
‫‪2‬‬
‫‪‬‬
‫‪j‬‬
‫‪ b  y j  y‬‬
‫‪i‬‬
‫‪SSB‬‬
‫‪j‬‬
‫‪SSA‬‬
‫כאשר‪:‬‬
‫‪ - y j‬ממוצע התצפיות של טיפול ה‪( j -‬על פני כל‬
‫הבלוקים)‬
‫‪ - yi‬ממוצע התצפיות השייכות לבלוק ה‪i -‬‬
‫‪ - y‬ממוצע של כל ‪ N‬תצפיות‬
‫‪21‬‬
‫נוסחאות מקוצרות לחישוב סכומי ריבועים‬
‫‪SSA  N  A2‬‬
‫‪SSB  N  B2‬‬
‫‪SST  N  N2‬‬
‫‪SSE  SST  SSA  SSB‬‬
‫כאשר‪:‬‬
‫‪ -  A2‬שונות (אוכלוסיה) של ממוצעי הטיפולים‬
‫‪2‬‬
‫‪‬‬
‫‪ - B‬שונות (אוכלוסיה) של ממוצעי הבלוקים‬
‫‪2‬‬
‫‪‬‬
‫‪ - N‬שונות (אוכלוסיה) של כל ‪ N‬תצפיות‬
‫‪22‬‬
‫ניתוח תוצאות הניסוי מתבצע בשלבים הבאים‪:‬‬
‫שלב א' – בדיקת טיב התכנון‬
‫נבדוק את ההשערות הבוחנות טיב תכנון הניסוי לפי בלוקים‪:‬‬
‫‪b‬‬
‫‪H 0 : 1  2  3 ‬‬
‫)‪H1 : i   j for at least one pair (i,j‬‬
‫במידה בשלב זה לא נדחה את השערת האפס (כלומר‪ ,‬תכנון לפי בלוקים‬
‫היה מיותר)‪ ,‬מבצעים שלבים ב' ו‪-‬ג' לפי טבלת ניתוח שונות חד‪-‬כיווני רגיל‪.‬‬
‫שלב ב' – בדיקת השפעת הטיפולים‬
‫נבדוק את ההשערות הבוחנות השפעת הטיפולים על משתנה התלוי‪:‬‬
‫‪k‬‬
‫‪H0 :  1   2   3 ‬‬
‫)‪H1 :  i   j for at least one pair (i,j‬‬
‫שלב ג' – חלוקה לקבוצות הומוגניות‪ ,‬מסקנות והמלצות‬
‫במידה ודחינו השערת האפס בשלב ב'‪ ,‬נבצע חלוקה לקבוצות הומוגניות‬
‫בעזרת מבחן ‪ LSD‬כאשר נחשב ערך קריטי לפי נוסחא‪:‬‬
‫‪23‬‬
‫‪2* MSE‬‬
‫‪b‬‬
‫‪‬‬
‫‪2‬‬
‫‪ k 1 b 1,‬‬
‫‪LSD  t‬‬
)ANOVA( ‫טבלת ניתוח שונות‬
‫ מקור‬SS
)Source(
‫ דרגות‬MS=SS/df
)df( ‫חופש‬
‫ טיפולים‬SSA
k-1
‫ בלוקים‬SSB
b-1
‫ שגיאות‬SSE
(k-1)(b-1)
- ‫ סה"כ‬SST
Total
N-1
F2  Fb1, k 1b1,
F1  Fk 1, k 1b1,
SSA
MSA 
k 1
SSB
MSB 
b 1
MSE 
F
‫ססטיסטי‬
F1 
F2 
‫ קריטי‬F
MSA
MSE
Fk 1, k 1b1,
MSB
MSE
Fb1, k 1b1,
SSE
 k  1 b  1
:‫שלב א' – בדיקת טיב התכנון לפי בלוקים‬
:‫שלב ב' – בדיקת השפעת הטיפולים‬
:‫איזורי דחייה‬
24
‫דוגמה‪ :‬חישוב ממוצעים ושונויות‬
‫‪58.625‬‬
‫‪92.243‬‬
‫‪155.19‬‬
‫‪ A2‬‬
‫‪ B2‬‬
‫‪ N2‬‬
‫‪N=12‬‬
‫‪k=3‬‬
‫‪b=4‬‬
‫‪25‬‬
‫ימים (בלוקים)‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫תמיסה‬
‫(טיפולים)‬
‫‪23‬‬
‫‪39‬‬
‫‪18‬‬
‫‪22‬‬
‫‪13‬‬
‫‪1‬‬
‫‪25.25‬‬
‫‪44‬‬
‫‪17‬‬
‫‪24‬‬
‫‪16‬‬
‫‪2‬‬
‫‪8‬‬
‫‪22‬‬
‫‪1‬‬
‫‪4‬‬
‫‪5‬‬
‫‪3‬‬
‫‪35‬‬
‫‪12‬‬
‫‪11.333 16.667‬‬
‫‪yj‬‬
‫‪yi‬‬
‫דוגמה‪ :‬בניית טבלת ‪ ,ANOVA‬ביצוע שלבים‬
‫א'‪+‬ב'‬
‫החלטה‬
‫‪F‬קריטי‬
‫‪F‬ססטיסטי‬
‫דרגות‬
‫‪MS=SS/df‬‬
‫חופש ‪df‬‬
‫‪ SS‬מקור‬
‫שלב ב'‪:‬‬
‫דוחים‬
‫‪40.717042 5.1432528‬‬
‫‪351.75‬‬
‫‪2‬‬
‫שלב א'‪:‬‬
‫דוחים‬
‫‪42.710611 4.7570627‬‬
‫‪368.97222‬‬
‫‪ 1106.9167 3‬בלוקים‬
‫‪8.6388889‬‬
‫‪ 51.833333 6‬שגיאות‬
‫‪11‬‬
‫‪26‬‬
‫‪ 703.5‬טיפולים‬
‫‪ 1862.25‬סה"כ‬
‫דוגמה‪ :‬שלב ג' – חלוקה לקבוצות הומוגניות‬
‫(מבחן ‪)LSD‬‬
‫נחשב ערך קריטי של מבחן ‪:LSD‬‬
‫‪2* MSE‬‬
‫‪2*8.63‬‬
‫‪LSD  t‬‬
‫‪ 2.447‬‬
‫‪ 5.0855‬‬
‫‪‬‬
‫‪ k 1 b 1,‬‬
‫‪b‬‬
‫‪4‬‬
‫‪2‬‬
‫מספר השוואות זוגיות שצריך לבצע‪.(3*2)/2=3 :‬‬
‫נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים‪:‬‬
‫‪y3 8‬‬
‫‪y 2  25.25 y 1  23‬‬
‫‪y 2  25.25‬‬
‫*‪15‬‬
‫‪27‬‬
‫‪2.25‬‬
‫‪y 1  23‬‬
‫*‪17.25‬‬
‫‪y3 8‬‬
‫דוגמה‪ :‬שלב ג' – חלוקה לקבוצות הומוגניות‬
‫(מבחן ‪)LSD‬‬
‫ניתוח תוצאות המבחן וחלוקה לקבוצות הומוגניות‪ .‬התקבל כי‪:‬‬
‫‪y 1  y 2  2.25  5.0855‬‬
‫אין הבדל מובהק בין טיפול ‪ 1‬וטיפול ‪:2‬‬
‫‪y 1  y 3  15*  5.0855‬‬
‫יש הבדל מובהק בין טיפול ‪ 1‬וטיפול ‪:3‬‬
‫יש הבדל מובהק בין טיפול ‪ 2‬וטיפול ‪y 2  y 3  17.25*  5.0855 :3‬‬
‫טיפולים אשר אין ביניהם הבדל מובהק‪ ,‬יהיו ביחד באותה קבוצה‪.‬‬
‫לכן התקבלו קבוצות הבאות‪:‬‬
‫קבוצה ‪( A‬טיפולים ‪)2 ,1‬‬
‫קבוצה ‪( B‬טיפול ‪)3‬‬
‫מסקנה‪ :‬אם רוצים מקסימום בערך של משתנה תלוי‪ ,‬נמליץ על קבוצה ‪A‬‬
‫(טיפול ‪ 1‬או ‪.)2‬‬
‫אם רוצים מינימום של משתנה התלוי‪ ,‬נמליץ על קבוצה ‪( B‬טיפול ‪.)3‬‬
‫‪28‬‬
‫ פלט אקסל‬:‫דוגמה‬
Anova: Two-Factor Without Replication
Variance Average
127.3333
23
168.9167
25.25
90
8
Sum
92
101
32
32.33333 11.33333
121.3333 16.66667
91
12
133
35
F crit
P-value
F
MS
5.143253 0.000323 40.71704
351.75
4.757063 0.000192 42.71061 368.9722
8.638889
Count
SUMMARY
4
4
4
1
2
3
34
50
36
105
df
3
1
3
2
3
3
3
4
ANOVA
SS
Source of Variation
2
703.5Rows
3 1106.917Columns
6 51.83333Error
11
1862.25Total
29
‫דוגמה ‪2‬‬
‫‪30‬‬
‫ פלט אקסל‬:2 ‫דוגמה‬
Anova: Two-Factor Without Replication
Variance Average
0.101733 0.516667
0.121033 0.606667
0.1303
0.67
0.125633 1.156667
0.1911
1.27
Sum
1.55
1.82
2.01
3.47
3.81
0.145
0.11942
0.09515
5.55
4.96
2.15
1.11
0.992
0.43
F crit
P-value
F
MS
3.837853 1.61E-07 146.8903 0.35474
4.45897 4.33E-08 273.3499 0.66014
0.002415
df
4
2
8
Count
3
3
3
3
3
SUMMARY
15-24
25-34
35-44
45-54
55-64
‫דיאטת רמת שומן נמוכה‬
‫דיאטת רמת שומן בינונית‬
‫דיאטת רמת שומן גבוהה‬
ANOVA
SS
Source of Variation
1.41896
Rows
1.32028
Columns
0.01932
Error
5
5
5
31
‫דוגמה ‪ :2‬פתרון‬
‫סעיף ‪( 1‬שלב א') – בדיקת טיב התכנון לפי גיל‬
‫נבדוק את ההשערות הבאות‪:‬‬
‫סעיף ‪( 2‬שלב ב') – בדיקת הבדל בין ‪ 3‬שיטות דיאטה (בדיקת השפעת‬
‫הטיפולים)‬
‫נבדוק את ההשערות הבאות‪:‬‬
‫‪32‬‬
‫דוגמה ‪ :2‬פתרון‬
‫סעיף ‪( 3‬שלב ג') – חלוקה לקבוצות הומוגניות‬
‫נחשב ערך קריטי של מבחן ‪:LSD‬‬
‫‪2MSE‬‬
‫‪2*0.0024‬‬
‫‪LSD  t‬‬
‫‪ 2.447‬‬
‫‪ 0.0716‬‬
‫‪‬‬
‫‪ k 1 b 1,‬‬
‫‪b‬‬
‫‪5‬‬
‫‪2‬‬
‫מספר השוואות זוגיות שצריך לבצע‪.(3*2)/2=3 :‬‬
‫נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים‪:‬‬
‫‪y 1  1.11 y 2  0.992 y 3  0.43‬‬
‫‪y 1  1.11‬‬
‫*‪0.562‬‬
‫*‪0.118‬‬
‫‪y 2  0.992‬‬
‫*‪0.68‬‬
‫‪y 3  0.43‬‬
‫התקבל כי כל הפרש גדול מערך הסטטיסטי ‪ .LSD‬כלומר‪ ,‬כל טיפול שונה‬
‫מובהק משני האחרים (סה"כ ‪ 3‬קבוצות הומוגניות הרי כל טיפול הינו‬
‫קבוצה)‪ .‬המלצה‪ :‬על מנת לקבל משתנה תלוי הגדול ביותר‪ ,‬נמליץ על‬
‫טיפול ‪ ,1‬כיוון שממוצע הטיפול הינו גבוה ביותר והוא נמצא בקבוצה לבד‪.‬‬
‫‪33‬‬

Lecture10

Transcript Lecture10

Directory