Transcript Lecture10
המחלקה לניהול תעשייתי סמסטר א' ,תשע"ב רגרסיה לינארית ,ניתוח שונות ותכנון ניסויים סטטיסטיים הרצאה 10 )1חלוקה לקבוצות הומוגניות (השוואות מרובות) )2תכנון בבלוקים אקראיים דוגמה 1משיעור קודם 2 דוגמה :1חישוב סכומי הריבועים אחוז כותנה/חזרות 1 2 3 4 5 ממוצעי טיפולים 15% 7 7 15 11 9 9.8 20% 12 17 12 18 18 15.4 25% 14 18 18 19 19 17.6 30% 19 25 22 19 23 21.6 35% 7 10 11 15 11 10.8 שונות בין הטיפולים B2 =19.0304 : שונות בין התצפיות T2 =25.4784 : k 5מספר הטיפולים n j n 5מספר תצפיות בכל טיפול N 5*5 25סה"כ מספר תצפיות במדגם סכומי ריבועים: SST N T2 25 25.4784 636.96 SSB N B2 25 19.0304 475.76 SSW SST SSB 636.96-475.76 161.2 3 j y דוגמה :1טבלת ANOVA F P-Valueקריטי 0.0000 F(4,20, 0.05)=2.866 F ססטיסטי 14.76 SSמקור ()Source MS=SS/דרגות dfחופש ()df 118.94 4 475.76טיפולים (אחוזי כותנה) 8.06 20 161.2שגיאות 24 636.96סה"כ ערך סטטיסטי גדול מערך קריטי ,לכן נדחה את השערת האפס ונאמר שלפחות אחד מהטיפולים שונה מאחרים .כלומר אחוז כותנה משפיע של חוזק הבד. 4 פלט אקסל:דוגמה Anova: Single Factor Variance Average Sum 11.2 9.8 49 9.8 15.4 77 4.3 17.6 88 6.8 21.6 108 8.2 10.8 54 F crit P-value F MS 2.8660814 9.13E-06 14.75682 118.94 8.06 SUMMARY Count Groups 5Row 1 5Row 2 5Row 3 5Row 4 5Row 5 ANOVA Source of df SS Variation Between 4 475.76 Groups 20 161.2Within Groups 24 636.96Total 5 חלוקה לקבוצות הומוגניות :השוואות מרובות • קבוצה הומוגנית :קבוצה של טיפולים שביניהם לא קיים הבדל מובהק סטטיסטי. • מתי מבצעים חלוקה לקבוצות הומוגניות? כאשר בניתוח שונות דחינו את השערת האפס: H 0 : 1 2 3 k )H1 : i j for at least one pair (i,j כלומר ,התקבל כי לפחות אחד מהטיפולים שונה מהשאר. • מטרה של חלוקה לקבוצות הומוגניות: למצוא קבוצות של טיפולים שביניהם אין הבדל מובהק 6 חלוקה לקבוצות הומוגניות :השוואות מרובות • איך נבצע? • נבצע סדרה של השוואות זוגיות ,כאשר לכל זוג הטיפולים נבדוק השערות הבאות: H 0 : i j H 0 : i j 0 H1 : i j H1 : i j 0 לכל זוג טיפולים ,i≠jכאשר j=1,2,…,k ,i=1,2,..,k סה"כ מספר השוואות זוגיות שנצטרך לבצע בינתן k טיפולים: k k k 1 2 2 סטטיסטי שבעזרתו נאמוד הפרש בין התוחלות הינו הפרש מוחלט בין ממוצעים של זוג הטיפולים: yi y j 7 חלוקה לקבוצות הומוגניות :השוואות מרובות • את הבדיקה של סדרת ההשערות נבצע בעזרת מבחן מיוחד הנקרא מבחן .)Least Significant Difference( LSD • במבחן LSDנשווה בין ערך הסטטיסטי (הפרש מוחלט בין ממוצעים של זוג הטיפולים) לערך הקריטי שמחושב כך: עבור מערך מאוזן (כאשר מספר תצפיות בכל טיפול שווה :)n 2* MSE n 2 N k , LSD t מערך לא מאוזן (כאשר מספר תצפיות בכל טיפול שונה): 1 1 MSE n n j i • איזור דחייה: 8 LSD j 2 N k , LSD t yi y חלוקה לקבוצות הומוגניות :השוואות מרובות • שלבים בביצוע חלוקה לקבוצות הומוגניות: k k k 1 • לחשב מספר השוואות זוגיות: 2 2 • לבנות טבלה של הפרשים מוחלטים בין הממוצעים: בשורות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם (מלמעלה למטה). בעמודות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם (משמאל לימין). בכל תא ijשל טבלה נשים הפרש בערך מוחלט בין ממוצע שנמצא בשורה iלבין ממוצע שנמצא בשורה .j נמלא רק משולש התחתון של טבלה (מתחת לאלכסון הראשי). • אם ערך הסטטיסטי בתא מסויים גדול מערך הקריטי של ,LSDאז נדחה השערת האפס ונאמר כי קיים הבדל מובהק בין שני הטיפולים 9 דוגמה :1חלוקה לקבוצות הומוגניות נחשב ערך קריטי של מבחן :LSD 2* MSE 2*8.06 2*8.06 t 0.05 2.086 3.7454 20, n 5 5 2 2 N k , LSD t מספר השוואות זוגיות שצריך לבצע.(5*4)/2=10 : נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים: y 1 9.8 y 4 21.6 y 3 17.6 y 2 15.4 y 5 10.8 y 4 21.6 10 1 17.6 21.6 4 y 3 17.6 2.2 15.4 21.6 6.2 y 2 15.4 4.6 6.8 10.8 y 5 10.8 5.6 7.8 11.8 y 1 9.8 דוגמה :1חלוקה לקבוצות הומוגניות כעת נשווה כל הפרש בטבלה עם ערך הקריטי LSD 3.7454 אם ערך סטטיסטי גדול מערך הקריטי ,נסמן אותו בכוכבית (דחייה של השערת ה.)0- y 21.6 y 17.6 y 15.4 y 10.8 y 9.8 1 5 2 4 3 y 4 21.6 4*>3.74 1<3.74 y 3 17.6 2.2 6.2*>3.74 *4.6 *6.8 *10.8 y 5 10.8 *5.6 *7.8 *11.8 y 1 9.8 y 2 15.4 ניתוח תוצאות :התקבלו קבוצות הומוגניות הבאות: קבוצה :1טיפולים 2ו( 3-ביניהם אין הבדל מובהק) קבוצה :2טיפולים 1ו( 5-ביניהם אין הבדל מובהק) קבוצה :3טיפול ( 4שונה מובהק מכל שאר הטיפולים) מסקנה :אם מהנדס רוצה לקבל חוזק בד גבוה ביותר ,נמליץ לו להשתמש ב 30% -כותנה (טיפול 4בעל ממוצע הכי גבוה ,נמצא לבד בקבוצה) 11 דוגמה 2משיעור קודם 12 דוגמה 2פתרון אטמים/טיפולים 1 2 3 4 ממוצעי טיפולים 1 17.5 16.9 15.8 18.6 j 17.2 y 2 שונות בין הטיפולים 0.222431 B 2 שונות בין התצפיות 2.832431 T 24=N 6=k 4=nj 13 2 16.4 19.2 17.7 15.4 3 20.3 15.7 17.8 18.9 4 14.6 16.7 20.8 18.9 5 17.5 19.2 16.5 20.5 6 18.3 16.2 17.5 20.1 17.175 18.175 17.75 18.425 18.025 פלט אקסל: Anova: Single Factor SUMMARY Groups Sum Count Average Variance 1 4 68.8 17.2 1.366667 2 4 68.7 17.175 2.709167 3 4 72.7 18.175 3.769167 4 4 71 17.75 7.216667 5 4 73.7 18.425 3.155833 6 4 72.1 18.025 2.6625 דוגמה :2 בנית ANOVA ANOVA MS F P-value F crit Source of Variation SS 5.338333 Between Groups 5 1.067667 0.306801 0.902421 2.772853 62.64 Within Groups 18 3.48 67.97833 Total df 23 מסקנה :מאחר וקיבלנו שסטטיסטי קטן מ F -טבלה לא נדחה את השערת האפס ז"א אין הבדל בין התוחלות של הטיפולים .כלומר מכונות לא שונות מהותית מבחינת חוזק אטמי הגומי .אין צורך לבצע חלוקה לקבוצות הומוגניות, היות וגם כך קיבלנו שאין הבדל בין הטיפולים ,כלומר כל הטיפולים שייכים 14 לאותה קבוצה. תכנון בבלוקים אקראים • מתי משתמשים? – עד עתה התייחסנו לכל יחידות הניסוי כהומוגניות (כלומר, אין הבדלים מובהקים בין יחידות) והקצאנו טיפולים בין היחידות בצורה אקראית. – מה קורה כאשר יחידות הניסוי מתחלקות למספר קבוצות הומוגניות? – לדוגמה :רוצים לבצע ניסוי שמטרתו לבדוק השפעה של 3 שיטות דיאטה על רמת ההרזיה .את הנבדקים שנבחרו לניסוי (יחידות ניסוי) ניתן לחלק ל 4-קבוצות לפי משקלם ההתחלתי :בעלי משקל עודף גבוה ,בעלי משקל עודף בינוני ,בעלי משקל עודף נמוך ,ללא משקל עודף. 15 תכנון בבלוקים אקראים –אם נחלק את הטיפולים ליחידות הניסוי בצורה אקראית ללא התייחסות להבדלים במשקלם ,אזי יתכן שלא נהיה מסוגלים להסיק מסקנות חד-משמעיות מניתוח תוצאות הניסוי. –כלומר ,אם מניתוח שונות והשוואות זוגיות התקבל ששיטת דיאטה מס' 1מביאה להורדת משקל הכי גבוהה ,לא נהיה בטוחים ,האם תוצאה זו נובעת אכן מטיב דיאטה מס' 1או מסיבות אחרות שקשורות להבדלים במשקל ההתחלתי בין הקבוצות .למשל ,יתכן טיפול 1ניתן לרוב לנבדקים מקבוצה של בעלי משקל עודף. –על מנת למנוע מצב כזה ,במקרה של אי-הומוגניות ביחידות הניסוי משתמשים בתכנון ניסוי בבלקוים אקראים. –(בתכנון זה נדאג שכל קבוצת משקל תקבל כל סוגים של דיאטה) 16 תכנון בבלוקים אקראים • איך משתמשים? – בתכנון ניסויים בבלוקים אקראים מחלקים כל קבוצה של יחידות הניסוי ל b-קבוצות הומוגניות. – הקבוצות ההומוגניות האלו נקראות בלוקים. – את הטיפולים מקציאים באופן אקראי ליחידות הניסוי בכל בלוק – טיפול אחד לכל יחידת ניסוי בכל בלוק. – מטרת הניסוי נשארת אותה מטרה כמו בתכנון חד-כיווני רגיל ,כלומר ללמצוא הבדלים בין הטיפולים ,אך תכנון הניסוי שונה. 17 דוגמה בניסוי נעשה השוואה בין 3סוגים של תמיסות לחומרי ניקוי .השוואה נעשית על מנת לחקור את מידת ההצלחה של כל חומר ניקוי במניעת גידול החיידקים במיכלי חלב תעשייתיים של 20ליטר. את הניסוי מבצעים במעבדה וקיימת מגבלה של מספר חזרות שניתן לעשות ביום – 3חזרות .מכיוון שימים עלולים להוות מקור פוטנציאלי נוסף לשונות ,המהנדס החליט לתכנן ניסוי לפי בלוקים אקראים ,כאשר ימים הינם בלוקים .בכל יום עושים בדיקה של כל 3חומרי ניקוי. 18 דוגמה :נתונים 19 תכנון בבלוקים אקראים -מודל 20 פירוק סכום הריבועים SST y y 2 ij i 2 yjy yij yi 2 j SSE=SSW k yi y i 2 j b y j y i SSB j SSA כאשר: - y jממוצע התצפיות של טיפול ה( j -על פני כל הבלוקים) - yiממוצע התצפיות השייכות לבלוק הi - - yממוצע של כל Nתצפיות 21 נוסחאות מקוצרות לחישוב סכומי ריבועים SSA N A2 SSB N B2 SST N N2 SSE SST SSA SSB כאשר: - A2שונות (אוכלוסיה) של ממוצעי הטיפולים 2 - Bשונות (אוכלוסיה) של ממוצעי הבלוקים 2 - Nשונות (אוכלוסיה) של כל Nתצפיות 22 ניתוח תוצאות הניסוי מתבצע בשלבים הבאים: שלב א' – בדיקת טיב התכנון נבדוק את ההשערות הבוחנות טיב תכנון הניסוי לפי בלוקים: b H 0 : 1 2 3 )H1 : i j for at least one pair (i,j במידה בשלב זה לא נדחה את השערת האפס (כלומר ,תכנון לפי בלוקים היה מיותר) ,מבצעים שלבים ב' ו-ג' לפי טבלת ניתוח שונות חד-כיווני רגיל. שלב ב' – בדיקת השפעת הטיפולים נבדוק את ההשערות הבוחנות השפעת הטיפולים על משתנה התלוי: k H0 : 1 2 3 )H1 : i j for at least one pair (i,j שלב ג' – חלוקה לקבוצות הומוגניות ,מסקנות והמלצות במידה ודחינו השערת האפס בשלב ב' ,נבצע חלוקה לקבוצות הומוגניות בעזרת מבחן LSDכאשר נחשב ערך קריטי לפי נוסחא: 23 2* MSE b 2 k 1 b 1, LSD t )ANOVA( טבלת ניתוח שונות מקורSS )Source( דרגותMS=SS/df )df( חופש טיפוליםSSA k-1 בלוקיםSSB b-1 שגיאותSSE (k-1)(b-1) - סה"כSST Total N-1 F2 Fb1, k 1b1, F1 Fk 1, k 1b1, SSA MSA k 1 SSB MSB b 1 MSE F ססטיסטי F1 F2 קריטיF MSA MSE Fk 1, k 1b1, MSB MSE Fb1, k 1b1, SSE k 1 b 1 :שלב א' – בדיקת טיב התכנון לפי בלוקים :שלב ב' – בדיקת השפעת הטיפולים :איזורי דחייה 24 דוגמה :חישוב ממוצעים ושונויות 58.625 92.243 155.19 A2 B2 N2 N=12 k=3 b=4 25 ימים (בלוקים) 4 3 2 1 תמיסה (טיפולים) 23 39 18 22 13 1 25.25 44 17 24 16 2 8 22 1 4 5 3 35 12 11.333 16.667 yj yi דוגמה :בניית טבלת ,ANOVAביצוע שלבים א'+ב' החלטה Fקריטי Fססטיסטי דרגות MS=SS/df חופש df SSמקור שלב ב': דוחים 40.717042 5.1432528 351.75 2 שלב א': דוחים 42.710611 4.7570627 368.97222 1106.9167 3בלוקים 8.6388889 51.833333 6שגיאות 11 26 703.5טיפולים 1862.25סה"כ דוגמה :שלב ג' – חלוקה לקבוצות הומוגניות (מבחן )LSD נחשב ערך קריטי של מבחן :LSD 2* MSE 2*8.63 LSD t 2.447 5.0855 k 1 b 1, b 4 2 מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 : נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים: y3 8 y 2 25.25 y 1 23 y 2 25.25 *15 27 2.25 y 1 23 *17.25 y3 8 דוגמה :שלב ג' – חלוקה לקבוצות הומוגניות (מבחן )LSD ניתוח תוצאות המבחן וחלוקה לקבוצות הומוגניות .התקבל כי: y 1 y 2 2.25 5.0855 אין הבדל מובהק בין טיפול 1וטיפול :2 y 1 y 3 15* 5.0855 יש הבדל מובהק בין טיפול 1וטיפול :3 יש הבדל מובהק בין טיפול 2וטיפול y 2 y 3 17.25* 5.0855 :3 טיפולים אשר אין ביניהם הבדל מובהק ,יהיו ביחד באותה קבוצה. לכן התקבלו קבוצות הבאות: קבוצה ( Aטיפולים )2 ,1 קבוצה ( Bטיפול )3 מסקנה :אם רוצים מקסימום בערך של משתנה תלוי ,נמליץ על קבוצה A (טיפול 1או .)2 אם רוצים מינימום של משתנה התלוי ,נמליץ על קבוצה ( Bטיפול .)3 28 פלט אקסל:דוגמה Anova: Two-Factor Without Replication Variance Average 127.3333 23 168.9167 25.25 90 8 Sum 92 101 32 32.33333 11.33333 121.3333 16.66667 91 12 133 35 F crit P-value F MS 5.143253 0.000323 40.71704 351.75 4.757063 0.000192 42.71061 368.9722 8.638889 Count SUMMARY 4 4 4 1 2 3 34 50 36 105 df 3 1 3 2 3 3 3 4 ANOVA SS Source of Variation 2 703.5Rows 3 1106.917Columns 6 51.83333Error 11 1862.25Total 29 דוגמה 2 30 פלט אקסל:2 דוגמה Anova: Two-Factor Without Replication Variance Average 0.101733 0.516667 0.121033 0.606667 0.1303 0.67 0.125633 1.156667 0.1911 1.27 Sum 1.55 1.82 2.01 3.47 3.81 0.145 0.11942 0.09515 5.55 4.96 2.15 1.11 0.992 0.43 F crit P-value F MS 3.837853 1.61E-07 146.8903 0.35474 4.45897 4.33E-08 273.3499 0.66014 0.002415 df 4 2 8 Count 3 3 3 3 3 SUMMARY 15-24 25-34 35-44 45-54 55-64 דיאטת רמת שומן נמוכה דיאטת רמת שומן בינונית דיאטת רמת שומן גבוהה ANOVA SS Source of Variation 1.41896 Rows 1.32028 Columns 0.01932 Error 5 5 5 31 דוגמה :2פתרון סעיף ( 1שלב א') – בדיקת טיב התכנון לפי גיל נבדוק את ההשערות הבאות: סעיף ( 2שלב ב') – בדיקת הבדל בין 3שיטות דיאטה (בדיקת השפעת הטיפולים) נבדוק את ההשערות הבאות: 32 דוגמה :2פתרון סעיף ( 3שלב ג') – חלוקה לקבוצות הומוגניות נחשב ערך קריטי של מבחן :LSD 2MSE 2*0.0024 LSD t 2.447 0.0716 k 1 b 1, b 5 2 מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 : נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים: y 1 1.11 y 2 0.992 y 3 0.43 y 1 1.11 *0.562 *0.118 y 2 0.992 *0.68 y 3 0.43 התקבל כי כל הפרש גדול מערך הסטטיסטי .LSDכלומר ,כל טיפול שונה מובהק משני האחרים (סה"כ 3קבוצות הומוגניות הרי כל טיפול הינו קבוצה) .המלצה :על מנת לקבל משתנה תלוי הגדול ביותר ,נמליץ על טיפול ,1כיוון שממוצע הטיפול הינו גבוה ביותר והוא נמצא בקבוצה לבד. 33