Transcript Lecture11
המחלקה לניהול תעשייתי סמסטר א' ,תשע"ב רגרסיה לינארית ,ניתוח שונות ותכנון ניסויים סטטיסטיים הרצאה 11 ניתוח שונות דו-כיווני ניתוח שונות דו-כיווני נדון כעת במקרה שבו אנו מעוניינים ללמוד על השפעה שיש לשני גורמים Aו B-על איזשהו משתנה תלוי. למשל ,בניסוי כימי מעוניינים לבחון תוצר התגובה הכימית כתוצאה מלחץ ותוצר של אותה תגובה כימית כתוצאה ממשך התגובה ,סימולטנית. דוגמה נוספת :סטודנטית איילה חקרה האם ציון של פרויקט גמר בתואר מושפע מהערות של מנחה הפרויקט במהלך הביצוע ,כאשר מנחה יכול לתת הערות מפורטות ,או הערות קצרות או לא להעיר כלל .סטודנט אחר נעם טוען כי ציון בפרויקט תלוי בסוג האנשים המבצעים :יצירתיים או לא יצירתיים .לדעתו ,ריבוי הערות של מנחה יעיל לסטודנטים לא יצירתיים ואילו סטודנטים יצירתיים לא זקוקים להערות והן לא פוגעות בעבודתם .כלומר ,לדעתו של נועם קיימת השפעה הדדית בין סוג האנשים ולבין הערות של מנחה על משתנה התלוי (ציון בפרויקט). בכל מקרה שכזה ,חשוב לא רק לבדוק את השפעת הגורמים השונים אלא גם האם יש אינטראקציה (השפעה הדדית) מהותית בין שני הגורמים אלו. במודל רב כיווני טיפול מהווה צירוף של רמות שונות של שני הגורמים. 2 דוגמה 1 בניסוי כלשהו בדקו השפעה שיש לטמפרטורה ולסוג התנור על אורך החיים של רכיב אלקטרוני מסוים .ארבעה סוגים של תנורים ושלוש רמות טמפרטורה נבחנו בניסוי 24 .דגימות נלקחו באקראי, 2דגימות בכל צירוף של טיפולים .התקבלו תוצאות הבאות: 3 O4 O3 O2 O1 260 225 214 227 229 236 259 221 246 232 181 187 273 198 179 208 206 178 198 174 219 213 194 202 תנור/טמפרטורה 500O 550O 600O מודל ניתוח שונות דו-כיווני אפקטים קבועים 4 הנחות המודל תחת השערת האפס מתקיים: 5 בדיקת השערות נבקש לבדוק 3השערות בסיסיות: (1האם קיימת השפעה הדדית בין (אינטראקציה) שני הגורמים: (2האם גורם Aמשפיע על משתנה התלוי: (3האם גורם Bמשפיע על משתנה התלוי: 6 ניתוח שונות דו-כיווני :שלבים בביצוע המודל א) בדיקת השפעת האינטראקציה בין שני הגורמים: אם )) F F ( , a 1 b 1 , ( N a bאז דוחים את השערת האפס ברמת מובהקות אלפה .אם לא ניכרת השפעה אינטרקטיבית בין שני הגורמים (כלומר ,אם לא דוחים את השערת האפס) ,ממשיכים בבדיקת השפעות הגורמים השונים (שלב ג' להלן). ב) כניסה לפלחים (שיטה לא נלמדת בקורס זה) אם דוחים את השערת האפס בשלב א' ,ברור כי השפעת הגורמים ניכרת ויש לבדוק כיצד השפעה זו מתבטאת .בודקים השפעת כל טיפול בכל גורם ביחס לכל הטיפולים של גורם השני ובונים מודל ANOVAלכל גורם. 1 7 ניתוח שונות דו-כיווני :שלבים בביצוע המודל ג) בדיקת השפעת הגורמים השונים ללא אינטראקציה. אם לא דוחים את השערת האפס בשלב א' ,ניתן לבדוק השפעה של כל גורם בנפרד. אם )) F F ( , a 1 , ( N a bאז דוחים את ההשערה בדבר זהותם של a טיפולים השייכים לגורם Aברמת מובהקות αומבצעים חלוקה לקבוצות הומוגניות עבור .)A1, A2,…, Aa אם )) F F ( , b 1 , ( N abאז דוחים את ההשערה בדבר זהותם של b טיפולים השייכים לגורם Bברמת מובהקות αומבצעים חלוקה לקבוצות הומוגניות עבור .)B1, B2,…, Bb 2 3 8 ניתוח שונות דו-כיווני :שלבים בביצוע המודל ג) (המשך) במידה ויש צורך לבצע חלוקה לקבוצות הומוגניות לגורם ראשון (,)A נשתמש במבחן ,LSDכאשר ערך הקריטי יחושב על פי נוסחא הבאה: 2 * M SE b*n N ab , L SD t 2 כאשר – bמספר הטיפולים בגורם השני – n ,מספר החזרות על מדידה של צירוף מסוים (מספר תצפיות בתא בודד של טבלת הנתונים המקורית). במידה ויש צורך לבצע חלוקה לקבוצות הומוגניות לגורם השני (,)B נשתמש במבחן ,LSDכאשר ערך הקריטי יחושב על פי נוסחא הבאה: 2 * M SE a*n N ab , L SD t 2 כאשר – aמספר הטיפולים בגורם הראשון. 9 פירוק סכום הריבועים b a n y ijk y 2 SST i 1 j 1 k 1 2 2 2 2 y y y y n y y an y y bn y y ijk ij i j ij i j i j SSE i j i k SSA SSB j SSAB 10 כיווני-) דוANOVA( טבלת ניתוח שונות מקורSS סטטיסטיF קריטיF DF MS גורם ראשוןSSA A a-1 MSA=SSA/(a-1) F2=MSA/MSE F (α,(a-1), (N-ab)) B גורם שניSSB b-1 MSB=SSB/(b-1) F3=MSB/MSE F (α, (b-1), (N-ab)) (a-1)(b-1) MSAB= F1=MSAB/MSE =SSAB/((a-1)(b-1)) N-ab MSE=SSE/(N-ab) אינטראקציהSSAB AB שגיאותSSE סה"כSST F (α, (a-1)(b-1),(Nab)) N-1=abn1 11 חישוב סכומי הריבועים – נוסחאות מקוצרות שלבים בחישוב סכומי ריבועים ובניית טבלת ניתוח שונות: (1נחשב טבלת עזר – טבלת ממוצעים ע"י חישוב ממוצע של ערכים בכל תא של טבלת נתונים מקורית. (2נחשב ממוצע של כל גורם בשוליים (פלחים). (3נחשב השונות בין ממוצעי השוליים של כל גורם. (4נחשב שונות בין ממוצעי התאים. (5נחשב שונות בין כלל התצפיות. (6נחשב סכומי ריבועים לפי נוסחאות מקוצרות: 2 A SSA N SSB N B 2 SSAB N avg SSA SSB 2 SST N T 2 SSE SST SSA SSB SSAB 12 כאשר: • – σ2Aשונות ממוצעי השוליים של גורם A • – σ2Bשונות ממוצעי השוליים של גורם B • – σ2AVGשונות בין ממוצעי התאים • – σ2Tשונות בין כלל התצפיות דוגמה –1בניית טבלת ניתוח שונות שלב א' נבנה טבלת עזר (טבלת ממוצעים): ממוצעי גורם טמפרטורה O3 O4 ()A 244.5 233.875 213 O2 Temp/Oven O1 230.5 236.5 224 500 259.5 215 180 197.5 550 212.5 195.5 196 188 600 198 ממוצע כלל ממוצעי גורם התצפיות: 203.1667 204.1667 213.6667 238.8333214.9583תנורים ()B כעת נחשב שונויות: 216.4201 206.7969 553.4774 713.2066 13 N 24 דוגמה – 1טבלת ניתוח שונות דו-כיווני החלטה לדחות לדחות לא לדחות MS F statistic F Critical 2597.042 8.129516 3.885 1654.375 5.178688 3.49 2.996 DF 2 3 521.0417 1.631016 6 319.4583 12 23 מקור SS 5194.083טמפרטורה A תנור B 4963.125 אינטראקציה 3126.25 AB שגיאה E 3833.5 סה"כ 17116.96 מסקנות מטבלת :ANOVA (1שלב א' :ניתן לראות שלא קיימת השפעה הדדית בין הטמפרטורה לסוג התנור .לכן נעבור לשלב ג'. (2שלב ג': (3טמפרטורה הינה גורם משפיע על אורך החיים של רכיב. (4גם סוג התנור הוא גורם שמשפיע על אורך החיים של רכיב. כעת יש לבצע חלוקה לקבוצות הומוגניות לכל גורם על מנת לבדוק מהם רמות טמפרטורה וסוגי התנורים המביאים לאורך החיים המקסימלי. 14 דוגמה – 1תרשים פרופיליים אורך חיים ממוצע A2 259.5 A1 244.5 236.5 230.5 224 215 212.5 A3 197.5 196 195.5 188 180 גורם B 15 B4 B3 B2 B1 מסקנה מתרשים :בין 1Aל B -וגם בין 3Aל B-אין אינטראקציה .יתכן וקיימת אינטרקציה בין 2Aל.B- – פלט אקסל1 דוגמה Total 8 1871 233.875 289.8393 8 1704 213 1165.143 8 1584 198 248.2857 O4 O3 2 489 244.5 480.5 2 519 259.5 364.5 2 425 212.5 84.5 6 1433 238.8333 646.9667 Anova: Two-Factor With Replication O2 O1 SUMMARY 500 2 2 2Count 461 473 448Sum 230.5 236.5 224Average 60.5 1012.5 18Variance 2 430 215 578 2 391 195.5 612.5 6 1282 213.6667 496.2667 2 360 180 2 550 2Count 395Sum 197.5Average 220.5Variance 2 392 196 8 600 2Count 376Sum 188Average 392Variance 6 1225 204.1667 882.9667 Total 6Count 1219Sum 203.1667Average 404.5667Variance 16 – פלט אקסל1 דוגמה F crit P-value F MS 3.885294 0.005863 8.129516 2597.042 3.490295 0.015885 5.178688 1654.375 2.99612 0.22152 1.631016 521.0417 319.4583 df 2 3 6 12 ANOVA SS Source of Variation 5194.083Sample 4963.125Columns 3126.25Interaction 3833.5Within 23 17116.96Total 17 דוגמה – 1חלוקה לקבוצות הומוגניות בגלל שלא קיימת אינטראקציה ,נבצע חלוקה לקבוצות לכל גורם בנפרד. מבחן LSDעבור גורם ( Aטמפרטורה): 19.47 2 * 319.45 2.1788 2 * M SE bn 2*4 N ab , L SD t 2 t12 ,0.025 2.1788 מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 : A3=600 A2=550 A1=500 198 213 233.875 15 233.875 A1=500 20.875 213 A2=550 35.875 198 A3=600 קבוצות )A2, A3( :ו.A1 - אם רוצים אורך חיים גבוה ,נמליץ על טיפול ( A1טמפרטורה של 500 18מעלות). דוגמה – 1חלוקה לקבוצות הומוגניות בגלל שלא קיימת אינטראקציה ,נבצע חלוקה לקבוצות לכל גורם בנפרד. מבחן LSDעבור גורם ( Bסוג התנור): 22.48 2 * 319.45 2.1788 2 * M SE bn 2*3 מספר השוואות זוגיות שצריך לבצע.(4*3)/2=6 : B1=O1 B2=O2 B3=O3 B4=O4 203.1667 204.1667 213.6667 238.8333 1 N ab , L SD t 2 t12 ,0.025 2.1788 238.8333 B4=O4 *25.16667 213.6667 B3=O3 9.5 *34.66667 204.1667 B2=O2 10.5 *35.66667 203.1667 B1=O1 קבוצות )B1, B2, B3( :ו.B4 - אם רוצים אורך חיים גבוה ,נמליץ על טיפול ( B4תנור מסוג .)4 המלצה סופית :עבור אורך חיים גבוה יש לבחור סוג תנור 4וטמפרטורה 500מעלות. 19 דוגמה 2 תוצאות הניסוי לבדיקת ההשפעה של סוגי הערות המנחה וסוגי יצירתיות של סטודנטים על ציון בפרויקט גמר (בסקאלה מ 0-עד )10נתונות בטבלה הבאה ,כאשר לכל צירוף בוצעו 5מדידות: הערות מפורטות B3- הערות קצרות B2 - ללא הערות B1- 7 8 7 9 9 4 5 3 6 7 2 3 4 5 6 5 7 7 8 8 2 2 3 4 4 7 9 9 10 10 גורם Bסוג הערות /גורם Aסוג יצירתיות לא יצירתיים A1 - יצירתיים A2- נחשב ממוצע בכל תא: 20 הערות B3- מפורטות הערות קצרות B2 - y13 8 y12 4 y11 3 y 23 5 y 22 7 y 21 9 ללא הערות B1- גורם Bסוג הערות/ גורם Aסוג יצירתיות לא יצירתיים A1 - יצירתיים A2- פלט אקסל2 דוגמה Anova: Two-Factor With Replication Total B3- הערותB2 - הערותB1- ללא מפורטות קצרות הערות 15 75 5 6.285714 15 105 7 4.428571 5 40 8 1 5 25 5 2.5 5 20 4 2.5 SUMMARY A1 - לא יצירתיים 5Count 15Sum 3Average 1Variance 5 35 7 1.5 A2- יצירתיים 5Count 45Sum 9Average 1.5Variance 10 10 65 55 6.5 5.5 4.055556 4.277778 Total 10Count 60Sum 6Average 11.11111Variance 21 דוגמה 2פלט אקסל ANOVA Source of Variation 30Sample df SS F MS P-value F crit 1 30 18 4.259677 0.000285 5Columns 2 2.5 1.5 3.402826 0.243315 105Interaction 2 52.5 31.5 3.402826 1.94E-07 24 1.666667 40Within 180Total 29 מסקנות מטבלת :ANOVA שלב א' :ניתן לראות שקיימת השפעה הדדית בין יצירתיות הסטודנטים להערות המנחה. כלומר ,שני הגורמים האלו משפיעים על ציון בפרויקט ,אך ההשפעה היא משותפת. לכן לא ניתן לבדוק השפעה של כל גורם בנפרד ולא ניתן לבצע שלב ג' אלא יש צורך לבצע שלב ב' – כניסה לפלחים. אינטראקציה בין הגורמים הראשיים באה לידי ביטוי גם בתרשים פרופיליים בשקף הבא. 22 דוגמה – 2תרשים פרופיליים נבנה תרשים פרופיליים .תרשים זה הינו תרשים של משתנה התלוי ציון ממוצע נגד רמות שונות של שני הגורמים. 9 A1 8 7 5 A2 4 3 גורם B 23 B3 B2 B1 מסקנה מתרשים :קווים חותכים זה את זה ,הדבר מעיד על קיום אינטראקציה בין הגורמים. דוגמה 3 24 דוגמה 3 נזהה תחילה שמדובר בניתוח שונות דו-כיווני :בניסוי מעוניינים לבדוק השפעה של שני גורמים על משתנה תלוי "היקף מכירות של אבקת כביסה" .הגורמים הינם גובה המדף (גורם ראשון )Aורוחב המדף (גורם שני .)Bבגורם ראשון יש 3רמות )(i=1,2,3; a=3 ובגורם שני יש 2רמות ( .)j=1,2; b=2לכל צירוף בין הרמות נמדדו 2תצפיות ( ;k=1,2 .)n=2 המודל של ניתוח שונות דו-כיווני הוא: נבדוק השערות הבאות: )1 )2 )3 25 דוגמה –3בניית טבלת ניתוח שונות שלב א' נבנה טבלת עזר (טבלת ממוצעים): טבלת ממוצעים: רחב גובה /רוחב 43 נמוך 69 בינוני 44 גבוה 52 ממוצע B רגיל 45 65 40 50 ממוצע A 44 67 42 כעת נחשב שונויות: 131.6667 136.8333 נחשב סכומי ריבועים: 1 128.6667 N 12 12 *128.6667 1544 2 A SSA N SSB N B 12 *1 12 2 SSA B N avg SSA SSB 12 *131.6667 1544 12 24 2 SST N T 12 *136.8333 1642 2 26 SSE SST SSA SSB SSA B 1642 1544 12 24 62 דוגמה –3בניית טבלת ניתוח שונות שלב א' (המשך) נבנה טבלת ניתוח שונות: מקור גורם Aגובה גורם Bרוחב אינטראקציה AB שגיאות סה"כ SS 1544 12 24 62 1642 MS דרגות חופש 772 2 12 1 12 2 10.33333 6 11 סטטיסטי Fקריטי F 10.92477 74.70968 13.74502 1.16129 10.92477 1.16129 החלטה דוחים לא דוחים לא דוחים מסקנות מטבלת :ANOVA (1שלב א' :סטטיסטי המבחן בנוגע לאינטראקציה ABקטן מערך הקריטי ( ,)1.61>10.92לכן לא נדחה את השערת האפס (השערה )1נאמר שברמת מובהקות 0.01לא קיימת אינטראקציה בין גובה המדף ולרוחב המדף .לכן נעבור לשלב ג'. (2שלב ג': נבדוק האם יש השפעה של גובה המדף ,74.709<10.92 :לכן נדחה את השערת האפס (השערה )2ונאמר כי ברמת מובהקות 0.01גובה המדף משפיע על היקף המכירות. נבדוק האם יש השפעה של רוחב המדף ,1.16>13.74 :לכן לא נדחה השערת האפס (השערה )3ונאמר כי ברמת המובהקות 0.01רוחב המדף אינו משפיע על היקף 27 המכירות. דוגמה –3חלוקה לקבוצות הומוגניות שלב ג' (המשך): היות ומצאנו שרק גורם Aמשפיע ,על מנת להמליץ על גובה המדף המביא למקסימום את היקף המכירות ,נבצע חלוקה לקבוצות הומוגניות עבור גורם .A 8.4271 2 *10.3333 3.7074 2 * M SE bn 2*2 מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 : גבוה=A3 42 נמוך=A1 44 בינוני=A2 67 2 *23 *25 67 44 42 N ab , L SD t 2 t 6 ,0.005 3.7074 בינוני=A2 נמוך=A1 גבוה=A3 קבוצות )A1, A3( :ו.A2 - המלצה :להשגת היקף מכירות מקסימאלי ,נמליץ לבחור גובה מדף בינוני (טיפול .)A2לגבי רוחב המדף אנחנו אדישים ,היות וגורם זה לא נמצא משפיע .לכן ניתן לבחור רוחב מדף כלשהו. 28