Transcript Lecture11
המחלקה לניהול תעשייתי
סמסטר א' ,תשע"ב
רגרסיה לינארית ,ניתוח שונות
ותכנון ניסויים סטטיסטיים
הרצאה 11
ניתוח שונות דו-כיווני
ניתוח שונות דו-כיווני
נדון כעת במקרה שבו אנו מעוניינים ללמוד על השפעה שיש לשני גורמים Aו B-על
איזשהו משתנה תלוי.
למשל ,בניסוי כימי מעוניינים לבחון תוצר התגובה הכימית כתוצאה מלחץ ותוצר של אותה
תגובה כימית כתוצאה ממשך התגובה ,סימולטנית.
דוגמה נוספת :סטודנטית איילה חקרה האם ציון של פרויקט גמר בתואר מושפע מהערות
של מנחה הפרויקט במהלך הביצוע ,כאשר מנחה יכול לתת הערות מפורטות ,או
הערות קצרות או לא להעיר כלל .סטודנט אחר נעם טוען כי ציון בפרויקט תלוי בסוג
האנשים המבצעים :יצירתיים או לא יצירתיים .לדעתו ,ריבוי הערות של מנחה יעיל
לסטודנטים לא יצירתיים ואילו סטודנטים יצירתיים לא זקוקים להערות והן לא פוגעות
בעבודתם .כלומר ,לדעתו של נועם קיימת השפעה הדדית בין סוג האנשים ולבין
הערות של מנחה על משתנה התלוי (ציון בפרויקט).
בכל מקרה שכזה ,חשוב לא רק לבדוק את השפעת הגורמים השונים אלא גם האם יש
אינטראקציה (השפעה הדדית) מהותית בין שני הגורמים אלו.
במודל רב כיווני טיפול מהווה צירוף של רמות שונות של שני הגורמים.
2
דוגמה 1
בניסוי כלשהו בדקו השפעה שיש לטמפרטורה ולסוג התנור על
אורך החיים של רכיב אלקטרוני מסוים .ארבעה סוגים של תנורים
ושלוש רמות טמפרטורה נבחנו בניסוי 24 .דגימות נלקחו באקראי,
2דגימות בכל צירוף של טיפולים .התקבלו תוצאות הבאות:
3
O4
O3
O2
O1
260
225
214
227
229
236
259
221
246
232
181
187
273
198
179
208
206
178
198
174
219
213
194
202
תנור/טמפרטורה
500O
550O
600O
מודל ניתוח שונות דו-כיווני אפקטים קבועים
4
הנחות המודל
תחת השערת האפס מתקיים:
5
בדיקת השערות
נבקש לבדוק 3השערות בסיסיות:
(1האם קיימת השפעה הדדית בין (אינטראקציה) שני הגורמים:
(2האם גורם Aמשפיע על משתנה התלוי:
(3האם גורם Bמשפיע על משתנה התלוי:
6
ניתוח שונות דו-כיווני :שלבים בביצוע המודל
א) בדיקת השפעת האינטראקציה בין שני הגורמים:
אם )) F F ( , a 1 b 1 , ( N a bאז דוחים את השערת האפס ברמת
מובהקות אלפה .אם לא ניכרת השפעה אינטרקטיבית בין שני הגורמים
(כלומר ,אם לא דוחים את השערת האפס) ,ממשיכים בבדיקת
השפעות הגורמים השונים (שלב ג' להלן).
ב) כניסה לפלחים (שיטה לא נלמדת בקורס זה)
אם דוחים את השערת האפס בשלב א' ,ברור כי השפעת הגורמים ניכרת
ויש לבדוק כיצד השפעה זו מתבטאת .בודקים השפעת כל טיפול בכל
גורם ביחס לכל הטיפולים של גורם השני ובונים מודל ANOVAלכל
גורם.
1
7
ניתוח שונות דו-כיווני :שלבים בביצוע המודל
ג) בדיקת השפעת הגורמים השונים ללא אינטראקציה.
אם לא דוחים את השערת האפס בשלב א' ,ניתן לבדוק השפעה של כל
גורם בנפרד.
אם )) F F ( , a 1 , ( N a bאז דוחים את ההשערה בדבר זהותם של a
טיפולים השייכים לגורם Aברמת מובהקות αומבצעים חלוקה
לקבוצות הומוגניות עבור .)A1, A2,…, Aa
אם )) F F ( , b 1 , ( N abאז דוחים את ההשערה בדבר זהותם של b
טיפולים השייכים לגורם Bברמת מובהקות αומבצעים חלוקה
לקבוצות הומוגניות עבור .)B1, B2,…, Bb
2
3
8
ניתוח שונות דו-כיווני :שלבים בביצוע המודל
ג) (המשך)
במידה ויש צורך לבצע חלוקה לקבוצות הומוגניות לגורם ראשון (,)A
נשתמש במבחן ,LSDכאשר ערך הקריטי יחושב על פי נוסחא הבאה:
2 * M SE
b*n
N ab ,
L SD t
2
כאשר – bמספר הטיפולים בגורם השני – n ,מספר החזרות על מדידה
של צירוף מסוים (מספר תצפיות בתא בודד של טבלת הנתונים
המקורית).
במידה ויש צורך לבצע חלוקה לקבוצות הומוגניות לגורם השני (,)B
נשתמש במבחן ,LSDכאשר ערך הקריטי יחושב על פי נוסחא הבאה:
2 * M SE
a*n
N ab ,
L SD t
2
כאשר – aמספר הטיפולים בגורם הראשון.
9
פירוק סכום הריבועים
b
a
n
y ijk y
2
SST
i 1 j 1 k 1
2
2
2
2
y
y
y
y
n
y
y
an
y
y
bn
y
y
ijk ij i j ij i j
i
j
SSE
i
j
i
k
SSA
SSB
j
SSAB
10
כיווני-) דוANOVA( טבלת ניתוח שונות
מקורSS
סטטיסטיF
קריטיF
DF
MS
גורם ראשוןSSA
A
a-1
MSA=SSA/(a-1)
F2=MSA/MSE
F (α,(a-1), (N-ab))
B גורם שניSSB
b-1
MSB=SSB/(b-1)
F3=MSB/MSE
F (α, (b-1), (N-ab))
(a-1)(b-1)
MSAB=
F1=MSAB/MSE
=SSAB/((a-1)(b-1))
N-ab
MSE=SSE/(N-ab)
אינטראקציהSSAB
AB
שגיאותSSE
סה"כSST
F (α, (a-1)(b-1),(Nab))
N-1=abn1
11
חישוב סכומי הריבועים – נוסחאות מקוצרות
שלבים בחישוב סכומי ריבועים ובניית טבלת ניתוח שונות:
(1נחשב טבלת עזר – טבלת ממוצעים ע"י חישוב ממוצע של ערכים בכל תא של טבלת
נתונים מקורית.
(2נחשב ממוצע של כל גורם בשוליים (פלחים).
(3נחשב השונות בין ממוצעי השוליים של כל גורם.
(4נחשב שונות בין ממוצעי התאים.
(5נחשב שונות בין כלל התצפיות.
(6נחשב סכומי ריבועים לפי נוסחאות מקוצרות:
2
A
SSA N
SSB N B
2
SSAB N avg SSA SSB
2
SST N T
2
SSE SST SSA SSB SSAB
12
כאשר:
• – σ2Aשונות ממוצעי השוליים של גורם A
• – σ2Bשונות ממוצעי השוליים של גורם B
• – σ2AVGשונות בין ממוצעי התאים
• – σ2Tשונות בין כלל התצפיות
דוגמה –1בניית טבלת ניתוח שונות
שלב א' נבנה טבלת עזר (טבלת ממוצעים):
ממוצעי
גורם
טמפרטורה
O3
O4
()A
244.5 233.875
213
O2
Temp/Oven O1
230.5
236.5
224
500
259.5
215
180
197.5
550
212.5
195.5
196
188
600
198
ממוצע כלל
ממוצעי גורם
התצפיות:
203.1667 204.1667 213.6667 238.8333214.9583תנורים ()B
כעת נחשב שונויות:
216.4201 206.7969 553.4774 713.2066
13
N
24
דוגמה – 1טבלת ניתוח שונות דו-כיווני
החלטה
לדחות
לדחות
לא לדחות
MS
F statistic F Critical
2597.042 8.129516 3.885
1654.375 5.178688
3.49
2.996
DF
2
3
521.0417 1.631016
6
319.4583
12
23
מקור
SS
5194.083טמפרטורה A
תנור B
4963.125
אינטראקציה
3126.25
AB
שגיאה E
3833.5
סה"כ
17116.96
מסקנות מטבלת :ANOVA
(1שלב א' :ניתן לראות שלא קיימת השפעה הדדית בין הטמפרטורה לסוג התנור .לכן
נעבור לשלב ג'.
(2שלב ג':
(3טמפרטורה הינה גורם משפיע על אורך החיים של רכיב.
(4גם סוג התנור הוא גורם שמשפיע על אורך החיים של רכיב.
כעת יש לבצע חלוקה לקבוצות הומוגניות לכל גורם על מנת לבדוק מהם רמות טמפרטורה
וסוגי התנורים המביאים לאורך החיים המקסימלי.
14
דוגמה – 1תרשים פרופיליים
אורך חיים ממוצע
A2
259.5
A1
244.5
236.5
230.5
224
215
212.5
A3
197.5
196
195.5
188
180
גורם B
15
B4
B3
B2
B1
מסקנה מתרשים :בין 1Aל B -וגם בין 3Aל B-אין אינטראקציה .יתכן
וקיימת אינטרקציה בין 2Aל.B-
– פלט אקסל1 דוגמה
Total
8
1871
233.875
289.8393
8
1704
213
1165.143
8
1584
198
248.2857
O4
O3
2
489
244.5
480.5
2
519
259.5
364.5
2
425
212.5
84.5
6
1433
238.8333
646.9667
Anova: Two-Factor With Replication
O2
O1
SUMMARY
500
2
2
2Count
461
473
448Sum
230.5
236.5
224Average
60.5
1012.5
18Variance
2
430
215
578
2
391
195.5
612.5
6
1282
213.6667
496.2667
2
360
180
2
550
2Count
395Sum
197.5Average
220.5Variance
2
392
196
8
600
2Count
376Sum
188Average
392Variance
6
1225
204.1667
882.9667
Total
6Count
1219Sum
203.1667Average
404.5667Variance
16
– פלט אקסל1 דוגמה
F crit
P-value
F
MS
3.885294 0.005863 8.129516 2597.042
3.490295 0.015885 5.178688 1654.375
2.99612 0.22152 1.631016 521.0417
319.4583
df
2
3
6
12
ANOVA
SS
Source of Variation
5194.083Sample
4963.125Columns
3126.25Interaction
3833.5Within
23 17116.96Total
17
דוגמה – 1חלוקה לקבוצות הומוגניות
בגלל שלא קיימת אינטראקציה ,נבצע חלוקה לקבוצות לכל גורם בנפרד.
מבחן LSDעבור גורם ( Aטמפרטורה):
19.47
2 * 319.45
2.1788
2 * M SE
bn
2*4
N ab ,
L SD t
2
t12 ,0.025 2.1788
מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 :
A3=600
A2=550
A1=500
198
213
233.875
15
233.875
A1=500
20.875
213
A2=550
35.875
198
A3=600
קבוצות )A2, A3( :ו.A1 -
אם רוצים אורך חיים גבוה ,נמליץ על טיפול ( A1טמפרטורה של 500
18מעלות).
דוגמה – 1חלוקה לקבוצות הומוגניות
בגלל שלא קיימת אינטראקציה ,נבצע חלוקה לקבוצות לכל גורם בנפרד.
מבחן LSDעבור גורם ( Bסוג התנור):
22.48
2 * 319.45
2.1788
2 * M SE
bn
2*3
מספר השוואות זוגיות שצריך לבצע.(4*3)/2=6 :
B1=O1
B2=O2
B3=O3
B4=O4
203.1667
204.1667
213.6667
238.8333
1
N ab ,
L SD t
2
t12 ,0.025 2.1788
238.8333
B4=O4
*25.16667
213.6667
B3=O3
9.5
*34.66667
204.1667
B2=O2
10.5
*35.66667
203.1667
B1=O1
קבוצות )B1, B2, B3( :ו.B4 -
אם רוצים אורך חיים גבוה ,נמליץ על טיפול ( B4תנור מסוג .)4
המלצה סופית :עבור אורך חיים גבוה יש לבחור סוג תנור 4וטמפרטורה 500מעלות.
19
דוגמה 2
תוצאות הניסוי לבדיקת ההשפעה של סוגי הערות המנחה וסוגי יצירתיות של סטודנטים על ציון
בפרויקט גמר (בסקאלה מ 0-עד )10נתונות בטבלה הבאה ,כאשר לכל צירוף בוצעו 5מדידות:
הערות מפורטות B3-
הערות קצרות B2 -
ללא הערות B1-
7
8
7
9
9
4
5
3
6
7
2
3
4
5
6
5
7
7
8
8
2
2
3
4
4
7
9
9
10
10
גורם Bסוג הערות /גורם
Aסוג יצירתיות
לא יצירתיים A1 -
יצירתיים A2-
נחשב ממוצע בכל תא:
20
הערות B3-
מפורטות
הערות קצרות B2 -
y13 8
y12 4
y11 3
y 23 5
y 22 7
y 21 9
ללא הערות B1-
גורם Bסוג הערות/
גורם Aסוג יצירתיות
לא יצירתיים A1 -
יצירתיים A2-
פלט אקסל2 דוגמה
Anova: Two-Factor With Replication
Total
B3- הערותB2 - הערותB1- ללא
מפורטות
קצרות
הערות
15
75
5
6.285714
15
105
7
4.428571
5
40
8
1
5
25
5
2.5
5
20
4
2.5
SUMMARY
A1 - לא יצירתיים
5Count
15Sum
3Average
1Variance
5
35
7
1.5
A2- יצירתיים
5Count
45Sum
9Average
1.5Variance
10
10
65
55
6.5
5.5
4.055556 4.277778
Total
10Count
60Sum
6Average
11.11111Variance
21
דוגמה 2פלט אקסל
ANOVA
Source of
Variation
30Sample
df
SS
F
MS
P-value
F crit
1
30
18
4.259677 0.000285
5Columns
2
2.5
1.5
3.402826 0.243315
105Interaction
2
52.5
31.5
3.402826 1.94E-07
24
1.666667
40Within
180Total
29
מסקנות מטבלת :ANOVA
שלב א' :ניתן לראות שקיימת השפעה הדדית בין יצירתיות הסטודנטים להערות המנחה.
כלומר ,שני הגורמים האלו משפיעים על ציון בפרויקט ,אך ההשפעה היא משותפת.
לכן לא ניתן לבדוק השפעה של כל גורם בנפרד ולא ניתן לבצע שלב ג' אלא יש צורך
לבצע שלב ב' – כניסה לפלחים.
אינטראקציה בין הגורמים הראשיים באה לידי ביטוי גם בתרשים פרופיליים בשקף הבא.
22
דוגמה – 2תרשים פרופיליים
נבנה תרשים פרופיליים .תרשים זה הינו תרשים של משתנה התלוי
ציון ממוצע
נגד רמות שונות של שני הגורמים.
9
A1
8
7
5
A2
4
3
גורם B
23
B3
B2
B1
מסקנה מתרשים :קווים חותכים זה את זה ,הדבר מעיד על קיום
אינטראקציה בין הגורמים.
דוגמה 3
24
דוגמה 3
נזהה תחילה שמדובר בניתוח שונות דו-כיווני :בניסוי מעוניינים לבדוק השפעה של שני
גורמים על משתנה תלוי "היקף מכירות של אבקת כביסה" .הגורמים הינם גובה המדף
(גורם ראשון )Aורוחב המדף (גורם שני .)Bבגורם ראשון יש 3רמות )(i=1,2,3; a=3
ובגורם שני יש 2רמות ( .)j=1,2; b=2לכל צירוף בין הרמות נמדדו 2תצפיות ( ;k=1,2
.)n=2
המודל של ניתוח שונות דו-כיווני הוא:
נבדוק השערות הבאות:
)1
)2
)3
25
דוגמה –3בניית טבלת ניתוח שונות
שלב א' נבנה טבלת עזר (טבלת ממוצעים):
טבלת ממוצעים:
רחב
גובה /רוחב
43
נמוך
69
בינוני
44
גבוה
52
ממוצע B
רגיל
45
65
40
50
ממוצע A
44
67
42
כעת נחשב שונויות:
131.6667 136.8333
נחשב סכומי ריבועים:
1
128.6667
N
12
12 *128.6667 1544
2
A
SSA N
SSB N B 12 *1 12
2
SSA B N avg SSA SSB 12 *131.6667 1544 12 24
2
SST N T 12 *136.8333 1642
2
26
SSE SST SSA SSB SSA B 1642 1544 12 24 62
דוגמה –3בניית טבלת ניתוח שונות
שלב א' (המשך) נבנה טבלת ניתוח שונות:
מקור
גורם Aגובה
גורם Bרוחב
אינטראקציה AB
שגיאות
סה"כ
SS
1544
12
24
62
1642
MS
דרגות חופש
772
2
12
1
12
2
10.33333
6
11
סטטיסטי Fקריטי F
10.92477 74.70968
13.74502 1.16129
10.92477 1.16129
החלטה
דוחים
לא דוחים
לא דוחים
מסקנות מטבלת :ANOVA
(1שלב א' :סטטיסטי המבחן בנוגע לאינטראקציה ABקטן מערך הקריטי
( ,)1.61>10.92לכן לא נדחה את השערת האפס (השערה )1נאמר שברמת
מובהקות 0.01לא קיימת אינטראקציה בין גובה המדף ולרוחב המדף .לכן נעבור
לשלב ג'.
(2שלב ג':
נבדוק האם יש השפעה של גובה המדף ,74.709<10.92 :לכן נדחה את השערת האפס
(השערה )2ונאמר כי ברמת מובהקות 0.01גובה המדף משפיע על היקף המכירות.
נבדוק האם יש השפעה של רוחב המדף ,1.16>13.74 :לכן לא נדחה השערת האפס
(השערה )3ונאמר כי ברמת המובהקות 0.01רוחב המדף אינו משפיע על היקף
27
המכירות.
דוגמה –3חלוקה לקבוצות הומוגניות
שלב ג' (המשך):
היות ומצאנו שרק גורם Aמשפיע ,על מנת להמליץ על גובה המדף המביא למקסימום את
היקף המכירות ,נבצע חלוקה לקבוצות הומוגניות עבור גורם .A
8.4271
2 *10.3333
3.7074
2 * M SE
bn
2*2
מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 :
גבוה=A3
42
נמוך=A1
44
בינוני=A2
67
2
*23
*25
67
44
42
N ab ,
L SD t
2
t 6 ,0.005 3.7074
בינוני=A2
נמוך=A1
גבוה=A3
קבוצות )A1, A3( :ו.A2 -
המלצה :להשגת היקף מכירות מקסימאלי ,נמליץ לבחור גובה מדף בינוני
(טיפול .)A2לגבי רוחב המדף אנחנו אדישים ,היות וגורם זה לא נמצא
משפיע .לכן ניתן לבחור רוחב מדף כלשהו.
28