Transcript Lecture10
המחלקה לניהול תעשייתי
סמסטר א' ,תשע"ב
רגרסיה לינארית ,ניתוח שונות ותכנון
ניסויים סטטיסטיים
הרצאה 10
)1חלוקה לקבוצות הומוגניות
(השוואות מרובות)
)2תכנון בבלוקים אקראיים
דוגמה 1משיעור קודם
2
דוגמה :1חישוב סכומי הריבועים
אחוז כותנה/חזרות
1
2
3
4
5
ממוצעי טיפולים
15%
7
7
15
11
9
9.8
20%
12
17
12
18
18
15.4
25%
14
18
18
19
19
17.6
30%
19
25
22
19
23
21.6
35%
7
10
11
15
11
10.8
שונות בין הטיפולים B2 =19.0304 :
שונות בין התצפיות T2 =25.4784 :
k 5מספר הטיפולים
n j n 5מספר תצפיות בכל טיפול
N 5*5 25סה"כ מספר תצפיות במדגם
סכומי ריבועים:
SST N T2 25 25.4784 636.96
SSB N B2 25 19.0304 475.76
SSW SST SSB 636.96-475.76 161.2
3
j
y
דוגמה :1טבלת ANOVA
F P-Valueקריטי
0.0000
F(4,20,
0.05)=2.866
F
ססטיסטי
14.76
SSמקור
()Source
MS=SS/דרגות
dfחופש
()df
118.94
4
475.76טיפולים
(אחוזי
כותנה)
8.06
20
161.2שגיאות
24
636.96סה"כ
ערך סטטיסטי גדול מערך קריטי ,לכן נדחה את השערת האפס
ונאמר שלפחות אחד מהטיפולים שונה מאחרים .כלומר אחוז כותנה
משפיע של חוזק הבד.
4
פלט אקסל:דוגמה
Anova: Single Factor
Variance Average Sum
11.2
9.8
49
9.8
15.4
77
4.3
17.6
88
6.8
21.6 108
8.2
10.8
54
F crit
P-value
F
MS
2.8660814 9.13E-06 14.75682 118.94
8.06
SUMMARY
Count
Groups
5Row 1
5Row 2
5Row 3
5Row 4
5Row 5
ANOVA
Source of
df
SS
Variation
Between
4 475.76
Groups
20 161.2Within Groups
24 636.96Total
5
חלוקה לקבוצות הומוגניות :השוואות מרובות
• קבוצה הומוגנית :קבוצה של טיפולים שביניהם לא
קיים הבדל מובהק סטטיסטי.
• מתי מבצעים חלוקה לקבוצות הומוגניות?
כאשר בניתוח שונות דחינו את השערת האפס:
H 0 : 1 2 3 k
)H1 : i j for at least one pair (i,j
כלומר ,התקבל כי לפחות אחד מהטיפולים שונה מהשאר.
• מטרה של חלוקה לקבוצות הומוגניות:
למצוא קבוצות של טיפולים שביניהם אין הבדל מובהק
6
חלוקה לקבוצות הומוגניות :השוואות מרובות
• איך נבצע?
• נבצע סדרה של השוואות זוגיות ,כאשר לכל זוג הטיפולים
נבדוק השערות הבאות:
H 0 : i j
H 0 : i j 0
H1 : i j
H1 : i j 0
לכל זוג טיפולים ,i≠jכאשר j=1,2,…,k ,i=1,2,..,k
סה"כ מספר השוואות זוגיות שנצטרך לבצע בינתן k
טיפולים:
k k k 1
2
2
סטטיסטי שבעזרתו נאמוד הפרש בין התוחלות הינו הפרש
מוחלט בין ממוצעים של זוג הטיפולים:
yi y j
7
חלוקה לקבוצות הומוגניות :השוואות מרובות
• את הבדיקה של סדרת ההשערות נבצע בעזרת מבחן מיוחד
הנקרא מבחן .)Least Significant Difference( LSD
• במבחן LSDנשווה בין ערך הסטטיסטי (הפרש מוחלט בין
ממוצעים של זוג הטיפולים) לערך הקריטי שמחושב כך:
עבור מערך מאוזן (כאשר מספר תצפיות בכל טיפול שווה :)n
2* MSE
n
2
N k ,
LSD t
מערך לא מאוזן (כאשר מספר תצפיות בכל טיפול שונה):
1 1
MSE
n n
j
i
• איזור דחייה:
8
LSD
j
2
N k ,
LSD t
yi y
חלוקה לקבוצות הומוגניות :השוואות מרובות
• שלבים בביצוע חלוקה לקבוצות הומוגניות:
k k k 1
• לחשב מספר השוואות זוגיות:
2
2
• לבנות טבלה של הפרשים מוחלטים בין הממוצעים:
בשורות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם
(מלמעלה למטה).
בעמודות יהיו ממוצעי הטיפולים מסודרים בסדר יורד לפי ערכם
(משמאל לימין).
בכל תא ijשל טבלה נשים הפרש בערך מוחלט בין ממוצע שנמצא
בשורה iלבין ממוצע שנמצא בשורה .j
נמלא רק משולש התחתון של טבלה (מתחת לאלכסון הראשי).
• אם ערך הסטטיסטי בתא מסויים גדול מערך הקריטי
של ,LSDאז נדחה השערת האפס ונאמר כי קיים
הבדל מובהק בין שני הטיפולים
9
דוגמה :1חלוקה לקבוצות הומוגניות
נחשב ערך קריטי של מבחן :LSD
2* MSE
2*8.06
2*8.06
t 0.05
2.086
3.7454
20,
n
5
5
2
2
N k ,
LSD t
מספר השוואות זוגיות שצריך לבצע.(5*4)/2=10 :
נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים:
y 1 9.8
y 4 21.6 y 3 17.6 y 2 15.4 y 5 10.8
y 4 21.6
10
1
17.6 21.6 4
y 3 17.6
2.2
15.4 21.6 6.2
y 2 15.4
4.6
6.8
10.8
y 5 10.8
5.6
7.8
11.8
y 1 9.8
דוגמה :1חלוקה לקבוצות הומוגניות
כעת נשווה כל הפרש בטבלה עם ערך הקריטי LSD 3.7454
אם ערך סטטיסטי גדול מערך הקריטי ,נסמן אותו בכוכבית (דחייה של השערת
ה.)0-
y 21.6
y 17.6 y 15.4 y 10.8
y 9.8
1
5
2
4
3
y 4 21.6
4*>3.74
1<3.74
y 3 17.6
2.2
6.2*>3.74
*4.6
*6.8
*10.8
y 5 10.8
*5.6
*7.8
*11.8
y 1 9.8
y 2 15.4
ניתוח תוצאות :התקבלו קבוצות הומוגניות הבאות:
קבוצה :1טיפולים 2ו( 3-ביניהם אין הבדל מובהק)
קבוצה :2טיפולים 1ו( 5-ביניהם אין הבדל מובהק)
קבוצה :3טיפול ( 4שונה מובהק מכל שאר הטיפולים)
מסקנה :אם מהנדס רוצה לקבל חוזק בד גבוה ביותר ,נמליץ לו להשתמש ב 30% -כותנה
(טיפול 4בעל ממוצע הכי גבוה ,נמצא לבד בקבוצה)
11
דוגמה 2משיעור קודם
12
דוגמה 2פתרון
אטמים/טיפולים
1
2
3
4
ממוצעי טיפולים
1
17.5
16.9
15.8
18.6
j
17.2 y
2
שונות בין הטיפולים 0.222431 B
2
שונות בין התצפיות 2.832431 T
24=N
6=k
4=nj
13
2
16.4
19.2
17.7
15.4
3
20.3
15.7
17.8
18.9
4
14.6
16.7
20.8
18.9
5
17.5
19.2
16.5
20.5
6
18.3
16.2
17.5
20.1
17.175
18.175
17.75
18.425
18.025
פלט אקסל:
Anova: Single Factor
SUMMARY
Groups
Sum
Count
Average
Variance
1
4
68.8
17.2
1.366667
2
4
68.7
17.175
2.709167
3
4
72.7
18.175
3.769167
4
4
71
17.75
7.216667
5
4
73.7
18.425
3.155833
6
4
72.1
18.025
2.6625
דוגמה :2
בנית
ANOVA
ANOVA
MS
F
P-value
F crit
Source of Variation
SS
5.338333 Between Groups
5
1.067667
0.306801
0.902421
2.772853
62.64 Within Groups
18
3.48
67.97833 Total
df
23
מסקנה :מאחר וקיבלנו שסטטיסטי קטן מ F -טבלה לא נדחה את השערת
האפס ז"א אין הבדל בין התוחלות של הטיפולים .כלומר מכונות לא שונות
מהותית מבחינת חוזק אטמי הגומי .אין צורך לבצע חלוקה לקבוצות הומוגניות,
היות וגם כך קיבלנו שאין הבדל בין הטיפולים ,כלומר כל הטיפולים שייכים
14
לאותה קבוצה.
תכנון בבלוקים אקראים
• מתי משתמשים?
– עד עתה התייחסנו לכל יחידות הניסוי כהומוגניות (כלומר,
אין הבדלים מובהקים בין יחידות) והקצאנו טיפולים בין
היחידות בצורה אקראית.
– מה קורה כאשר יחידות הניסוי מתחלקות למספר קבוצות
הומוגניות?
– לדוגמה :רוצים לבצע ניסוי שמטרתו לבדוק השפעה של 3
שיטות דיאטה על רמת ההרזיה .את הנבדקים שנבחרו
לניסוי (יחידות ניסוי) ניתן לחלק ל 4-קבוצות לפי משקלם
ההתחלתי :בעלי משקל עודף גבוה ,בעלי משקל עודף
בינוני ,בעלי משקל עודף נמוך ,ללא משקל עודף.
15
תכנון בבלוקים אקראים
–אם נחלק את הטיפולים ליחידות הניסוי בצורה אקראית ללא
התייחסות להבדלים במשקלם ,אזי יתכן שלא נהיה מסוגלים
להסיק מסקנות חד-משמעיות מניתוח תוצאות הניסוי.
–כלומר ,אם מניתוח שונות והשוואות זוגיות התקבל ששיטת
דיאטה מס' 1מביאה להורדת משקל הכי גבוהה ,לא נהיה
בטוחים ,האם תוצאה זו נובעת אכן מטיב דיאטה מס' 1או
מסיבות אחרות שקשורות להבדלים במשקל ההתחלתי בין
הקבוצות .למשל ,יתכן טיפול 1ניתן לרוב לנבדקים מקבוצה
של בעלי משקל עודף.
–על מנת למנוע מצב כזה ,במקרה של אי-הומוגניות ביחידות
הניסוי משתמשים בתכנון ניסוי בבלקוים אקראים.
–(בתכנון זה נדאג שכל קבוצת משקל תקבל כל סוגים של
דיאטה)
16
תכנון בבלוקים אקראים
• איך משתמשים?
– בתכנון ניסויים בבלוקים אקראים מחלקים כל קבוצה של
יחידות הניסוי ל b-קבוצות הומוגניות.
– הקבוצות ההומוגניות האלו נקראות בלוקים.
– את הטיפולים מקציאים באופן אקראי ליחידות הניסוי בכל
בלוק – טיפול אחד לכל יחידת ניסוי בכל בלוק.
– מטרת הניסוי נשארת אותה מטרה כמו בתכנון חד-כיווני
רגיל ,כלומר ללמצוא הבדלים בין הטיפולים ,אך תכנון
הניסוי שונה.
17
דוגמה
בניסוי נעשה השוואה בין 3סוגים של תמיסות לחומרי
ניקוי .השוואה נעשית על מנת לחקור את מידת
ההצלחה של כל חומר ניקוי במניעת גידול החיידקים
במיכלי חלב תעשייתיים של 20ליטר.
את הניסוי מבצעים במעבדה וקיימת מגבלה של מספר
חזרות שניתן לעשות ביום – 3חזרות .מכיוון שימים
עלולים להוות מקור פוטנציאלי נוסף לשונות ,המהנדס
החליט לתכנן ניסוי לפי בלוקים אקראים ,כאשר ימים
הינם בלוקים .בכל יום עושים בדיקה של כל 3חומרי
ניקוי.
18
דוגמה :נתונים
19
תכנון בבלוקים אקראים -מודל
20
פירוק סכום הריבועים
SST y y
2
ij
i
2
yjy
yij yi
2
j
SSE=SSW
k yi y
i
2
j
b y j y
i
SSB
j
SSA
כאשר:
- y jממוצע התצפיות של טיפול ה( j -על פני כל
הבלוקים)
- yiממוצע התצפיות השייכות לבלוק הi -
- yממוצע של כל Nתצפיות
21
נוסחאות מקוצרות לחישוב סכומי ריבועים
SSA N A2
SSB N B2
SST N N2
SSE SST SSA SSB
כאשר:
- A2שונות (אוכלוסיה) של ממוצעי הטיפולים
2
- Bשונות (אוכלוסיה) של ממוצעי הבלוקים
2
- Nשונות (אוכלוסיה) של כל Nתצפיות
22
ניתוח תוצאות הניסוי מתבצע בשלבים הבאים:
שלב א' – בדיקת טיב התכנון
נבדוק את ההשערות הבוחנות טיב תכנון הניסוי לפי בלוקים:
b
H 0 : 1 2 3
)H1 : i j for at least one pair (i,j
במידה בשלב זה לא נדחה את השערת האפס (כלומר ,תכנון לפי בלוקים
היה מיותר) ,מבצעים שלבים ב' ו-ג' לפי טבלת ניתוח שונות חד-כיווני רגיל.
שלב ב' – בדיקת השפעת הטיפולים
נבדוק את ההשערות הבוחנות השפעת הטיפולים על משתנה התלוי:
k
H0 : 1 2 3
)H1 : i j for at least one pair (i,j
שלב ג' – חלוקה לקבוצות הומוגניות ,מסקנות והמלצות
במידה ודחינו השערת האפס בשלב ב' ,נבצע חלוקה לקבוצות הומוגניות
בעזרת מבחן LSDכאשר נחשב ערך קריטי לפי נוסחא:
23
2* MSE
b
2
k 1 b 1,
LSD t
)ANOVA( טבלת ניתוח שונות
מקורSS
)Source(
דרגותMS=SS/df
)df( חופש
טיפוליםSSA
k-1
בלוקיםSSB
b-1
שגיאותSSE
(k-1)(b-1)
- סה"כSST
Total
N-1
F2 Fb1, k 1b1,
F1 Fk 1, k 1b1,
SSA
MSA
k 1
SSB
MSB
b 1
MSE
F
ססטיסטי
F1
F2
קריטיF
MSA
MSE
Fk 1, k 1b1,
MSB
MSE
Fb1, k 1b1,
SSE
k 1 b 1
:שלב א' – בדיקת טיב התכנון לפי בלוקים
:שלב ב' – בדיקת השפעת הטיפולים
:איזורי דחייה
24
דוגמה :חישוב ממוצעים ושונויות
58.625
92.243
155.19
A2
B2
N2
N=12
k=3
b=4
25
ימים (בלוקים)
4
3
2
1
תמיסה
(טיפולים)
23
39
18
22
13
1
25.25
44
17
24
16
2
8
22
1
4
5
3
35
12
11.333 16.667
yj
yi
דוגמה :בניית טבלת ,ANOVAביצוע שלבים
א'+ב'
החלטה
Fקריטי
Fססטיסטי
דרגות
MS=SS/df
חופש df
SSמקור
שלב ב':
דוחים
40.717042 5.1432528
351.75
2
שלב א':
דוחים
42.710611 4.7570627
368.97222
1106.9167 3בלוקים
8.6388889
51.833333 6שגיאות
11
26
703.5טיפולים
1862.25סה"כ
דוגמה :שלב ג' – חלוקה לקבוצות הומוגניות
(מבחן )LSD
נחשב ערך קריטי של מבחן :LSD
2* MSE
2*8.63
LSD t
2.447
5.0855
k 1 b 1,
b
4
2
מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 :
נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים:
y3 8
y 2 25.25 y 1 23
y 2 25.25
*15
27
2.25
y 1 23
*17.25
y3 8
דוגמה :שלב ג' – חלוקה לקבוצות הומוגניות
(מבחן )LSD
ניתוח תוצאות המבחן וחלוקה לקבוצות הומוגניות .התקבל כי:
y 1 y 2 2.25 5.0855
אין הבדל מובהק בין טיפול 1וטיפול :2
y 1 y 3 15* 5.0855
יש הבדל מובהק בין טיפול 1וטיפול :3
יש הבדל מובהק בין טיפול 2וטיפול y 2 y 3 17.25* 5.0855 :3
טיפולים אשר אין ביניהם הבדל מובהק ,יהיו ביחד באותה קבוצה.
לכן התקבלו קבוצות הבאות:
קבוצה ( Aטיפולים )2 ,1
קבוצה ( Bטיפול )3
מסקנה :אם רוצים מקסימום בערך של משתנה תלוי ,נמליץ על קבוצה A
(טיפול 1או .)2
אם רוצים מינימום של משתנה התלוי ,נמליץ על קבוצה ( Bטיפול .)3
28
פלט אקסל:דוגמה
Anova: Two-Factor Without Replication
Variance Average
127.3333
23
168.9167
25.25
90
8
Sum
92
101
32
32.33333 11.33333
121.3333 16.66667
91
12
133
35
F crit
P-value
F
MS
5.143253 0.000323 40.71704
351.75
4.757063 0.000192 42.71061 368.9722
8.638889
Count
SUMMARY
4
4
4
1
2
3
34
50
36
105
df
3
1
3
2
3
3
3
4
ANOVA
SS
Source of Variation
2
703.5Rows
3 1106.917Columns
6 51.83333Error
11
1862.25Total
29
דוגמה 2
30
פלט אקסל:2 דוגמה
Anova: Two-Factor Without Replication
Variance Average
0.101733 0.516667
0.121033 0.606667
0.1303
0.67
0.125633 1.156667
0.1911
1.27
Sum
1.55
1.82
2.01
3.47
3.81
0.145
0.11942
0.09515
5.55
4.96
2.15
1.11
0.992
0.43
F crit
P-value
F
MS
3.837853 1.61E-07 146.8903 0.35474
4.45897 4.33E-08 273.3499 0.66014
0.002415
df
4
2
8
Count
3
3
3
3
3
SUMMARY
15-24
25-34
35-44
45-54
55-64
דיאטת רמת שומן נמוכה
דיאטת רמת שומן בינונית
דיאטת רמת שומן גבוהה
ANOVA
SS
Source of Variation
1.41896
Rows
1.32028
Columns
0.01932
Error
5
5
5
31
דוגמה :2פתרון
סעיף ( 1שלב א') – בדיקת טיב התכנון לפי גיל
נבדוק את ההשערות הבאות:
סעיף ( 2שלב ב') – בדיקת הבדל בין 3שיטות דיאטה (בדיקת השפעת
הטיפולים)
נבדוק את ההשערות הבאות:
32
דוגמה :2פתרון
סעיף ( 3שלב ג') – חלוקה לקבוצות הומוגניות
נחשב ערך קריטי של מבחן :LSD
2MSE
2*0.0024
LSD t
2.447
0.0716
k 1 b 1,
b
5
2
מספר השוואות זוגיות שצריך לבצע.(3*2)/2=3 :
נבנה טבלה של הפרשים מוחלטים בין ממוצעי הטיפולים:
y 1 1.11 y 2 0.992 y 3 0.43
y 1 1.11
*0.562
*0.118
y 2 0.992
*0.68
y 3 0.43
התקבל כי כל הפרש גדול מערך הסטטיסטי .LSDכלומר ,כל טיפול שונה
מובהק משני האחרים (סה"כ 3קבוצות הומוגניות הרי כל טיפול הינו
קבוצה) .המלצה :על מנת לקבל משתנה תלוי הגדול ביותר ,נמליץ על
טיפול ,1כיוון שממוצע הטיפול הינו גבוה ביותר והוא נמצא בקבוצה לבד.
33