Transcript Lecture9
המחלקה לניהול תעשייתי
סמסטר א' ,תשע"ב
רגרסיה לינארית ,ניתוח שונות ותכנון
ניסויים סטטיסטיים
הרצאה 9
סוגיות בתכנון ניסויים
ניתוח שונות חד-כיווני
תכנון ניסויים
ניסוי הוא מחקר בו ניתן לשלוט בתנאי
הסביבה .המטרה של הניסוי היא לבחון איך
התנאים הנשלטים ()input variables
משפיעים על מדדים או תוצרים חשובים
(.)response/output
מחקר תצפיתי ,לעומת זאת ,הוא מחקר בו
התנאים נוצרים באופן טבעי ,מבלי שהחוקר
יכול לקבוע אותם.
2
דוגמה :1ניסוי קליני לטיפול בלויקמיה
מטרת הניסוי לשפר את ההישרדות של
ילדים הלוקים בלויקמיה (סרטן) לימפטית
חריפה.
הרופאים רוצים להשוות בין מספר משטרי
הטיפול שונים ולא יודעים איזה משטר עדיף.
הרופאים יקבעו לכל ילד את הטיפול שיקבל
וירצו בסוף הניסוי להשוות בין הטיפולים.
3
מספר סוגיות בתכנון הניסוי
• איך לקבוע מה יהיה הטיפול של כל ילד.
• איך לדאוג שקבוצות הטיפול יהיו "ברי
השוואה הוגנת".
• איך כדאי למדוד את הצלחת הטיפולים.
• מהו גודל המדגם הדרוש לניסוי.
4
דוגמה :2מחקר תצפיתי בלויקמיה
מטרת המחקר הינה להעריך את החשיבות של
ספירת דם לבנה בעת אבחון כגורם תחזיתי אצל
ילדים הלוקים בלויקמיה .מודדים לכל ילד את
ספירת הדם הלבנה בעת האבחון.
• אין אפשרות לקבוע את הספירה.
• כמו כן ,יתכן שילדים שונים זה מזה בספירת דם
לבנה שונים גם במשתנים חשובים נוספים.
• סוגיות כמו אפיון טיפול מוצלח ובחירת גודל
המדגם נשארות פתוחות.
5
דוגמה :3ייצור אופטימלי של גלגלי שיניים
חברה לייצור משאיות מתלבטת איך לבצע טיפול
תרמי של גלגלי שיניים .יש ויכוח על שיטה הנכונה
להכניס את הגלגלים לתנור החימום.
• שיטה א' :לתלות את הגלגלים על המוטות.
• שיטה ב' :להניח את הגלגלים אחד על שני.
שיטה א' זולה ונוחה יותר .אך יש טענה ששיטה
ב' יכולה לשפר את הביצועים של הגלגלים.
בניסוי הפעילו את שתי השיטות והשוו את
הביצועים לפי מדד של עיוות הגלגל
.thrust face runout
6
מספר סוגיות בתכנון הניסוי
• איך לקבוע איזה גלגל מקבל איזה טיפול.
• מהו גודל המדגם הדרוש לניסוי.
7
מרכיבים אופייניים לניסוי
.1
.2
.3
8
יחידת הניסוי .יחידות מאוד הומוגניות יכולות להדגיש
השפעות .יחידות מגוונות יכולות לשפר את היכולת
להכללה מן הניסוי.
גורמים ( .)factorsהתנאים אותם נרצה לחקור .כל גורם
יכול לבוא במספר רמות (יש צורך בלפחות .)2אם יש
מספר גורמים משפיעים בניסוי וכל גורם בעל מספר רמות,
הטיפולים ( )treatmentsהינם כל קומבינציות
האפשריות בין כל הרמות של כל הגורמים .למשל ,גורם A
(גיל) בעל 3רמות וגורם ( Bמין) בעל 2רמות ,סה"כ 6
טיפולים .בניסוים רבים טיפול אחד יהיה קבוצת ביקורת.
תוכנית הניסוי .תוכנית שמפרטת איזה טיפול ניתן לכל
יחידת הניסוי .חשוב לדאוג שלא יהיו הבדלים חשובים בין
הטיפול.
היחידות בכל קבוצת
12/06/2011
סיכום
מרכיבים אופייניים לניסוי -המשך
.4בלוקים .לפעמים ניתן לחלק את יחידות
הניסוי לקבוצות הומוגניות הנקראות בלוקים.
אם כן ,ניתן לנצל את החלוקה הזאת לבניית
תוכנית הניסוי.
.5הקצאה אקראית ( .)randomizationשיטה
מקובלת לקבוע את תוכנית הניסוי .הקצאה
אקראית מונעת מן החוקר להטות את תוכנית
הניסוי לטובת טיפול מסויים .היא גם מבטיחה
שמשתנים נוספים יתחלקו באופן די שווה בין
קבוצות הטיפול.
9
מרכיבים אופייניים לניסוי -המשך
.6סמיות .סמיות גם מצמצמת אפשרויות
להטיה על ידי כך שיחידות הניסוי וחוקרים לא
יידעו מה היא קבוצת הטיפול של היחידה.
• סמיות בודדה :יחידת הניסוי לא יודעת מה
הטיפול.
• סמיות כפולה :בנוסף ,גם חוקר המבצע את
הטיפול לא יודע מה הטיפול.
• סמיות משולשת :בנוסף ,גם חוקר המודד
את התוצרים לא יודע מה הטיפול.
10
השוואה בין ניסוי מתוכנן למחקר תצפיתי
ניסוי מתוכנן
.1התערבות יזומה.
.2שליטה בתנאים.
.3צורך ליצור נתונים.
.4בסיס מוצק להסקת
מסקנות.
.5יכולת להסיק סיבה-
תוצאה.
11
מחקר תצפיתי
.1צפייה פסיבית.
.2תנאים שנוצרו בטבע.
.3נתונים ממעקב שותף.
.4בסיס חלש להסקת
מסקנות.
.5חשש שמשתנים
מתערבים אחראים על
הקשרים.
דוגמה :4מציאת מלפפון בעל יבול גבוה
12
מספר סוגיות בתכנון הניסוי
• איך לחלק את השדה לחלקות.
• איך לקבוע איזה זן לזרוע בכל חלקה.
• איך לדאוג שהחלקות לכל זן יהיו "ברי
השוואה הוגנת".
• מהו גודל המדגם הדרוש לניסוי.
13
דוגמה :5מציאת מדיום אופטימלי לגידול תאים
14
מספר סוגיות בתכנון הניסוי
• יש מספיק זמן לכמה סבבים של ניסויים.
איך כדאי לחלק את המאמץ בין הסבבים
השונים.
• איזה (וכמה) תוספים ניתן לכלול בניסוי.
• איזה הרכבים של תוספים כדאי להפעיל
ביחד.
15
דוגמה :6שיפור ההצלחה בביצוע ( IVFהפריה
חוץ גופית)
16
מספר סוגיות בתכנון הניסוי
• מהו גודל המדגם הדרוש.
• האם לבסס את גודל המדגם על מספר הנשים,
מספר מחזורי הריון או מספר עוברים מושתלים.
• האם יש הגיון להשוות את השיטה החדשה מול
שיעורי הצלחה שהתפרסמו במחקרים אחרים.
• האם יש בעיות אתיות לכלול את השיטות
הקיימות אם אכן הן פחות טובות מן השיטה
החדשה.
17
דוגמה :7חקירת חשיבה על בעיות הנדסה
18
מספר סוגיות בתכנון הניסוי
• איך לקבוע כמה פריטים מקבל כל נבדק.
• איך לקבוע כמה נבדקים לכלול.
• איך לקבוע את צורות המצולעים אולי צורת
המצולע מכניסה גורמים נוספים שעשויים
להשפיע על תוצאות הניסוי.
19
שלבים בתכנון הניסוי
.1
.2
.3
.4
.5
.6
.7
20
הכרת הבעיה והמטרה.
בחירת יחידות הניסוי ,גורמים ,רמות של גורמים (ומכאן -
טיפולים).
בחירת משתנים הנמדדים (.)response variables
קביעת תוכנית הניסוי – איזו יחידת ניסוי תקבל איזה
טיפול.
איסוף נתונים.
קביעת מספר החזרות.
ניתוח תוצאות.
התקדמות איטרטיבית
לשקול סבב של ניסויים במקום ניסוי אחד כוללני.
תכנון ניסוי
מטרה ואמצעים
הסקת מסקנות
ביצוע ניסוי
איסוף נתונים
ניתוח תוצאות
21
ניתוח שונות חד-כיוונית
The Completely Randomized
Designניסוי אקראי מלא
•
•
•
•
•
נבצע את הניסוי על מנת לבדוק השפעה של גורם
אחד על משתנה התלוי
נבדוק את גורם ב k -רמות (טיפולים)
הנחה :כל יחידות ניסוי הומוגניות
נחלק אקראית את יחידות הניסוי ל k -קבוצות בגודל n
נקצה טיפול לכל קבוצה באופן אקראי
22
ניתוח שונות חד כיווני – אפקטים קבועים:
דוגמה
23
דוגמה :נתונים
24
ניתוח שונות חד כיווני – מודל
- jתוחלת טיפול j
25
j j
קיימים סה"כ kקבוצות (טיפולים) ,כאשר בכל
טיפול יש njתצפיות.
ניתוח שונות חד כיווני – השערות
k 0
H 0 : 1 2 3
H1 : at least one j 0
פירוש השערת אפס :השפעה של כל טיפול (קבוצה) שווה ל ,0-כלומר
אף טיפול לא משפיע על משתנה התלוי.
פירוש השערת אחד :לפחות אחד מהטיפולים בעל השפעה מובהקת.
או בצורה שקולה:
k
H 0 : 1 2 3
)H1 : i j for at least one pair (i,j
פירוש השערת אפס :תוחלות של כל הטיפולים שוות.
פירוש השערת אחד :קיים לפחות זוג אחד של טיפולים בעלי תוחלות
שונות.
26
הנחות המודל – אפקטים קבועים
צריך להתקיים תחת
השערת אפס
27
j
n y
j
y
אומדי הפרמטרים:
ij
j
N
j
i
N
ˆ y
-אומד לתוחלת של כל המדגם
כאשר - N kn j :גודל המדגם (סה"כ מספר תצפיות)
n
y
ij
i 1
nj
- ˆ j y j אומד לתוחלת של טיפול j
- ˆ j y j yאומד להשפעה של טיפול j
2
1
S
j
j
n
2
j
N k
כאשר:
j
ij y
2
y
i
N k
j
y
y
ij
i
28
j
n j 1
S 2j
ˆ2 SE2
אומד לשונותשל שגיאות
-אומד לשונות של טיפול j
דוגמה :סטטיסטיקה תיאורית
S 2j
nj
j
N
29
y
y
טיפולים:
דוגמה :אמידת הפרמטרים
N 25, k 5, n j 5
30
פירוק סכום הריבועים
SST yij y yij y j n j y j y
2
j
2
j
i
i
j
SSW=SSE
SSB n j y j y
j
SSW yij y
j
i
2
SSB
n jˆ 2j
:ניתן לראות ש
j
n
2
j
2
2
2
1
S
N
k
S
j
j
j
)Total( סכום ריבועים הכללי-SST
)Between( – סכום ריבועי ההפרשים בין הטיפוליםSSB
) גורמי רעש, – סכום ריבועים בתוך הטיפולים (שגיאותSSW
)Within(
31
נוסחאות מקוצרות לחישוב סכומי הריבועים
2
T
SST N
2
B
SSB N
SSW SST SSB
כאשר:
– Nסה"כ מספר התצפיות
2
- Tשונות (אוכלוסיה) של כל התצפיות
2
- Bשונות (אוכלוסיה) של ממוצעי הטיפולים
הערה :שונות אוכלוסיה מחשבים חלקי ( nבמחשבון)
באקסל ניתן להשמש בפונקציה )( VARPאו STDEVP^2
32
דוגמה :חישוב סכומי הריבועים
טיפולים
אחוז כותנה/חזרות
1
2
3
4
5
ממוצעי טיפולים
15%
7
7
15
11
9
9.8
20%
12
17
12
18
18
15.4
25%
14
18
18
19
19
17.6
30%
19
25
22
19
23
21.6
35%
7
10
11
15
11
10.8
שונות בין הטיפולים B2 =19.0304 :
שונות בין התצפיות T2 =25.4784 :
k 5מספר הטיפולים
n j n 5מספר תצפיות בכל טיפול
N 5*5 25סה"כ מספר תצפיות במדגם
סכומי ריבועים:
SST N T2 25 25.4784 636.96
SSB N B2 25 19.0304 475.76
SSW SST SSB 636.96-475.76 161.2
33
j
y
ניתוח חד כיווני – בניית טבלת ניתוח שונות (טבלת )ANOVA
F P-Valueקריטי
PH 0 Fk 1, N k Fst
Fk 1, N k ,
F
ססטיסטי
MS=SS/dfדרגות
חופש
()df
SSמקור
()Source
k-1
SSBבין
הטיפולים
Between
SSB
MSB
Fst
k 1
MSW
SSW
N k
MSB
MSW
SSW N-kבתוך
הטיפולים
Within
(שגיאות)
N-1
איזור דחייה:
SSTסה"כ -
Total
Fst Fk 1, N k ,
P Value
תזכורת :בטבלת ANOVAערכים בשורה אחרונה (של סה"כ) מהווים
34סכום של ערכים בשורות שמעליה.
דוגמה :טבלת ANOVA
F P-Valueקריטי
0.0000
F(4,20,
0.05)=2.866
F
ססטיסטי
14.76
SSמקור
()Source
MS=SS/דרגות
dfחופש
()df
118.94
4
475.76טיפולים
(אחוזי
כותנה)
8.06
20
161.2שגיאות
24
636.96סה"כ
ערך סטטיסטי גדול מערך קריטי ,לכן נדחה את השערת האפס
ונאמר שלפחות אחד מהטיפולים שונה מאחרים .כלומר אחוז כותנה
משפיע של חוזק הבד.
35
דוגמה :פלט אקסל
ממוצע
תצפיות
בכל טיפול
Anova: Single Factor
טיפולים
nj
SUMMARY
Count
Groups
5Row 1
5Row 2
5Row 3
5Row 4
5Row 5
מקור
השונות
סכום
Variance Average Sum
11.2
9.8
49
9.8
15.4
77
4.3
17.6
88
6.8
21.6 108
8.2
10.8
54
סכומי
ANOVAריבועים
Source of
Variation
Between
4 475.76
בין הטיפולים
Groups
20 161.2Within Groups
SS
בתוך הטיפולים
סה"כ
36
שונות (מדגמית)
תצפיות בכל טיפול
24 636.96Total
דרגות
חופש
df
אומדים
לשונות
MS
Fסטטיסטי
F
P-value
Fקריטי
F crit
2.8660814 9.13E-06 14.75682 118.94
8.06
דוגמה 2
מכונות=k
אטמים=nj
37
דוגמה 2פתרון
אטמים/טיפולים
1
2
3
4
ממוצעי טיפולים
1
17.5
16.9
15.8
18.6
j
17.2 y
2
שונות בין הטיפולים 0.222431 B
2
שונות בין התצפיות 2.832431 T
24=N
6=k
4=nj
38
2
16.4
19.2
17.7
15.4
3
20.3
15.7
17.8
18.9
4
14.6
16.7
20.8
18.9
5
17.5
19.2
16.5
20.5
6
18.3
16.2
17.5
20.1
17.175
18.175
17.75
18.425
18.025
דוגמה :2בנית ANOVA
פלט אקסל:
Anova: Single Factor
SUMMARY
Groups
Sum
Count
Average
Variance
1
4
68.8
17.2
1.366667
2
4
68.7
17.175
2.709167
3
4
72.7
18.175
3.769167
4
4
71
17.75
7.216667
5
4
73.7
18.425
3.155833
6
4
72.1
18.025
2.6625
ANOVA
MS
F
P-value
F crit
Source of Variation
SS
5.338333 Between Groups
5
1.067667
0.306801
0.902421
2.772853
62.64 Within Groups
18
3.48
67.97833 Total
df
23
מסקנה :מאחר וקיבלנו שסטטיסטי קטן מ F -טבלה לא נדחה את
השערת האפס ז"א אין הבדל בין התוחלות של הטיפולים .כלומר
39מכונות לא שונות מהותית מבחינת חוזק אטמי הגומי.