Transcript Lecture9
המחלקה לניהול תעשייתי סמסטר א' ,תשע"ב רגרסיה לינארית ,ניתוח שונות ותכנון ניסויים סטטיסטיים הרצאה 9 סוגיות בתכנון ניסויים ניתוח שונות חד-כיווני תכנון ניסויים ניסוי הוא מחקר בו ניתן לשלוט בתנאי הסביבה .המטרה של הניסוי היא לבחון איך התנאים הנשלטים ()input variables משפיעים על מדדים או תוצרים חשובים (.)response/output מחקר תצפיתי ,לעומת זאת ,הוא מחקר בו התנאים נוצרים באופן טבעי ,מבלי שהחוקר יכול לקבוע אותם. 2 דוגמה :1ניסוי קליני לטיפול בלויקמיה מטרת הניסוי לשפר את ההישרדות של ילדים הלוקים בלויקמיה (סרטן) לימפטית חריפה. הרופאים רוצים להשוות בין מספר משטרי הטיפול שונים ולא יודעים איזה משטר עדיף. הרופאים יקבעו לכל ילד את הטיפול שיקבל וירצו בסוף הניסוי להשוות בין הטיפולים. 3 מספר סוגיות בתכנון הניסוי • איך לקבוע מה יהיה הטיפול של כל ילד. • איך לדאוג שקבוצות הטיפול יהיו "ברי השוואה הוגנת". • איך כדאי למדוד את הצלחת הטיפולים. • מהו גודל המדגם הדרוש לניסוי. 4 דוגמה :2מחקר תצפיתי בלויקמיה מטרת המחקר הינה להעריך את החשיבות של ספירת דם לבנה בעת אבחון כגורם תחזיתי אצל ילדים הלוקים בלויקמיה .מודדים לכל ילד את ספירת הדם הלבנה בעת האבחון. • אין אפשרות לקבוע את הספירה. • כמו כן ,יתכן שילדים שונים זה מזה בספירת דם לבנה שונים גם במשתנים חשובים נוספים. • סוגיות כמו אפיון טיפול מוצלח ובחירת גודל המדגם נשארות פתוחות. 5 דוגמה :3ייצור אופטימלי של גלגלי שיניים חברה לייצור משאיות מתלבטת איך לבצע טיפול תרמי של גלגלי שיניים .יש ויכוח על שיטה הנכונה להכניס את הגלגלים לתנור החימום. • שיטה א' :לתלות את הגלגלים על המוטות. • שיטה ב' :להניח את הגלגלים אחד על שני. שיטה א' זולה ונוחה יותר .אך יש טענה ששיטה ב' יכולה לשפר את הביצועים של הגלגלים. בניסוי הפעילו את שתי השיטות והשוו את הביצועים לפי מדד של עיוות הגלגל .thrust face runout 6 מספר סוגיות בתכנון הניסוי • איך לקבוע איזה גלגל מקבל איזה טיפול. • מהו גודל המדגם הדרוש לניסוי. 7 מרכיבים אופייניים לניסוי .1 .2 .3 8 יחידת הניסוי .יחידות מאוד הומוגניות יכולות להדגיש השפעות .יחידות מגוונות יכולות לשפר את היכולת להכללה מן הניסוי. גורמים ( .)factorsהתנאים אותם נרצה לחקור .כל גורם יכול לבוא במספר רמות (יש צורך בלפחות .)2אם יש מספר גורמים משפיעים בניסוי וכל גורם בעל מספר רמות, הטיפולים ( )treatmentsהינם כל קומבינציות האפשריות בין כל הרמות של כל הגורמים .למשל ,גורם A (גיל) בעל 3רמות וגורם ( Bמין) בעל 2רמות ,סה"כ 6 טיפולים .בניסוים רבים טיפול אחד יהיה קבוצת ביקורת. תוכנית הניסוי .תוכנית שמפרטת איזה טיפול ניתן לכל יחידת הניסוי .חשוב לדאוג שלא יהיו הבדלים חשובים בין הטיפול. היחידות בכל קבוצת 12/06/2011 סיכום מרכיבים אופייניים לניסוי -המשך .4בלוקים .לפעמים ניתן לחלק את יחידות הניסוי לקבוצות הומוגניות הנקראות בלוקים. אם כן ,ניתן לנצל את החלוקה הזאת לבניית תוכנית הניסוי. .5הקצאה אקראית ( .)randomizationשיטה מקובלת לקבוע את תוכנית הניסוי .הקצאה אקראית מונעת מן החוקר להטות את תוכנית הניסוי לטובת טיפול מסויים .היא גם מבטיחה שמשתנים נוספים יתחלקו באופן די שווה בין קבוצות הטיפול. 9 מרכיבים אופייניים לניסוי -המשך .6סמיות .סמיות גם מצמצמת אפשרויות להטיה על ידי כך שיחידות הניסוי וחוקרים לא יידעו מה היא קבוצת הטיפול של היחידה. • סמיות בודדה :יחידת הניסוי לא יודעת מה הטיפול. • סמיות כפולה :בנוסף ,גם חוקר המבצע את הטיפול לא יודע מה הטיפול. • סמיות משולשת :בנוסף ,גם חוקר המודד את התוצרים לא יודע מה הטיפול. 10 השוואה בין ניסוי מתוכנן למחקר תצפיתי ניסוי מתוכנן .1התערבות יזומה. .2שליטה בתנאים. .3צורך ליצור נתונים. .4בסיס מוצק להסקת מסקנות. .5יכולת להסיק סיבה- תוצאה. 11 מחקר תצפיתי .1צפייה פסיבית. .2תנאים שנוצרו בטבע. .3נתונים ממעקב שותף. .4בסיס חלש להסקת מסקנות. .5חשש שמשתנים מתערבים אחראים על הקשרים. דוגמה :4מציאת מלפפון בעל יבול גבוה 12 מספר סוגיות בתכנון הניסוי • איך לחלק את השדה לחלקות. • איך לקבוע איזה זן לזרוע בכל חלקה. • איך לדאוג שהחלקות לכל זן יהיו "ברי השוואה הוגנת". • מהו גודל המדגם הדרוש לניסוי. 13 דוגמה :5מציאת מדיום אופטימלי לגידול תאים 14 מספר סוגיות בתכנון הניסוי • יש מספיק זמן לכמה סבבים של ניסויים. איך כדאי לחלק את המאמץ בין הסבבים השונים. • איזה (וכמה) תוספים ניתן לכלול בניסוי. • איזה הרכבים של תוספים כדאי להפעיל ביחד. 15 דוגמה :6שיפור ההצלחה בביצוע ( IVFהפריה חוץ גופית) 16 מספר סוגיות בתכנון הניסוי • מהו גודל המדגם הדרוש. • האם לבסס את גודל המדגם על מספר הנשים, מספר מחזורי הריון או מספר עוברים מושתלים. • האם יש הגיון להשוות את השיטה החדשה מול שיעורי הצלחה שהתפרסמו במחקרים אחרים. • האם יש בעיות אתיות לכלול את השיטות הקיימות אם אכן הן פחות טובות מן השיטה החדשה. 17 דוגמה :7חקירת חשיבה על בעיות הנדסה 18 מספר סוגיות בתכנון הניסוי • איך לקבוע כמה פריטים מקבל כל נבדק. • איך לקבוע כמה נבדקים לכלול. • איך לקבוע את צורות המצולעים אולי צורת המצולע מכניסה גורמים נוספים שעשויים להשפיע על תוצאות הניסוי. 19 שלבים בתכנון הניסוי .1 .2 .3 .4 .5 .6 .7 20 הכרת הבעיה והמטרה. בחירת יחידות הניסוי ,גורמים ,רמות של גורמים (ומכאן - טיפולים). בחירת משתנים הנמדדים (.)response variables קביעת תוכנית הניסוי – איזו יחידת ניסוי תקבל איזה טיפול. איסוף נתונים. קביעת מספר החזרות. ניתוח תוצאות. התקדמות איטרטיבית לשקול סבב של ניסויים במקום ניסוי אחד כוללני. תכנון ניסוי מטרה ואמצעים הסקת מסקנות ביצוע ניסוי איסוף נתונים ניתוח תוצאות 21 ניתוח שונות חד-כיוונית The Completely Randomized Designניסוי אקראי מלא • • • • • נבצע את הניסוי על מנת לבדוק השפעה של גורם אחד על משתנה התלוי נבדוק את גורם ב k -רמות (טיפולים) הנחה :כל יחידות ניסוי הומוגניות נחלק אקראית את יחידות הניסוי ל k -קבוצות בגודל n נקצה טיפול לכל קבוצה באופן אקראי 22 ניתוח שונות חד כיווני – אפקטים קבועים: דוגמה 23 דוגמה :נתונים 24 ניתוח שונות חד כיווני – מודל - jתוחלת טיפול j 25 j j קיימים סה"כ kקבוצות (טיפולים) ,כאשר בכל טיפול יש njתצפיות. ניתוח שונות חד כיווני – השערות k 0 H 0 : 1 2 3 H1 : at least one j 0 פירוש השערת אפס :השפעה של כל טיפול (קבוצה) שווה ל ,0-כלומר אף טיפול לא משפיע על משתנה התלוי. פירוש השערת אחד :לפחות אחד מהטיפולים בעל השפעה מובהקת. או בצורה שקולה: k H 0 : 1 2 3 )H1 : i j for at least one pair (i,j פירוש השערת אפס :תוחלות של כל הטיפולים שוות. פירוש השערת אחד :קיים לפחות זוג אחד של טיפולים בעלי תוחלות שונות. 26 הנחות המודל – אפקטים קבועים צריך להתקיים תחת השערת אפס 27 j n y j y אומדי הפרמטרים: ij j N j i N ˆ y -אומד לתוחלת של כל המדגם כאשר - N kn j :גודל המדגם (סה"כ מספר תצפיות) n y ij i 1 nj - ˆ j y j אומד לתוחלת של טיפול j - ˆ j y j yאומד להשפעה של טיפול j 2 1 S j j n 2 j N k כאשר: j ij y 2 y i N k j y y ij i 28 j n j 1 S 2j ˆ2 SE2 אומד לשונותשל שגיאות -אומד לשונות של טיפול j דוגמה :סטטיסטיקה תיאורית S 2j nj j N 29 y y טיפולים: דוגמה :אמידת הפרמטרים N 25, k 5, n j 5 30 פירוק סכום הריבועים SST yij y yij y j n j y j y 2 j 2 j i i j SSW=SSE SSB n j y j y j SSW yij y j i 2 SSB n jˆ 2j :ניתן לראות ש j n 2 j 2 2 2 1 S N k S j j j )Total( סכום ריבועים הכללי-SST )Between( – סכום ריבועי ההפרשים בין הטיפוליםSSB ) גורמי רעש, – סכום ריבועים בתוך הטיפולים (שגיאותSSW )Within( 31 נוסחאות מקוצרות לחישוב סכומי הריבועים 2 T SST N 2 B SSB N SSW SST SSB כאשר: – Nסה"כ מספר התצפיות 2 - Tשונות (אוכלוסיה) של כל התצפיות 2 - Bשונות (אוכלוסיה) של ממוצעי הטיפולים הערה :שונות אוכלוסיה מחשבים חלקי ( nבמחשבון) באקסל ניתן להשמש בפונקציה )( VARPאו STDEVP^2 32 דוגמה :חישוב סכומי הריבועים טיפולים אחוז כותנה/חזרות 1 2 3 4 5 ממוצעי טיפולים 15% 7 7 15 11 9 9.8 20% 12 17 12 18 18 15.4 25% 14 18 18 19 19 17.6 30% 19 25 22 19 23 21.6 35% 7 10 11 15 11 10.8 שונות בין הטיפולים B2 =19.0304 : שונות בין התצפיות T2 =25.4784 : k 5מספר הטיפולים n j n 5מספר תצפיות בכל טיפול N 5*5 25סה"כ מספר תצפיות במדגם סכומי ריבועים: SST N T2 25 25.4784 636.96 SSB N B2 25 19.0304 475.76 SSW SST SSB 636.96-475.76 161.2 33 j y ניתוח חד כיווני – בניית טבלת ניתוח שונות (טבלת )ANOVA F P-Valueקריטי PH 0 Fk 1, N k Fst Fk 1, N k , F ססטיסטי MS=SS/dfדרגות חופש ()df SSמקור ()Source k-1 SSBבין הטיפולים Between SSB MSB Fst k 1 MSW SSW N k MSB MSW SSW N-kבתוך הטיפולים Within (שגיאות) N-1 איזור דחייה: SSTסה"כ - Total Fst Fk 1, N k , P Value תזכורת :בטבלת ANOVAערכים בשורה אחרונה (של סה"כ) מהווים 34סכום של ערכים בשורות שמעליה. דוגמה :טבלת ANOVA F P-Valueקריטי 0.0000 F(4,20, 0.05)=2.866 F ססטיסטי 14.76 SSמקור ()Source MS=SS/דרגות dfחופש ()df 118.94 4 475.76טיפולים (אחוזי כותנה) 8.06 20 161.2שגיאות 24 636.96סה"כ ערך סטטיסטי גדול מערך קריטי ,לכן נדחה את השערת האפס ונאמר שלפחות אחד מהטיפולים שונה מאחרים .כלומר אחוז כותנה משפיע של חוזק הבד. 35 דוגמה :פלט אקסל ממוצע תצפיות בכל טיפול Anova: Single Factor טיפולים nj SUMMARY Count Groups 5Row 1 5Row 2 5Row 3 5Row 4 5Row 5 מקור השונות סכום Variance Average Sum 11.2 9.8 49 9.8 15.4 77 4.3 17.6 88 6.8 21.6 108 8.2 10.8 54 סכומי ANOVAריבועים Source of Variation Between 4 475.76 בין הטיפולים Groups 20 161.2Within Groups SS בתוך הטיפולים סה"כ 36 שונות (מדגמית) תצפיות בכל טיפול 24 636.96Total דרגות חופש df אומדים לשונות MS Fסטטיסטי F P-value Fקריטי F crit 2.8660814 9.13E-06 14.75682 118.94 8.06 דוגמה 2 מכונות=k אטמים=nj 37 דוגמה 2פתרון אטמים/טיפולים 1 2 3 4 ממוצעי טיפולים 1 17.5 16.9 15.8 18.6 j 17.2 y 2 שונות בין הטיפולים 0.222431 B 2 שונות בין התצפיות 2.832431 T 24=N 6=k 4=nj 38 2 16.4 19.2 17.7 15.4 3 20.3 15.7 17.8 18.9 4 14.6 16.7 20.8 18.9 5 17.5 19.2 16.5 20.5 6 18.3 16.2 17.5 20.1 17.175 18.175 17.75 18.425 18.025 דוגמה :2בנית ANOVA פלט אקסל: Anova: Single Factor SUMMARY Groups Sum Count Average Variance 1 4 68.8 17.2 1.366667 2 4 68.7 17.175 2.709167 3 4 72.7 18.175 3.769167 4 4 71 17.75 7.216667 5 4 73.7 18.425 3.155833 6 4 72.1 18.025 2.6625 ANOVA MS F P-value F crit Source of Variation SS 5.338333 Between Groups 5 1.067667 0.306801 0.902421 2.772853 62.64 Within Groups 18 3.48 67.97833 Total df 23 מסקנה :מאחר וקיבלנו שסטטיסטי קטן מ F -טבלה לא נדחה את השערת האפס ז"א אין הבדל בין התוחלות של הטיפולים .כלומר 39מכונות לא שונות מהותית מבחינת חוזק אטמי הגומי.