Transcript m 1 m 2
สถิตเิ พื่อใช้ เปรี ยบเทียบ ระหว่ างกลุ่มประชากร 2 กลุ่ม 1 t-Test: Paired Two Sample For Means ใช้ ทดสอบแบบจับคู่เมื่อมีการจับคู่ค่าสังเกตตามธรรมชาติในตัวอย่ าง ต่ างๆ เช่ น เมื่อมีการทดสอบกลุ่มตัวอย่ างสองครั ง้ คือก่ อนและหลังการ ทดลอง เครื่ องมือวิเคราะห์ นีจ้ ะทา t-Test แบบจับคู่สองตัวอย่ าง เพื่อ ระบุว่าการสังเกตที่ทาก่ อนและหลังการทดลอง รู ปแบบ t-Test นีไ้ ม่ ได้ ตงั ้ สมมติฐานว่ าความแปรปรวนของประชากรทัง้ สองต้ องมีค่าเท่ ากัน t-Test: Two-Sample Assuming Equal Variances เครื่ องมือวิเคราะห์ นีจ้ ะทา t-Test สองตัวอย่ าง รู ปแบบ t-Test นีจ้ ะตัง้ สมมติฐานว่ าชุดข้ อมูลทัง้ สองชุดมาจากการแจกแจงที่ มีค่าความแปรปรวนเท่ ากัน หรื อที่เรี ยกว่ า homoscedastic t-Test สามารถใช้ t-Test นีเ้ มื่อทัง้ สองตัวอย่ างมาจากการแจกแจงที่มีค่าเฉลี่ย ประชากรเท่ ากัน t-Test: Two-Sample Assuming Unequal Variances เครื่ องมือวิเคราะห์นี ้จะทา t-Test สองตัวอย่าง ภายใต้ สมมติฐานว่าชุดข้ อมูลสองชุดมาจากการแจกแจงที่มีคา่ ความแปรปรวนไม่ เท่ากัน หรื อที่เรี ยกว่า heteroscedastic t-Test เครื่ องมือวิเคราะห์ F-Test Two-Sample for Variances (ความแปรปรวนแบบ F-test สองตัวอย่าง) จะดาเนินการ F-test แบบสองตัวอย่างเพื่อเปรี ยบเทียบความแปรปรวนของ ประชากรสองกลุม่ ตัวอย่างเช่น คุณสามารถใช้ เครื่ องมือ F-Test กับตัวอย่างเวลาในการ ว่ายน ้าของทีมสองทีม เครื่ องมือจะให้ ผลลัพธ์ในการทดสอบสมมติฐานว่าง ว่า ตัวอย่างสองกลุม่ มาจากการแจกแจงที่มีความแปรปรวนเท่ากัน เทียบ กับสมมติฐานแย้ งว่าค่าความแปรปรวนไม่เท่ากันบนฐานการแจกแจง • Example 1 –จริงหรือไม่ ที่ผ้ ทู ี่ทานอาหารที่มีไฟเบอร์ สงู ๆในมื ้อเช้ า จะมีปริ มาณการบริ โภคอาหารมื ้อกลางวันได้ ในจานวน (แคลอรี่ )ที่ต่ากว่าผู้ที่ไม่ได้ ทานอาหารที่มี ไฟเบอร์ สงู ๆตอนเช้ า จริงหรือไม่ ครับ? –การทดลองใช้ วิธีสมุ่ ตัวอย่างคนจานวน 150 คน แบ่งเป็ นสองกลุม่ คือกลุม่ ที่บริ โภค และที่ไม่ได้ บริ โภค –ทาการระบุปริ มาณอาหาร (แคลอรี่ )ที่ได้ รับในมื ้อ กลางวัน 6 Calories consumed at lunch Consmers Non-cmrs 568 498 589 681 540 646 636 739 539 596 607 529 637 617 633 555 . . . . 705 819 706 509 613 582 601 608 787 573 428 754 741 628 537 748 . . . . Solution: • ข้ อมูลเชิงปริมาณ. • พารามิเตอร์ ที่ใช้ ในการทดสอบคือค่าความแตกต่าง ระหว่างค่าเฉลี่ยของทังสองกลุ ้ ม่ ตัวอย่าง • สมมติฐานคือค่าเฉลี่ยจานวนแคลอรี่ ของกลุม่ m1 น้ อยกว่ากลุม่ m2 XM12-01 7 • Identifying the technique –สมมติฐานคือ: H0: (m1 - m2) = 0 H1: (m1 - m2) < 0 (m1 < m2) – ตรวจสอบความสัมพันธ์ระหว่างความแปรปรวนในกลุม่ ประชากรทังสองกลุ ้ ม่ โดย คานวณส่วนเบี่ยงเบนมาตรฐานของตัวอย่างพบว่า S1 = 64.05, และ S2 = 103.29. ผลลัพธ์ที่ได้ คือตัวอย่างทังสองมี ้ คา่ ความแปรปรวนไม่เท่ากัน The variances are unequal. – run the t - test for unequal variances. 8 Calories consumed at lunch Consmers Non-cmrs 568 498 589 681 540 646 636 739 539 596 607 529 637 617 633 555 . . . . 705 819 706 509 613 582 601 608 787 573 428 754 741 628 537 748 . . . . t-Test: Two-Sample Assuming Unequal Variances Consumers Nonconsumers Mean 604.023 633.234 Variance 4102.98 10669.8 Observations 43 107 Hypothesized Mean Difference 0 df 123 t Stat -2.09107 P(T<=t) one-tail 0.01929 t Critical one-tail 1.65734 P(T<=t) two-tail 0.03858 t Critical two-tail 1.97944 • At 5% significance level there is sufficient evidence to reject the null hypothesis. มีความเป็ นไปได้ เพียง 3.8%ที่ค่าเฉลี่ยทัง้ สองจะเท่ ากัน 9 • Example 2 – จริงหรื อไม่ ที่การออกแบบงานและการเคลื่อนไหวของผู้ปฏิบตั ิงานมีผลต่อ ผลิตภาพของแรงงาน จริงหรื อไม่ ครั บ – วิธีการทางานสองแบบถูกออกแบบมาเพื่อใช้ ทดสอบผลิตภาพในการทางาน ของสายการผลิต – กลุม่ ตัวอย่างสองกลุม่ ถูกสุม่ ขึ ้นมาเพื่อทดสอบ แบ่งเป็ น Design A = 25 workers และ Design B = 25 workers • บันทึกเวลาที่ผ้ ปู ฏิบตั ิงานแต่ละคนทาได้ – นาเวลาที่บนั ทึกไว้ จากทังสองกลุ ้ ม่ มาเปรี ยบเทียบเมื่อหาความแตกต่างของ เวลาทางานที่ได้ จากระบบงานสองแบบที่แตกต่างกัน 10 Assembly times in Minutes Design-A Design-B 6.8 5.2 5.0 6.7 7.9 5.7 5.2 6.6 7.6 8.5 5.0 6.5 5.9 5.9 5.2 6.7 6.5 6.6 . . . . . . . . Solution • The data are quantitative. • The parameter of interest is the difference between two population means. • The claim to be tested is whether a difference between the two designs exists. XM12-02 11 Checking the required Conditions for the equal variances case (example 2) Design A 12 The distributions are not bell shaped, but they seem to be approximately normal. Since the technique is robust, we can be confident about the results. 10 8 6 4 2 0 5 5.8 6.6 Design B 7.4 8.2 More 4.2 5 5.8 7 6 5 4 3 2 1 0 6.6 7.4 More 12 Design-A Design-B 6.8 5.2 5.0 6.7 7.9 5.7 5.2 6.6 7.6 8.5 5.0 6.5 5.9 5.9 5.2 6.7 6.5 6.6 . . . . . . . . Degrees of freedom t - statistic P-value of the one tail test P-value of the two tail test The Excel printout t-Test: Two-Sample Assuming Equal Variances Design-A Mean 6.288 2 S1 0.847766667 Variance Observations 25 Pooled Variance 1.075416667 Hypothesized Mean Difference 0 df 48 t Stat 0.927332603 P(T<=t) one-tail 0.179196744 t Critical one-tail 1.677224191 P(T<=t) two-tail 0.358393488 t Critical two-tail 2.01063358 Design-B 6.016 1.3030667 25 2 S22 Sp m m 13 • Conclusion: From this experiment, it is unclear at 5% significance level if the two job designs are different in terms of worker’s productivity. 14 A 95% confidence interval for m1 - m2 is calculated as follows: ( x1 x 2 ) t 1 1 sp ( ) n1 n2 2 1 1 6.288 6.016 2.0106 1.075( ) 25 25 0.272 0.5896 [ 0.3176, 0.8616] Thus, at 95% confidence level -0.3176 < m1 - m2 < 0.8616 Notice: “Zero” is included in the interval 15 Example 3 • โรงงานผลิตยางรถยนต์แห่งหนึง่ ต้ องการทดสอบว่ายางเรเดียลแบบใหม่ มี อายุการใช้ งานโดยเฉลี่ย(เวลาในการวิ่ง) ดีกว่าหรื อเท่ากับแบบเดิม จึง ออกแบบการทดลองดังนี ้ – นายางรถยนต์แบบเก่าและแบบใหม่มาทดสอบวิ่งด้ วยรถยนต์จานวน 20 คันในแต่ ละกลุม่ ที่ถกู สุม่ เลือกขึ ้นมา ทดลองกับทังยางรถยนต์ ้ แบบเก่าและแบบใหม่ – ผู้ทดลองจะทดลองขับรถยนต์ในสภาพการใช้ งานแบบปกติจนกระทัง่ ยางรถยนต์จะ สึกถึงเกณฑ์ที่กาหนด – บันทึกระยะทางการวิ่งของรถยนต์แต่ละคันดังแสดงในข้ อมูล XM12-03 16 Solution New-Design 70 83 78 46 74 56 74 52 99 57 77 84 72 98 81 63 88 69 54 97 m1 Exstng-Dsn 47 65 59 61 75 65 73 85 97 84 72 39 72 91 64 63 79 74 76 43 • Compare two populations of quantitative data. • The parameter is m1 - m2 The hypotheses are: H0: (m1 - m2) = 0 H1: (m1 - m2) > 0 Mean distance driven before worn out occurs for the new design tires m2 Mean distance driven before worn out occurs for the existing design tires 17 ทดสอบหาความแตกต่างระหว่างความแปรปรวน • พบว่าไม่มีความแตกต่างอย่างมีนยั สาคัญ ระหว่างความแปรปรวนของทังสองกลุ ้ ม่ • The hypotheses are H0: m1 - m2 = 0 H1: m1 - m2 > 0 The test statistic is t x1 x 2 (m1 m 2 ) 1 1 s( ) n1 n1 2 p t-Test: Two-Sample Assuming Equal Variances New Dsgn Exstng dsgn Mean 73.6 69.2 Variance 243.4105263 226.8 Observations 20 20 Pooled Variance 235.1052632 Hypothesized Mean Difference0 df 38 t Stat 0.907447484 P(T<=t) one-tail 0.184944575 t Critical one-tail 1.685953066 P(T<=t) two-tail 0.36988915 t Critical two-tail 2.024394234 ยอมรับสมมติฐานที่วา่ ค่าเฉลี่ยของเวลา การวิ่งในยางทังสอบแบบเท่ ้ ากัน 19 วิเคราะห์ผลลัพธ์ที่ได้จากการทดสอบ • จากตัวอย่างข้ างต้ นความแตกต่างระหว่างอายุการใช้ งานเฉลี่ยของยาง ทังสองกลุ ้ ม่ คือ (73.6-69.2) = 4.4 ขณะที่คา่ ความแปรปรวนร่วม ของทังสองกลุ ้ ม่ คือ = 4.85 ดังนันค่ ้ า t เท่ากับ 1 2 1 Sp n n 2 1 • t-test statistic = 4.4/4.85 = 0.91 • The rejection region is t t ,n t0.05,19 1.729 • สาเหตุที่ทาให้ เราไม่อาจปฏิเสธสมมติฐานนี ้ได้ แม้ วา่ ค่าเฉลี่ยของทังสอง ้ กลุม่ จะแตกต่างกันค่อนข้ างมาก ก็เนื่องจากค่าความแปรปรวนร่วม ระหว่างทังสองกลุ ้ ม่ มีคา่ ค่อนข้ างสูงด้ วยเช่นกัน D 1 New design 7 6 5 4 3 2 1 0 45 60 75 90 105 More 105 More Existing design 12 10 8 6 4 2 0 45 60 75 90 While the sample mean of the new design is larger than the sample mean of the existing design, the variability within each sample is large enough for the sample distributions to overlap and cover about the same range. It is therefore difficult to argue that one expected value is different than the other. 21 Match Pairs Experiment เพื่อขจัดความแปรปรวนที่เกิดขึน้ จึง ปรับปรุ งการทดสอบโดยเลือกจับคู่การ ทดสอบใช้ วิธีทดสอบการเปลี่ยนแปลง ของตัวอย่ างเดียวกันภายใต้ เงื่อนไขที่ แตกต่ างกันเพื่อเปรียบเทียบว่ าใน เงื่อนไขที่แตกต่ างกันมีผลต่ อค่ าเฉลี่ย ของกลุ่มตัวอย่ างหรือไม่ • XM 12-04 – ขจัดความแปรปรวนที่เกิดขึ ้น – ใช้ วธิ ี t-test: Paired two sample for means t-Test: Paired Two Sample for Means New-Dsn Exst-Dsn Mean 73.6 69.05 Variance 242.779 316.366 Observations 20 20 Pearson Correlation 0.91468 Hypothesized Mean Difference 0 df 19 t Stat 2.81759 P(T<=t) one-tail 0.0055 t Critical one-tail 1.72913 P(T<=t) two-tail 0.01099 t Critical two-tail 2.09302 Car 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 New-Dsn Exst-Dsn 57 48 64 50 102 89 62 56 81 78 87 75 61 50 62 49 74 70 62 66 100 98 90 86 83 78 84 90 86 98 62 58 67 58 40 41 71 61 77 82 23