Transcript m 1 m 2

สถิตเิ พื่อใช้ เปรี ยบเทียบ
ระหว่ างกลุ่มประชากร 2 กลุ่ม
1
t-Test: Paired Two Sample For Means
ใช้ ทดสอบแบบจับคู่เมื่อมีการจับคู่ค่าสังเกตตามธรรมชาติในตัวอย่ าง
ต่ างๆ เช่ น เมื่อมีการทดสอบกลุ่มตัวอย่ างสองครั ง้ คือก่ อนและหลังการ
ทดลอง เครื่ องมือวิเคราะห์ นีจ้ ะทา t-Test แบบจับคู่สองตัวอย่ าง เพื่อ
ระบุว่าการสังเกตที่ทาก่ อนและหลังการทดลอง
รู ปแบบ t-Test นีไ้ ม่ ได้ ตงั ้ สมมติฐานว่ าความแปรปรวนของประชากรทัง้
สองต้ องมีค่าเท่ ากัน
t-Test: Two-Sample Assuming Equal Variances
เครื่ องมือวิเคราะห์ นีจ้ ะทา t-Test สองตัวอย่ าง
รู ปแบบ t-Test นีจ้ ะตัง้ สมมติฐานว่ าชุดข้ อมูลทัง้ สองชุดมาจากการแจกแจงที่
มีค่าความแปรปรวนเท่ ากัน หรื อที่เรี ยกว่ า homoscedastic t-Test
สามารถใช้ t-Test นีเ้ มื่อทัง้ สองตัวอย่ างมาจากการแจกแจงที่มีค่าเฉลี่ย
ประชากรเท่ ากัน
t-Test: Two-Sample Assuming Unequal Variances
เครื่ องมือวิเคราะห์นี ้จะทา t-Test สองตัวอย่าง
ภายใต้ สมมติฐานว่าชุดข้ อมูลสองชุดมาจากการแจกแจงที่มีคา่ ความแปรปรวนไม่
เท่ากัน หรื อที่เรี ยกว่า heteroscedastic t-Test
เครื่ องมือวิเคราะห์ F-Test Two-Sample for Variances
(ความแปรปรวนแบบ F-test สองตัวอย่าง)
จะดาเนินการ F-test แบบสองตัวอย่างเพื่อเปรี ยบเทียบความแปรปรวนของ
ประชากรสองกลุม่
ตัวอย่างเช่น คุณสามารถใช้ เครื่ องมือ F-Test กับตัวอย่างเวลาในการ
ว่ายน ้าของทีมสองทีม เครื่ องมือจะให้ ผลลัพธ์ในการทดสอบสมมติฐานว่าง
ว่า ตัวอย่างสองกลุม่ มาจากการแจกแจงที่มีความแปรปรวนเท่ากัน เทียบ
กับสมมติฐานแย้ งว่าค่าความแปรปรวนไม่เท่ากันบนฐานการแจกแจง
• Example 1
–จริงหรือไม่ ที่ผ้ ทู ี่ทานอาหารที่มีไฟเบอร์ สงู ๆในมื ้อเช้ า
จะมีปริ มาณการบริ โภคอาหารมื ้อกลางวันได้ ในจานวน
(แคลอรี่ )ที่ต่ากว่าผู้ที่ไม่ได้ ทานอาหารที่มี
ไฟเบอร์ สงู ๆตอนเช้ า จริงหรือไม่ ครับ?
–การทดลองใช้ วิธีสมุ่ ตัวอย่างคนจานวน 150 คน
แบ่งเป็ นสองกลุม่ คือกลุม่ ที่บริ โภค และที่ไม่ได้ บริ โภค
–ทาการระบุปริ มาณอาหาร (แคลอรี่ )ที่ได้ รับในมื ้อ
กลางวัน
6
Calories consumed at lunch
Consmers Non-cmrs
568
498
589
681
540
646
636
739
539
596
607
529
637
617
633
555
.
.
.
.
705
819
706
509
613
582
601
608
787
573
428
754
741
628
537
748
.
.
.
.
Solution:
• ข้ อมูลเชิงปริมาณ.
• พารามิเตอร์ ที่ใช้ ในการทดสอบคือค่าความแตกต่าง
ระหว่างค่าเฉลี่ยของทังสองกลุ
้
ม่ ตัวอย่าง
• สมมติฐานคือค่าเฉลี่ยจานวนแคลอรี่ ของกลุม่ m1
น้ อยกว่ากลุม่ m2
XM12-01
7
• Identifying the technique
–สมมติฐานคือ:
H0: (m1 - m2) = 0
H1: (m1 - m2) < 0
(m1 < m2)
– ตรวจสอบความสัมพันธ์ระหว่างความแปรปรวนในกลุม่ ประชากรทังสองกลุ
้
ม่ โดย
คานวณส่วนเบี่ยงเบนมาตรฐานของตัวอย่างพบว่า
S1 = 64.05, และ S2 = 103.29.
ผลลัพธ์ที่ได้ คือตัวอย่างทังสองมี
้
คา่ ความแปรปรวนไม่เท่ากัน
The variances are unequal.
– run the t - test for unequal variances.
8
Calories consumed at lunch
Consmers Non-cmrs
568
498
589
681
540
646
636
739
539
596
607
529
637
617
633
555
.
.
.
.
705
819
706
509
613
582
601
608
787
573
428
754
741
628
537
748
.
.
.
.
t-Test: Two-Sample Assuming
Unequal Variances
Consumers
Nonconsumers
Mean
604.023 633.234
Variance
4102.98 10669.8
Observations
43
107
Hypothesized Mean Difference
0
df
123
t Stat
-2.09107
P(T<=t) one-tail 0.01929
t Critical one-tail 1.65734
P(T<=t) two-tail 0.03858
t Critical two-tail 1.97944
• At 5% significance level there is
sufficient evidence to reject the null
hypothesis.
มีความเป็ นไปได้ เพียง 3.8%ที่ค่าเฉลี่ยทัง้ สองจะเท่ ากัน
9
• Example 2
– จริงหรื อไม่ ที่การออกแบบงานและการเคลื่อนไหวของผู้ปฏิบตั ิงานมีผลต่อ
ผลิตภาพของแรงงาน จริงหรื อไม่ ครั บ
– วิธีการทางานสองแบบถูกออกแบบมาเพื่อใช้ ทดสอบผลิตภาพในการทางาน
ของสายการผลิต
– กลุม่ ตัวอย่างสองกลุม่ ถูกสุม่ ขึ ้นมาเพื่อทดสอบ แบ่งเป็ น Design A =
25 workers และ Design B = 25 workers
• บันทึกเวลาที่ผ้ ปู ฏิบตั ิงานแต่ละคนทาได้
– นาเวลาที่บนั ทึกไว้ จากทังสองกลุ
้
ม่ มาเปรี ยบเทียบเมื่อหาความแตกต่างของ
เวลาทางานที่ได้ จากระบบงานสองแบบที่แตกต่างกัน
10
Assembly times in Minutes
Design-A Design-B
6.8
5.2
5.0
6.7
7.9
5.7
5.2
6.6
7.6
8.5
5.0
6.5
5.9
5.9
5.2
6.7
6.5
6.6
.
.
.
.
.
.
.
.
Solution
• The data are quantitative.
• The parameter of interest is the difference
between two population means.
• The claim to be tested is whether a difference
between the two designs exists.
XM12-02
11
Checking the required Conditions for the
equal variances case (example 2)
Design A
12
The distributions are not
bell shaped, but they
seem to be approximately
normal. Since the technique
is robust, we can be confident
about the results.
10
8
6
4
2
0
5
5.8
6.6
Design B
7.4
8.2
More
4.2
5
5.8
7
6
5
4
3
2
1
0
6.6
7.4
More
12
Design-A Design-B
6.8
5.2
5.0
6.7
7.9
5.7
5.2
6.6
7.6
8.5
5.0
6.5
5.9
5.9
5.2
6.7
6.5
6.6
.
.
.
.
.
.
.
.
Degrees of freedom
t - statistic
P-value of the one tail test
P-value of the two tail test
The Excel printout
t-Test: Two-Sample Assuming Equal Variances
Design-A
Mean
6.288
2
S1 0.847766667
Variance
Observations
25
Pooled Variance
1.075416667
Hypothesized Mean Difference
0
df
48
t Stat
0.927332603
P(T<=t) one-tail
0.179196744
t Critical one-tail
1.677224191
P(T<=t) two-tail
0.358393488
t Critical two-tail
2.01063358
Design-B
6.016
1.3030667
25
2
S22
Sp
m  m 
13
• Conclusion: From this experiment, it is unclear
at 5% significance level if the two job designs
are different in terms of worker’s productivity.
14
A 95% confidence interval for m1 - m2 is calculated as follows:
( x1  x 2 )  t  
1 1
sp (  ) 
n1 n2
2
1
1
 6.288  6.016  2.0106 1.075(  ) 
25 25
 0.272  0.5896  [ 0.3176, 0.8616]
Thus, at 95% confidence level
-0.3176 < m1 - m2 < 0.8616
Notice: “Zero” is included in the interval
15
Example 3
• โรงงานผลิตยางรถยนต์แห่งหนึง่ ต้ องการทดสอบว่ายางเรเดียลแบบใหม่ มี
อายุการใช้ งานโดยเฉลี่ย(เวลาในการวิ่ง) ดีกว่าหรื อเท่ากับแบบเดิม จึง
ออกแบบการทดลองดังนี ้
– นายางรถยนต์แบบเก่าและแบบใหม่มาทดสอบวิ่งด้ วยรถยนต์จานวน 20 คันในแต่
ละกลุม่ ที่ถกู สุม่ เลือกขึ ้นมา ทดลองกับทังยางรถยนต์
้
แบบเก่าและแบบใหม่
– ผู้ทดลองจะทดลองขับรถยนต์ในสภาพการใช้ งานแบบปกติจนกระทัง่ ยางรถยนต์จะ
สึกถึงเกณฑ์ที่กาหนด
– บันทึกระยะทางการวิ่งของรถยนต์แต่ละคันดังแสดงในข้ อมูล
XM12-03
16
Solution
New-Design
70
83
78
46
74
56
74
52
99
57
77
84
72
98
81
63
88
69
54
97
m1
Exstng-Dsn
47
65
59
61
75
65
73
85
97
84
72
39
72
91
64
63
79
74
76
43
• Compare two populations of
quantitative data.
• The parameter is m1 - m2
The hypotheses are:
H0: (m1 - m2) = 0
H1: (m1 - m2) > 0
Mean distance driven before worn out
occurs for the new design tires
m2
Mean distance driven before worn out
occurs for the existing design tires
17
ทดสอบหาความแตกต่างระหว่างความแปรปรวน
• พบว่าไม่มีความแตกต่างอย่างมีนยั สาคัญ
ระหว่างความแปรปรวนของทังสองกลุ
้
ม่
• The hypotheses are
H0: m1 - m2 = 0
H1: m1 - m2 > 0
The test statistic is
t
x1  x 2  (m1  m 2 )
1 1
s(  )
n1 n1
2
p
t-Test: Two-Sample Assuming
Equal Variances
New Dsgn Exstng dsgn
Mean
73.6
69.2
Variance
243.4105263
226.8
Observations
20
20
Pooled Variance 235.1052632
Hypothesized Mean Difference0
df
38
t Stat
0.907447484
P(T<=t) one-tail 0.184944575
t Critical one-tail 1.685953066
P(T<=t) two-tail
0.36988915
t Critical two-tail 2.024394234
ยอมรับสมมติฐานที่วา่ ค่าเฉลี่ยของเวลา
การวิ่งในยางทังสอบแบบเท่
้
ากัน
19
วิเคราะห์ผลลัพธ์ที่ได้จากการทดสอบ
• จากตัวอย่างข้ างต้ นความแตกต่างระหว่างอายุการใช้ งานเฉลี่ยของยาง
ทังสองกลุ
้
ม่ คือ (73.6-69.2) = 4.4 ขณะที่คา่ ความแปรปรวนร่วม
ของทังสองกลุ
้
ม่ คือ
= 4.85 ดังนันค่
้ า t เท่ากับ
1
2 1

Sp
n  n
2
 1




• t-test statistic = 4.4/4.85 = 0.91
• The rejection region is t  t ,n  t0.05,19  1.729
• สาเหตุที่ทาให้ เราไม่อาจปฏิเสธสมมติฐานนี ้ได้ แม้ วา่ ค่าเฉลี่ยของทังสอง
้
กลุม่ จะแตกต่างกันค่อนข้ างมาก ก็เนื่องจากค่าความแปรปรวนร่วม
ระหว่างทังสองกลุ
้
ม่ มีคา่ ค่อนข้ างสูงด้ วยเช่นกัน
D 1
New design
7
6
5
4
3
2
1
0
45
60
75
90
105
More
105
More
Existing design
12
10
8
6
4
2
0
45
60
75
90
While the sample mean of the new design is larger than the sample mean
of the existing design, the variability within each sample is large enough
for the sample distributions to overlap and cover about the same range.
It is therefore difficult to argue that one expected value is different than
the other.
21
Match Pairs Experiment
เพื่อขจัดความแปรปรวนที่เกิดขึน้ จึง
ปรับปรุ งการทดสอบโดยเลือกจับคู่การ
ทดสอบใช้ วิธีทดสอบการเปลี่ยนแปลง
ของตัวอย่ างเดียวกันภายใต้ เงื่อนไขที่
แตกต่ างกันเพื่อเปรียบเทียบว่ าใน
เงื่อนไขที่แตกต่ างกันมีผลต่ อค่ าเฉลี่ย
ของกลุ่มตัวอย่ างหรือไม่
• XM 12-04
– ขจัดความแปรปรวนที่เกิดขึ ้น
– ใช้ วธิ ี t-test: Paired two
sample for means
t-Test: Paired Two Sample
for Means
New-Dsn Exst-Dsn
Mean
73.6
69.05
Variance
242.779 316.366
Observations
20
20
Pearson Correlation
0.91468
Hypothesized Mean Difference
0
df
19
t Stat
2.81759
P(T<=t) one-tail
0.0055
t Critical one-tail
1.72913
P(T<=t) two-tail
0.01099
t Critical two-tail
2.09302
Car
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
New-Dsn Exst-Dsn
57
48
64
50
102
89
62
56
81
78
87
75
61
50
62
49
74
70
62
66
100
98
90
86
83
78
84
90
86
98
62
58
67
58
40
41
71
61
77
82
23