Transcript Document
การทดสอบสมมติฐานเบือ้ งต้ น
กรณีท่ มี ีตัวอย่ างประชากรหนึ่งกลุ่ม
เพื่อเปรียบเทียบข้ อมูลสถิตทิ ่ ไี ด้ จากกลุ่มตัวอย่ างกับ
กลุ่มประชากร
10.1 Introduction
• วัตถุประสงค์ของการทดสอบสมมติฐานคือ การพิจารณาว่าข้ อมูลทางสถิติที่มีอยู่
เพียงพอหรื อไม่ที่จะทาให้ เราเชื่อมัน่ ในค่าพารามิเตอร์ ที่ปรากฏ
• ตัวอย่างเช่น
1. ถ้ าหลอดไฟที่บริ ษัทผลิตอยู่มีอายุการใช้ งานโดยเฉลี่ยที่ 2000 ชัว่ โมง ขณะที่
หลอดไฟใหม่ทางทีมวิจยั บอกว่ามีอายุการใช้ งานโดยเฉลี่ยที่มากกว่า (เช่นอาจจะ
บอกว่ามีอายุการใช้ งานเฉลีย่ ที่ 2200 ชัว่ โมง) คาถามก็คือเราจะเชือ่ ข้ อมูลของ
ทีมวิจยั ได้ หรื อไม่
2. ถ้ าค่าเฉลี่ยของปริ มาณการบริ โภคไข่ของคนไทยอยู่ที่ปีละ 200 ฟองต่อคน
ขณะที่จากการเก็บข้ อมูลพบว่านักศึกษา ป.โท KM ทานไข่โดยเฉลี่ยปี ละ 210
ฟอง คาถามก็คือเราจะกล่าวได้ หรื อไม่วา่ นักศึกษา ป.โท KM ทานไข่โดยเฉลี่ย
มากกว่าคนไทยทังประเทศ
้
2
Concept of hypothesis testing
• The critical concepts of hypothesis testing.
– There are two hypotheses (about a population parameter(s))
• H0 - the null hypothesis
[ for example m = 5]
• H1 - the alternative hypothesis [m > 5]
m=5
x
3
ทดสอบสมมติฐาน ค่าเฉลี่ยของประชากร เมื่อทราบ
ส่ วนเบี่ยงเบนมาตรฐานของประชากร
• ตัวอย่างที่ 1 (XM10-01)
– ระบบการจัดการบัญชีใหม่จะคุ้มค่าก็ตอ่ เมื่อยอดเงินที่ลกู ค้ าชาระโดยเฉลี่ยมีคา่
มากกว่า 170 บาทต่อรายการ
– จากการสารวจกลุม่ ตัวอย่าง 400 ตัวอย่างใน 1 เดือน พบว่ายอดชาระเงินโดย
เฉลี่ยอยูท่ ี่178 บาท
– สมมติฐานข้ อมูลมีการกระจายแบบปกติ (Normal distribution) โดยที่
s = $65 เราสามารถสรุปได้ หรื อไม่วา่ การติดตังระบบการจั
้
ดการบัญชีใหม่มี
ความความคุ้มเหมาะสมต่อการลงทุน
4
Null Hypothesis คือ ไม่มีความแตกต่างระหว่างค่าเฉลี่ยของ
ประชากรกับตัวอย่าง H0 : m = 170
Alternative Hypothesis คือ มีความแตกต่างระหว่างค่าเฉลี่ยของ
ประชากรกับตัวอย่าง H1 : m > 170
m x 170 178
If m is really equal to 170, then m x 170. The
distribution of the sample mean should look like this.
x 178
5
The standardized test statistic
– Instead of using the statistic x , we can use the
standardized value z.
z
xm
s
n
– Then, the rejection region becomes
z z
One tail test
6
• Example 1 - continued
– We redo this example using the standardized
test statistic.
H0: m = 170
H1: m > 170
– Test statistic:
z
xm
s
n
178 170
65
400
2 . 46
– ค่า Z จะคานวณจาก ผลต่างระหว่างค่าเฉลี่ยของตัวอย่างกับค่าเฉลี่ย
ของประชากร หารด้ วย ค่าความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย
(Standard Error of the mean)
7
P-value method
– ค่า p-value เป็ นตัวบอกค่าความน่าจะเป็ นที่คา่ เฉลี่ยของประชากรจะมี
ค่าแตกต่างกับค่าเฉลี่ยของตัวอย่าง
– โดยทัว่ ไปเรามักกาหนดการทดสอบที่ความน่าจะเป็ นเท่ากับ 5%
ตัวอย่าง ถ้ า P-value ที่คานวณได้ มีคา่ มากกว่า 0.05 ก็แปลว่าโอกาสที่
ค่าเฉลี่ยประชากรกับค่าเฉลี่ยของตัวอย่างจะเท่ากันมีมากกว่า5% (ยอมรับ
สมมติฐาน H0)
แต่ถ้า P-value ที่คานวณได้ มีคา่ น้ อยกว่า 0.05 ก็แปลว่าโอกาสที่
ค่าเฉลี่ยประชากรกับค่าเฉลี่ยของตัวอย่างจะเท่ากันมีน้อยกว่า 5% (ปฏิเสธ
สมมติฐาน H0)
8
จากตัวอย่าง XM10-01
• P-value = 0.007 แปลว่าความน่าจะเป็ นที่คา่ เฉลี่ยของ
ประชากรกับค่าเฉลี่ยของตัวอย่างจะเท่ากันมีอยูเ่ พียง 0.7% ดังนันเรา
้
จึงปฏิเสธสมมติฐานที่วา่ ค่าเฉลี่ย = 170
• ดังนันจากตั
้
วอย่างจึงสรุปได้ วา่ ที่ความเชื่อมัน่ 95% ค่าเฉลี่ยของยอด
ใช้ จ่ายของลูกค้ าจะสูงกว่า 170 บาทต่อรายการ ดังนันระบบใหม่
้
จงึ มี
ความคุ้มค้ าที่จะลงทุน
คาถาม : ถ้ าจุดที่ค้ ุมค่ าต่ อการลงทุนอยู่ท่ ลี ูกค้ าต้ องใช้ บริการตัง้ แต่
174 บาทต่ อรายการขึน้ ไป ระบบใหม่ ยังน่ าลงทุนอยู่หรือไม่
• 10.2 (Ex. XM10-02)
– สคบ. ทาการสุ่มตรวจขวดบรรจุนา้ แร่ นาเข้ าจานวน 25 ขวดที่มี
ฉลากระบุไว้ ว่า นา้ หนักสุทธิเท่ ากับ 16 ออนซ์
– จากประสบการณ์ ท่ ีผ่านมาทาเขาทราบว่ า นา้ หนักมีการกระจาย
แบบปกติโดยมีค่าส่ วนเบี่ยงเบนมาตรฐานเท่ ากับ 0.4 ounces.
– สคบ. สามารถสรุ ปได้ หรื อไม่ ว่าฉลากที่ตดิ หน้ าขวดนีบ้ อกข้ อมูลไม่
ตรงกับข้ อเท็จจริง
10
• Example 3 (XM10-03)
– กาหนดให้ สินค้ าตัวหนึ่งในสายผลิตมีความยาวมาตรฐานที่130 mm.
– จากการทดสอบสุม่ ตัวอย่างสินค้ า 100 ชิ ้นมาทาการวัดความยาวพบว่ามี
ความยาวเฉลี่ย 126.8 mm.
– กาหนดให้ ค่าเฉลี่ยของความยาวมาตรฐานมีการกระจายแบบปกติ โดยมีส่วน
เบี่ยงเบนมาตรฐานเท่ากับ 15 mm. เราสามารถสรุปได้ หรื อไม่วา่
สายการผลิตขณะนี ้กาลังมีปัญหาไม่สามารถผลิตของได้ ตรงตามมาตรฐาน
11
สถิติเชิงอนุมานสาหรับอธิ บายค่าเฉลี่ยของประชากรเมื่อ
ไม่ทราบส่ วนเบี่ยงเบนมาตรฐานของประชากร
12
ZZttt
Z
ttt
Z
x
m
xm
Z
t
t
Z
ttttt
ss n
s
s
sss n
s
ssss s sssssss
When the sampled population is normally distributed,
the statistic t is Student t distributed.
13
• Example 1 Trainees productivity (XM11-01)
– บริษัทขนส่งด่วนทางอากาศแห่งหนึง่ มักใช้ วิธีการปรับจานวนพนักงาน
ตามความต้ องการของตลาด จึงทาให้ มีอตั ราการเข้ าและออกของ
พนักงานสูง ปั ญหาที่ตามมาก็คือเมื่อพนักงานใหม่ถกู รับเข้ ามามักมี
ปั ญหาผลิตภาพต่ากว่าพนักงานเดิม กระบวนการฝึ กอบรมภายในหนึ่ง
สัปดาห์เพื่อให้ พนักงานสามารถทางานได้ โดยมีผลิตภาพเท่ากับร้ อยละ
90 ของพนักงานเดิมจึงเกิดขึ ้น
– สมมติวา่ พนักงานเดิมมีความสามารถในการบรรจุและส่งของที่ 500
ชิ ้นต่อวัน ผู้จดั การต้ องการทราบว่าพนักงานใหม่ที่เข้ าฝึ กอบรมจานวน
50 คนสามารผ่านตามเกณฑ์ผลิตภาพที่ร้อยละ 90 ของพนักงานเดิม
ได้ หรื อไม่
14
• Solution
– The problem objective is to describe the
population of the number of packages
processed in one hour.
– The data are quantitative.
H0:m = 450
H1:m > 450
– The t statistic
xm
t
s n
d.f. = n - 1 = 49
15
Test of Hypothesis About MU (SIGMA Unknown)
Data
505
Test of MU = 450 Vs MU greater than 450
400
Sample standard deviation = 38.8271
499
Sample mean = 460.38
415
Test Statistic: t = 1.8904
418
P-Value = 0.0323
.
.
.
.05
.0323
• Since .0323 < .05, we reject the null hypothesis in favor
of the alternative.
• There is sufficient evidence to infer that the mean
productivity of trainees one week after being hired is
greater than 450 packages at .05 significance level.
16
สถิติเชิงอนุมานสาหรับประชากรที่มีค่าเป็ นสัดส่ วน
Z
p p
p (1 p ) / n
ตัวอย่าง (XM11-05)
• บริษัทผู้ผลิตหนังสือพิมพ์แห่งหนึง่ ออกหนังสือพิมพ์ใหม่ โดยประมาณ
ว่าต้ องมีสว่ นแบ่งทางการตลาดในเขตจังหวัดเชียงใหม่อย่างน้ อยร้ อยละ
12 จึงจะคุ้มค่าต่อการลงทุน ฝ่ ายการตลาดได้ สมุ่ ตัวอย่างผู้อา่ น
หนังสือพิมพ์ในเชียงใหม่ 400 ตัวอย่าง โดยอธิบายวัตถุประสงค์และ
รูปแบบของหนังสือพิมพ์ใหม่ที่กาลังจะทาให้ กลุม่ ตัวอย่างเหล่านันฟั
้ ง
จากนันจะถามค
้
าถามว่าถ้ าราคาไม่เกินฉบับละ 10 บาทท่านจะซื ้อ
หรื อไม่ พบว่า มีอยู่ 58 คนที่ตอบว่าจะซื ้อ ท่านคิดว่าควรผลิต
หนังสือพิมพ์ฉบับนี ้ออกมาจาหน่ายหรื อไม่