Measure_of_dispersion

Download Report

Transcript Measure_of_dispersion

การวัดการกระจาย
1
กิจกรรมอภิปราย
ในการสอบวิชาสมุทรสาครศึกษา ของนักศึกษาห้อง
การจัดการทัว่ ไป ชั้นปี 1 มีคะแนนเฉลี่ย 60 คะแนน
นักศึกษาได้คะแนนดีหรื อไม่ ให้นกั ศึกษาช่วยกัน
อภิปราย
2
มีพนักงาน 2 กลุ่ม ๆละ 10 คน ทาการบรรจุสินค้าลงหี บห่อแล้ว
พบว่าความสามารถในการบรรจุสินค้าลงหี บต่อชัว่ โมงของ
พนักงานทั้งสองกลุ่ม จงหาค่าเฉลี่ยของทั้งสองกลุ่ม
กลุ่ม1
จานวนหี บห่อ จานวนคน
7
1
8
2
9
4
10
2
11
1
กลุ่ม2
จานวนหี บห่อ จานวนคน
3
1
4
1
5
1
6
1
9
2
12
1
13
1
14
1
15
1
3
มีบริ ษทั 2 บริ ษทั กาลังเปิ ดรับสมัครพนักงาน แต่กรมจัดหางานได้มี
การเก็บข้อมูลการทา OT ล่วงเวลาของทั้งสองบริ ษทั มีระยะเวลา
การเก็บข้อมูล จานวน 10 วัน พบว่า
กลุ่ม1
จานวนชัว่ โมง จานวนวัน
7
1
8
2
9
4
10
2
11
1
กลุ่ม2
จานวนชัว่ โมง จานวนวัน
3
1
4
1
5
1
6
1
9
2
12
1
13
1
14
1
15
1
4
เรื่อง การวัดแนวโน้ มเข้ าสู่ ส่วนกลางและการวัดการกระจาย
5
การวัดการกระจาย
ค่าของการวัดแนวโน้มเข้าสู่ ส่วนกลางแสดงลักษณะ
ของข้อมูลได้ไม่ละเอียด เพราะยังไม่เห็นการกระจายของ
ข้อมูลออกจากค่ากลาง
ดังนั้นในการสรุ ปลักษณะของข้อมูล เพื่อความชัดเจน
ในการอธิ บายลักษณะของข้อมูล เราต้องแสดงค่าของการ
วัดการกระจายของข้อมูลประกอบ หรื อควบคู่กบั ค่าของการ
วัดแนวโน้มเข้าสู่ ส่วนกลางด้วย
6
การวัดการกระจาย
คือ สถิติที่ช่วยให้ทราบถึงระดับการกระจายหรื อ
การแปรผันของคะแนนหรื อข้อมูลในกลุ่มนั้น
ถ้าค่าสูงแสดงว่าข้อมูลแตกต่างกันมาก
ถ้าค่าต่าแสดงว่าข้อมูลแตกต่างกันน้อยหรื อใกล้เคียงกัน
7
เปรี ยบเทียบการกระจายของข้อมูล
ข้อมูลชุดที่ 1 มีการกระจายน้อย
ข้อมูลชุดที่ 2 ไม่มีการกระจาย
ข้อมูลชุดที่ 3 มีการกระจายมาก
8
Ex การใช้อินเทอร์เน็ตของนักศึกษา 3 คณะ
9
• ถ้าพิจารณาค่าเฉลี่ยสามารถสรุ ปและตีความได้วา่
นักศึกษาทั้ง 3 คณะใช้อินเทอร์เน็ตในระดับเดียวกัน
หรื อไม่แตกต่างกันคือระดับปานกลาง (3)
• แต่ถา้ พิจารณาจากข้อมูลแต่ละค่าของทั้ง 3 กลุ่ม จะพบ
ความแตกต่างของคะแนนทั้ง 3 กลุ่มอย่างชัดเจน
• ดังนั้นการแสดงทั้งค่าที่แสดงแนวโน้มเข้าสู่ส่วนกลาง
และการกระจายจะทาให้การตีความและสรุ ปได้ถูกต้อง
ตามความเป็ นจริ ง
10
การวัดการกระจาย
การวัดการกระจายของข้ อมูล แบ่ งเป็ น 2 วิธี คือ
1. การวัดการกระจายสั มบูรณ์
2. การวัดการกระจายสั มพัทธ์
11
วิธีการวัดการกระจายของข้ อมูล
1) การวัดการกระจายสั มบูรณ์ (Absolute Variation) คือ
การวัดการกระจายของข้ อมูลชุดหนึ่ง เพือ่ ดูว่าข้ อมูลชุดนั้น
แต่ ละค่ ามีความแตกต่ างกันมากน้ อยเพียงใด
การวัดการกระจายสั มบูรณ์ ทนี่ ิยมใช้ กนั มีหลายแบบ
เช่ น พิสัย ส่ วนเบี่ยงเบนควอร์ ไทล์ ส่ วนเบี่ยงเบนเฉลีย่
ส่ วนเบี่ยงเบนมาตรฐาน
12
2) การวัดการกระจายสั มพัทธ์ (Relative Variation) การใช้
วัดการกระจายของข้ อมูลตั้งแต่ สองชุดขึน้ ไปเพือ่ นาค่ าที่
ได้ ของแต่ ละชุดมาเปรียบเทียบการกระจาย การวัดการ
กระจายสั มพัทธ์ มหี ลายแบบ เช่ น สั มประสิ ทธิ์ของพิสัย
สั มประสิ ทธิ์ของส่ วนเบี่ยงเบนควอร์ ไทล์ สั มประสิ ทธิ์ของ
ส่ วนเบี่ยงเบนเฉลีย่ และสั มประสิ ทธิ์ของส่ วนเบี่ยงเบน
มาตรฐาน
13
สมมติข้อมูลทีไ่ ด้ จากการวัดของกลุ่มตัวอย่ าง 2 กลุ่ม
กลุ่ม 1
10
12
15
18
20
กลุ่ม 2
20
4
8
15
28
เราจะพบว่ าค่ าเฉลีย่ ของทั้ง 2 กลุ่มนีเ้ ท่ ากันคือ 15 แต่ เมื่อพิจารณา
ให้ ดีแล้ว ข้ อมูลทีไ่ ด้ จากการวัดของกลุ่ม 2 แต่ ละค่ ามีความแตกต่ างกัน
มากกว่ าข้ อมูลในกลุ่มที่ 1 ในการจะทราบความแตกต่ างของข้ อมูลในแต่ ละ
กลุ่มเราเรียกว่ า การวัดการกระจาย ซึ่งมีวธิ ีการต่ าง ๆ ดังนี้
14
1. พิสัย ( Range )
• ความแตกต่างระหว่างค่าสูงสุ ดกับค่าต่าสุ ดของข้อมูล
ั =ข ้อมูลทีม
พิสย
่ ค
ี า่ สูงสุด–ข ้อมูลทีม
่ ค
ี า่ ตา่ สุด
• ถ้าพิสัยมีค่ามาก แสดงว่า ข้อมูลมีการกระจายมาก
• ถ้าพิสัยมีค่าน้อย แสดงว่า ข้อมูลมีการกระจายน้อย
• พิสยั เป็ นการวัดการกระจายอย่างหยาบๆ ไม่ใช่การวัดการกระจายที่ดี
15
ค่าของพิสยั
• ค่าเท่ากับ 0 แสดงว่าข้อมูลไม่มีการกระจาย
4 4 4 4 4
• พิสยั น้อย แสดงว่าข้อมูลมีการกระจายน้อย
4 5 4 5 4
• พิสยั มาก แสดงว่าข้อมูลมีการกระจายมาก
1 2 3 4 5
16
การใช้พิสยั
• เมื่อต้องการวัดการกระจายแบบคร่ าวๆ
• เมื่อต้องการทราบขอบเขตของความแปรผันอย่าง
สูงสุ ดของข้อมูลแต่ละชุด
• เมื่อต้องการจัดข้อมูลเป็ นชั้น หรื อกลุ่มข้อมูล
17
คุณสมบัติของพิสยั
มาตราวัดการกระจายที่คานวณได้ง่ายสุ ดแต่ไม่ละเอียด
คานวณจากค่าเพียงสองค่าคือค่าสูงสุ ดลบค่าต่าสุ ด
นิยามและค่าที่คานวณได้ตรงกับความหมายของการกระจายมากที่สุด
ถ้าข้อมูลจานวนมากค่าที่คานวณได้มีแนวโน้มจะสูงด้วย การเปรี ยบเทียบ
พิสยั ของชุดข้อมูล ควรมีจานวนเท่ากัน
• พิสัยใช้ได้ดีกบั กลุ่มตัวอย่างขนาดเล็ก เพราะค่าจะคงที่มากกว่ากลุ่มตัวอย่าง
ขนาดใหญ่
• ถ้ามีคะแนนตัวใดมากหรื อน้อยกว่าคะแนนตัวอื่นๆ อยูม่ าก จะมีผลต่อค่า
พิสยั มากกว่าค่าส่ วนเบี่ยงเบนมาตรฐาน เช่น 1 2 3 4 5 30
•
•
•
•
18
ตัวอย่ าง 1
จงหาพิสยั ของข้อมูลดังนี้
335 , 232 , 183 , 268 , 190 , 282 , 315 , 180 , 288
พิสัย = 335 – 180 = 155
19
1. พิสัย ( Range )
• ถ้าเป็ นข้อมูลที่มีการแจกแจงความถี่เป็ นอันตรภาคชั้น
ั = ขีดจำก ัดบนทีแ
พิสย
่ ท้จริงของคะแนนใน
ั้ งสุด – ขีดจำก ัดล่ำงทีแ
อ ันตรภำคชนสู
่ ท้จริง
ั้ ำ
ของคะแนนในอ ันตรภำคชนต
่ สุด
20
ตัวอย่ าง 2
จากตารางแจกแจงความถี่ของน้ าหนักนักศึกษากลุ่มหนึ่งจงหาพิสยั
น้ าหนัก
(กิโลกรัม)
50-52
53-55
56-58
59-61
จานวน
12
13
20
15
พิสัย = 61.5 - 49.5 = 12
21
2. ส่ วนเบี่ยงเบนควอไทล์
( Quartile Deviation )
ค่ าครึ่งหนึ่งของผลต่ างระหว่ างควอไทล์ที่ 3 กับควอไทล์ที่ 1 หรือ
เรียกว่ า“ Semi – interquartile range ”
Q3  Q1
Q.D. 
2
เมื่อ Qr หมายถึง ควอไทล์ที่ r โดยนาข้อมูลมาเรี ยงจากน้อยไปหามาก
แล้วแบ่งออกเป็ น 4 ส่ วน
22
กรณีข้อมูลดิบหรือข้ อมูลแจกแจงความถี่แบบไม่ เป็ นกลุ่ม
ควอไทล์ที่ r คือ ข้อมูลที่มีค่าอยูท่ ี่ตาแหน่ง
r
Qr   N  1
4
ตาแหน่ง
1
Q1   N  1
4
ตาแหน่ง
2
Q2   N  1
4
ตาแหน่ง
3
Q3   N  1
4
23
ตัวอย่ าง 3
จงหาส่ วนเบี่ยงเบนควอไทล์ของน้ าหนักของ 19 คน ดังนี้
55 , 48 , 56 , 49 , 56 , 50 , 57 , 49 , 56, 51 ,
58 , 52 , 60 , 53 , 60 , 54 , 60 , 61, 60
เรี ยงข้อมูลใหม่จะได้ 48 , 49 , 49 , 50 , 51 , 52 , 53 , 54 , 55 , 56 , 56 , 56 , 57 ,
58 , 60 , 60 , 60 , 60 , 61
Q1 = (1*20)/4 = 5
, Q3 = (3*20)/4 = 15
QD = (Q3-Q1)/2 = 4.5
24
b. ข้ อมูลแจกแจงความถี่แบบเป็ นกลุ่ม
 rN


f

L 
 4
Qr  L0  i 

f
q




25
กรณีข้อมูลแจกแจงความถี่แบบเป็ นกลุ่ม
 rN

 4   fL 
Qr  L0  i 

f
q




• เมื่อ
คือ ควอไทล์ที่ r
L0คือ ขีดจากัดล่างที่แท้จริ งของชั้นที่มีควอไทล์ที่ r
คือ ความกว้างของอันตรภาคชั้น
N คือ จานวนข้อมูลทั้งหมด
 f L คือ ความถี่สะสมจากชั้นต่าสุ ดก่อนถึงชั้นที่มีควอไทล์ที่ r
f q คือ ความถี่ของชั้นที่มีควอไทล์ที่ r
Qr
i
26
2. ส่ วนเบี่ยงเบนควอไทล์
( Quartile Deviation )
• เราใช้ Q.D. ในการวัดการกระจายของข้อมูล เมื่อข้อมูลนั้น
มีการวัดแนวโน้มเข้าสู่ ส่วนกลางด้วยมัธยฐาน
• ถ้า Q.D. มาก แสดงว่า ข้อมูลมีการกระจายมาก
• ถ้า Q.D. น้อย แสดงว่า ข้อมูลมีการกระจายน้อย
• แต่ Q.D. ไม่ค่อยนิยมใช้
27
จาได้หรื อเปล่าว่าการหาควอไทล์แบบ
แจกแจงหาได้อย่างไร ลองกลับไป
ทบทวนดูนะครับ
อย่าลืมการหาส่ วน
เบี่ยงเบนควอไทล์มีสูตร
การหาอย่างไร
28
ตัวอย่ าง 4
จงหาส่ วนเบี่ยงเบนควอไทล์
จากตารางแจกแจงความถี่
ต่อไปนี้
Q3=79.5+5(60-57)/6 =82
Q1=64.5+5(20-14)/10=67.5
(Q3-Q1)/2=(82-67.5)/2=7.25
อันตรภาคชั้น
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-94
95-99
f
1
2
11
10
12
21
6
9
4
4
f
1
3
14
24
36
57
63
72
76
8029
3. ส่ วนเบี่ยงเบนเฉลีย่
( Mean or Average Deviation )
ค่ าทีใ่ ช้ วดั การกระจายของข้ อมูลทีไ่ ด้ จากการเฉลีย่ ค่ าสั มบูรณ์
ของความแตกต่ างระหว่ างค่ าของข้ อมูลแต่ ละค่ าจากค่ ากลางของ
ข้ อมูลชุดนั้น (ค่ ากลางอาจใช้ มัธยฐานหรือค่ าเฉลีย่ เลขคณิตก็ได้
แต่ นิยมใช้ ค่าเฉลีย่ เลขคณิต)
30
3. ส่ วนเบี่ยงเบนเฉลีย่
( Mean or Average Deviation)
N
M .D. 
 x x
i 1
i
N
31
3. ส่ วนเบี่ยงเบนเฉลีย่
( Mean or Average Deviation)
= 3.6
32
สมมติข้อมูลทีไ่ ด้ จากการวัด 3 กลุ่มดังนี้
กลุ่ม 1
8
8
8
8
8
กลุ่ม 2
1
4
7
10
13
กลุ่ม 3
1
5
20
25
29
พิจารณาดูจะเห็นว่ า กลุ่ม 1 มีการกระจายน้ อยกว่ ากลุ่ม 2 และกลุ่ม 2 มี
การกระจายน้ อยกว่ ากลุ่ม 3 ในกลุ่ม 1 นั้น ข้ อมูลทั้งหมดไม่ มีความแปรปรวน
เมื่อหาค่ าเฉลีย่ ของแต่ ละกลุ่มจะได้ 8, 7 และ 16 ตามลาดับ ถ้ าเราหาความ
เบี่ยงเบนของข้ อมูลแต่ ละตัวกับค่ าเฉลีย่ แล้วจะได้
33
กลุ่ม 1
0
0
0
0
0
กลุ่ม 2
-6
-3
0
+3
+6
กลุ่ม 3
-15
-11
+4
+9
+13
เราอาจจะใช้ คุณลักษณะนีข้ องการวัดการกระจายทีช่ ื่อว่ าส่ วนเบี่ยงเบนเฉลีย่ (Mean
Deviation) ส่ วนเบี่ยงเบนเฉลีย่ ก็คอื ค่ าเฉลีย่ ของค่ าสั มบูรณ์ ของความเบี่ยงเบนของข้ อมูล
แต่ ละตัวกับค่ าเฉลีย่ ค่ าสั มบูรณ์ ของความเบี่ยงเบนก็คอื ความเบี่ยงเบนทีป่ ราศจาก
เครื่องหมายทางคณิตศาสตร์ เราจะพูดให้ ง่ายเข้ าส่ วนเบี่ยงเบนเฉลีย่ ก็คือการคานวณความ
เบี่ยงเบนของข้ อมูลแต่ ละตัวกับค่ าเฉลีย่ นาความเบี่ยงเบนแต่ ละตัวมาหาค่ าสั มบูรณ์ แล้ ว
นามาบวกกันและหารด้ วย N
จากตัวอย่ างข้ างบน กลุ่ม 1 มีส่วนเบี่ยงเบนเฉลีย่ เป็ น 0 กลุ่ม 2 มีส่วนเบี่ยงเบนเฉลีย่ คือ (6
+ 3 + 0 + 3 + 6)/5 = 18/5 = 3.6 และกลุ่ม 3 มีส่วนเบี่ยงเบนเฉลีย่ คือ (15 + 11 + 4 + 9 +
34
13) / 15 = 52/5 = 10.4
ตัวอย่ าง 5
จงหาส่ วนเบี่ยงเบนเฉลี่ย จากข้อมูลต่อไปนี้
5 , 12 , 18 , 10 , 14 , 13
N
M .D. 
x
i 1
i
ให้เวลา
คิดๆๆๆ
x
N
x = (5+12+18+10+14+13)/6 = 12
M.D. = (|5-12|+|12-12|+|18-12|+|10-12|+|14-12|+|13-12|)/6 = 3
35
3. ส่ วนเบี่ยงเบนเฉลีย่
( Mean or Average Deviation)
• สาหรับข้อมูลแจกแจงความถี่แบบกลุ่ม สามารถหา M.D.
โดยใช้สูตร
N
M .D. 
 f x x
i
i 1
N
36
ตัวอย่ างการคานวณหาส่ วนเบี่ยงเบนมาตรฐาน
478.42
76
37
ตัวอย่ าง 6
จงหาส่ วนเบี่ยงเบนเฉลี่ย จากตารางแจกแจงความถี่ต่อไปนี้
อันตรภาคชั้น
1-3
4-6
7-9
f
2
3
7
10-12 13-15
5
3
ฮึๆๆๆ ให้เวลาทาและเขียนชื่อนามสกุล และเลขที่ส่งด้วย
38
3. ส่ วนเบี่ยงเบนเฉลีย่
( Mean or Average Deviation)
• M.D. เป็ นการวัดการกระจายของข้อมูล ที่ดีกว่าการวัดการกระจาย
โดยใช้พิสยั และส่ วนเบี่ยงเบนควอไทล์
• ถ้า M.D. มาก แสดงว่า ข้อมูลมีการกระจายมาก
• ถ้า M.D. น้อย แสดงว่า ข้อมูลมีการกระจายน้อย
• แต่ M.D. ไม่ค่อยนิยมใช้ เนื่องจากมีการตัดเครื่ องหมายออก
39
4. ส่ วนเบี่ยงเบนมาตรฐาน ( Standard Deviation )
ค่าสถิติที่ใช้วดั การกระจายของข้อมูล ได้มาจากการหารากที่สองของ
ค่าเฉลี่ยกาลังสองของผลต่างระหว่างค่าของข้อมูลแต่ละค่า จากค่าเฉลี่ย
เลขคณิ ตของข้อมูลชุดนั้น เขียนแทนด้วย S หรื อ S.D. สาหรับกลุ่ม
ตัวอย่าง
• การวัดการกระจายของข้ อมูล โดยใช้ส่วนเบี่ยงเบนมาตรฐานเป็ นวิธีที่นกั
สถิติยอมรับว่าเป็ นวิธีที่ใช้วดั การกระจายได้ดีที่สุด
40
4. ส่ วนเบี่ยงเบนมาตรฐาน
(Standard Deviation)
41
4. ส่ วนเบี่ยงเบนมาตรฐาน
(Standard Deviation)
• สาหรับข้อมูลแจกแจงความถี่แบบไม่เป็ นกลุ่ม และเป็ นกลุ่ม
• สูตร
 f x  x 
N
S .D. 
i 1
2
i
i
N
42
ตัวอย่ าง 9
จงหาส่ วนเบี่ยงเบนมาตรฐาน จากตารางแจกแจงความถี่ต่อไปนี้
x
2
4
6
8
10
f
1
2
3
2
2
43
4. ส่ วนเบี่ยงเบนมาตรฐาน
(Standard Deviation)
• การหาส่ วนเบี่ยงเบนมาตรฐานวิธีน้ ี ต้องหาค่าเฉลี่ยเลขคณิ ตก่อน
• ถ้าค่าเฉลี่ยเลขคณิ ตเป็ นจานวนทศนิยมจะทาให้การคานวณหา
ส่ วนเบี่ยงเบนมาตรฐานคลาดเคลื่อนได้
• ถ้า S.D. มาก แสดงว่า ข้อมูลมีการกระจายมาก
• ถ้า S.D. น้อย แสดงว่า ข้อมูลมีการกระจายน้อย
44
• จึงควรใช้สูตร
4. ส่ วนเบี่ยงเบนมาตรฐาน
(Standard Deviation)
หรื อ


f i xi   f i xi 


S .D.  i 1
  i 1
N
 N 


N
2
N
2
N
S .D. 
fx
i 1
i i
N
2

 x
2
45
ตัวอย่ าง 10
จงหาส่ วนเบี่ยงเบนมาตรฐาน จากตารางแจกแจงความถี่ต่อไปนี้
อันตรภาคชั้น
2-4
5-7
8-10
11-13
14-16
f
1
2
3
2
2
46
สมบัติของส่ วนเบี่ยงเบนมาตรฐาน
1. หน่วยของส่ วนเบี่ยงเบนมาตรฐาน เป็ นหน่วยเช่นเดียวกับข้อมูล
2. ส่ วนเบี่ยงเบนมาตรฐาน มีค่ามากกว่าหรื อ เท่ากับ 0
3. ถ้าทุกค่าของข้อมูลเท่ากันแล้ว ส่ วนเบี่ยงเบนมาตรฐาน มีค่าเป็ น 0
แสดงว่าข้อมูลไม่มีการกระจาย
4. ถ้าส่ วนเบี่ยงเบนมาตรฐานของข้อมูลมีค่าเป็ น 0 แล้ว ข้อมูลทุกค่า
เท่ากัน
47
สมบัติของส่ วนเบี่ยงเบนมาตรฐาน
5. ถ้านาค่าคงตัวไปบวกหรื อลบออกจากข้อมูลทีละจานวนแล้ว ส่ วน
เบี่ยงเบนมาตรฐานใหม่ มีค่าเท่ากับส่ วนเบี่ยงเบนมาตรฐานเดิม
Ex
• ข้อมูล 9, 3, 8, 8, 9, 8, 9, 18 คานวณส่ วนเบี่ยงเบนมาตรฐานได้ = 3.87 ถ้า
นาค่าคงที่ 2 ไปบวกกับข้อมูลทุก ๆ ตัว จะได้ขอ้ มูลใหม่เป็ น
• 11, 5, 10, 10, 11, 10, 11, 20 คานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ = 3.87 ซึ่ ง
เท่าเดิม
• ถ้านาค่าคงที่ 2 ไปลบออกจากข้อมูลทุก ๆ ตัว จะได้ขอ้ มูลใหม่เป็ น 7, 1, 6, 6, 7, 6,
7, 16 คานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ = 3.87 ซึ่ งเท่าเดิม
48
สมบัติของส่ วนเบี่ยงเบนมาตรฐาน
6. ถ้านาค่าคงตัวไปคูณหรื อหารออกจากข้อมูลทีละจานวนแล้ว ส่ วนเบี่ยงเบน
มาตรฐานใหม่ มีค่าเท่ากับ ผลคูณหรื อผลหารของค่าสัมบูรณ์ของค่าคงตัวนั้นกับ
ส่ วนเบี่ยงเบนมาตรฐานเดิม
• Ex ข้อมูล 9, 3, 8, 8, 9, 8, 9, 18 ส่ วนเบี่ยงเบนมาตรฐาน = 3.87 ถ้านาเอา
ค่าคงที่ -2 ไปคูณกับข้อมูลทุกตัว จะได้ขอ้ มูลใหม่เป็ น -18, -6, -16, -16,
-18, -16, -18, -36 จะคานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ = 7.74
ซึ่งมีค่าเท่ากับ (3.87) x 2
• ถ้านาเอาค่าคงที่ 2 ไปหารออกจากข้อมูลตัวจะได้ขอ้ มูลใหม่เพิ่ม 4.5,
1.5, 4, 4, 4.5, 4, 4.5, 9 จะคานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ =
3.87
1.935 ซึ่งมีค่าเท่ากับ 2
49
สมบัติของส่ วนเบี่ยงเบนมาตรฐาน
7. การคานวณหาส่ วนเบี่ยงเบนมาตรฐานโดยใช้ค่ากลางของข้อมูลชนิดอื่นๆ
ที่ไม่ใช่ค่าเฉลี่ยเลขคณิ ต ค่าของส่ วนเบี่ยงเบนมาตรฐานที่ได้ จะมีค่า
มากกว่า ค่าของส่ วนเบี่ยงเบนมาตรฐานที่ใช้ค่าเฉลี่ยเลขคณิ ต
50
ความแปรปรวนและส่ วนเบี่ยงเบนมาตรฐาน
( ThemmVariance and Standard Deviation )
• การวัดการกระจายทีน่ ิยมใช้ กนั มากคือความแปรปรวนซึ่งมี
ความสั มพันธ์ กบั ส่ วนเบี่ยงเบนมาตรฐาน ต่ อไปนีจ้ ะพูดถึงความ
แปรปรวนของประชากรและการประมาณค่าความแปรปรวนของ
ประชากรจากกลุ่มตัวอย่ าง
• ความแปรปรวนของประชากร มีสัญลักษณ์ และสู ตรคานวณว่ า
51
ประชากร
กลุ่มตัวอย่าง
สัญลักษณ์แทนความแปรปรวน
σ2
S2 หรื อ S.D2
สัญลักษณ์แทนความเบี่ยงเบนมาตรฐาน
σ
S หรื อ S.D
52
การคานวณค่ าความแปรปรวน มีสูตรดังนี้
1. กรณีทขี่ ้ อมูลไม่ มีการแจกแจงความถี่
σ2 =
2


X



N
 X  X 
2
S.D2 =
หาจากประชากร
N 1
หาจากกลุ่มตัวอย่าง
53
2. กรณีทขี่ ้ อมูลมีการแจกแจงความถี่
σ2 =
 fx
N
2
  fx 


 N 


N  fx 2   fx
2
S.D2 =
N N  1
2
หาจากประชากร
หาจากกลุ่มตัวอย่าง
54
การคานวณค่ าความเบี่ยงเบนมาตรฐาน มีสูตรดังนี้
1. กรณีทขี่ ้ อมูลไม่ มีการแจกแจงความถี่
σ =
 X   
2
หาจากประชากร
N
 X  X 
2
S.D =
N 1
หาจากกลุ่มตัวอย่าง
55
2. กรณีทขี่ ้ อมูลมีการแจกแจงความถี่
σ=

f X   
2
หาจากประชากร
N
S.D =
 
f XX

2
หาจากกลุ่มตัวอย่าง
N 1
56
ตัวอย่ าง จงหาค่าความแปรปรวนและความเบี่ยงเบนมาตรฐานของกลุ่ม
ตัวอย่างต่อไปนี้ 3 , 5 , 7 , 10 , 6 , 5
วิธีทา
X
3
(X-X)2
9
X2
9
5
1
25
7
1
49
10
16
100
6
0
36
5
1
25
Σ 36
28
244
57
X
=
3  5  7  10  6  5
6
=
6
 X  X 
2
S.D2
 ความแปรปรวน
S.D
=
N 1
=
28
6 1
=
5.6
=
5.6
 ความเบี่ยงเบนมาตรฐาน = 2.37
58
ตัวอย่ าง จงคานวณหาความเบี่ยงเบนมาตรฐาน ของความสูงของนักศึกษา
5 คน ต่อไปนี้ 162 170 173 158 164
วิธีทา
หา X จากสูตร X
=
162  170  173  158  164
5
=
827
5
= 165.4
X
= 165.4
59
สู ตรหาความเบี่ยงเบนมาตรฐาน
σ =
  X    =
2
2


X



N
162  165.42  170  165.42  173  165.42
2
2
 158  165.4  164  165.4
=
11.56 + 21.16 + 57.76 + 54.76 + 1.96
=
147.2
σ =
147.2
5
σ =
5.42
ดังนั้น ความเบี่ยงเบนมาตรฐานของความสู งของนักศึกษา 5 คน เท่ากับ 5.42 เซนติเมตร
60
การวัดการกระจายสั มพัทธ์
(Relative Variation)
ในการเปรี ยบเทียบข้อมูลตั้งแต่สองชุดขึ้นไป เพื่อดูวา่ ชุดใดมีการกระจายมาก
ชุดใดมีการกระจายน้อย ถ้าใช้ค่าที่ได้จากการวัดการกระจายสัมบูรณ์ของข้อมูลแต่
ละชุดมาเปรี ยบเทียบกันจะตัดสิ นได้ยาก เพราะถ้าแต่ละค่าของข้อมูลมีค่ามาก
อาจจะส่ งผลให้ค่าแสดงการกระจายสัมบูรณ์มีค่ามากตามไปด้วย ซึ่ งจะทาให้การ
สรุ ปเปรี ยบเทียบอาจะไม่ถกู ต้อง
เพื่อให้การเปรี ยบเทียบเป็ นไปอย่างถูกต้องและมีความหมายต่อการตัดสิ น จึง
นิยมนาตัวเลขที่ได้จากผลหารระหว่าง “ ค่าการกระจายสัมบูรณ์กบั ค่ากลางของ
ข้อมูลนั้นๆ ” มาเป็ นตัวตัดสิ นว่า ข้อมูลชุดใดกระจายน้อย หรื อ มากกว่ากัน
ซึ่ ง ตัวเลข ดังกล่าวนี้จะเรี ยกว่า “ สัมประสิ ทธิ์ ของการกระจาย
61
การวัดการกระจายสั มพัทธ์
(Relative Variation)
เนื่องจากการวัดการกระจายสัมบูรณ์มี 4 วิธี ดังนั้นสัมประสิ ทธิ์ ของการ
กระจายที่ใช้ในการวัดการกระจายสัมพัทธ์จะมี 4 วิธีดว้ ย คือ ”
สัมประสิ ทธิ์ ของพิสัย (Coefficient of Range)
สัมประสิ ทธิ์ ของส่ วนเบี่ยงเบนควอร์ ไทล์ (Coefficient of Quartile Deviation)
สัมประสิ ทธิ์ ของส่ วนเบี่ยงเบนเฉลี่ย ( Coefficient of Average Deviation) และ
สัมประสิ ทธิ์ ของการแปรผัน หรื อสัมประสิ ทธิ์ ของการกระจาย ( Coefficient of
Variation)
ล้วนเป็ นการเปรี ยบเทียบการกระจายของข้อมูล โดยข้อมูลที่ต่างชุดกันซึ่ ง
ไม่มีหน่วย ถ้าข้อมูลที่มีสัมประสิ ทธิ์ มีค่ามาก แสดงว่ามีการกระจายของข้อมูลมาก
ถ้าข้อมูลชุดใดมีการกระจายของข้อมูลน้อย แสดงว่าข้อมูลชุดนั้นมีคุณภาพ
การวัดการกระจายสัมพัทธ์ใช้สูตรในการหาดังนี้
62
การวัดการกระจายสั มพัทธ์
(Relative Variation)
63
จากตารางสารวจอายุของคน 2 กลุ่มดังนี้
กลุ่มที่ 1 40 44 55 62 48 50 61 60 56 58 71 55
กลุ่มที่ 2 65 68 75 80 69 84 60 74 90 81 70 72
จงเปรียบเทียบอายุของคน 2 กลุ่ม โดยใช้ สัมประสิ ทธิ์ความแปรผัน
กลุ่มที่ 1
x
40  44  55  62  48  50  61  60  56  58  71  55

12
ปี
 55
S .D. 

( xi  x ) 2
N
225 121 0  49  49  25  36  25  1  9  256 0
12
 66.3
S .D.  8.14
ปี
64
C.V1
กลุ่มที่ 2
x
8.14
 0.148

55
65  68  75  80  69  84  60  74  90  81  70  72

12
 74
S .D.  81 36  1  36  25  100 196 0  256 49  16  4
12
 66.67
 8.17
C.V2
8.17

74
 0.11
 อายุของคนกลุ่มที่ 1 มีการกระจายมากกว่าอายุของคนกลุ่มที่ 2
65
ตัวอย่ าง 11
ผลการสอบของนักศึกษากลุ่มหนึ่ง จากการสอบสองครั้ง
ได้ผลดังนี้
การสอบ
ครั้งที่1
ครั้งที่2
คะแนนเฉลี่ย ส่ วนเบี่ยงเบนมาตรฐาน
60
6
700
7
66
ตัวอย่ าง 12
บริ ษทั แห่งหนึ่งผลิตหูฟังเครื่ องมือสื่ อสารขึ้นมา 2 ชนิด แล้ว
ทดสอบการใช้งาน โดยการให้พนักงานใช้หูฟังทั้ง 2 ชนิด
สรุ ปผลได้ดงั นี้
หูฟัง
ชนิดที่1
ชนิดที่2
คะแนนเฉลี่ย ส่ วนเบี่ยงเบนมาตรฐาน
86.4
12.1
138.6
13.5
67
ตัวอย่ าง 13
บริ ษทั ไทยยูเนียนได้ประเมินประสิ ทธิภาพการบริ การของ
พนักงานสามกลุ่ม ซึ่งพนักงานทั้งสามกลุ่มต่างก็มีหน้าที่
ให้บริ การลูกค้าเหมือนกัน เพียงแต่การบริ การที่ให้ลูกค้านั้นมี
ลักษณะแตกต่างกัน ผลการประเมินการบริ การทั้งสามกลุ่มมี
คะแนน ดังนี้
กลุ่ม
คะแนนเฉลี่ย ส่ วนเบี่ยงเบนมาตรฐาน
1
100
10
2
50
10
3
200
25
68
2
S =  f (x-x)
n-1
Xmax - Xmin
พิสัย
ส่ วนเบีย่ งเบนควอไทล์
QD = (Q3-Q1)/2
แจกแจง
ไม่ แจกแจง
ส่ วนเบีย่ งเบนมาตรฐาน
การกระจายสั มบูรณ์
ส่ วนเบีย่ งเบนเฉลีย่
ไม่ แจกแจง
การวัดการกระจายข้ อมูลเพียงชุดเดียว
แจกแจง
69
Xmax-Xmin
Xmax+Xmin
Q3-Q1
M.D.
Q3+Q1
x
สั มประสิ ทธิ์ส่วน
เบี่ยงเบนควอไทล์
สั มประสิ ทธ์ ของพิสัย
ประชากร
Z
X 

กลุ่มตัวอย่ าง
Z
X x
s

สั มประสิ ทธิ์ส่วนเบี่ยงเบน
เฉลีย่ ของกลุ่มตัวอย่ าง
การกระจายสั มพัทธ์
ค่ามาตรฐาน
M.D.
สั มประสิ ทธิ์การแปรผัน
ของกลุ่มตัวอย่ าง
S
X
สั มประสิ ทธิ์ส่วนเบี่ยงเบน
เฉลีย่ ของกลุ่มประชากร
สั มประสิ ทธิ์การแปรผัน
ของกลุ่มประชากร


70
71