Chapter 1 - วฐา มินเสน

Download Report

Transcript Chapter 1 - วฐา มินเสน

สถิตสิ าหรับสั งคมศาสตร์ 1
โดย
อ. วฐา มินเสน
บทที่ 1 ระเบียบวิธีทางสถิติ
1.1 ความหมายของสถิติ
1.2 ขอบข่ ายของสถิติ
1.3 ประเภทของข้ อมูล
1.4 มาตรการวัด
1.5 ระเบียบวิธีทางสถิติ
1.6 เทคนิคการสุ่ มตัวอย่ าง
1.7 ระเบียบวิธีในการแจงนับ
1.8 การนาเสนอข้ อมูล
1.1 ความหมายของสถิติ


หมายถึง ข้อเท็จจริ งที่เป็ นตัวเลขหรื อเป็ นลายลักษณ์อกั ษรที่ทาการเก็บรวบรวมมาได้ เช่น
ข้อมูลการยิงประตูของนักฟุตบอล ไมเคิล โอเว่น เป็ นต้น
หมายถึง สถิติเป็ นศาสตร์ที่ถือเป็ นทั้งวิทยาศาสตร์และศิลปศาสตร์ ว่าด้วยการเก็บรวบรวม
ข้อมูลที่เป็ นตัวเลข ซึ่งแสดงถึงข้อเท็จจริ งต่างๆ การนาเสนอข้อมูล การวิเคราะห์ การ
คานวณและตีความหมายของข้อมูล การสรุ ปผลจากข้อมูลที่รวบรวมมาเพื่อนาไปสู่การ
ตัดสิ นใจที่มีเหตุผล ซึ่งขั้นตอนเหล่านี้รวมเรี ยกว่า ระเบียบวิธีทางสถิติ
1.2 ขอบข่ ายของสถิติ


ขอบข่ายของสถิติครอบคลุมในทุกๆ แขนงวิชา และกิจกรรมต่างๆ ของการดารงชีวติ ใน
ปัจจุบนั
ในกรณี ให้ความหมายถึง สถิติศาสตร์ สามารถจาแนกขอบข่ายออกไปได้เป็ น 3 ประเภท
 สถิติปฎิบต
ัิ
 สถิติวเิ คราะห์เชิ งพรรณนา
 สถิติวเิ คราะห์เชิ งอนุ มาน
1.3 ประเภทของข้ อมูล

แบ่งออกเป็ น 2 ประเภท
 1. ข้อมูลเชิ งคุณภาพ เช่น ข้อมูลเพศ ข้อมูลสถานภาพสมรส
 2. ข้อมูลเชิ งปริ มาณ เช่น ข้อมูลที่ได้จาก ชัง
่ ตวง วัด ทั้งหลาย
1.4 มาตรการวัด


การแบ่งมาตรการวัดเพื่อประโยชน์ในการเลือกใช้วธิ ีการทางสถิติในการวิเคราะห์ขอ้ มูลชุด
นั้นๆ
แบ่งออกเป็ น 4 ระดับ
 1. มาตรนามบัญญัติ
 2. มาตรเรี ยงลาดับ
 3. มาตรอันตรภาค
 4. มาตรอัตราส่ วน
1.5 ระเบียบวิธีทางสถิติ





1. การวางแผนเก็บรวบรวมข้อมูล
2. การรวบรวมข้อมูลสถิติ
3. การนาเสนอข้อมูล
4. การวิเคราะห์ขอ้ มูล
5. การตีความหมาย
1.6 เทคนิคการสุ่ มตัวอย่ าง



วิธีการเลือกตัวอย่างแบ่งออกเป็ น 2 วิธี คือ
1. การเลือกตัวอย่างโดยไม่ใช้ความน่าจะเป็ น
 การเลือกตัวอย่างตามสะดวก
 การเลือกตัวอย่างแบบเจาะจง
 การเลือกตัวอย่างตามวิจารณญาน
 การเลือกตัวอย่างแบบกาหนดโควต้า
2. การเลือกตัวอย่างโดยใช้ความน่าจะเป็ น
 การเลือกตัวอย่างแบบสุ่ มแบบง่าย
 การเลือกตัวอย่างแบบมีระบบ
 การเลือกตัวอย่างแบบมีช้ น
ั ภูมิ
 การเลือกตัวอย่างแบบกลุ่ม
การเลือกตัวอย่ างแบบใช้ หลักความน่ าจะเป็ น
5
Population
N
สุ่ มแบบอย่ างง่ าย
Sample
n
หน่ วยตัวอย่าง
6
ตารางเลขสุ่ ม
20
74
94
22
93
45
44
16
04
.
.
.
17
49
70
42
04
49
28
49
31
23 ……………………….
03 ……………………….
38 ……………………….
7
Population
1
สุ่ มแบบมีระบบ
N
8
15
22
Sample
29
n
36
หน่ วยตัวอย่าง
I = N/n
8
Population
N
สุ่ มแบบแบ่ งชั้นภูมิ
Sample
หน่ วยตัวอย่าง
หน่ วยตัวอย่าง
9
Population
N
สุ่ มแบบแบ่ งเป็ นกลุ่ม
Sample
หน่ วยตัวอย่าง
หน่ วยตัวอย่าง
10
1.7 ระเบียบวิธีการแจงนับ

เช่น การสัมภาษณ์ , ส่ งแบบสอบภาม ,
บันทึกจากการวัดและนับ , การสังเกต
เป็ นต้น
1.8 การนาเสนอข้ อมูล


การนาเสนอโดยปราศจากแบบแผน
 เช่น บทความ หรื อ บทความถึ่งตาราง
การนาเสนอโดยมีแบบแผน
 1. การนาเสนอโดยตาราง
 2. การนาเสนอโดยกราฟ
 กราฟเส้น หรื อ แผนภูมิเส้น
 กราฟแท่ง หรื อ แผนภูมิ แท่ง
 กราฟรู ปภาพ หรื อ แผนภูมิรูปภาพ
 กราฟวงกลม เป็ นต้น
กราฟ แท่ ง (Bar Chart)
กราฟ เส้ น (Line Chart)
กราฟ เส้ น และกราฟแท่ ง
กราฟ พืน้ ผิว (Surface Chart)
แผนที่ (Map)
แผนที่เส้ นทาง (Bus Route map)
กราฟวงกลม (Pie Chart)
แผนที่วงกลม (Pie Chart)
แผนที่ต้นไม้ (Tree map)
กราฟ Radar (เรดาร์ )
กราฟ Radar (เรดาร์ )
ไมเคิล โอเว่ น
การเลี ้ยงบอล
ความเร็ว
วฐา มินเสน
10
5
ความแข็งแกร่ง
การเลี ้ยงบอล
0
การทาประตู
เหลิม อยู่รอด
การเลี ้ยงบอล
5
ความเร็ว
การทาประตู
โอซาระ ซึบาสะ
10
ความแข็งแกร่ง
การเลี ้ยงบอล
0
การทาประตู
10
ความแข็งแกร่ง
0
การส่งลูกบอล
5
ความเร็ว
การส่งลูกบอล
ความเร็ว
10
5
ความแข็งแกร่ง
0
การส่งลูกบอล
การทาประตู
การส่งลูกบอล
บทที่ 2 การแจกแจงความถี่
2.1 การแจกแจงความถี่
2.2 การสร้างตารางแจกแจงความถี่
2.3 การนาเสนอในรู ปของลาต้นและใบ
2.4 กราฟของการแจกแจงความถี่ และความถี่สะสม
2.1 การแจกแจงความถี่
การเตรี ยมข้อมูลดิบให้เป็ นระเบียบเป็ นหมวดหมู่เพื่อให้ดูเข้าใจง่าย และสะดวกในการนาไปใช้ใน
การวิเคราะห์ สามารถทาได้ดงั นี้
1. การจัดเรี ยงข้อมูล เช่น การเรี ยงข้อมูลจากมากไปหาน้อย เป็ นต้น
2. การแจกแจงความถี่ หมายถึง การเรี ยงลาดับข้อมูลดิบที่รวบรวมมาได้ โดยจัดให้เป็ นหมวดหมู่
หรื อเป็ นชั้นๆ แล้วหาจานวนของข้อมูลในแต่ละชั้น จานวนของข้อมูลในแต่ละชั้นเรี ยกว่า
ความถี่ จากนั้น น าค่ า ของข้อ มู ล และความถี่ ใ นแต่ ล ะชั้น มาจัด ไว้ใ นตารางเพื่อ ความเป็ น
ระเบี ยบ ตารางนี้ จะต้องบรรจุขอ้ มูลที่ เก็บรวบรวมมาทั้งหมด ซึ่ งจะเรี ยกว่า ตารางแจกแจง
ความถี่
ลักษณะของตารางแจกแจงความถี่
ชั้น
ขีดจากัดชั้น
1.
2.
1.
2.
3.
4.
5.
ขีดจากัดล่าง
ขีดจากัดบน
ขอบเขตชั้น
อันตรภาคชั้น
จุดกลางชั้น
กลุ่มอายุ
(แบบขีดจากัดชั้น)
กลุ่มอายุ
(แบบขอบเขตชั้น)
ความถี่
0–9
10 – 19
20 – 29
30 – 39
40 – 49
50 – 59
-0.5 – 9.5
9.5 – 19.5
19.5 – 29.5
29.5 – 39.5
39.5 – 49.5
49.5 -59.5
5
10
20
15
10
5
2.2 การสร้ างตารางแจกแจงความถี่
หาค่าต่าสุ ด (minimum value) และค่าสูงสุ ด (maximum value) ของข้อมูล
2. หาความแตกต่างระหว่างค่าต่าสุ ดและค่าสู งสุ ดของข้อมูล ซึ่ งเรี ยกว่า พิสัย
1.
(Range ; R)
Range = Maximum Value - Minimum Value หรื อ
พิสยั = คะแนนสูงสุ ด – คะแนนต่าสุ ด
3. กาหนดจานวนชั้นที่ตอ้ งการ (number of class) ให้ k เป็ นจานวนชั้น เพื่อจัดกลุ่มข้อมูลตามความ
เหมาะสม จานวนชั้นจะต้องมีไม่มากไม่นอ้ ยเกินไป เพราะถ้าจัดจานวนชั้นน้อยเกินไปจะทาให้เสี ยรายละเอียด
ในบางส่ วนไป แต่ถา้ มีจานวนชั้นมากเกินไปจะทาให้ไม่เห็นการกระจายที่แท้จริ งของข้อมูล จานวนชั้น
โดยทัว่ ไปควรจัดให้อยูร่ ะหว่าง 5-15 ชั้น ซึ่ งก็แล้วแต่จานวนข้อมูลและพิสยั หรื ออาจคานวณได้จากสูตรของ
Sturges ดังนี้
k = 1 + 3.322 log N
เมื่อ
k = จานวนชั้น
N = จานวนข้อมูลทั้งหมด
27
Note: คาตอบทีไ่ ด้ เป็ นทศนิยมให้ ปัดขึน้
2.2 การสร้ างตารางแจกแจงความถี่
คโดยทั
านวณค่
าอันตารางแจกแจงความถี
ตรภาคชั้น สามารถค่มานวณได้
จากสูาอัตนร ตรภาคชั้นของแต่
ว่ ไป
กั จะกาหนดค่
พิสยั
ละชั้นcเท่ากัน แต่ถา้ จาเป็ นหรื อทาไม่ได้ อาจจะกาหนดให้อนั ตรภาคชั้นใน
จ
ำนวนชั
น
้
แต่ละชั้นไม่เท่ากันก็ได้ หรื อบางครั้งอาจจะเป็ นอันตรภาคชั้นเปิ ด
สาหรับค่ าอันตรภาคชั้นทีค่ านวณได้ จะมีการปัดค่ าขึน้ เสมอ (ถึงแม้วา่ จะหารลงตัว) โดย
ปัดให้อยูใ่ นลักษณะเดียวกับข้อมูลดิบ เช่น ถ้าข้อมูลดิบเป็ นเลขจานวนเต็ม
อันตรภาคชั้นก็จะเป็ นเลขจานวนเต็มด้วย ถ้าข้อมูลดิบเป็ นเลขจานวน
ทศนิยม 1 ตาแหน่ง อันตรภาคชั้นก็จะเป็ นเลขจานวนทศนิยม 1 ตาแหน่ง
ด้วย
5. จัดข้อมูลเป็ นชั้น ๆ โดยเรี ยงลาดับจากคะแนนต่าไปหาคะแนนสู ง หรื อ
จากคะแนนสู งไปหาคะแนนต่าก็ได้ แต่มกั จะนิ ยมจัดข้อมูลจากคะแนนต่า28
4.
2.2 การสร้ างตารางแจกแจงความถี่
5.
6.
7.
8.
ทารอยคะแนน
จัดทาความถี่สะสม
1. ความถี่สะสมชนิ ดน้อยกว่า
2. ความถี่สะสมชนิ ดมากกว่า
ความถี่สมั พัทธ์ ( = ความถี่ของแต่ละชั้น /
ความถี่ท้ งั หมด)
ความถี่สะสมสัมพัทธ์
ตัวอย่ าง
ขีดจากัดชั้น
ขอบเขตชั้น ความถี่
ความถี่
สั มพันธ์
1.0000
ความถี่สะสม
น้ อยกว่า
มากกว่า
ความถีส่ ะสม
สัมพันธ์
(น้ อยกว่า)
2.3 การนาเสนอในรูป 2.4 กราฟของการแจกแจง
ความถี่ และความถี่สะสม
ของลาต้ นและใบ


ขั้นตอนที่ 1 สร้างลาต้น (ตัวเลขด้านซ้ายมือเหลือไว้
หนึ่งหลักสุ ดท้าย)
ขั้นตอนที่ 2 สร้างใบ (ตัวเลขหนึ่งหลักด้านซ้ายมือ)
1.
2.
3.
Data : 68 , 71 , 77 , 83 ,79
ลำต ้น
26
27
28
29
Histogram
8
1, 7, 9
3
Data : 29.5 , 28.7 , 27.8 , 29.3 , 28.3 , 26.0
ลำต ้น
รูปหลำยเหลืย
่ มควำมถี่
โค ้งควำมถี่
ใบ
ใบ
0
8
3,7
3,5
25
20
ความถี่
6
7
8
Histogram
15
10
5
ควำมถี่
0
-5.5
4.5
14.5
24.5
34.5
ค่ากึง่ กลาง
44.5
54.5
64.5
บทที่ 3 การว ัดแนวโน้มเข้าสู่
สว่ นกลาง
ตัวกลำงเลขคณิต (Arithmetic Mean)
2. มัธยฐำน (Median)
3. ฐำนนิยม (Mode)
4. ตัวกลำงเรขำคณิต (Geometric Mean)
5. ตัวกลำงอำร์โมนิค (Harmonic Mean)
1.
สั ญลักษณ์ และรูปแบบทีค่ วรทราบ
ตัวแปร คือ กำรใชตั้ วอักษรภำษำอังกฤษแทนข ้อมูล
ั ลักษณ์แทนผลบวก
ผลรวม (Summation) คือ สญ
ั ลักษณ์กำรบวก มีกฎอยู่ 3 ข ้อ
กำรคำนวณภำยใต ้สญ
3.1 ตัวกลางเลขคณิต (ค่ าเฉลีย่ )
่ ว่ นกลำงซงึ่ ถือว่ำดีทส
เป็ นค่ำแนวโน ้มเข ้ำสูส
ี่ ด
ุ เพรำะเป็ นค่ำทีค
่ ำนวณ
ได ้จำกกำรรวมคะแนนทัง้ หมดของข ้อมูลทีส
่ นใจเข ้ำไว ้ด ้วยกัน แล ้วจึงหำร
ด ้วยจำนวนข ้อมูล โดยปกติมักนิยมเรียกว่ำ ค่ำเฉลีย
่ (Mean)
กำรคำนวณค่ำเฉลีย
่ สำมำรถคำนวณแยกตำมลักษณะของข ้อมูลได ้
ดังนี
กำรคำนวณค่ำเฉลีย
่ ของข ้อมูลทีไ่ ม่ได ้แจกแจงควำมถี่
กำรคำนวณหำค่ำเฉลีย
่ ของข ้อมูลทีแ
่ จกแจงควำมถี่ (ได ้ค่ำเพียงกำร
ประมำณ)
ตัวกลางเลขคณิตถ่ วงน้าหนัก
เป็ นกำรหำค่ ำ เฉลี่ย โดยที่ข ้อมู ล แต่ ล ะตั ว มีค วำมส ำคั ญ ไม่ เ ท่ ำ กั น
ดังนัน
้ กำรคำนวณจึงต ้องคำนึกถึงน้ ำหนักของควำมสำคัญของข ้อมูลแต่ละ
ตัวด ้วย
ตัวกลางเลขคณิตรวม
เมื่อ มี่ข ้อมูล หน่ ว ยเดีย วกัน หลำยๆ ชุด ซ งึ่ ข ้อมูล แต่ล ะชุด เรำทรำบ
ค่ำเฉลีย
่ เรำสำมำรถหำค่ำเฉลีย
่ รวมของข ้อมูลได ้ โดยกำรคำนึงถึง จำนวน
และค่ำเฉลีย
่ ในข ้อมูลแต่ละชุด
คุณสมบัตขิ องตัวกลางเลขคณิต
ค่ำเฉลีย
่ จะมีเพียงค่ำเดียวจำกชุดของข ้อมูลชุดหนึง่ เท่ำนัน
้
2. ถ ้ำนำค่ำคงทีบ
่ วกเข ้ำทุกๆ ค่ำของข ้อมูลแต่ละตัว ค่ำเฉลีย
่ จะเพิม
่ ขึน
้
เท่ำกับค่ำคงทีน
่ ัน
้ ในกรณีคำ่ คงทีไ่ ปลบ ก็จะลดลงเท่ำกับค่ำคงทีน
่ ัน
้
3. ถ ้ำนำค่ำคงทีไ
่ ปคูณหรือหำรกับทุกๆ ค่ำของข ้อมูล ค่ำเฉลีย
่ ก็จะเพิม
่ ขึน
้
หรือลดลงเท่ำกับจำนวนค่ำคงทีท
่ น
ี่ ำไปคูณหรือหำรนัน
้
4. ผลบวกของผลต่ำงทีแ
่ ต่ละข ้อมูลต่ำงไปจำกค่ำเฉลีย
่ จะมีคำ่ เป็ น 0 เสมอ
5. ผลบวกของกำลังสองของผลต่ำงทีข
่ ้อมูลแต่ละตัวต่ำงไปจำกค่ำเฉลีย
่ จะ
มีคำ่ น ้อยทีส
่ ด
ุ
1.
3.2 มัธยฐาน
คือ ค่ำของข ้อมูลทีอ
่ ยู่ ณ ตำแหน่งกึง่ กลำงของข ้อมูลชุดหนึง่ ซงึ่ ได ้มี
กำรจั ด เรีย งล ำดับข ้อมูล แล ้ว นั น
้ คือค่ำ มั ธ ยฐำนจะแบ่ง ข ้อมูล ออกเป็ น 2
สว่ นเท่ำๆ กัน
่ 5 , 9 , 7 , 12 , 89
ถ ้ำชุดข ้อมูลมีข ้อมูลทีม
่ ค
ี วำมแตกต่ำงกันมำก เชน
กำรใชมั้ ธยฐำนเป็ นตัวแทนของข ้อมูลจะดีกว่ำกำรใชค่้ ำเฉลีย
่
กำรคำนวณค่ำมัธยฐำน สำมำรถคำนวณแยกตำมลักษณะของข ้อมูล
ได ้ดังนี้
กำรคำนวณค่ำมัธยฐำนของข ้อมูลทีไ่ ม่ได ้แจกแจงควำมถี่
กำรคำนวณหำค่ำมัธยฐำนของข ้อมูลทีแ
่ จกแจงควำมถี่ (ได ้ค่ำเพียงกำร
ประมำณ)
3.3 ฐานนิยม
คือ ค่ำกลำงทีค
่ ำนึงถึงกำรเกิดขึน
้ ของข ้อมูลบ่อยทีส
่ ด
ุ
ฐำนนิยม มีคณ
ุ สมบัตพ
ิ เิ ศษทีต
่ ัวกลำงแบบอืน
่ ๆ ไม่มค
ี อ
ื สำมำรถหำค่ำ
กลำงได ้ในกรณีข ้อมูลเป็ นข ้อมูลเชงิ คุณภำพ
กำรคำนวณค่ำฐำนนิยม สำมำรถคำนวณแยกตำมลักษณะของข ้อมูล
ได ้ดังนี้
กำรคำนวณค่ำฐำนนิยมของข ้อมูลทีไ่ ม่ได ้แจกแจงควำมถี่
ค่ำฐำนนิยมสำมำรถมีได ้หลำยๆ ค่ำ
กำรคำนวณหำค่ำฐำนนิยมของข ้อมูลทีแ
่ จกแจงควำมถี่ (ได ้ค่ำเพียงกำร
ประมำณ)
ความสั มพันธ์ ของค่ าเฉลีย่ มัธยฐาน และฐานนิยม
เมื่อ ข ้อมู ล มีลั ก ษณะของโค ้งควำมถี่ (กำรแจกแจง) เป็ นแบบสมมำตร
ค่ำเฉลีย
่ มัธยฐำน และ ฐำนนิยมจะมีคำ่ เท่ำกัน
ถ ้ำลักษณะของโค ้งควำมถี่ (กำรแจกแจง) มีลก
ั ษณะเบ ้ขวำ จะได ้ว่ำ
ค่ำเฉลีย
่ > มัธยฐำน > ฐำนนิยม
้ จะได ้ว่ำ
ถ ้ำลักษณะของโค ้งควำมถี่ (กำรแจกแจง) มีลก
ั ษณะเบ ้ซำย
ค่ำเฉลีย
่ < มัธยฐำน < ฐำนนิยม
การพิจารณาเลือกใช้ ค่าเฉลีย่ มัธยฐาน และฐานนิยม
1.
2.
3.
4.
5.
ค่ำเฉลีย
่ เหมำะสำหรับกำรคำนวณขัน
้ สูงต่อไป
ถ ้ำข ้อมูลมีบำงค่ำทีม
่ ค
ี ำ่ สูงหรือตำ่ กว่ำคะแนนอืน
่ ๆ มำกๆ กำรหำค่ำ มัธยฐำน หรือ
ฐำนนิยมจะเหมำะสมกว่ำค่ำเฉลีย
่
ั ้ ชว่ งเปิ ด เรำไม่สำมำรถหำค่ำเฉลีย
ในตำรำงแจกแจงควำมถีท
่ ม
ี่ อ
ี ต
ั รภำคชน
่ ได ้
้ ในแต่ละชัน
้ ไม่เท่ำกัน กำรใช ค่้ ำเฉลีย
ในตำรำงแจกแจงควำมถีท
่ ม
ี่ อ
ี ัตรภำคชัน
่
และฐำนนิยม เป็ นค่ำกลำงจะคลำดเคลือ
่ น จึงควรใชค่้ ำมัธยฐำนเป็ นค่ำกลำง
ลักษณะของข ้อมูลเชงิ คุณภำพ (มำตรวัด Nominal or Ordinal Scale) ควรใช ้
ฐำนนิยมเป็ นค่ำกลำงของข ้อมูล
3.4 การวัดตาแหน่ งของข้ อมูล
เป็ นกำรหำตำแหน่งทีอ
่ ยู่ของข ้อมูล เมือ
่ พิจำรณำเทียบกับจำนวนของ
ข ้อมู ล ทั ง้ หมด โดยเรีย งค่ ำ ของข ้อมู ล จำกค่ ำ น อ
้ ยไปค่ ำ มำก จำกกำร
ค ำนวณหำมั ธ ยฐำนของข ้อมู ล ที่ ผ่ ำ นมำแล ว้ นั ้น ก็ เ ป็ นกำรหำค่ ำ ขอ ง
ตำแหน่ งของข ้อมูล ทีอ
่ ยู่ตรงกึง่ กลำงของข ้อมูลชุดนั น
้ ๆ โดยมั ธยฐำนจะ
แบ่งข ้อมูลออกเป็ นสองสว่ น โดยทัง้ สองสว่ นมีจำนวนข ้อมูลเท่ำกัน
ตำแหน่งของข ้อมูล ประกอบไปด ้วย : ควอไทล์ เดไซล์ เปอร์เซนต์ไทล์
1. ควอไทล์ คือ ค่ำของข ้อมูล 3 ค่ำทีแ
่ บ่งข ้อมูลออกเป็ น 4 ส่วน เท่ำๆ
กัน Q1 , Q2 , Q3
2. เดไซล์ คือ ค่ำของข ้อมูล 9 ค่ำทีแ
่ บ่งข ้อมูลออกเป็ น 10 ส่วน เท่ำๆ
กัน D1 , D2 , D3 …. D8 , D9
3. เปอร์เซนต์ไทล์ คือ ค่ำของข ้อมูล 99 ค่ำทีแ
่ บ่งข ้อมูลออกเป็ น 100
สว่ น เท่ำๆ กัน P1 , P2 , P3 …. P98 , P99
สงั เกตุวำ่ ค่ำ มัธยฐำน = Q2 = D5 = P50
การคานวณหาค่ าของตาแหน่ งข้ อมูล
กำรคำนวณหำค่ำของตำแหน่งข ้อมูลนีม
้ ด
ี ้วยกัน 2 กรณี คือ
1. ข ้อมูลทีไ่ ม่ได ้แจกแจงควำมถี่
Qi  X  i ( N 1)  Di  X  i ( N 1) 


4




10


Pi  X  i (N 1) 
 100 


ี ก่อน
อย่ำลืม ก่อนอืน
่ ต ้องเรียงลำดับข ้อมูลจำกน ้อยไปมำกเสย
2. ข ้อมูลทีแ
่ จกแจงควำมถี่
 iN

 4  F 
Qi  L  c
fm
 iN

100  F 
Pi  L  c
fm
 iN

 10  F 
Di  L  c
fm
บทที่ 4 การวัดการกระจาย
1.
2.
3.
4.
5.
6.
พิสัย (Range; R)
ส่ วนเบี่ยงเบนควอไทล์ (Quartile Deviation : QD)
ส่ วนเบี่ยงเบนเฉลีย่ (Mean Deviation; MD)
ส่ วนเบี่ยงเบนมาตรฐาน (Standard Deviation; SD)
การเปรียบเทียบข้ อมูล
การวัดความเบ้ และความโด่ ง (Meacures of Skewness and Kurtosis)
จากวิธีการวัดแนวโน้มเข้าสู่ ส่วนกลาง ซึ่งเป็ นการคานวณหาตัวแทนของข้อมูลชุดนั้น ๆ
แต่ไม่ได้พิจารณาถึงลักษณะของการเกิดขึ้นของข้อมูลว่าข้อมูลที่เกิดขึ้นนั้นมีการกระจัดกระจายหรื อคละกันไปแค่ไหน หรื อว่าข้อมูลที่เกิดขึ้นมี
ค่าใกล้เคียงไล่เลี่ยกันหรื อเกาะกลุ่มมากน้อยเพียงใด เช่น ลองพิจารณาข้อมูล 2 ชุดนี้
ชุดที่ 1 160, 55, 80, 355, 200, 170 มีค่าเฉลี่ยเลขคณิ ต = 170
ชุดที่ 2 157, 151, 170, 175, 170, 197 มีค่าเฉลี่ยเลขคณิ ต = 170
จะเห็นได้วา่ ข้อมูลทั้ง 2 ชุด มีค่าเฉลี่ยเลขคณิ ตเท่ากัน คือ 170 แต่การเกิดขึ้นของข้อมูลแต่ละชุดแตกต่างกัน กล่าวคือ ข้อมูลชุดที่ 1 มีค่าของ
ข้อมูลการกระจัดกระจายแตกต่างกันมาก แต่ขอ้ มูลชุ ดที่ 2 การเกิดขึ้นของข้อมูลมีค่าใกล้เคียงหรื อเกาะกลุ่มกัน ดังนั้นลักษณะการ
เกิดขึ้นของข้อมูลที่มีค่าแตกต่างกันนี้ เรี ยกว่า การกระจายของข้ อมูล (variation or dispersion of data) ซึ่ งถ้าข้อมูลชุดใดมีค่าของข้อมูล
แตกต่างกันมาก ก็เรี ยกว่าข้อมูลชุดนั้นมีการกระจายมาก แต่ถา้ ข้อมูลชุดใดมีค่าของข้อมูลแตกต่างกันน้อย ก็เรี ยกว่า ข้อมูลชุดนั้นมีการ
กระจายน้อย จะเห็นได้ว่า นอกจากการพิจารณาการวัดแนวโน้มเข้าสู่ ส่วนกลางแล้ว การวัดการกระจายของข้อมูลก็ยงั จะทาให้เห็น
ธรรมชาติของการเกิดขึ้นของข้อมูล ซึ่งจะนาไปใช้ในการวิเคราะห์ต่าง ๆ ในทางสถิติต่อไป
4.1 พิสัย (Range:R)
การวัดการกระจายโดยหาค่าพิสัยคานวณได้จากผลต่างระหว่างข้อมูลที่มีค่าสู งสุ ดกับ
ข้อมูลที่มีค่าต่าสุ ดวิธีการวัดการกระจายโดยใช้พิสัย เป็ นวิธีคานวณได้ง่ายและรวดเร็ ว
ที่สุด
ก. ข้ อมูลทีไ่ ม่ ได้ แจกแจงความถี่ (ungrouped data)
พิสัย = ข้อมูลที่มีค่าสู งสุ ด - ข้อมูลที่มีค่าต่าสุ ด
R = Xmax - Xmin
ข. ข้ อมูลทีไ่ ด้ มกี ารแจกแจงความถี่ (grouped data)
พิสัย = ขอบเขตชั้นบนของชั้นสู งสุ ด - ขอบเขตชั้นล่างของชั้นต่าสุ ด
แต่ กรณีทตี่ ารางแจกแจงความถี่มีลกั ษณะเป็ นแบบอันตรภาคชั้นเปิ ด จะไม่ สามารถ
หาค่ า
4.2 ส่ วนเบี่ยงเบนควอไทล์ (Quartile Deviation:QD)
หลัก การของการวัดการกระจายโดยส่ วนเบี่ ย งเบนควอไทล์น้ ัน จะพิ จ ารณา
ตาแหน่งของข้อมูล 2 ค่า คือ ควอไทล์ที่ 3 (Q3) และควอไทล์ที่ 1 (Q1) นัน่ ก็คือ ถ้าข้อมูล
มีการกระจายมาก ค่า Q3 และ Q1 ก็จะห่ างกันมาก แต่ถา้ ข้อมูลมีการกระจายน้อย ค่า Q3
และ Q1 ก็จะห่ างกันน้อย โดยคานวณค่าการกระจายจากสู ตรหรื ออาจเรี ยกว่า พิสัยกึ่งค
วอไทล์ (semi-interquartile range)
ก. ข้ อมูลทีไ่ ม่ ได้ แจกแจงความถี่ (ungrouped data)
Q3  Q1
QD 
2
Qi  X  i ( N 1) 


4
ข. ข้ อมูลทีไ่ ด้ มกี ารแจกแจงความถี่ (grouped data)
Q3  Q1
QD 
2


 iN

 4  F 
Qi  L  c
fm
4.3 ส่ วนเบี่ยงเบนเฉลีย่ (Mean Deviation:MD)
การวัดการกระจายโดยส่ วนเบี่ ยงเบนเฉลี่ ย เป็ นวิธีการวัดการกระจายรอบค่าเฉลี่ ยของข้อมูลชุ ดนั้น โดย
พิจารณาได้วา่ ถ้าข้อมูลแต่ละค่าใกล้เคียงกับค่าเฉลี่ยก็แสดงว่าข้อมูลมีการกระจายน้อย แต่ถา้ ข้อมูลแต่ละค่าห่ างจากค่าเฉลี่ย
มากก็แสดงว่าข้อมูลมีการกระจากมาก
ส่ วนเบี่ยงเบนเฉลี่ยเป็ นค่าเฉลี่ยสัมบูรณ์ของความแตกต่างของข้อมูลแต่ละค่ากับตัวกลางเลขคณิ ตของข้อมูลชุด
นั้น
ก. ข้ อมูลทีไ่ ม่ ได้ แจกแจงความถี่ (ungrouped data)
ถ้า XXi i แทนข้
อมูลแต่ละค่า จานวน N ตัว
X
ค่า
เรี ยกว่า ค่าสัมบูรณ์ (absolute value)
ของความแตกต่างของข้อมูลตัวที่ i กับตัวกลางเลขคณิ ต
MD 
ข. ข้ อมูลทีไ่ ด้ มกี ารแจกแจงความถี่ (grouped data)
จากตารางแจกแจงข้อมูล จานวน k ชั้น ถ้า
แทนจุดกลางชั้นของข้อมูลในแต่ละชั้น
f1, f2 , f3 ,..., fk
k แทนความถี่ของข้อมูลในแต่ละชัน ตามลาดับ
้
 fi X i  X
X1, X2 , X3 ,..., Xk
MD 
i 1
N
; N 
k
 fi
i 1
N
 Xi
i 1
N
X
4.4 ส่ วนเบี่ยงเบนมาตรฐาน (Standard Deviation:SD)
การคานวณส่ วนเบี่ยงเบนมาตรฐานใช้หลักการเดี ยวกันกับการคานวณส่ วนเบี่ยงเบนเฉลี่ยแต่หลี่ กเลี่ยงการ
คานวณหาค่าสัมบูรณ์โดยการใช้การยกกาลังสองของผลต่างแทน ส่วนเบี่ยงเบนมาตรฐานเป็ นรากที่สองของค่าเฉลี่ยกาลังสอง
ของความแตกต่างของข้อมูลแต่ละตัวกับตัวกลางเลขคณิ ตของข้อมูลชุ ดนั้น บางครั้งใช้สัญลักษณ์แทนด้วย S และความ
แปรปรวน (variance) คือกาลังสองของส่วนเบี่ยงเบนมาตรฐาน (S2)
ก. ข้ อมูลทีไ่ ม่ ได้ แจกแจงความถี่ (ungrouped data)
ถ้า Xi แทนข้อมูลแต่ละค่า จานวน N ตัว
N
2
  X i  X
i 1
SD  S 
N
SD 
N
 X2
i
i 1
N
  X
การวั ด การกระจายของ
ข้ อ มู ล ด้ ว ยส่ วนเบี่ ย งเบน
มาตรฐาน เป็ นวิธี ก ารวั ด
การกระจายที่ดีที่สุด และ
นิยมใช้ กนั มากที่สุดในทาง
สถิติ
2
ข. ข้ อมูลทีไ่ ด้ มกี ารแจกแจงความถี่ (grouped data)
จากตารางแจกแจงข้อมูล จานวน k ชั้น ถ้า
X1, X2 , X3 ,..., Xk
แทนจุดกลางชั้นของข้อมูลในแต่ละชั้น
f1, f2 , f3 ,..., fk
แทนความถี่ของข้อมูลในแต่ละชั้น ตามลาดับ
SD 
k
 fi
i 1
 X i  X 2
N
SD 
k
 fi X2
i
i 1
N
  X
2
คุณสมบัตขิ องส่ วนเบี่ยงเบนมาตรฐาน
1. ส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดหนึ่งชุดใดจะต้องมีค่ามากกว่าหรื อเท่ากับศูนย์เสมอ
2. ถ้าข้อมูลชุดหนึ่งมีค่าของข้อมูลแต่ละตัวเท่ากันหมด ส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้นต้อง
เท่ากับศูนย์
3. ถ้านาเอาค่ าคงที่ ใด ๆ ไปบวกเข้า หรื อ ลบออกจากค่ า ของข้อ มู ล ทุ ก ๆ ตัว แล้ว ส่ ว นเบี่ ย งเบน
มาตรฐานของข้อมูลชุดนั้นจะไม่เปลี่ยนแปลง เช่น ข้อมูล 9, 3, 8, 8, 9, 8, 9, 18 คานวณส่ วน
เบี่ยงเบนมาตรฐานได้ = 3.87
ถ้านาค่าคงที่ 2 ไปบวกกับข้อมูลทุก ๆ ตัว จะได้ขอ้ มูลใหม่เป็ น 11, 5, 10, 10, 11, 10, 11, 20
คานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ = 3.87 ซึ่ งเท่าเดิม
ถ้านาค่าคงที่ 2 ไปลบออกจากข้อมูลทุก ๆ ตัว จะได้ขอ้ มูลใหม่เป็ น 7, 1, 6, 6, 7, 6, 7, 16
คานวณค่าส่ วนเบี่ยงเบนมาตรฐานใหม่ได้ = 3.87 ซึ่ งเท่าเดิม
4. ถ้าเอาค่าคงที่ใด ๆ ไปคูณหรื อหารกับข้อมูลทุก ๆ ตัวแล้ว ส่ วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้น
จะเปลี่ยนเป็ นส่ วนเบี่ยงเบนมาตรฐานเดิมคูณหรื อหารด้วยค่าสัมบูรณ์ (absolute value) ของค่าคงที่น้ นั
4.5 การเปรียบเทียบข้ อมูล
จากข้อมูลที่เก็บรวบรวมมาได้หลาย ๆ ชุด หรื อหลาย ๆ กลุ่ม การเปรี ยบเทียบข้อมูล
ระหว่างชุดหรื อระหว่างกลุ่ม สามารถทาได้ 2 ลักษณะ
การเปรียบเทียบค่ าของข้ อมูล
การเปรี ยบเทียบค่าของข้อมูลคู่หนึ่งคู่ใด ถ้าข้อมูลคูน่ ้ นั อยูใ่ นกลุ่มตัวอย่างหรื อชุดข้อมูลเดียวกัน การ
เปรี ยบเทียบก็สามารถดูจากค่าของข้อมูลว่าแตกต่างกันมากน้อยเพียงใด หรื ออาจจะเปรี ยบเทียบจากตาแหน่งของ
ข้อมูล เช่น ควอไทล์ เดไซล์ หรื อเปอร์เซนต์ไทล์ แต่ถา้ ข้อมูลที่จะนามาเปรี ยบเทียบกันเป็ นข้อมูลจากคนละชุดหรื อ
คนละกลุ่มตัวอย่างกัน ซึ่ งอาจจะมีหน่ วยหรื อมาตรการวัดเหมือนกันหรื อต่างกัน การเปรี ยบเทียบที่นิยมใช้ คือ
การเปลี่ยนข้อมูลให้อยูร่ ู ปของคะแนนมาตรฐาน (standard score) ซึ่ งมีอยูห่ ลายแบบและแบบที่นิยมใช้คือคะแนน
มาตรฐานแบบ Z(Z-score) ซึ่ งเป็ นคะแนนมาตรฐานที่มีค่าเฉลี่ยเลขคณิ ตเป็ น 0 และส่ วนเบี่ยงเบนมาตรฐานเป็ น 1
หลังจากได้คะแนนมาตรฐานแล้ว ก็สามารถนาคะแนนมาตรฐานนั้นมาเปรี ยบเทียบกันได้
การเปลี่ยนค่าของข้อมูล (X) ซึ่ งมีค่าเฉลี่ย และมีส่วนเบี่ยงเบนมาตรฐาน S ให้เป็ นคะแนนมาตรฐาน
(Z-score) หาได้โดยใช้สูตร
Z 
XX
S
การเปรียบเทียบการกระจายของข้ อมูล
การเปรี ย บเที ย บการกระจายของข้อ มูล ตั้งแต่ 2 ชุ ดขึ้ น ไป ว่า ข้อ มูล ชุ ด ใดมี การ
กระจายมากกว่ากัน ซึ่ งหน่วยหรื อมาตรการวัดของข้อมูลที่จะเปรี ยบเทียบกันอาจจะเหมือนกัน
หรื อ แตกต่า งกัน ก็ไ ด้ การเปรี ยบเที ย บนั้นจะคานวณอัตราส่ วนระหว่างค่ าวัดการกระจายต่ อ
ค่าเฉลี่ ยของการวัดการกระจายนั้น ซึ่ งเรี ยกว่า สั มประสิ ทธ์ การกระจาย (coefficient of
dispersion) และมักจะนิ ย มทาให้อ ยู่ในรู ปของเปอร์ เซนต์ โดยการคู ณด้ว ย 100 แล้ว นาค่ า
สัมประสิ ทธิ์การกระจายนี้มาเปรี ยบเทียบกัน ถ้าสัมประสิ ทธิ์การกระจายของข้อมูลชุดใดมาก ก็
แสดงว่าข้อมูลชุดนั้นมีการกระจายที่สูงกว่า
การคานวณหาสัมประสิ ทธิ์การกระจายแบ่งได้เป็ น 4 วิธี ตามลักษณะของการวัดการ
กระจาย
1.
2.
3.
4.
เมือ่ วัดการกระจายของข้ อมูลด้ วยพิสัย
เมือ่ วัดการกระจายของข้ อมูลด้ วยส่ วนเบีย่ งเบนควอไทล์
เมือ่ วัดการกระจายของข้ อมูลด้ วยส่ วนเบีย่ งเบนเฉลีย่
เมือ่ วัดการกระจายของข้ อมูลด้ วยส่ วนเบีย่ งเบนมาตรฐาน
4.6 การวัดความเบ้ และความโด่ ง (Measures of
kewness and Kurtosis)
การพิจารณาลักษณะของข้อมูลที่ เ ก็บ รวบรวมมาได้ หรื อ ลักษณะการเกิ ดขึ้ นของ
ข้อมูลชุดหนึ่ งชุดใด นอกจากจะหาตัวแทนของข้อมูลโดยการวัดแนวโน้มเข้าสู่ ส่วนกลาง และ
วัดการกระจายของข้อมูลแล้ว ลักษณะของข้อมูลที่ควรจะพิจารณาต่ออีก คือ การพิจารณาว่า
ค่าของข้อมูลชุดนั้นเอนเอียงไปทางข้อมูลค่ามาก หรื อเอนเอียงไปทางข้อมูลค่าน้อยแตกต่างกัน
อย่างไร เช่น จานวนนักศึกษาที่สอบได้คะแนนน้อยมีจานวนค่อนข้างมากผิดปกติ หรื อจานวน
นักศึกษาที่สอบได้คะแนนสู งมีจานวนค่อนข้างน้อยผิดปกติ ลักษณะอย่างนี้ เรี ยกว่า ข้ อมูลมี
ความเบ้ (skewness) เกิดขึ้น
ส่ วนการพิจารณาว่า ความถี่ ของข้อมูลในแต่ ละค่ าหรื อในแต่ ละช่ วงของข้อมูล มี
ความถี่มากน้อยเพียงใด หรื อมีความถี่สูงผิดปกติ หรื อต่ากว่าปกติอย่างไร เช่น มีจานวน
นักศึกษาค่อนข้างมาก หรื อเกือบทั้งหมด ได้คะแนนสอบอยู่ ในช่วง 50 - 59 คะแนน ลักษณะ
อย่างนี้ เรี ยกว่า ข้ อมูลมีความโด่ ง (kurtosis) เกิดขึ้น
ความเบ้ (Skewness)
ความเบ้ คือ ระดับความเอนเอียงหรื อความไม่สมมาตรของการแจกแจงของข้อมูล โดยพิจารณา
ได้จากโค้งความถี่ (frequency curve) ซึ่ งความเบ้ของโค้งความถี่ของข้อมูลอาจเกิดขึ้นได้ 3
ลักษณะ
การวัดความเบ้ (measure of skewness)
การคานวณหาค่าความเบ้ แล้วพิจารณาว่า โค้งความถี่ของข้อมูลนั้นมีการแจกแจงที่สมมาตร เบ้
ซ้าย หรื อเบ้ขวา โดยจะเป็ นการคานวณหาค่าสัมประสิ ทธิ์ความเบ้ ซึ่ งมีวธิ ีต่าง ๆ ดังนี้
1. พิจารณาจากความสัมพันธ์ของค่ากลางเลขคณิ ต มัธยฐาน ฐานนิยม และส่ วนเบี่ยงเบนมาตรฐาน
Mean  Mode
3( Mean  Median )
,
หรื อเรี ยกว่า วิธีของ Karl Pearson
SD
SD
( Q3  Q 2 )  ( Q 2  Q1 )
2. พิจารณาจากควอไทล์ หรื อเรี ยกว่า วิธีของ Bowley
Q3  Q1
( P90  P50 )  ( P50  P10 )
3. พิจารณาจากเปอร์เซนต์ไทล์
P90  P10
เมื่อคานวณได้ค่าของสัมประสิ ทธิ์ความเบ้แล้ว ก็พิจารณาความเบ้ของโค้งความถี่ ดังนี้
ถ้าสัมประสิ ทธิ์ความเบ้ = 0 โค้งความถี่มีการแจกแจงที่สมมาตร
สัมประสิ ทธิ์ความเบ้ > 0 โค้งความถี่มีการแจกแจงที่เบ้ขวา
สัมประสิ ทธิ์ความเบ้ < 0 โค้งความถี่มีการแจกแจงที่เบ้ซา้ ย
ความโด่ ง (Kurtosis)
ความโด่ง คือ ระดับความสู งโด่ งของการแจกแจงของข้อมูล โดยพิจารณาจากโค้งความถี่ ว่ามี
ความโด่งมากน้อยเพียงใด ซึ่ งในกรณี ที่ขอ้ มูลมีการแจกแจงแบบสมมาตรหรื อโค้งปกติน้ นั ความ
โด่งของเส้นโค้งความถี่จะต้องได้สดั ส่ วนกันในลักษณะรู ประฆังคว่า ความโด่งของโค้งความถี่แบ่ง
ได้เป็ น 3 ระดับ
การวัดความโด่ ง (measure of kurtosis)
คือ การคานวณหาค่าความโด่ง เพื่อพิจารณาว่า โค้งความถี่ของข้อมูลมีการแจกแจงที่ โด่ งปกติ
โด่งมาก หรื อโด่งน้อย โดยจะเป็ นการคานวณหาค่าสัมประสิ ทธิ์ความโด่ง ซึ่ งมีวธิ ีการคานวณ ดังนี้
QD
สัมประสิ ทธิ์ความโด่ง
=
โดย QD คือ ส่ วนเบี่ยงเบนควอไทล์ =
P90  P10
Q 3  Q1
2
เมื่อคานวณได้ค่าสัมประสิ ทธิ์ความโด่งแล้ว ก็พิจารณาความโด่งของโค้งความถี่ ดังนี้
ถ้าสัมประสิ ทธิ์ความโด่ง = 0.263 โค้งความถี่มีการแจกแจงที่โด่งปกติ
สัมประสิ ทธิ์ความโด่ง > 0.263 โค้งความถี่มีการแจกแจงที่โด่งมาก
สัมประสิ ทธิ์ความโด่ง < 0.263 โค้งความถี่มีการแจกแจงที่โด่งน้อย