ความหมายของสถิติ

Download Report

Transcript ความหมายของสถิติ

ความหมายของสถิต ิ
สถิตท
ิ เี่ ป็น
ข้อเท็จจริงทีเ่ ป็นต ัวเลข
(Numerical facts)
ในภาษาอังกฤษใช้คาว่า Statistic
 เช่น สถิติจานวนน้ าฝนที่ตกในรอบปี ที่ผา่ นมา ได้มาจาก
การบันทึกจานวนน้ าฝนที่ตกในวันหนึ่งๆ แล้วเอาจานวน
น้ าฝนในแต่ละวันมาหาค่าเฉลี่ย เป็ นค่าสถิติ 1 ค่า
 หรื อ สถิติรายจ่ายของนักศึกษาแต่ละคนต่อเดือน ได้จาก
การหารายจ่ายของนักศึกษาแต่ละคนแล้วนามารวมกันหา
ค่าเฉลี่ย

สถิตท
ิ เี่ ป็น
ศาสตร์ (วิชา) (Science)
 ในภาษาอังกฤษใช้คาว่า Statistics
 การเก็บรวบรวมข้อมูล (Collection of data)
 การนาเสนอข้อมูล (Presentation of data)
 การวิเคราะห์ขอ
้ มูล (Analysis of data)
 การตีความหมายข้อมูล (Interpretation of data)
ประเภทของสถิต ิ
สถิตเิ ชงิ พรรณนา
(Descriptive statistics)
เป็ นสถิติที่ใช้บรรยายถึงลักษณะของกลุ่มข้อมูลเฉพาะกลุ่ม
นั้นๆ โดยไม่สรุ ปอ้างอิง หรื อพาดพิงไปถึงกลุ่มอื่นๆ
 เช่น การหาน้ าหนักเฉลี่ยของนักศึกษากลุ่มนี้ ก็จะไม่
สรุ ปว่าเป็ นน้ าหนักเฉลี่ยของนักศึกษากลุ่มอื่นๆ
 ได้แก่ การวัดแนวโน้มเข้าสู่ ส่วนกลาง
การวัดการกระจาย การหาค่าสหสัมพันธ์

สถิตเิ ชงิ อ้างอิง
(Inferential statistics)
เป็ นสถิติที่นาเอาค่าสถิติเชิงพรรณนามาสรุ ปอ้างอิงไปสู่
ประชากร
 เป็ นสถิติที่ศึกษาจากกลุ่มตัวอย่าง (Sample) แล้วนาผลไป
อ้างอิงหรื อขยายความไปยังกลุ่มใหญ่ที่เรี ยกว่า ประชากร
(Population)
่ ี่การเลือกตัวอย่างที่จะต้องเป็ นตัวแทน
 ความสาคัญอยูท
จริ งๆ ของประชากร

ต ัวแปร (Variable)
คุณสมบัติหรื อคุณลักษณะของสิ่ งต่างๆ อาจเป็ นสิ่ งมีชีวติ
หรื อไม่มีชีวติ
 เป็ นสิ่ งที่เปลี่ยนค่าได้ เช่น เพศ อายุ พื้นที่ถือครอง ลลล
 ตัวแปรด้านสังคมและพฤติกรรมศาสตร์ ส่ วนใหญ่เกี่ยวกับ
คุณลักษณะและพฤติกรรมของมนุษย์

ข้อมูล (data)
 คือข้อเท็จจริ งต่างๆ ซึ่ งอาจเป็ นตัวเลขหรื อไม่ใช่
ตัวเลขก็ได้
ประเภทของข้อมูล
ข้อมูลเชงิ คุณภาพ
(qualitative data)
 ได้แก่ขอ
้ มูลที่ให้ขอ้ เท็จจริ งในเชิงคุณภาพ ซึ่ง
บางครั้งอาจแทนด้วยตัวเลขก็ได้ โดยที่ตวั เลข
ดังกล่าวไม่มีความหมายในเชิงปริ มาณ เช่น เพศ
เชื้อชาติ ศาสนา ความนิยม ทัศนคติ
ข้อมูลเชงิ ปริมาณ
(quantitative data)
 ได้แก่ขอ
้ มูลที่ให้ขอ้ เท็จจริ งในเชิงปริ มาณ เช่น
น้ าหนัก อายุ คะแนน
มาตรการว ัด
มาตรนามบ ัญญ ัติ (Nominal Scale)
เป็ นข้อมูลที่มีลกั ษณะจาแนกกลุ่มหรื อประเภท อย่างน้อย
แบ่งเป็ น 2 กลุ่ม ต้องแยกอย่างเด็ดขาดและครอบคลุม
ข้อมูลทั้งหมด
 ตัวเลขหรื อค่าต่างๆ ที่กาหนดให้ ไม่มีความหมาย
เชิงปริ มาณ
 ตัวเลขนามาบวก ลบ คูณ หาร ไม่ได้ แต่นามาหาค่าความถี่
เช่น เพศ ศาสนา หมายเลขห้อง หมายเลขหนังสื อห้องสมุด

มาตรเรียงอ ันด ับ (Ordinal Scale)
เป็ นการกาหนดอันดับให้แก่สิ่งต่างๆ มีลกั ษณะเหมือนการ
ประเมินค่า เช่น ประเมินเป็ นสูง ปานกลาง ต่า หรื อ
เห็นด้วยอย่างยิง่ เห็นด้วย ไม่แน่ใจ ไม่เห็นด้วย ไม่เห็นด้วย
อย่างยิง่ แต่บอกไม่ได้วา่ มากกว่าหรื อน้อยกว่ากันเท่าใด
 ข้อมูลประเภทนี้ นอกจากจะจาแนกกลุ่มหรื อประเภทแล้ว
ยังสามารถเรี ยงอับดับได้ดว้ ย

มาตรอ ันตรภาค (Interval Scale)




ช่วงห่างระหว่างหน่วยจะต้องเท่ากัน เช่น 1 ถึง 2 ต้องเท่ากับ 2-3
หรื อจาก 10-11
นัน่ คือ 2 - 1 = 3 - 2 = 11 - 10
อาจกาหนดตัวเลขแทนสิ่ งของหรื อวัตถุหรื อพฤติกรรมได้และ
ความแตกต่างระหว่างตัวเลขจะแทนความแตกต่างของกลุ่มหรื อ
สิ่ งที่วดั ได้
ไม่มีค่าศูนย์แท้หรื อ "ศูนย์สมบูรณ์" (Absolute Zero) แต่เป็ นศูนย์
สมมติ เช่นนักศึกษาสอบได้ศูนย์ไม่หมายความว่าไม่มีความรู ้เลย
ศูนย์องศาเซลเซียสไม่ได้หมายความว่าไม่มีความร้อนเลย
แสดงปริ มาณมากน้อย คือนามาบวก ลบได้ แต่คูณหารไม่ได้ เช่น
คะแนนจากแบบทดสอบ อุณหภูมิ ปี ปฏิทิน
่ น (Ratio Scale)
มาตราอ ัตราสว
 แบ่งช่วงตัวแปรเหมือนกับการวัดอันตรภาค
 แต่มีศน
ู ย์แท้ คือไม่มีอะไรเลย
 เปรี ยบเทียบเชิ งอัตราส่ วนได้
แหล่งของข้อมูล
แหล่งปฐมภูม ิ
(Primary Source)
ได้แก่แหล่งต้นตอของข้อมูลโดยตรง และเรี ยกข้อมูลที่ได้
จากแหล่งดังกล่าวว่า ข้อมูลปฐมภูมิ
 ข้อมูลประเภทนี้ ผส
ู้ นใจศึกษาจะต้องไปวัดหรื อเก็บข้อมูล
จากแหล่งต้นตอของข้อมูลโดยตรง
 เช่น ในการศึกษาค่าใช้จ่ายในการบริ โภครายเดือนของ
ครัวเรื อนในจังหวัดกาญจนบุรี แต่ละครัวเรื อนในจังหวัด
กาญจนบุรี ที่ถูกเก็บข้อมูลจะเป็ นแหล่งปฐมภูมิ

แหล่งทุตย
ิ ภูม ิ
(secondary source)
 ได้แก่แหล่งที่มีการเก็บรวบรวมข้อมูลต่างๆ ไว้แล้ว
และเรี ยกข้อมูลที่ได้จากแหล่งนี้วา่ ข้อมูลทุติยภูมิ
 เช่น การรวบรวมข้อมูลเกี่ยวกับจานวนคนเกิด ตาย
และย้าย ของสานักงานเทศบาลต่างๆ
 หรื อ รายงานประจาปี ของหน่วยงานของราชการและ
เอกชนต่างๆ
วิธก
ี ารเก็บรวบรวม
ข้อมูล
ปัจจ ัยสาค ัญในการรวบรวม
ข้อมูล







การนิยามศัพท์ ของคุณลักษณะทีต่ ้ องการเก็บรวบรวม
ความถูกต้ อง (Accuracy) และ ความเที่ยงตรง (Validity) ของ
ข้ อมูล
ความแม่ นยา (Precision) และเชื่อถือได้ (Reliable)
ความผิดพลาดทีเ่ กิดขึน้
การจดบันทึกตัวเลข
วิธีเก็บรวบรวมข้ อมูล
ระยะเวลาในการเก็บรวบรวมข้ อมูล
ขนตอนของการรวบรวมข้
ั้
อมูล
 กาหนดตัวแปรทีต
่ ้ องการศึกษา
 กาหนดลักษณะของข้ อมูลและตัวชี้วด
ั
 กาหนดแหล่ งข้ อมูล
 เลือกวิธีเก็บรวบรวมข้ อมูล
 นาเครื่ องมือรวบรวมข้ อมูลไปทดลองใช้
 ออกเก็บรวบรวมข้ อมูลจริ ง
เทคนิคและวิธก
ี ารรวบรวม
ข้อมูล
การรวบรวมข้อมูลที่มีอยูแ่ ล้ว
 การสังเกต
 การสัมภาษณ์
 การสอบถาม
 การทดสอบ
 การรวบรวมข้อมูลที่เป็ นเอกสาร
 การรวบรวมข้อมูลที่เป็ นหลักฐาน ร่ องรอย

เครือ
่ งมือทีใ่ ชใ้ นการเก็บรวบรวมข้อมูล
1.
2.
3.
4.
แบบทดสอบ
แบบสารวจรายการ
แบบประมาณค่า
แบบคาถามปลายเปิ ด
ข ้อมูลดิบ (raw data)
 ข้อมูลที่ไม่แจกแจงความถี่มก
ั เรี ยงตามลาดับคะแนน
จากมากไปหาน้อยหรื อน้อยไปหามาก
 นักสถิติใช้ประโยชน์จากข้อมูลดิบเพื่อแปลงผล
ข้อมูล
ข้อมูลดิบ (Raw data) ทางสถิต ิ
หมายถึงตัวเลขหรือสั ญลักษณ์ ที่ใช้ แทนค่ าของตัวแปรหรือ
คุณลักษณะทีส่ นใจศึกษา
เพศ
1 (ชาย)
2 (หญิง)
ผลการเรียน
A B+ B C+ C D+ D F
อายุ
17, 18, 20, 23, 25, 30, 34, 35, 40, 41, 42
การแจกแจงความถีข
่ องข้อมูลระด ับนามบ ัญญ ัติ
ความถี่(จานวน)
คานาหน้ า
รอยขีด
นาย
////
4
///// ///// ///// ///// /////
///// ///// ///// ///// ///// //
///// ///// ///// ///// /////
////
52
นาง
น.ส.
รวม
29
85
จานวน น.ศ. จาแนกตามคานาหน้าชื่อ
60
50
40
30
จานวน
20
10
0
นาย
นาง
น.ส.
จานวน น.ศ. จาแนกตามคานาหน้ าชื่อ
5%
34%
นาย
นาง
น.ส.
61%
คะแนนสอบวิชาภาษาไทยของนักเรียน 80 คน
79
65
57
51
45
32
78
64
56
51
45
32
75
64
56
50
44
32
72
61
56
50
43
31
72
61
55
50
43
30
72
61
55
50
43
71
61
55
50
43
70
61
55
49
40
68
61
54
49
40
68
60
54
49
39
68
60
54
48
38
66
60
54
48
38
66
59
52
48
37
65
57
51
47
36
65
57
51
47
32
คะแนน รอยขีด จานวน
79
/
1
78
/
1
77
0
76
0
75
/
1
74
0
73
0
72
///
3
71
/
1
70
/
1
69
0
68
///
3
67
0
คะแนน รอยขีด จานวน คะแนน รอยขีด จานวน คะแนน รอยขีด จานวน
0 40
66
//
2 53
/
1
//
2 39
65
///
3 52
//
2
////
4 38
64
//
2 51
//
2
/////
5 37
63
0 50
/
1
///
3 36
62
0 49
/
1
///
3 35
61
///// / 6 48
0
/
1 34
60
///
3 47
0
/
1 33
59
/
1 46
0
//
2 32
58
0 45
///
3
/
1 31
57
///
3 44
//
2
////
4 30
56
///
3 43
/
1
0
55
/////
5 42
0
54
//
2 41
ช่ วงคะแนน
75 - 79
70 - 74
65 - 69
60 - 64
55 - 59
50 - 54
45 - 49
40 - 44
35 - 39
30 - 34
รอยขีด
///
/////
///// ///
///// ///// /
///// ///// //
///// ///// ///
///// /////
///// /
///// /
///// /
รวม
ความถี่
3
5
8
11
12
13
10
6
6
6
80
1. หาพิสัย
พิสัย = ค่ าสู งสุ ด-ค่ าตา่ สุ ด
= 79 - 30 = 49
2. กาหนดจานวนชั้น
ประมาณ 5 ถึง 20 ชั้น
ในที่นีก้ าหนดเป็ น 10 ชั้น
3. หาขนาดอันตรภาคชั้น
= พิสัย / จานวนชั้น
= 49 / 10 = 4.9
ปัดให้ เป็ นจานวนเต็ม = 5
ช่ วงคะแนน
75 - 79
70 - 74
65 - 69
60 - 64
55 - 59
50 - 54
45 - 49
40 - 44
35 - 39
30 - 34
ความถี่
3
5
8
11
12
13
10
6
6
6
ความถี่สะสม ความถี่สัมพัทธ์ ความถี่สะสมสั มพัทธ์
80
77
72
64
53
41
28
18
12
6
0.034
0.063
0.100
0.138
0.150
0.163
0.125
0.075
0.075
0.075
1.000
0.963
0.900
0.800
0.663
0.513
0.350
0.225
0.150
0.075
ช่ วงคะแนน
75 - 79
70 - 74
65 - 69
60 - 64
55 - 59
50 - 54
45 - 49
40 - 44
35 - 39
30 - 34
ความถี่
ขีดจากัดทีแ่ ท้ จริง
จุดกึง่ กลาง
3
5
8
11
12
13
10
6
6
6
74.5 - 79.5
69.5 - 74.5
64.5 - 69.5
59.5 - 64.5
54.5 - 59.5
49.5 - 54.5
44.5 - 49.5
39.5 - 44.5
34.5 - 39.5
29.5 - 34.5
77
72
67
62
57
52
47
42
37
32
13...
12...
11...
10...
9...
8...
7...
6...
5...
4...
3...
2...
1...
0...
HISTOGRAM
|
|
|
|
|
|
|
|
|
|
|
29.5 34.5 39.5 44.5 49.5 54.5 59.5 64.5 69.5 74.5 79.5
13...
12...
11...
10...
9...
8...
7...
6...
5...
4...
3...
2...
1...
0...
รู ปหลายเหลี่ยมของความถี่
Frequency Polygon
29.5 34.5 39.5 44.5 49.5 54.5 59.5 64.5 69.5 74.5 79.5
13...
12...
11...
10...
9...
8...
7...
6...
5...
4...
3...
2...
1...
0...
โค้งความถี่
Frequency Curve)
29.5 34.5 39.5 44.5 49.5 54.5 59.5 64.5 69.5 74.5 79.5
ตาแหน่ งของข้ อมูล
เป็ นการบรรยายลักษณะของข้ อมูล โดยเรียงลาดับข้ อมูล
จากค่ าน้ อยไปหาค่ ามาก แล้ วหาค่ าของข้ อมูล ณ ตาแหน่ ง
ทีต่ ้ องการ ของข้ อมูลนั้น
• ลาดับที่
• เปอร์ เซนไทล์
• ควอไทล์
• เดไซล์
Rank
Percentile
Quartile
Decile
Percentile
เป็ นการหาค่ าของข้ อมูล ณ ตาแหน่ งทีต่ ้ องการ เมื่อแบ่ งข้ อมูล
ที่เรียงลาดับจากค่ าน้ อยไปหาค่ ามาก ออกเป็ น 100 ส่ วน เท่ าๆ กัน
ค่าน้อย
ค่ามาก
P1 P2 P3 P4
Pr Pr+1
P98 P99
Pr อ่านว่ า ตาแหน่ งเปอร์ เซนไทล์ที่ r
หมายความว่ า ณ ตาแหน่ งนี้ มีข้อมูล ทีม่ ีค่าน้ อยกว่ าค่ านีอ้ ยู่ r ส่ วน
จากทั้งหมด 100 ส่ วน
คะแนน ความถี่ ความถี่สะสม
28
2
150
27
6
148
26
8
142
25
9
134
24
16
125
23
20
109
22
27
89
21
16
62
20
13
46
19
11
33
18
10
22
17
7
12
16
3
5
15
2
2
P45 = ?
ถ้าข้อมูล มี 100 ต้องการข้อมูล ณ ตาแหน่งที่ 45
แต่ขอ้ มูลมี 150 ข้อมูลที่ตอ้ งการจะอยูท่ ี่ตาแหน่ง
Nr
100

150  45
100
 67 . 5
 Nr


cf


100
 i
Pr  L  
f






P45
 150  45

 62 

  1  21 . 70
 21 . 5   100
27






คะแนน ความถี่ ความถี่สะสม
78-82
1
50
73-77
4
49
68-72
3
45
63-67
6
42
58-62
8
36
53-57
9
28
48-52
5
19
43-47
5
14
38-42
4
9
33-37
3
5
28-32
2
2
P64 = ?
Nr
100

50  64
100
 32
 Nr

 cf 

 i
Pr  L   100
f






P64
 50  64


28


100
  5  60
 57 . 5  
8






คะแนน ความถี่ ความถี่สะสม
78-82
1
50
73-77
4
49
68-72
3
45
63-67
6
42
58-62
8
36
53-57
9
28
48-52
5
19
43-47
5
14
38-42
4
9
33-37
3
5
28-32
2
2
Pr =70
r=?
 Nr

 cf 

 i
Pr  L   100
f






 50  r

 42 

5
70  67 . 5   100
3






 70  67 . 5 3
 100
r  
 42  
5
50


r = 87
 Nr


cf


100
 i
Pr  L  
f






 Nr

 cf 

 i
Pr  L   100
f






 Nr

Pr  L  f  
 cf  i
 100

Pr
 L f
i

Nr
100
 cf
Pr
 L f
i
 cf 
Nr
100
 Pr  L f
 100

cf
r


i

 N
 P  L f
 100
r   r
 cf 
i

 N
 70  67 . 5 3
 100
r  
 42 
5

 50
ความสั มพันธ์ ของตาแหน่ งข้ อมูล ตามวิธีต่างๆ
P10
ค่าน้อย
P25
P75
P20 P30 P40 P50 P60 P70 P80 P90
D1 D2 D3 D4 D5 D6 D7 D8 D9
Q1
Q2
มัธยฐาน
Q3
ค่ามาก
ต ัวอย่างต ัวแปรระด ับ NOMINAL
มาตราว ัด
เพศ
ชาย หญิง
ศาสนา
พุทธ คริสต์ อิสลาม
สถานภาพสมรส
แต่งงาน แยกกันอยู่ หม ้าย โสด
ระบบการปกครอง
ประชาธิปไตย คอมมิวนิสต์
สาขาวิชา
บริหารงานบุคคล นโยบาย
สาธารณะ
วิชาเอกทีส
่ าเร็จ
ึ ษา
รัฐศาสตร์ คณิตศาสตร์ พลศก
ี
อาชพ
ข ้าราชการ ธุรกิจเอกชน เกษตรกร
ื้ ชาติ
เชอ
ไทย จีน อเมริกา
เบอร์นักกีฬา
11, 10, 17, 1, 2
ื่ ถนน
ชอ
พหลโยธิน อังรีดน
ู ังต์
จังหวัด
ี งใหม่
อยุธยา สงขลา เชย
อาเภอ
สารภี ฮอด แม่รม
ิ
ต ัวอย่างต ัวแปรระด ับ
ORDINAL
ทัศนคติ
มาตราว ัด
เห็นด ้วย เฉยๆ
ไม่เห็นด ้วย
รายได ้
มาก ปานกลาง น ้อย
ลาดับทีส
่ มัคร
คนที่ 1 คนที่ 2 คนที่ 3
ลูกคนที่
คนแรก สอง สาม
ความสูง
สูงมาก ปานกลาง เตีย
้
ขนาดชุมชน
หมูบ
่ ้าน ตาบล อาเภอ จังหวัด
สถานะทางเศรษฐกิจ
สูง กลาง ตา่
ระบบการให ้เกรด
A B C D F
การประกวดนางงาม
อันดับ 1, 2, 3, 4,....
อันดับเพลงยอดนิยม
อันดับที่ 1, 2, 3, ....
ต ัวอย่างต ัวแปรระด ับ
INTERVAL
ทัศนคติจากสเกลการวัด
่ Likert
เชน
มาตราว ัด
เห็นด ้วยอย่างมาก = 5,
เห็นด ้วย = 4,
เป็ นกลาง = 3,
ไม่เห็นด ้วย = 2,
ไม่เห็นด ้วยอย่างมาก = 1
อุณหภูม ิ (บางมาตรา)
ี ส,
25 องศาเซลเซย
0o c (ศูนย์สมมติ)
GPA
3.3, 2.94, 3.8
0.00 (ศูนย์สมมติ)
คะแนน I.Q
110, 145, 93,
0 (ศูนย์สมมติ)
คะแนนจากการสอบ
40, 70, 95,...
0 (ศูนย์สมมติ)
ตัวอย่างตัวแปรระดับ Ratio
น้ าหนัก
มาตราวัด
50 กิโลกรัม, 30.7 ปอนด์
ความเร็ว
170 เซนติเมตร,
165.3 เซนติเมตร, 6 ฟุต 5 นิว้
60 กิโลเมตรต่อชวั่ โมง
ความยาว
5.4 ฟุต 4 นิว้ 8 กิโลกรัม
รายได ้
4,000 บาท, 79.50 บาท $ 250
จานวนข ้าราชการ
1 ล ้านคน, 2,047 คน
ความสูง