บทที่ 2.การวิเคราะห์ข้อมูลเบื้องต้น - สาขาวิชาคณิตศาสตร์และสถิติ คณะ

Download Report

Transcript บทที่ 2.การวิเคราะห์ข้อมูลเบื้องต้น - สาขาวิชาคณิตศาสตร์และสถิติ คณะ

2.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง
(Measure of Central Tendency)
การวัดแนวโน้มเข้าสู่ส่วนกลาง
ค่าเฉลีย่ (Mean)
มัธยฐาน (Median)
ค่าเฉลีย่ เลขคณิต (Arithmetic Mean)
ค่าเฉลีย่ เรขาคณิต (Geometric Mean)
ค่าเฉลีย่ ฮาร์โมนิค (Harmonic Mean)
ฐานนิยม (Mode)
2.1.1 ค่าเฉลีย่ เลขคณิต (Arithmetic Mean)
กรณีขอ้ มูลไม่ได้แจกแจงความถี่
N
ค่าเฉลีย่ เลขคณิตของประชากร
 
X
i
i 1
N
n
ค่าเฉลีย่ เลขคณิตของตัวอย่าง
x 
x
i 1
n
i
ตัวอย่าง 2.1 ในการวัดระดับความสามารถทางสติปัญญา
(I.Q.) ของนักเรียนห้องหนึง่ สุ่มตัวอย่างนักเรียนมา 10 คน
วัดระดับ I.Q. บันทึกผลได้ดงั ตาราง
คนที่ 1 2 3 4 5 6 7 8 9 10
I.Q. 70 65 89 67 55 74 69 88 95 97
n
∑x
x =
i= 1
i
=
70 + 65 + 89 + 67 + 55 + 74 + 69 + 88 + 95 + 97
n
= 7.69
10
กรณีขอ้ มูลแจกแจงความถี่
k
fx
i
x 
i
i 1
n
โดยที่
xi
หมายถึง จุดกีง่ กลางชั้น
n หมายถึง จานวนตัวอย่าง
fi คือ
ความถีใ่ นแต่ละอันตรภาคชั้น
ตัวอย่างที่ 2.2 ในการสารวจเป็ ดของครัวเรือนในหมู่บา้ นชนบท
แห่งหนึง่ บันทึกจานวนเป็ ดต่อครัวเรือน ได้ขอ้ มูลดังตาราง
จานวนเป็ ด 1 – 5 6 – 10 11 – 15 16 – 20 21 – 25
14
20
25
16
จานวนครัวเรือน 5
จงหาจานวนเป็ ดเฉลีย่ ต่อครัวเรือน
จานวนเป็ ด
1–5
6 – 10
11 – 15
16 – 20
21 – 25
รวม
ความถี่ (fi) จุดกึง่ กลางชั้น (xi)
5
3
14
8
20
13
25
18
16
23
n = 80
fixi
15
112
260
450
368
1,205
n

x 
fi xi
i 1
n

1, 250
 15 . 625
80
ดังนั้น แต่ละครัวเรือนจะเลี้ ยงเป็ ดเฉลีย่ 15.625 ตัวต่อครัวเรือน
2.1.2 มัธยฐาน (Median)
=
กรณีขอ้ มูลไม่ได้แจกแจงความถี่
1) เรียงลาดับข้อมูลจากน้อยไปหามาก หรือมากไปหาน้อย
2) หาตาแหน่งของมัธยฐาน ถ้าข้อมูลมี n ตัว
ตาแหน่งมัธยฐาน

n 1
2
3) ค่ามัธยฐานคือค่าสังเกตทีอ่ ยู่ในตาแหน่งทีห่ าได้ในข้อ (2)
หมายเหตุ ถ้าชุดข้อมูลมี n ตัว ซึ่ง n เป็ นจานวนคู่ ตาแหน่งที่ได้จะอยู่ระหว่างค่า
สังเกต 2 จานวน การหาค่ามัธยฐานให้นาค่าสังเกตทั้ง 2 ที่อยู่ระหว่างตาแหน่งที่หาได้มา
หาค่าเฉลีย่
ตัวอย่าง 2.3 จงหาค่ามัธยฐานของข้อมูลต่อไปนี้
1) 12 9
14 10 18 20 17
•เรียงลาดับข้อมูลจากน้อยไปหามาก
9 10 12 14 17 18 20
•หาตาแหน่งมัธยฐาน
n 1
7 1

 4
ตาแหน่งมัธยฐาน 
2
2
•หาค่ามัธยฐาน
มัธยฐานคือค่าสังเกตในตาแหน่งที่ 4
ดังนั้น มัธยฐาน = 14
2) 22 29 17 27 39 35 25 28
•เรียงลาดับข้อมูลจากน้อยไปหามาก
17 22 25 27 28 29 35 39
•หาตาแหน่งมัธยฐาน
n 1
81

 4.5
ตาแหน่งมัธยฐาน 
2
2
•หาค่ามัธยฐาน
มัธยฐานคือค่าสังเกตในตาแหน่งที่ 4.5 ซึ่งอยู่ระหว่างค่า
สังเกตในตาแหน่งที่ 4 และ 5
27  28
ดังนั้น มัธยฐาน 
 27.5
2
กรณีขอ้ มูลแจกแจงความถี่
1) หาตาแหน่งมัธยฐานจากสูตร
n
ตาแหน่งมัธยฐาน 
2
2) คานวณหาค่ามัธยฐานจากสูตร
 n


F
 2

M edian  L  I 

f




โดยที่ L
I
n
F
f
คือ
คือ
คือ
คือ
คือ
ขอบเขตล่างของชั้นมัธยฐาน
ความกว้างของอันตรภาคชั้น
จานวนข้อมูล
ความถีส่ ะสมของชั้นก่อนมัธยฐาน
ความถีใ่ นชั้นมัธยฐาน
ตัวอย่าง 2.4 ตารางแจกแจงความถีแ่ สดงปริมาณเครือ่ งคอมพิวเตอร์
ทีส่ งมาขายของบริ
ั่
ษทั แห่งหนึง่ ในแต่ละสาขาจานวน 40 สาขา มี
ข้อมูลดังนี้
ปริมาณเครือ่ ง
1 – 10 11 – 20 21 – 30 31 – 40 41 – 50 51 - 60
คอมพิวเตอร์
3
4
6
12
5
10
จานวนสาขา
วิธีทา
ตาแหน่งมัธยฐาน
ปริมาณเครือ่ ง
คอมพิวเตอร์
1 – 10
11 – 20
21 – 30
31 – 40
41 – 50
51 - 60
L = 30.5

n
2

40
2
 20
ความถี่ ความถีส่ ะสม
(fi)
(F)
3
3
ตาแหน่งที่ 1 – 3
4
7
ตาแหน่งที่ 4 – 7
6
13
ตาแหน่งที่ 8 – 13
12
25
ตาแหน่งที่ 14 – 25
5
30 มัธยฐานคื
ตาแหน่
งที่ 26
อตาแหน่
ง ที–่ 30
่ในชั้นงนี้ที่ 31 – 40
10
40 20 ซึ่งตอยูาแหน่
I = 10
n = 40
F = 13
f = 12
หาค่ามัธยฐานจากสูตร
L = 30.5
I = 10
Median
 n


F
 2

M edian  L  I 

 f 


n = 40
F = 13
f = 12
 20  13 
 30 . 5  10 

 12

 30 . 5  5 . 83
 36 . 33
ดังนั้น มัธยฐานของปริมาณการสังซื้
่ อเครือ่ งคอมพิวเตอร์
คือ 36.33 เครือ่ ง
2.1.3 ฐานนิยม (Mode)
กรณีขอ้ มูลไม่ได้แจกแจงความถี่
ฐานนิยม คือข้อมูลที่มีความถีม่ ากที่สุด สามารถหา
ฐานนิยมได้ท้ งั ข้อมูลเชิงปริมาณ และข้อมูลเชิงคุณภาพ
ตัวอย่าง 2.5 จงหาฐานนิยมของข้อมูลต่อไปนี้
1) 2
5
7
9
7
3
1
9
7 4 3 5 10 7
ข้อมูลทีม่ ีความถีม่ ากทีส่ ุดคือ 7 ดังนั้นฐานนิยม คือ 7
2) 73 11 14 16 17
18 20 24 26 37
ข้อมูลชุดนี้ ไม่มีค่าไหนทีซ่ ้ ากันเลย ดังนั้นข้อมูลชุดนี้ จึ งไม่มีฐานนิยม
3) 10 11 9 7 10 15 9
4 7 10 9 6 5
ข้อมูลทีม่ ีความถีม่ ากทีส่ ุดคือ 9 และ 10 ดังนั้น ข้อมู ลชุดนี้ ไม่มีฐาน
นิยม
ตัวอย่าง 2.6 ในการสารวจคนที่ใช้รถยนต์จานวน 20
คน ว่าใช้รถยีห่ อ้ อะไร ได้ผลสารวจดังนี้
HONDA
VOLVO
TOYOTA
BENZ
TOYOTA TOYOTA
MITSUBISHI LEXUS
SUZUKI
MAZDA
BMW
TOYOTA
MAZDA
FORD
FORD
NISSAN
SUZUKI
NISSAN
HONDA
KIA
พบว่า TOYOTA มีความถีม่ ากทีส่ ุด ดังนั้น ฐานนิยมคือ TOYOTA
กรณีขอ้ มูลแจกแจงความถี่
1) เลือกชั้นทีม่ ีความถีม่ ากทีส่ ุดเป็ นชั้นฐานนิยม
2) คานวณหาค่าฐานนิยมจากสูตร

d1
Mode  L  I 
 d1  d 2
โดยที่ L
I
d1
d2




คือ ขอบเขตล่างของชั้นมัธยฐาน
คือ ความกว้างของอันตรภาคชั้น
คือ ความถีช่ ้ นั ฐานนิยม – ความถีช่ ้ นั ก่อนมฐานนิยม
คือ ความถีช่ ้ นั ฐานนิยม – ความถีช่ ้ นั หลังฐานนิยม
ตัวอย่าง 2.7 จากตัวอย่าง 2.4 จงหาฐานนิยมของปริมาณ
คอมพิวเตอร์ทีส่ งมาขาย
ั่
ปริมาณเครือ่ ง
1 – 10 11 – 20 21 – 30 31 – 40 41 – 50 51 - 60
คอมพิวเตอร์
3
4
6
12
5
10
จานวนสาขา
วิธีทา
ปริมาณเครือ่ ง
คอมพิวเตอร์
1 – 10
11 – 20
21 – 30
31 – 40
41 – 50
51 - 60
ความถี่
(fi)
3
4
6
12
5
10
d1=12 – 6 = 6
d2=12 – 5 = 7
อันตรภาคชั้น 31 – 40 มีความถีส่ ูงสุด คือ 12 จึ งให้ช้ นั นี้ เป็ นชั้นฐานนิยม
จะได้ L = 30.5 d1 = 6 d2 = 7
แทนค่าในสูตร
 d1
Mode  L  I 
 d1  d 2




 6 
 30 . 5  10 

67
 30 . 5  4 . 62
 35 . 12
ดังนั้นฐานนิยมของปริมาณการสังซื้
่ อเครือ่ งคอมพิวเตอร์คือ 35.12 เครือ่ ง
2.3 การวัดการกระจาย
(Measurement of Dispersion)
ในการวัดแนวโน้มเข้าสู่ส่วนกลาง เป็ นค่ากลางที่ใช้เป็ น
ลักษณะของตัวแทนข้อมูลชุดนั้น แต่ถา้ เราทราบแต่ค่ากลาง
เพียงค่าเดียว ทาให้เราไม่สามารถมองเห็นภาพรวมของข้อมูล
ในชุดนั้นๆ ได้
ชุดที่ 1
ชุดที่ 2
ชุดที่ 3
8
4
6
8
6
1
8
8
15
8
10
11
8
12
7
2.3.1 พิสยั (Range)
พิสยั = Xmax – Xmin
เมือ่
Xmax
Xmin
คือ ค่ามากที่สุดในชุดข้อมูล
คือ ค่าน้อยที่สุดในชุดข้อมูล
2.3.2 ส่วนเบีย่ งเบนมาตรฐาน
(Standard Deviation)
ส่วนเบีย่ งเบนมาตรฐานของประชากร ( )
กรณีขอ้ มูลไม่ได้แจกแจงความถี่
กรณีขอ้ มูลแจกแจงความถี่
N
N
 
 (X
i
i 1
N
 X)
2
 

fi ( X i  X )
i 1
N
2
2.3.3 ความแปรปรวน
(Variance)
ความแปรปรวนของประชากร ( σ )
2
กรณีขอ้ มูลไม่ได้แจกแจงความถี่
กรณีขอ้ มูลแจกแจงความถี่
N


2

(X i  X )
i 1
N
N

2

2

fi (X i  X )
i 1
N
2
ส่วนเบีย่ งเบนมาตรฐานของตัวอย่าง (S.D หรือ S)
- กรณีขอ้ มูลไม่ได้แจกแจงความถี่
n

S .D . 
n
( xi  x )
i 1
n 1

2
หรือ
S .D . 
xi  n( x )
2
i 1
n 1
2
ความแปรปรวนของตัวอย่าง (S.D หรือ S)
- กรณีขอ้ มูลไม่ได้แจกแจงความถี่
n
n

S
2

( xi  x )
i 1
หรือ
n

2
S .D . 
xi  n( x )
2
i 1
n 1
2
ตัวอย่าง 2.8 สุ่มตัวอย่างนักศึกษาคณะวิทยาศาสตร์และ
เทคโนโลยี มหาวิทยาลัยราชภัฏเชียงใหม่ จานวน 11 คน
สอบถามถึงจานวนครั้งทีใ่ ช้โทรศัพท์ในการโทรออกในแต่ ละวัน
ได้ขอ้ มูลดังนี้
8
3
2 11 7 5
10 6 5 4 5
จงหา พิสยั ส่วนเบีย่ งเบนมาตรฐาน และความแปรปรวน
ของข้อมูลชุดนี้
วิธีทา
1) พิสยั = Xmax – Xmin
= 10 – 2
= 8
ดังนั้นพิสยั มีค่าเท่ากับ 9
2) ส่วนเบีย่ งเบนมาตรฐาน
- หาค่าเฉลีย่
n
x
x 
i 1
n
i

8  2  11  7  5  3  10  6  5  4  5
11
 6
การหาส่วนเบีย่ งเบนมาตรฐานของตัวอย่างมี 2 สูตร ดังนั้นจะแสดงทั้ง 2 สูตร
n

สูตรที่ 1
S .D . 
( xi  x )
i 1
n 1
( 8  6 )  ( 2  6 )  (11  6 )  . . .  ( 5  6 )
2


2
2
2
11  1
4  16  25  1  1  9  16  0  1  4  1
10

97
10
 3 . 114
2
สูตรที่ 2
n

S .D . 

S .D . =
xi  n( x )
2
2
i 1
n 1
8
2
 2  11  . . .  5
2
2
2
  11  6 
2
11  1
(64 + 4 + 121 + 49 + 25 + 9 + 100 + 36 + 25 + 16 + 25 ) - 396
10
= 3 . 114
ดังนั้นส่วนเบีย่ งเบนมาตรฐานมีค่าเท่ากับ 3.114 ครั้ง
3) ความแปรปรวน
จากสูตรจะเห็นว่า ความแปรปรวน = (ส่วนเบีย่ งเบนมาตรฐาน)2
ดังนั้นความแปรปรวน S2= (3.114)2 = 9.697 ครั้ง2
ส่วนเบีย่ งเบนมาตรฐานของตัวอย่าง (S.D หรือ S)
- กรณีขอ้ มูลแจกแจงความถี่
n

S .D . 
f i ( xi  x )
i 1
n 1
n

2
หรือ
S .D . 
f i xi  n( x )
2
i 1
n 1
2
ความแปรปรวนของตัวอย่าง (S.D หรือ S)
- กรณีขอ้ มูลแจกแจงความถี่
n
n

S
2

f i ( xi  x )
i 1

2
หรือ
n
S
2

fi xi  n( x )
2
i 1
n 1
2
ตัวอย่าง 2.9 จากการสอบถามถึงเงินออมในแต่ละวันของ
นักศึกษาสาขาวิชาสถิติ ได้ขอ้ มูลดังนี้
เงินออม 1 – 5 6 – 10 11 – 15 16 – 20 21 – 25
จานวน 1
5
8
4
2
จงหาส่วนเบีย่ งเบนมาตรฐานของข้อมูลชุดนี้
วิธีทา
เงินออม ความถี่ (fi)
1–5
1
6 – 10
5
11 – 15
8
16 – 20
4
21 – 25
2
รวม
20
xi
3
8
13
18
23
fi xi
3
40
104
72
36
265
fi xi2
9
320
1,352
1,296
1,058
4,035
ต้องหา
x
ก่อน จากสูตร
n

x 
f i xi
i 1
265

n
จะได้
 13 . 25
20
n

S .D . 
S .D . =
f i xi  n( x )
2
2
i 1
n 1
4 , 035 - 20 ( 13 . 25 )
20 - 1
= 5 . 25
2
สัมประสิทธิ์การแปรผัน
(Coefficient of Variation: C.V.)
ใช้ในการเปรียบเทียบการกระจายของข้อมูล 2 ชุดขึ้ นไป
C .V . 
S .D .
X
 100 %
ตัวอย่าง 2.10 ในการสอบกลางภาคเรียน วิชา การคิดและการ
ตัดสินใจ หลักสถิติ แคลคูลสั และสถิติธุรกิจ ปรากฏผลดังนี้
วิชา
ค่าเฉลีย่ ส่วนเบีย่ งเบนมาตรฐาน
การคิดและการตัดสินใจ 25
10
หลักสถิติ
30
9
แคลคูลสั
18
15
สถิติธุรกิจ
26
12
จงพิจารณาว่าคะแนนสอบวิชาใดมีการกระจายมากกว่ากัน
วิธีทา
C .V . 
S .D .
 100 %
X
วิชาการคิดและการตัดสินใจ
C .V . 
10 .
 100 %  40 %
25
วิชาหลักสถิติ
วิชาแคลคูลสั
วิชาสถิติธุรกิจ
C .V . 
9.
 100 %  30 %
30
C .V . 
15 .
 100 %  83 . 33 %
18
C .V . 
12 .
 100 %  46 . 15 %
26
ดังนั้น วิชาทีม่ ีการกระจายมากทีส่ ุดคือ แคลคูลสั รองลงมาได้แก่ วิชา
สถิติธุรกิจ การคิดและการตัดสินใจ และ หลักสถิติ ตามลาดับ
2.4 ค่ามาตรฐาน
(Standard Score)
เป็ นค่าทีบ่ อกความแตกต่างระหว่างค่าทีไ่ ด้จากการ
สังเกตนั้นกับค่าเฉลีย่ คิดเป็ นกีเ่ ท่าของส่วนเบีย่ งเบนมาตรฐาน
ของข้อมูลโดยคานวณได้จากสูตร
Z

xi  x
S .D .
ตัวอย่าง 2.11 จากข้อมูลในตัวอย่าง 2.10 ถ้านาย
เพลิงสอบวิชาการคิดและการตัดสินใจ หลักสถิติ
แคลคูลสั และสถิติธุรกิจ ได้คะแนน 30, 33, 24 และ
25 คะแนน ตามลาดับ อยากทราบว่านายเพลิงเรียน
วิชาไหนได้ดีที่สุด
วิธีทา
วิชา
การคิดและการ
ตัดสินใจ
หลักสถิติ
แคลคูลสั
สถิติธุรกิจ
ค่าเฉลีย่ ส่วนเบีย่ งเบน
มาตรฐาน
x
(S.D.)
25
10
30
18
26
9
15
12
คะแนนของนาย
เพลิง
( xi )
30
33
24
25
หาค่ามาตรฐานของทั้ง 4 วิชา จากสูตร
Z

Xi  X
S .D .
วิชาการคิดและการตัดสินใจ
Z

30  25
 0 .5
10
วิชาหลักสถิติ
วิชาแคลคูลสั
วิชาสถิติธุรกิจ
Z

33  30
 0 . 33
9
Z

24  18
 0 .4
15
Z

25  26
  0 . 08
12
ดังนั้นวิชาทีน่ ายเพลิงเรียนดีทีส่ ุดคือ วิชาการคิดและการตัดสินใจ
รองลงมาคือวิชาแคลคูลสั หลักสถิติ และสถิติธุรกิจ ตามลาดับ