การจัดกระทำกับข้อมูล

Download Report

Transcript การจัดกระทำกับข้อมูล

 การจัดกระทากับข้ อมูล
 การแจกแจงความถี่สถิตพิ นื้ ฐาน
1
การจัดกระทากับข้ อมูล
ในกรณี ที่ใช้แบบสอบถาม แบบสารวจ แบบวัดและแบบทดสอบ
สามารถดาเนินการได้ดงั นี้
1. ตรวจสอบความสมบูรณ์ของคาตอบ
2. นาคาตอบของกลุ่มตัวอย่างที่มีความสมบูรณ์มาตรวจคะแนน
ในกรณี ที่เป็ นแบบตรวจให้คะแนนได้เช่น แบบทดสอบ แบบวัดที่
เป็ นแบบมาตรส่ วนประมาณค่า (Rating Scale) เป็ นต้น
2
การจัดกระทากับข้ อมูล
กรณี ที่เป็ นแบบวัดที่เป็ นแบบมาตรส่ วนประมาณค่า (Rating Scale)
ตัวอย่างเช่น
เห็นด้วยอย่างยิง่
ตรวจให้
5 คะแนน
เห็นด้วย
ตรวจให้
4 คะแนน
ไม่แน่ใจ
ตรวจให้
3 คะแนน
ไม่เห็นด้วย
ตรวจให้
2 คะแนน
ไม่เห็นด้วยอย่างยิง่
ตรวจให้
1 คะแนน
3
การจัดกระทากับข้ อมูล
กรณี ใช้มาตรส่ วนประมาณค่า (Rating Scale) ผูว้ ิจยั อาจต้องการ
รายงานผลของการตอบของกลุ่มตัวอย่างที่ตอบในแต่ละข้อหรื อแต่ละด้าน
ซึ่งจะใช้เกณฑ์ในการแปลความหมายค่าเฉลี่ยของกลุ่มดังนี้
ค่าเฉลี่ย 4.51 – 5.00 แปลความว่า เห็นด้วยอย่างยิง่
ค่าเฉลี่ย 3.51 – 4.50 แปลความว่า เห็นด้วย
ค่าเฉลี่ย 2.51 – 3.50 แปลความว่า ไม่แน่ใจ
ค่าเฉลี่ย 1.51 – 2.50 แปลความว่า ไม่เห็นด้วย
ค่าเฉลี่ย 1.00 – 1.50 แปลความว่า ไม่เห็นด้วยอย่างยิง่
4
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1 สถิติที่ใช้อธิบายคุณลักษณะหรื อรายละเอียดของกลุ่มตัวอย่าง
ได้แก่
3.1.1 ร้อยละ (Percentage)
เมื่อ p แทน ร้อยละ
f แทน ความถี่ที่ตอ้ งการแปลงให้เป็ นร้อยละ
N แทน จานวนความถี่ท้ งั หมด
5
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง(Measures of Central
Tendency)
ก) ค่ าเฉลีย่ (Arithmetic Mean)
เมื่อ
แทน ค่าเฉลี่ย
แทน ผลรวมของคะแนนทั้งหมด
N แทน จานวนคะแนนหรื อข้อมูลทั้งหมด
6
การจัดกระทากับข้ อมูล
ต.ย. จงหาค่าเฉลี่ยของคะแนนวิชาภาษาอังกฤษของนักเรี ยน 5 คน ซึ่งสอบ
ได้คะแนนดังนี้ 12 9 6 18 10
แทนค่าได้
= 12 + 9 + 6 + 18 + 10 / 5
= 55/5
= 11
7
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง(Measures of Central
Tendency)
ข) การหาค่ าเฉลีย่ ของข้ อมูลทีม่ ีการแจกแจงความถี่
เมื่อ
แทน ผลรวมทั้งหมดของ คูณ
8
การจัดกระทากับข้ อมูล
จงหาค่ าเฉลีย่ ของข้ อมูลทีก่ าหนดให้
สู ตร
ค่าเฉลี่ยของข้อมูลเท่ากับ 13.2
9
การจัดกระทากับข้ อมูล
การนาค่ าเฉลีย่ ไปใช้
1. ใช้อธิบายสภาพของกลุ่มว่าระดับความสามารถโดยทัว่ ไปอยูใ่ นเกณฑ์สูง
ปานกลาง หรื อ ต่า
2. ใช้บอกระดับความยากง่ายของข้อสอบทั้งฉบับ ถ้าคะแนนเฉลี่ยค่อนข้าง
ต่า แสดงว่าเด็กส่ วนใหญ่ได้คะแนนน้อยหรื อข้อสอบยาก แต่ถา้ คะแนน
เฉลี่ยสูงแสดงว่าเด็กส่ วนใหญ่ได้คะแนนมาก หรื อข้อสอบค่อนข้างง่าย
3. ใช้เปรี ยบเทียบความสามารถระหว่างกลุ่ม
4. ใช้หาค่าสถิติอื่น ๆ เช่น t-test F-test
5. เหมาะสาหรับใช้กบั ข้อมูลที่มีการแจกแจงปกติ
10
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง
ข) มัธยฐาน (Median) คือ คะแนนตรงกลางที่แบ่งคะแนน
อื่น ๆ ในกลุ่มออกเป็ น 2 ฝ่ ายเท่า ๆ กันฝ่ ายหนึ่งอยูส่ ูงกว่า และอีกฝ่ ายหนึ่งอยูต่ ่า
กว่า เขียนแทนด้วย Mdn หรื อ Md
ต.ย. 1 คะแนนชุดนั้นเป็ นจานวนคี่ (ให้นาข้อมูลมาเรี ยงลาดับจากน้อยไปมาก)
6 9 10 12 18 มัธยฐานเท่ากับ 10
11
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง
ข) มัธยฐาน (Median) คือ คะแนนตรงกลางที่แบ่งคะแนน
อื่น ๆ ในกลุ่มออกเป็ น 2 ฝ่ ายเท่า ๆ กันฝ่ ายหนึ่งอยูส่ ูงกว่า และอีกฝ่ ายหนึ่งอยูต่ ่า
กว่า เขียนแทนด้วย Mdn หรื อ Md
ต.ย. 2 คะแนนชุดนั้นเป็ นจานวนคู่ (ให้นาข้อมูลมาเรี ยงลาดับจากน้อยไปมาก)
6 9 10 12 18 20 คะแนนคู่ที่อยูต่ รงกลาง
ดังนั้นมัธยฐาน = 10 + 12/2
12
= 11
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.2 การวัดแนวโน้มเข้าสู่ส่วนกลาง
ค) ฐานนิยม (Mode) คือ ค่าที่ซ้ ากันมากที่สุด หรื อที่มีความถี่
มากที่สุด เขียนแทนด้วย Mo
ต.ย. 1 จานวนข้อมูล 12 9 6 18 10
คาตอบ ในตัวอย่างนี้ไม่มีการซ้ ากัน ทุกค่าต่างก็มีค่าเดียว จึงไม่มีฐานนิยม
ต.ย. 2 จานวนข้อมูล 12 9 6 9 18 9 10 6
คาตอบ ฐานนิยมคือ 9 และ 6
13
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.3 การวัดการกระจาย (Measures of Variability) เป็ นสถิติที่
ช่วยให้ทราบถึงความแตกต่างกันหรื อการแปรผันของคะแนนในกลุ่มนั้น
ก) พิสัย (Rang) เป็ นการกระจายที่ตรงที่สุดและง่ายที่สุด
R = H–L
เมื่อ R แทน พิสยั
H แทน คะแนนสูงสุ ด
L แทน คะแนนต่าสุ ด
14
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.3 การวัดการกระจาย (Measures of Variability) เป็ นสถิติที่
ช่วยให้ทราบถึงความแตกต่างกันหรื อการแปรผันของคะแนนในกลุ่มนั้น
ข) ส่ วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
เป็ นการวัดการกระจายที่ได้รับการนาไปใช้อย่างกว้างขวาง หาได้จากสูตร
15
การจัดกระทากับข้ อมูล
16
การจัดกระทากับข้ อมูล
จงหาส่ วนเบี่ยงเบนมาตรฐานของคะแนนภาษาอังกฤษนักเรี ยน 5 คน มีดงั นี้
12 9 6 18 10 ( )
คะแนนเฉลี่ยของข้อมูลชุดนี้คือ 11
17
การจัดกระทากับข้ อมูล
18
การจัดกระทากับข้ อมูล
3. นาเอาข้อมูลมาจัดระบบ วิเคราะห์ และแปลผล
3.1.3 การวัดการกระจาย (Measures of Variability) เป็ นสถิติที่
ช่วยให้ทราบถึงความแตกต่างกันหรื อการแปรผันของคะแนนในกลุ่มนั้น
ค) ความแปรปรวน (Variance) เป็ นการวัดการกระจายที่
สาคัญมาก ความแปรปรวนก็คือส่ วนเบี่ยงเบนมาตรฐานยกกาลังสอง เป็ นการ
วัดการกระจายในรู ปพื้นที่ สูตรของการหาความแปรปรวนก็คือสูตรการหาค่า
ส่ วนเบี่ยงเบนมาตรฐานที่เอารากที่สองออกดังนี้
19
การจัดกระทากับข้ อมูล
ดังนั้นถ้าส่ วนเบี่ยงเบนมาตรฐานเป็ น 10 ความแปรปรวนจะเป็ น 100
ถ้าความแปรปรวนเป็ น 4 ส่ วนเบี่ยงเบนมาตรฐานจะเป็ น 2
20
การแจกแจงความถี่สถิติเบือ้ งต้ น
การแจกแจงความถี่ คือ การนาข้อมูลที่รวบรวมได้มาจัดใหม่ให้เป็ น
ระเบี ยบ เป็ นหมวดหมู่ เรี ย งจากมากไปหาน้อย หรื อจากน้อยไปหามาก
เพื่อแสดงให้ทราบว่าข้อมูลแต่ละค่า หรื อข้อมูลแต่ละกลุ่มเกิดการซ้ า ๆ กันกี่
ครั้งซึ่ง การแจกแจงความถี่แบ่งออกเป็ น 2 วิธีคือ
1. การแจกแจงความถี่แบบไม่จดั กลุ่ม (ungrouped data)
2. การแจกแจงความถี่แบบจัดกลุ่ม (grouped data)
21
1. การแจกแจงความถี่แบบไม่ จัดกลุ่ม (ungrouped data)
เป็ นการเรี ย งอัน ดับ ข้อ มู ล
จากมากไปหาน้อย หรื อจากน้อยไป
หามาก เช่ น คะแนนสอบวิ ช าการ
เขี ย นโปรแกรมเบื้ อ งต้น
ของ
นักศึ กษา 10 คน ปรากฏผลดังนี้
17,17,17,16,16,16,15,14,13,13 เมื่อ
นาคะแนนมาแจกแจงความถี่จะได้
ดังนี้
คะแนน
17
16
15
14
13
รอยขีด ความถี่ (f)
(Tally)
///
3
///
3
/
1
/
1
//
2
N = 10
22
1. การแจกแจงความถี่แบบไม่ จัดกลุ่ม (ungrouped data)
การแจกแจงความถี่แบบไม่จดั กลุ่ม เหมาะสาหรับข้อมูลที่มีคะแนน
สู งสุ ดและต่าสุ ดแตกต่างกันไม่มากนัก จะทาให้เห็ นภาพการกระจายของ
ข้อมูลและแปลความหมายได้ชดั เจน แต่ถา้ คะแนนสู งสุ ดและต่าสุ ดห่ างกัน
มากควรจะแจกแจงความถี่แบบจัดกลุ่ม
23
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
เพราะข้อ มู ล บางกลุ่ ม บางจ าพวกไม่ ส ะดวกที่ จ ะจัด เป็ นตาราง
ดังกล่าวข้างต้นเนื่องจากช่วงคะแนนอยูส่ ูงกับต่าต่างกันมาก วิธีที่ดีที่สุดก็คือ
การจัดชั้น (Class) การจัดแบบนี้จะต้องมีองค์ประกอบคือ
2.1 หาพิสัยของคะแนน
พิสัย = คะแนนสูงสุ ด – คะแนนต่าสุ ด
2.2 ประมาณจานวนชั้นคะแนน ซึ่งไม่ควรต่ากว่า 10 ชั้น และไม่เกิน 20 ชั้น
(ทั้งนี้พิจารณาจากพิสยั ถ้าพิสยั มีค่ามากก็ควรจะกาหนดหลายชั้น
ถ้าพิสยั มีค่าน้อยก็ไม่จาเป็ นต้องมีจานวนชั้นคะแนนมาก)
24
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
2.3 หาดูวา่ ในแต่ละชั้นคะแนนมีคะแนนกี่จานวน นั้นคือหาอัตรภาคชั้น
(Class interval) โดยใช้สูตร
อัตราภาคชั้น (i) = พิสัย/จานวนชั้น
2.4 เขียนตาราง 3 คอลัมน์ คือ คะแนน รอยขีด และความถี่
25
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
ต.ย. ในการสอบกลางภาค วิชาระบบการสื่ อสารข้อมูลของนักศึกษา
ชั้นปี ที่ 3 มีผไู ้ ด้คะแนนดังนี้
63 76 98 82 87 84 78 74 68 75 52 86 77 87 70 67
77 79 92 92 81 77 40 60 94 70 81 82 81 78 70 60
88 46 81 77 83 76 70 61
26
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
1. หาพิสัยของคะแนน ซึ่งพิสัย = คะแนนสูงสุ ด – คะแนนต่าสุ ด
พิสัย = 98-40 = 58
2. ประมาณจานวนชั้นคะแนน ทั้งนี้ให้พิจารณาจากพิสยั ถ้าพิสยั มีค่ามาก
ควรกาหนด หลายชั้น ถ้าพิสยั มีค่าน้อยควรกาหนดจานวนชั้นน้อย
โดยทัว่ ไปนิยมจานวนชั้นประมาณ 10-20 ชั้น ในที่น้ ีตอ้ งการ 12 ชั้น
3. หาอันตรภาคชั้น (class interval =i ) หรื อความกว้างของช่วงคะแนนใน
แต่ละชั้น โดยใช้สูตร i = (พิสัย/จานวนชั้น)
ดังนั้นอันตรภาคชั้นมีค่าประมาณ 5
27
28
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
1. ค่าอันตรภาคชั้น (i) ถ้าคานวณได้เป็ นทศนิยม ต้องปัดขึ้นให้เป็ นจานวน
เต็มเสมอ เช่น i = 4.83 ปัดเป็ น 5 ถ้าปัดลงเป็ น 4 คะแนนสูงสุ ดหรื อต่าสุ ด
จะไม่สามารถใส่ ลงไปในช่วงคะแนนใด ๆ ได้
2. ค่าอันตรภาคชั้น (i) ถ้าคานวณลงตัว (จานวนเต็ม) ให้บวก 1 อีกเช่นกัน
เช่น
จะต้องบวก 1 ซึ่งจะได้ i = (2+1) = 3 เพราะถ้าไม่บวก 1
เข้าไป คะแนนต่าสุ ดหรื อสูงสุ ดจะไม่สามารถใส่ ลง
ในช่วงคะแนนใด ๆ ได้ เช่นเดียวกับข้อ 1
29
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
3. ในกรณี ขอ้ 1 และ 2 เมื่อปัดจุดทศนิยมขึ้นแล้ว หรื อบวก 1 แล้ว ปรากฏว่า
ชั้นคะแนนเกินจากคะแนนสูงสุ ด หรื อชั้นคะแนนต่ากว่าคะแนนต่าสุ ด
ให้สามารถบวกหรื อลบได้ 1 ชั้น เช่น จากตัวอย่างการแจกแจงความถี่
แบบจัดกลุ่ม พิสยั = 98-40 = 58 ต้องการ 11 ชั้น จะได้อนั ตรภาคชั้น
หรื อประมาณ 6 เมื่อจัดเป็ นชั้น โดยเริ่ มตั้งแต่ช้ นั ล่างสุ ด
คือ ชั้นที่ 1 = 40-45, ชั้นที่ 2 = 46-51, ............., ชั้นที่ 10
= 94-99 และชั้นที่ 11 = 100-105
จะเห็นว่ าชั้นที่ 11 ไม่มีคะแนนใด ๆ ใส่ ลงไปเลย เพราะเกินคะแนนของ
ข้อมูล กรณี เช่นนี้ ให้ลดลง 1 ชั้น ดังนั้นให้ตดั ชั้นที่ 11 คือ 100-105 ออก30
2. การแจกแจงความถีแ่ บบจัดกลุ่ม (grouped data)
4. ค่าอันตรภาคชั้น (i) มักนิยมทาเป็ นเลขคี่ เช่น i=3,5,7,.. เพื่อให้จุดกึ่งกลาง
ของช่วงคะแนนเป็ นเลขจานวนเต็ม ซึ่งจะสะดวกในการคานวณ
31
โค้ งความถี่สะสม
โค้งความถี่สะสมได้มาจากความสัมพันธ์ระหว่างคะแนนกับ
ความถี่สะสม
ความถี่
100
90
60
40
20
คะแนน
10.5 16.5 22.5 28.5 34.5 40.5 46.5
32
ลักษณะโค้ งของความถี่
การแจกแจงของข้อมูลจะมีลกั ษณะเป็ นรู ปโค้งอย่างไรนั้น สามารถ
จาแนกได้เป็ น 3 ประเภทใหญ่ ดังนี้
1. โค้ งปกติ (normal curve)
เป็ นการแจกแจงความถี่ที่ได้ความถี่ของข้อมูลค่ากลาง ๆ มากกว่า
ข้อมูลที่มีค่าสูงและต่า ซึ่งจะมีโค้งความถี่เป็ นรู ประฆังคว่า
33
ลักษณะโค้ งของความถี่
2. โค้ งเบ้ ขวา (บวก)
เป็ นการแจกแจงความถี่ที่ได้ความถี่ของข้อมูลค่าต่า ๆ มากกว่า
ข้อมูลที่มีค่ากลางและค่าสูง
34
ลักษณะโค้ งของความถี่
3. โค้ งเบ้ ซ้าย (ลบ)
เป็ นการแจกแจงความถี่ที่ได้ความถี่ของข้อมูลค่าสูง ๆ มากกว่า
ข้อมูลที่มีค่ากลางและค่าต่า
35