9. สถิติสำหรับการวิจัย

Download Report

Transcript 9. สถิติสำหรับการวิจัย

สถิติสำหรับกำรวิจัย
รศ.ดร.โยธิน แสวงดี
สถาบันวิจัยประชากรและสังคม มหาวิทยาลัยมหิดล
สถิติสำหรับกำรวิจยั
• สถิติมีความสาคัญคือ เป็ นข้ อมูล แสดงลักษณะการดารงคงอยูข่ องสถานะของ
ข้ อมูล ปรากกฏการณ์ สถานะภาพ ฯลฯ
• สถิตเิ ชิงพรรณา ใช้ พรรณา เช่น แสดงปรากฎการณ์ สถานะการณ์ สถานะภาพ
ที่เป็ นอยู่ หรื อ ที่ผา่ นมาในอดีต เช่น สานักงานสถิติแห่งชาตินาเสนอข้ อมูล
สถานะการณ์ สถานะภาพ ปรากฎการณ์ ต่างๆ ทางด้ านจานวนประชากร
โครงสร้ างประชากรตามอายุ และเพศ โครงสร้ างครอบครัว ครอบครัวเดี่ยว
ครอบครัวขยาย บริษัท ห้ างหุ้นส่วนๆ ต่างๆ แสดงผลประกอบการ จานวนงบลงทุน
จานวนวัสดุ อุปกรณ์ ความสูญเสียฯลฯ
• สถิติเชิงพรรณา ได้ แก่ Mean Mode Median S.D. เป็ นต้ น
สถิตสิ ำหรับกำรทดสอบสมมุตฐิ ำนทำงสถิติ
•
•
•
•
ใช้ มากสาหรับการวิจยั เชิงทดลอง
การวิจยั เพื่อการวัดและประเมินผล
การวิจยั ดาเนินงาน
สาเหตุที่ต้องทาการพิสจู น์สมมุติฐานเพราะต้ องการข้ อค้ นพบไปชี ้นา
นโยบาย เนื่องจากสามารถยืนยันได้ อย่างแท้ จริงว่าผ่านการทดลอง (ที่มี
การควบคุม หรื อ การขจัดปั จจัยอื่นๆที่เกี่ยวข้ องออกๆปแล้ ว)
สมมุติฐำน
•
•
•
•
•
Ho หรื อ Null Hypothesis จะนิยมตังว่
้ า ไม่แตกต่าง
ใช้ สญ
ั ลักษณ์ =
Ha หรื อ Alternative Hypothesis หรื อ สมมุติฐานที่ต้องการพิสจู น์
ใช้ สญ
ั ลักษณ์วา่ แตกต่าง เช่น ไม่เท่ากับ > หรื อ < เป็ นต้ น
ส่วนใหญ่จะไม่นิยมเขียน จะทราบกันโดยนัยะว่าจะพิสจู น์อะไร แต่งานวิจยั เชิง
ทดลองทังสายวิ
้
ทยาศาสตร์ และสายสังคมศาสตร์ จะต้ องเขียนใว้
• สิง่ สาคัญคือ ตัง้ Ha ใว้ อย่างไร ต้ องพิสจู น์ ให้ ได้ เป็ นจริงตามนัน้ เพราะเป็ นไป
ตามหลักปฏิฐานนิยม ไม่งนจะถื
ั ้ อว่างานวิจจั ล้ มเหลว (เพราะไม่เป็ นไปตามที่ตงใว้
ั้
ในวัตถุประลงค์ที่ต้องการพิสจู น์)
t-test
• ใช้ สาหรับทดสอบสมมุตฐิ าน เปรี ยบเทียบกันสองกลุม่ เท่านัน้
• หน่วยวัดของสิง่ ที่จะเปรี ยบเทียบต้ องเป็ นคะแนนพฤติกรรม ฤทธิ์ ส่วนสูง
น ้าหนัก ฯลฯ เพราะเน้ นที่การเปรี ยบเทียบค่าเฉลี่ยมัชฌิมเลขคณิต
• หลักเบื ้องต้ น จานวนตัวอย่าง อย่างน้ อย 30 ตัวอย่างขึ ้นไป
• แบ่งกลุม่ เปรี ยบออกเป็ นสองกลุม่ เช่น กลุม่ ทดลอง กับกลุม่ เปรียบ
• กลุม่ เพศหญิง กับ กลุม่ เพศชาย
• กลุม่ เมือง กับ กลุม่ ชนบท
• กลุม่ เข้ าเรี ยน กับ กลุม่ ไม่เข้ าเรี ยน ฯลฯ
• ประเด็นที่จะวัด (พฤติกรรม ฤทธิ์ ส่วนสูง น ้าหนัก ค่าใช้ จ่าย ฯลฯ) ต้ องมี
ระดับการวัดเป็ นอัตราส่วน หรื อ เป็ นช่วง
ประเภทของ t-test
• One sample t-test ใช้ สาหรับทดสอบสมมุติฐานเมื่อเปรี ยบเทียบกับ
ค่ามาตรฐาน เช่น คะแนนภาษาอังกฤษ ของคนไทย เปรี ยเทียบกับ TOEFL
ทดสอบกับค่าต่างๆ ที่มาตรฐานทางสังคมศาสตร์ หรื อ วิทยาศาสตร์ ฯลฯ
• Independent-Samples t-test ใช้ สาหรับทดสอบความแตกต่าง
ของค่าเฉลี่ยมัชฌิมเลขคณิต ของสองกลุม่ เปรี ยบเทียบ เช่น ชาย หญิง เมือง
ชนบท ทดลอง ควบคุม ฯลฯ
• Paired-samples t-test ใช้ เปรี ยบสัมฤทธิ์ผลการทดลองที่เป็ น
กิจกรรมดาเนินงาน ก่อนและหลัง ที่ตดิ ตามคู่ นันๆ
้ ตลอด สามารถพิสจู น์วา่
กิจกรรมทดลองส่งผลตรงต่อการเปลี่ยนแปลง ตามที่ตงใว้
ั ้ ในสมมุตฐิ าน
F-test (One-Way Analysis of Variance)
• ใช้ ทดสอบความแตกต่างของค่าเฉลี่ยมัชฌิมเลขคณิต ตังแต่
้ 3 กลุม่ ขึ ้นไป
• เป็ นกลุม่ ทดลอง 3 treatment หรื อ ทดลอง 2 treatment กับ
กลุม่ ควบคุม 1 กลุม่ ก็ได้
• หรื อ ในทางสังคมศาสตร์ และทางวิทยาศาสตร์ จะใช้ เปรี ยบเทียบความ
แตกต่างของค่าเฉลี่ย ตังแต่
้ 3 กลุม่ ขึ ้นไปก็ได้
• ข้ อดีคือค้ นหาความแตกต่าง ในแต่ละกลุม่
• พฤติกรรมที่จะวัด ต้ องเป็ นคะแนน หรื อมีระดับการวัดแบบอัตรส่วน หรื อ
แบบช่วง ทังสายวิ
้
ทย์ และสายศิลป์
• ข้ อดี คือ Post-Hoc test ที่ใช้ ทดสอบความแตกต่างรายคูเ่ ปรี ยบเทียบ
ได้
Multivariate Analysis:
(1) ANCOVA
• หลัการเดียวกับ ANOVA แต่ใช้ Univariate เพราะใช้ ตวั แปรตาม
ตัวเดียว
• แต่เปิ ดโอกาสให้ มีการขจัดปั จจัยอื่นๆที่คาดว่ามีผลต่อพฤติกรรม หรื อ
ฤทธิ์ หรื อ การสิง่ ที่ศกึ ษานันๆ
้
• CO ย่อมาจาก Covariance
• ตัวแปรควบคุม Covariate Variable มักนิยมวัดด้ วยปั จจัยที่มี
ระดับการวัดแบบอัตราส่วน แบบช่วง หากเป็ นกลุม่ ต้ องจัดเป็ นตัวแปร
dummy variable (1,0 ตัวอย่างเช่น ในสายสังคมศาสตร์ เมือง
= 1 ชนบท = 0 เป็ นต้ น แต่สายวิทยาศาสตร์ จะนิยมใช้ อตั ราส่วน)
(2) MANOVA
• หลักการเดียวกันกับ ANOVA แต่ใช้ Multivariate
• เพราะมีตวั แปรตามได้ หลายตัว แต่ละตัวต้ องมีระดับการวัดแบบอัตราส่วน
หรื อ แบบช่วง เพราะต้ องการวัดความแตกต่างที่คา่ เฉลี่ยมัชฌิมเลขคณิต
• M ย่อมาจาก Multivariate ที่หมายถึงมีตวั แปรตามมากกว่า 1 ตัว
• หลักคิดคือ ในแต่ละกลุม่ เปรี ยบเทียบ สามารถเปรี ยบเทียบความแตกต่างใน
พฤติกรรม ฤทธิ์ ฯลฯ ได้ หลายตัวพร้ อมกัน เช่น ในสายบริ หารธุรกิจ มีการ
ขนส่ง 3 แบบ และผลที่ต้องการวัดคือ มีความแตกต่างทัง้ ยอดขาย ยอดสึก
หรอ เป็ นต้ น
(3) MANCOVA
• เหมือน MANOVA
• แต่เปิ ดโอกาสให้ มีการขจัดปั จจัยอื่นๆที่มีผลต่อพฤติกรรมที่ต้องการวัด
• ข้ อดีคือได้ ทราบผลการทดลองที่แน่ชดั หรื อวัดได้ แน่ชดั ว่า ไม่เพียงมีผล
ต่อเพียงหนึง่ พฤกรรม แต่ยงั วัดได้ จากพฤติกรรมอื่นๆ อีก (ฤทธิ์ อื่นๆอีก)
• มีการควบคุม ที่เป็ นการขจัดปั จจัยอื่นๆได้ ด้วย ระดับการวัดของปั จจัย
ควบคุม หรื อ ตัวขจัดออกเหมือน ANCOVA
Chi-squared Test
•
•
•
•
ทดสอบสมมุติฐานเมื่อเปรี ยบเทียบตัวแปรอิสระที่เป็ นกลุม่ กับตัวแปรตามที่เป็ นกลุม่
จุดอ่อนคือจานวนตัวอย่าง
จานวมกลุม่ ในตัวแปรตามและตัวแปรอิสระไม่ควรมากเกิน 5 กลุม่
ควรเป็ นกลุม่ ที่เกิดขึ ้นตามธรรมชาติ หรื อ ตามเกณฑ์ที่มีการกาหนดเป็ นมาตรใว้ และ
มีการอ้ างอิงใว้
• จานวน n ใน cell ควรมากว่า 5
• วัดความแตกต่างว่า ในตัวแปรอิสระที่มีระดับการวัดเป็ นกลุม่ ที่แตกต่างกัน จะมีความ
แตกต่างกันในตัวแปรตามที่เป็ นกลุม่ แตกต่างกัน
• หากจะทดสอบถึงความสัมพันธ์ (Association) ต้ องวัดที่คา่ Contingency
Coefficient: C)
Pearson Correlation
•
•
•
•
•
ใช้ ทดสอบสหสัมพันธ์ของตัวแปรสองตัว
มีระดับการวัดแบบอัตราส่วนและแบบช่วง
มีคา่ ระหว่าง -1 ถึง 1
จะวัดออกมาเป็ นร้ อยละก็ได้
มีการตรวจสอบด้ วยว่ามีสหสัมพันธ์กนั อย่างมีนยั สาคัญทางสถิติหรือไม่ โดยใช้ คา่ t
เป็ นตัวยืนยัน
• ใช้ ทดสอบเมื่อต้ องการขจัดปั จจัยอื่นๆออกไปด้ วยก็ได้ โดยใช้ Partial
correlation
• ประโยชน์ที่สาคัญคือใช้ ตรวจสอบ Collinearity และ Multicollinearity
ก่อนเข้ า Multiple Regression
• จุดตัด (Cut point 0.5 0.65 0.75)
สถิติสำหรับกำรพยำกรณ์
• สถิติสาหรับการจัดกลุม่
• Factors Analysis, Discriminant Analysis
•
•
•
•
Inferential Statistics
ใช้ สาหรับการพยากรณ์ การประมาณค่า
เน้ นการใช้ สมการถดถอยรูปแบบต่างๆ
การพิจารณาเส้ นทางความสัมพันธ์เพื่อเปรี ยบเทียบผลทางตรงกับผล
ทางอ้ อม ผ่านตัวแปรแทรกกลาง PATH ANALYSIS
• สมการโครงสร้ าง (SEM)
Simple Regression Analysis
• การทดถอยเชิงเดี่ยว
• ทดสอบ Causal Relationships ต้ องมีหลักการทางเชิงทฤษดีมา
ก่อน -Positivism
• Cause----- Consequence
• Cause--- Effect
• ต้ นเหตุ- ผลที่เกิดขึ ้น
• ความสัมพันธ์เชิงเหตุและผล ที่ทดสอบด้ วยสมการเศรษฐมิติ (Basic
Econometrics)
• ทดสอบอิทธิพล หนึง่ ตัวแปรอิสระ กับหนึง่ ตัวแปรตาม
• จานวน n ขันต
้ ่า คือ 30
• ไม่เน้ นการควบคุม หรื อ ขจัดอิทธิพลของปั จจัยอื่นๆ แต่ต้องการตรวจา
สอบ
• True Direct Real Effect
• ระดับการวัดของข้ อมูล อัตราส่วน ช่วง ทังตั
้ วแปรต้ นเหตุ และตัวแปร
ตาม แต่ ต้ นเหตุสามารถเป็ น dummy variable ได้
• ภาวะสมการสมรูป F, R-squared ยิ่งเข้ าใกล้ 1 ยิ่งดี
Multiple Regression Analysis: MRA
• ข้ อดีใช้ ในการค้ นหาปั จจัยตามกฏ Causal Relationships
• บนฐานคิดของสมการเศรษฐมิติ
• สามารถพิสจู น์และวิเคราะห์หลายตัวแปรอิสระได้ พร้ อมกัน บนฐานคิดที่วา่ when
everything being equals หรื อเมื่อทุกสิ่งทุกอย่างเท่าเทียมกัน
• ระดับการวัดของข้ อมูล ตัวแปรตามต้ องเป็ นอัตราส่วน ช่วง
• ตัวแปรอิสระ หรื อตัวต้ นเหตุ ควรเป็ นอัตราส่วน หรื อ ช่วง dummy variable ได้
• ต้ องปฏิบตั ิตาม Basic assumption อย่างเคร่งครัด (เรี ยนรู้ตอนใช้ ห้อง คอมพิวเตอร์ )
• PRF และ SRF
• จานวนตัวอย่างขั ้นต่า 1 ต่อ 30
• ภาวะสมการสมรูป
• Constrained Model และ Unconstrained Model (F-Ratio test)
• R-squared Change
MRA: Method
•
•
•
•
•
•
•
Enter
Forward
Backward
Remove
Stepwise
เพื่ออะไร เมื่อใดใช้ ?
การสร้ างตารางเพื่ออ่านและตีความหมายผลการวิเคราะห์ข้อมูล
Logistic Regression Analysis
• วิเคราะห์โอกาสความน่าจะเป็ นสูงสุด
• Causal Relationship
• ตัวแปรตามคือ การเกิดขึ ้น การทา การชื ้อ การระบาด การใช้ การ
ตัดสินใจ ฯลฯ ต้ องเป็ นตามกฏธรรมชาติ หรื อ ตามเกณฑ์
มาตรฐานสากล
• 1= เกิด 0= ไม่เกิด
• Binomial คือ Bi = สอง nominal คือ กลุม่
• Dichotomous outcome variable
•
•
•
•
•
•
•
•
ตัวแปรต้ นเหตุ ต้ องตามข้ อตกลงเบื ้องต้ น
Non-linear probability model
Linear probability model
Chi-squared test, Model Chi-squared
Restricted Model และ Unrestricted Model
Log likelihood Ratio test: LR test
Adjusted Proportional Probabilities
สอนในห้ อง computer การอ่านและการแปรผล การเขียนรายงาน