พหุคูณPPTกลุ่ม1

Download Report

Transcript พหุคูณPPTกลุ่ม1

การวิเคราะห์ การถดถอยพหุคูณ
Multiple regression Analysis
ความหมาย สหสัมพันธ์พหุคณ
ู (Multiple
Correlation) เป็ นการหาความสัมพันธ์ระหว่าง
ตัวแปรตามและตัวแปรอิสระมากกว่าหนึง่ ตัว
• และความสัมพันธ์ นี ้จะบอกให้ ทราบว่าตัวแปรตามและตัว
แปรอิสระมีความสัมพันธ์กนั ในระดับใด
• สหสัมพันธ์ พหุคณ
ู (multiple correlation)
เขียนแทนด้ วยตัวย่อ R หรื อย่อชนิดเต็มรูปเป็ น RY,
12…k (เมื่อ k แทนจานวนตัวพยากรณ์หรื อตัวแปร
อิสระ)
•
•
•
•
•
•
•
มีหลายแบบขึ ้นอยูก่ บั ประเภทของข้ อมูลของตัวแปรว่าจัดอยู่ในสเกลใด
ในที่นี ้จะใช้ สตู รพื ้นฐานในการคานวณ (บุญชม ศรี สะอาด. 2541:
156)
R
2
= 
1
ry1 + 
2
r
y2
+ … + k r
yk
เมื่อ R 2 แทน
กาลังสองของสัมประสิทธิ์สหสัมพันธ์พหุคณ
ู
 1 แทน ค่าน ้าหนักเบต้ าหรื อสัมประสิทธิ์การถดถอยในรูปของคะแนน
มาตรฐานของตัวแปรอิสระ (ตัวพยากรณ์) ตัวที่ 1 ถึงตัวที่ k ตามลาดับ
r y 1 , r y 2 , r y k แทน สัมประสิทธิ์สหสัมพันธ์
ระหว่างตัวแปรตาม (ตัวเกณฑ์) กับตัวแปรอิสระ (ตัวพยากรณ์) ตัวที่ 1 ถึง
ตัวที่ k
k แทนจานวนตัวแปรอิสระ (ตัวพยากรณ์)
• การวิเคราะห์การหาความสัมพันธ์ แบบเพียร์ สน
ั (the
Pearson Product-Modment Correlation Coefficient)
จะเกิดปั ญหาเพราะสหสัมพันธ์นี ้เป็ นการหา
ความสัมพันธ์ระหว่างตัวแปรได้ ครัง้ ละ 2 ตัวแปร
เท่านัน้ อย่างไรก็ตามตัวแปรที่เพิ่มเข้ ามาในการหา
ความสัมพันธ์จะทาอย่างไร คาตอบนี ้ต้ องหาโดยใช้
สหสัมพันธ์แยกส่วน สหสัมพันธ์ครึ่งส่วน และ
สหสัมพันธ์พหุคณ
ู
 สหสั มพันธ์ แยกส่ วน (Partial Correlation)
ความสัมพันธ์ระหว่าง 3 ตัวแปร ซึง่ ให้ ชื่อว่า X , X และ X การ
วิเคราะห์สหสัมพันธ์แยกส่วนระหว่าง X และ X เมื่อ X ถูก
ควบคุมเอาไว้ หรื อถูกขจัดออก นัน่ คือ อิทธิพลของ X
ถูกขจัดออกจากทัง้ X และ X (ตัวแปรทังสองถู
้
กปรับแก้ ด้วย X )
ดังนันสหสั
้
มพันธ์แยกส่วนจะแสดงความสัมพันธ์เชิงเส้ นตรง
ระหว่าง X และ X ที่เป็ นอิสระจากอิทธิพลของ X สหสัมพันธ์
แยกส่วนนี ้ใช้ สญ
ั ลักษณ์วา่ r สังเกตว่า ในสัญลักษณ์ไม่แสดง X
และมี . เป็ นตัวแบ่งระหว่างตัวแปรที่สมั พันธ์กบั ตัวแปรที่ถกู ควบคุม
1
1
2
3
2
3
3
1
1
2
2
3
3
12.3
 สหสัมพันธ์ครึ่ งส่ วน (Semipartial or Part Correlation) กรณี ที่ง่าย
คือกรณี ที่มีตวั แปรเพียง 3 ตัว ซึ่ งให้ชื่อว่า X1, X2 และ X3 การ
วิเคราะห์สหสัมพันธ์ครึ่ งส่ วนจะเป็ นการหาสหสัมพันธ์ระหว่าง X
และ X2 เมื่อ X3 ถูกขจัดออกจาก X2 เท่านั้น นัน่ คือ อิทธิ พลของ
X3 จะถูกขจัดออกจาก X2 เท่านั้น ดังนั้น สหสัมพันธ์ครึ่ งส่ วนจึง
เป็ นการแสดงถึงความสัมพันธ์เชิงเส้นระหว่าง X1 และ X2 หลังจา
สัดส่ วนความแปรปรวนของ X2 ที่สามารถทานายได้จาก X3 ถูก
r
ขจัดออกจาก X2 สหสัมพันธ์ครึ่ งส่ วนจะใช้สญ
ั ลักษณ์วา่ 1(2.3)
เมื่อ X จะไม่แสดงในสัญลักษณ์และจุดที่คนั่ หมายถึงการขจัด
 ตัวอย่ างกรณีที่ผ้ บ
ู ริ หารสถานศึกษาต้ องการใช้ คะแนนสอบเข้ า
ศึกษาต่อในระดับบัณฑิตศึกษา (Graduate Record
Exam : GRE) ในการทานายเกรดเฉลี่ยระดับบัณฑิตศึกษา
(GPA) ที่จะช่วยผู้บริ หารในการตัดสินใจทางการบริ หาร แต่เนื่อง
ด้ วยมีตวั แปรทานายอื่น ๆ ที่มี ศักยภาพในการทานายซึง่ อาจจะเป็ น
เกรดเฉลี่ยในระดับปริ ญญาตรี ผลการประเมินจากอาจารย์ หรื อผลการ
สอบสัมภาษณ์ คาถามการวิจยั เพื่อที่จะพิจารณาว่า GRE, GPA
ระดับปริ ญญาตรี , ผลการประเมินจากอาจารย์ และคะแนนสอบ
สัมภาษณ์ (ตัวแปรอิสระหรื อตัวแปรทานาย) สามารถทานายเกรด
เฉลี่ยระดับบัณฑิตศึกษาได้ หรือไม่ (ตัวแปรตามหรื อตัวแปรเกณฑ์)
6
• สัมประสิทธิ์สหสัมพันธ์ พหุคณ
ู
• สมการพยากรณ์ในรู ปคะแนนดิบ หรื อใน
รูปคะแนนมาตรฐาน หรื อทังคู
้ ่
• และความคลาดเคลื่อนมาตรฐานในการ
พยากรณ์
 ตัวแปรเกณฑ์ และตัวแปรพยากรณ์ อยูใ่ นมาตรา
อันตรภาคชัน้ (Interval Scale) หรื อ
มาตราวัดอัตราส่วน (Ratio Scale)
 ในกรณีที่ตวั แปรพยากรณ์ไม่เป็ นไปตามมาตรวัด
ข้ างต้ น ให้ แปลงข้ อมูลเป็ นตัวแปรหุ่น (Dummy
variable) ก่อนที่จะทาการวิเคราะห์ข้อมูล
•
•
•
1. Normality ประชากรมีการแจกแจงแบบปกติ
(Normality) ตรวจสอบได้ โดยการดูกราฟ หรื อวิธีการทาง
สถิติ เช่น
เช่นใช้ Kolmogorov-Smirnov Test ในกรณีที่ไม่
ทราบค่าเฉลี่ยและความแปรปรวนของประชากร จะใช้ คา่ เฉลี่ยและ
ความแปรปรวนของกลุม่ ตัวอย่างแทน
หรื อใช้ Shapiro-Wilk Test ในกรณีที่ทราบหรื อไม่ทราบ
ค่าเฉลี่ยและความแปรปรวนของประชากรก็ได้ แต่กลุม่ ตัวอย่างต้ องมี
ขนาดไม่เกิน 50 (กัลยา วานิชย์บญ
ั ชา. 2546: 220)
 หรื อ Lilliefors
Test ซึง่ เป็ นวิธีการที่
ปรับปรุงมาจากวิธีของ KolmogorovSmirnov แต่จะให้ คา่ ความน่าจะเป็ นในการ
ทดสอบน้ อยกว่าวิธีของ KolmogorovSmirnov (ศิริชยั พงษ์ วิชยั . 2551: 170)
2.
Linearlity ตัวแปรพยากรณ์กบั
ตัวแปรเกณฑ์มีความสัมพันธ์กนั เชิง
เส้ นตรง (Linearity)
ตรวจสอบได้ โดยใช้ วิธีการทางสถิติ เช่น ดู
จากค่าสัมประสิทธิ์สหสัมพันธ์ rxy
 3.
Homoscedasticity หมายถึง
ความแปรปรวนของความคลาดเคลื่อนมีความคงที่
ทุกค่าการสังเกต (ทรงศักดิ์ ภูสีออ่ น. 2551: 281)
 ตรวจสอบได้ โดยการดูจากกราฟ หรื อใช้ วิธีการทาง
สถิติ เช่น Non-constant Variance
Score Test หรื อ The Spearman
rank-correlation test หรื อ The
Goldfeld and Quadrant test
หรื อ White’s test
 4. ตัวแปรที่นามาใช้ พยากรณ์ต้องไม่มีปัญหาเรื่ อง
Multicollinearity หมายถึง ตัวแปรที่
นามาใช้ พยากรณ์ไม่ควรมีความสัมพันธ์กนั สูงเกินไป
(ทรงศักดิ์ ภูสอี อ่ น. 2551: 280)
 ตรวจสอบได้ ด้วยการดูกราฟ หรื อด้ วยวิธีการทางสถิติ
เช่น ดูจากค่าสัมประสิทธิ์สหสัมพันธ์ rxy หรื อดูจาก
ค่า variance inflation factors
(VIF)
: ตัวแปรอิ สระจะต้องไม่มีความสัมพันธ์
กันเอง (ไม่เกิ ด Multicollinearity)
 การตรวจสอบ

การตรวจสอบ Multicollinearity จะใช้ ค่า Variance
inflation factor (VIF) หรื อค่ า Tolerance หรือค่ า Eigen
Value ตัวใด ตัวหนึ่งก็ได้ โดยมีเกณฑ์ การตรวจสอบดังนี ้
 Variance
 ค่า VIF
inflation factor (VIF)
ที่เหมาะสมไม่ควรเกิน 4 หรื อ 5 หากเกินกว่านี ้
แสดงว่าตัวแปรอิสระมีความสัมพันธ์กนั เอง (ตาราบาง
แนะนาว่า หาก VIF > 10 แสดงว่าเกิด
Multicollinearity)
 Tolerance

หากค่า Tolerance < 0.2 แสดงว่าเกิด
Multicollinearity
 Eigen

Value
หากค่า Eigen Value ตัวที่มากที่สดุ มีคา่ 
10 แสดงว่าเกิด Multicollinearity
 1. สัมประสิทธิ์สหสัมพันธ์
คานวณด้ วยสูตรของเพียร์
สัน (rxy) (สมบัติ ทายเรื อคา. 2551: 145)
 สมการพยากรณ์ ในรู ปคะแนนดิบ

สมการณ์เชิงเส้ นตรงในรูปคะแนนดิบ (บุญชม ศรี สะอาด. 2547: 143)
สมการณ์ พยากรณ์ ในรู ปคะแนน
มาตรฐาน

ถ้ าต้ องการพยากรณ์เกณฑ์ในรูปของคะแนนมาตรฐาน เขียนสมการพยากรณ์ได้ ดงั นี ้
(บุญชม ศรี สะอาด. 2547: 144) 2-6

วิธีคดั เลือกตัวแปรพยากรณ์เข้ าสูส่ มการถดถอยมีอยูห่ ลายวิธีด้วยกัน เช่น
1. การวิเคราะห์ถดถอยพหุคณ
ู แบบปกติ (Enter Regression)
 2. การวิเคราะห์ถดถอยพหุคณ
ู แบบคัดเลือกออก (Remove
Regression)
 3. การวิเคราะห์ถดถอยพหุคณ
ู แบบเดินหน้ า (Forward
Regression)
 4. การวิเคราะห์ถดถอยพหุคณ
ู แบบถอยหลัง (Backward
Regression)
 5. การวิเคราะห์ถดถอยพหุคณ
ู แบบขันบั
้ นได (Stepwise
Regression)

 ใช้ ชด
ุ ย่อยของตัวแปรที่เป็ นไปได้

All possible subsets regression 26
 1. ตรวจสอบข้ อตกลงเบื ้องต้ น
 2. คานวณค่า rxy
ของตัวแปรพยากรณ์กบั ตัวแปร
เกณฑ์
 3. คัดเลือกตัวแปรพยากรณ์ที่มีความสัมพันธ์ สงู สุด
กับตัวแปรเกณฑ์เข้ าสมการ และคานวณค่า
สัมประสิทธิ์สหสัมพันธ์พหุคณ
ู (R)
 4. ทดสอบนัยสาคัญของสัมประสิทธิ์สหสัมพันธ์พหุคณ
ู
(R) ทดสอบว่าตัวแปรพยากรณ์ที่เข้ าในสมการยังคงอยู่
ในสมการต่อไปได้ หรื อไม่ด้วยสถิติ F
 5. หาค่าน ้าหนักความสาคัญของตัวแปรพยากรณ์ (b)
หรื อ เบต้ า หรื อทังสองอย่
้
าง เพื่อนามาใช้ ในการเขียน
สมการพยากรณ์ และเปรี ยบเทียบว่าตัวแปรพยากรณ์ตวั
ใดพยากรณ์ตวั แปรเกณฑ์ได้ ดีกว่า
 6. ทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย เพื่อ
ตรวจสอบว่าตัวแปรพยากรณ์สามารถพยากรณ์ตวั
แปรเกณฑ์ได้ หรื อไม่ ด้ วยสถิติ t
 7. คานวณค่าความคลาดเคลื่อนมาตรฐานของตัว
แปรพยากรณ์ที่เข้ าสมการ (SEb) และคานวณค่า
ความคลาดเคลื่อนมาตรฐานของการพยากรณ์
(SE )
est
 8. คัดเลือกตัวแปรพยากรณ์ที่มีความสัมพันธ์ สงู กับตัวแปร
เกณฑ์รองลงมาเข้ าสมการและทาการทดสอบค่า
สัมประสิทธิ์สหสัมพันธ์ที่เปลี่ยนแปลง (R2
change) ด้ วยสถิติ F ถ้ า R2 change ไม่มี
นัยสาคัญก็แสดงว่าตัวแปรพยากรณ์ไม่สามารถอยู่ใน
สมการพยากรณ์ได้ แต่ถ้ามีนยั สาคัญก็ดาเนินการตามข้ อ
4, 5, 6 และ 7 และดาเนินการต่อไปจนกว่าจะไม่มีตวั แปร
พยากรณ์ใดเข้ าในสมการ (การดาเนินการตามข้ อ 8 เป็ น
วิธีการวิเคราะห์ถดถอยพหุคณ
ู แบบขันบั
้ นได)
โปรแกรม

ขอบคุณที่ทนฟั ง
R
SPSS