Transcript Regression

การวิเคราะห์ การถดถอยเชิงเส้ นอย่ างง่ าย
การวิเคราะห์การถดถอยเชิงเส้นตรงแบบง่ายเป็ น
การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระ
(Independent) หรื อตัวพยากรณ์ กับตัวแปรตาม
(Dependent) หรื อตัวถูกพยากรณ์
วัตถุประสงค์
1. เพื่อศึกษาความสัมพันธ์ของตัวแปร 2 ตัวว่ามี
ความสัมพันธ์กนั มากน้อยเพียงใด
2. ใช้ความสัมพันธ์ที่ได้จากการวิเคราะห์มา
ประมาณค่าหรื อพยากรณ์ค่าของตัวแปรตามหรื อตัว
ถูกพยากรณ์ (Y)ในอนาคต โดยตัวพยากรณ์ (X)
ข้อตกลงเบือ้ งต้นของการวิเคราะห์การถดถอย
1. ข้อมูลการกระจายแบบโค้งปกติ (Normal Curve)
2. ความแปรปรวนของตัวแปรตามในทุกค่าของตัว
แปรอิสระต้องเท่ากัน
3. ตัวแปรตามเป็ นอิสระจากกัน
4. ค่าเฉลี่ยของความคลาดเคลื่อนเท่ากับ 0
สมการถดถอย
Y
= a+bX
เมื่อ
a คือ ค่าคงที่ซ่ ึ งเป็ นจุดตัดของเส้นสมการ
b คือ ความลาดชัน (Slope)
การหาจุดตัด (a) และ ความชัน (b)
การหาความชัน (b)
สูตร
n XY   X  Y
b
2
2
n X (  X )
การหาจุดตัด (a)
สูตร
a  Y  bX
การแปรความหมายของค่า a
1) ค่ า a เป็ นบวก
2) ค่ า a เป็ นลบ
y
y
x
x
3) ค่ า a เป็ น 0
y
x
ขัน้ ตอนการวิเคราะห์
1. หาความสัมพันธ์ของตัวแปรพยากรณ์ (ตัวแปรต้น)และ
ตัวแปรถูกพยากรณ์(ตัวแปรตาม)
2. การตรวจสอบเงื่อนไขการวิเคราะห์การถดถอยเชิงเส้น
2.1 การตรวจสอบค่าเฉลี่ยของความคลาดเคลื่อน
2.2 การตรวจสอบค่าความแปรปรวนของความ
คลาดเคลื่อน
ขัน้ ตอนการวิเคราะห์(ต่อ)
2.3 การตรวจสอบความเป็ นอิสระกันของความ
คลาดเคลื่อน เช่น การเขียนกราฟ สถิติทดสอบ Durbin-watson
2.4 การตรวจสอบว่าความคลาดเคลื่อนมีการแจกแจง
แบบโค้งปกติ มีหลายวิธีคือ ใช้ Histogram Box plot เป็ นต้น
3. การวิเคราะห์การถดถอยเชิงเส้น
ตัวอย่ าง
การพยากรณ์คะแนนการสอบเข้าเรี ยนต่อระดับมัธยม
ปลายของนักเรี ยนชั้นมัธยมศึกษาปี ที่ 3 ด้วยเกรดเฉลี่ย
ไฟล์ขอ้ มูล
D:\สัมมนา SPSS\Regressions.sav
การวิเคราะห์ข้อมูลด้วยโปรแกรม SPSS
1. การหาความสัมพันธ์ของข้อมูล
Analysis
Scatter
ผลการวิเคราะห์ ข้อมูล
1. การหาความสัมพันธ์ (Correlation)
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: SC O RE
1.00
.75
Expected Cum Prob
.50
.25
0.00
0.00
.25
.50
Obser ved Cum Pr ob
.75
1.00
การวิเคราะห์ข้อมูลด้วยโปรแกรม SPSS
2. การทดสอบการแจกแจงของข้อมูล
Analysis
Descriptive..
เลือก Chart
Frequency
2. ทดสอบการแจกแจงของข้อมูล
GPA
SC O RE
12
16
14
10
12
8
10
6
8
6
4
2
Std. Dev = .61
Mean = 2.83
N = 50.00
0
1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00
GPA
Frequency
Frequency
4
Std. Dev = 4.90
2
Mean = 22.6
N = 50.00
0
12.5
SCORE
15.0
17.5
20.0
22.5
25.0
27.5
30.0
32.5
การวิเคราะห์ข้อมูลด้วยโปรแกรม SPSS
3. วิเคราะห์การถดถอย
Analysis
Regression
Linear
3. ผลการวิเคราะห์สถิติสรุปของสมการถดถอย
Variables Entered/Removedb
Model
1
Variables
Entered
GPA a
Variables
Removed
.
Method
Enter
a. All requested variables entered.
b. Dependent Variable: SCORE
Model Summary b
Model
1
R
.998a
R Square
.997
a. Predictors: (Constant), GPA
b. Dependent Variable: SCORE
Adjusted
R Square
.996
Std. Error of
the Estimate
.291
Durbin-W
atson
2.204
4. ผลการวิเคราะห์ความแปรปรวนของสมการ
H 0 : β  0 หรื อ H 0 : เกรดเฉลี่ ยไม่มีความสััมพันธ์กคะแนนสอบ
บั
H1 : β  0 หรื อ H1 : เกรดเฉลี่ ยมีความสั มพัั นธ์กคะแนนสอบ
บั
ANOVAb
Model
1
Regression
Residual
Total
Sum of
Squares
1170.126
4.054
1174.180
df
1
48
49
Mean Square
1170.126
.084
F
13854.74
Sig.
.000a
a. Predictors: (Constant), GPA
b. Dependent Variable: SCORE
ผลจากทดสอบ พบว่า ค่า Sig น้อยกว่านัยสาคัญที่กาหนดจึง
ปฏิเสธ H0 หรื อสรุ ปได้วา่ เกรดเฉลี่ยมีความสัมพันธ์กบั คะแนนสอบ
5. ผลการวิเคราะห์ Coefficients
H 0 : β  0 หรื อ H 0 : เกรดเฉลี่ ยกับคะแนนสอ บไม่สมั พันธ์กนั ในรู ป เชิ งเส้น
H1 : β  0 หรื อ H1 : เกรดเฉลี่ ยกับคะแนนสอบมีความสั มพันธ์ใ นรู ปเชิงเส้ น
Coefficientsa
Model
1
(Constant)
GPA
Unstandardized
Coefficients
B
Std. Error
-.174
.198
8.041
.068
a. Dependent Variable: SCORE
Standardized
Coefficients
Beta
.998
t
-.878
117.706
Sig.
.384
.000
95% Confidence Interval for
B
Lower Bound
Upper Bound
-.571
.224
7.903
8.178
ผลจากทดสอบ พบว่า ค่า sig = .000 จึงปฏิเสธ H0 นัน่ คือ เกรด
เฉลี่ยและคะแนนสอบมีความสัมพันธ์กนั ในรู ปเชิงเส้น หรื อเกรดเฉลี่ย
สามารถพยากรณ์คะแนนสอบได้
6. ผลการวิเคราะห์ Residual Statistic
Residuals Statistics a
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum
13.33
-.45
-1.892
-1.553
a. Dependent Variable: SCORE
Maximum
31.99
.53
1.925
1.837
Mean
22.58
.00
.000
.000
Std. Deviation
4.887
.288
1.000
.990
N
50
50
50
50
5. สมการถดถอย
ดังนั้น จากผลการทดสอบสมการถดถอยซึ่งแสดง
ความสัมพันธ์ระหว่างเกรดเฉลี่ยและคะแนนสอบ คือ
Y  .174  8.041X