Thong ke kinh te 2

Download Report

Transcript Thong ke kinh te 2

CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
1
1. HỒI QUY ĐƠN BIẾN
Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi
suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp:
Xi
Yi
8.0 8.5 9.0 9.5 10.0 10.5 11.0 12.0 13.0 14.0
45.0 38.0 40.0 39.0 32.0 29.0 28.0 27.0 25.0 23.0
4/13/2015
1. HỒI QUY ĐƠN BIẾN
2
4/13/2015
1. HỒI QUY ĐƠN BIẾN
3
Phương trình: Yi = β1 + β2Xi + ui
Trong đó :
X, Y: Được gọi là biến. X được gọi là biến giải thích (độc
lập); Y: Biến được giải thích (phụ thuộc).
β1: Hệ số chặn, tham số chặn
β2: Hệ số góc, tham số biến
ui: Là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên
4/13/2015
2. MÔ HÌNH HỒI QUY TUYẾN TÍNH MẪU
4
Phương trình hồi quy mẫu:



Yi  1   2 X i
Yi =


nên ta có:

Y i + ei

2
e

(
Y

Y
)

(
Y




X
)
  i i  i 1 2 i  Min
2
i
2


1  Y   2 X

X iY i  n X Y

 2 
2
2
X

n
(
X
)

 i
4/13/2015
Hãy ước lượng phương trình hồi quy mẫu?
5
Xi
Yi
8
45
XY
360
X2
105,5
64
Ta có n =10, X  10  10,55 Y  326  32,6
10
 X Y  n X Y  3317 10  10,55 32,6  3,5220
 
 X  n( X ) 1147,75  10  (10,55)

8.5
38
323
72.25
9
40
360
81
9.5
39
370.5
90.25
10
32
320
10.5
29
304.5
11
28
308
12
27
324
144
13
25
325
169
14
23
322
196
i
2

2
i
i
2
2

1  Y   2 X = 32,6 + 3,5220 x 10,55 = 69,7571
100 Phương trình hồi quy mẫu:

110.25
Yi = 69,7571 – 3,5220Xi
121
Σ105.5 Σ326 Σ3317 Σ1147.75
4/13/2015
3. HỆ SỐ XÁC ĐỊNH VÀ HỆ SỐ TƯƠNG QUAN
6
 (Y
i

 Y )   (Yi  Y )   (Yi  Yi ) 2
TSS =
Xi

2
Yi
ESS
XY
2
+
RSS
(Yi  Y ) 2
X2

(Yi  Y ) 2
R2 
ESS 430,7457

 0,8712
TSS
494,4
8
45
360
64
153.76
80.6602
8.5
38
323
72.25
29.16
52.1298
Hệ số tương quan: r = ± R 2
9
40
360
81
54.76
29.8018
r   0,8712  0,9334
9.5
39
370.5
90.25
40.96
13.6759
10
32
320
100
0.36
3.7524
10.5
29
304.5
110.25
12.96
0.0310
11
28
308
121
21.16
2.5119
12
27
324
144
31.36
26.0804
13
25
325
169
57.76
74.4579
14
23
322
196
92.16
147.6444
Σ105.5
Σ326
Σ3317
Σ1147.75
Σ 494.4
Σ 430.7457
4/13/2015
4. PHƯƠNG SAI VÀ SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG

var(1 ) 

var( 2 ) 
X
2
i
n( X i2  n( X ) 2 )
7

2

se(1 )  var(1 )
2


se( 2 )  var( 2 )
2
2
X

n
(
X
)
 i

2

e


2
i
n2

RSS
n2
4/13/2015
5. KHOẢNG TIN CẬY CỦA β1, β2

8

Khoảng tin cậy của β1: 1 ± tα/2se( 1)


Khoảng tin cậy của β2:  2± tα/2se(  2)
Ví dụ: Tiếp tục ví dụ 1, Hãy xác định khoảng tin cậy của
β1, β2.
4/13/2015
6. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA HÀM HỒI QUY
9
Chúng ta kiểm định giả thuyết: H0: 2 = 0
R 2 (n  2) 0,8712(10  2)
F

 54,1118 F
2
1  0,8712
1 R
4/13/2015
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
10
Dự báo điểm: Cho X0, tìm thông qua phương trình hồi quy
Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu
tư là bao nhiêu?
4/13/2015
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
11
Dự báo giá trị trung bình:
2


(
X

X
)
1
2
0
var(Y0 )    

2
2
n

 X i  n( X ) 




se(Y0 )  var(Y0 )

Dự báo giá trị trung bình: Y0 ± t/2se( Y0)
Ví dụ: Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu
tư trung bình là khoảng bao nhiêu ?
4/13/2015
7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO
12


Dự báo giá trị riêng biệt: Y0± t/2se (Y0  Y 0 )
2




(
X

X
)
1
2
0
var(Y0  Y0 )   1  
 se(Y0  Y0 )  var(Y0  Y0 )
2
2
 n  X i  n( X ) 

Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% hãy dự báo giá
trị riêng biệt của tổng vốn đầu tư.
4/13/2015
CHƯƠNG 12. HỒI QUY ĐA BIẾN
13
1. TỔNG QUAN VỀ MÔ HÌNH HỒI QUY ĐA BIẾN
Mô hình: Yi = β1 + β2X1t + β3X2t +…+ βkXkt + ut
Trong đó :
Y là biến phụ thuộc
X là các biến độc lập
β1: Hệ số từ do
βj: Hệ số hồi quy riêng
4/13/2015
Các giả định (điều kiện) phân tích mô hình hồi quy đa biến
14
1. Tuyến tính các tham số hồi quy
2. Các giá trị mẫu của xtj được ước lượng đúng, không có sai số
3. Kỳ vọng hoặc trung bình số học của các sai số là bằng 0
4. Các sai số u độc lập với biến giải thích
5. Các sai số u có phương sai bằng nhau
6. Các sai số u từng cặp độc lập với nhau
7. Vector sai số u theo phân phối chuẩn nhiều chiều
8. Không có biến độc lập nào là hằng số, và không tồn tại các mối
liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập
4/13/2015
2. PHÂN TÍCH HỒI QUY ĐA BIẾN BẰNG
PHẦN MỀM SPSS
15
Để phân tích hồi quy ta cần một số bước như sau:
Bước 1: Xác định vấn đề cần nghiên cứu
Bước 2: Xác định được đâu là biến Y, đâu là các biến X.
Bước 3: Lập bảng câu hỏi hoặc phiếu khảo sát để thu thập
số liệu.
Bước 4: Xử lý số liệu và nhập liệu
Bước 5: Phân tích tương quan hồi quy.
Bước 6: Báo cáo kết quả
4/13/2015
Ví dụ
16
Yi = β1 + β2X1 + β3X2 + β4X3 + β5X4 + β6X5 + β7X6 + ei
Với:
Yi: Lợi nhuận bình quân (triệu đồng)
X1: Vốn kinh doanh hiện tại (triệu đồng)
X2: Tài sản cố định (triệu đồng)
X3: Tuổi chủ nhiêm HTX (tuổi)
X4: Chuyên môn của chủ nhiệm HTX
X5: Lương của chủ nhiệm HTX (triệu đồng)
X6: Quan tâm của chính quyền địa phương đối với hoạt
động của HTX
4/13/2015
Kết quả chạy phần mềm SPSS
17
Model Summaryb
Model
R
1
.898
R Square
a
Adjusted R
Std. Error of the
Square
Estimate
.807
.662
102.83959
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
ANOVAb
Model
1
Sum of Squares
Regression
Residual
Total
df
Mean Square
352891.599
6
58815.267
84607.847
8
10575.981
437499.446
14
F
5.561
Sig.
.015a
a. Predictors: (Constant), X6, X4, X5, X3, X2, X1
b. Dependent Variable: Y
4/13/2015
Kết quả chạy phần mềm SPSS
18
Coefficientsa
Standardized
Unstandardized Coefficients
Model
1
(Constant)
B
Std. Error
95% Confidence Interval for B
Coefficients
t
Beta
Sig.
Lower Bound
Upper Bound
172.028
262.471
.655
.531
-433.231
777.287
X1
-.224
.094
-.906 -2.389
.044
-.439
-.008
X2
.335
.113
1.120 2.956
.018
.074
.597
X3
-10.728
5.579
-.398 -1.923
.091
-23.594
2.138
X4
49.052
42.833
.290 1.145
.285
-49.721
147.824
X5
185.751
60.536
.615 3.068
.015
46.154
325.348
X6
25.364
27.582
.173
.385
-38.241
88.968
.920
a. Dependent Variable: Y
4/13/2015
Kết quả dự báo bằng phần mềm SPSS
19
4/13/2015
ĐA CỘNG TUYẾN
20
1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Đa cộng tuyến là sự tồn tại mối quan hệ tuyến tính “hoàn
hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải
thích trong một mô hình hồi quy.
4/13/2015
2. HẬU QUẢ CỦA ĐA CỘNG TUYẾN
21
Không xác định được hệ số quan hệ 
Độ lệch chuẩn của hệ số hồi quy ước lượng sẽ rất lớn.
Điều này có nghĩa là ước lượng của chúng ta kém chính
xác và khoảng tin cậy sẽ rộng hơn
Khi độ lệch chuẩn của hệ số hồi quy ước lượng lớn, giá trị
t-test thường nhỏ nhưng mô hình lại thường có R2 cao nên
ta dễ đưa ra các quyết định sai lầm về độ tốt của mô hình
hồi quy
Ước lượng hệ số hồi quy sẽ dễ bị thay đổi khi ta bỏ một
vài quan sát hay bỏ một biến độc lập được cho là không có
giá trị.
4/13/2015
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA
CỘNG TUYẾN
22
Cách 1: Một cách đơn giản để xác định đa cộng tuyến là ta
tính hệ số tương quan giữa các cặp biến độc lập. Nếu ta thấy
hệ số tương quan trên 0,8, ta có thể coi đó là quan hệ gần
như hoàn hảo. Nếu ta thấy hệ số tương quan trên 0,5, ta có
thể coi đó là quan hệ chặt chẽ
4/13/2015
3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
23
Cách 2: Sử dụng yếu tố phóng đại phương sai (VIF): Nếu
VIF > 10 thì xảy ra hiện tượng đa cộng tuyến.
Coefficients
a
Unstandardized Coefficients Standardized Coefficients
Model
1 (Constant)
I
W
B
Std. Error
Beta
Collinearity Statistics
t
Sig. Tolerance
VIF
3.348
.466
7.186 .000
-.073
.037
-.086
-1.989 .070
.252
3.962
.208
.008
1.071 24.796 .000
.252
3.962
a. Dependent Variable: C
4/13/2015
4. CÁCH KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
24
Thu thập thêm dữ liệu hoặc thu thập dữ liệu chính xác hơn
Tái cấu trúc mô hình bằng cách đưa thêm thông tin bổ trợ
vào
Xác định cặp biến độc lập nào có quan hệ gần hoàn hảo,
ta có thể bỏ bớt một biến độc lập. Tính R2 đối với các hàm
hồi quy: có mặt cả hai biến; không có mặt một trong hai
biến. Ta loại biến mà giá trị R2 tính được khi không có mặt
biến đó là lớn hơn
4/13/2015
PHƯƠNG SAI SAI SỐ THAY ĐỔI VÀ HẬU QUẢ
25
1. TỔNG QUAN VỀ PHƯƠNG SAI SAI SỐ THAY ĐỔI
4/13/2015
2. HẬU QUẢ CỦA PHƯƠNG SAI SAI SỐ THAY ĐỔI
26
Ước lượng OLS vẫn tuyến tính, chúng vẫn là ước lượng
không chệch. Tuy nhiên, chúng sẽ không còn có phương
sai nhỏ nhất nữa
Công thức thông thường để ước lượng phương sai của ước
lượng OLS, nhìn chung, sẽ chệch
Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông
thường dựa trên phân phối t và F sẽ không còn đáng tin
cậy nữa
4/13/2015
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC PHƯƠNG SAI
SAI SỐ THAY ĐỔI
27
1. CÁCH PHÁT HIỆN PHƯƠNG SAI SAI SỐ THAY ĐỔI
1.1. Xem xét đồ thị của phần sai số
4/13/2015
1.2. Kiểm định Park
28
Park cho rằng i2 là một hàm số nào đó của biến giải thích
X. Trong trường hợp mô hình hai biến, Park đã đưa ra dạng
hàm số giữa i2 và X như sau:
lni2 = 1 + 2lnXi + vi
(1)
Park đã đề nghị chúng ta có thể sử dụng ei thay cho i và
chạy mô hình hồi quy sau:
lnei2 = 1 + 2lnXi + vi
(2)
ei2 có thể được thu thập từ mô hình hồi quy gốc. Theo đó,
kiểm định Park được tiến hành theo các bước sau đây:
4/13/2015
1.2. Kiểm định Park
29
Bước 1: Chạy hàm hồi quy gốc bất chấp vấn đề phương sai của sai số thay đổi.
Bước 2: Từ hàm hồi quy này, tính phần dư e i, sau đó, bình phương và lấy log chúng:
lnei2.
Bước 3: Ước lượng hồi quy (2) sử dụng biến giải thích của hàm hồi quy ban đầu. Nếu có
nhiều biến giải thích, chúng ta sẽ chạy hồi quy cho từng biến giải thích đó. Hay cách

khác, chúng ta có thể chạy hồi quy mô hình với biến giải thích là Y , ước lượng của Y.
i
Bước 4: Kiểm định giả thuyết H0: 2 = 0, nghĩa là, không có phương sai của sai số thay
đổi. Nếu mối quan hệ giữa lne2 và lnX có ý nghĩa thống kê, giả thuyết H0 bị bác bỏ. Lúc
này, chúng ta có thể sử dụng các phương pháp khắc phục sẽ được trình bày trong phần
sau.
Bước 5: Nếu giả thuyết H0 được chấp nhận, 2 trong mô hình (2) có thể được xem là giá
trị chung của phương sai của sai số không đổi, σ2.
4/13/2015
1.3. Kiểm định Glejser
30
Glejser đề nghị chạy hồi quy giá trị tuyệt đối của ei, leil, theo biến X nào mà có quan
hệ chặt chẽ với . Ông ta đề xuất một số dạng hàm hồi quy sau:
ei  1   2 X i  vi
ei  1   2
ei  1   2
ei  1   2
X i  vi
1
 vi
Xi
(3)
(4)
(5)
1
 vi
Xi
(6)
ei  1   2 X i  vi
(7)
ei  1   2 X i2  vi
(8)
Giả thuyết H0 trong mỗi hàm số trên là phương sai của sai số không đổi, nghĩa là,
H0: 2 = 0.
4/13/2015
1.4. Kiểm định tương quan hạng của Spearman
31
Hệ số tương quan hạng của Spearman, r S, được xác định như sau:
  d i2 
rs  1  6 2

n
(
n

1
)


(9)
Trong đó di là hiệu của các hạng được gán cho 2 đặc trưng khác nhau của cùng
một phần tử thứ i và n là số các phần tử được xếp hạng.
Hệ số tương quan hạng có thể được dùng để phát hiện ra phương sai sai số thay
đổi. Xét mô hình hồi quy sau:
Yi = β1 + β2Xi + ui
(10)
Các bước thực hiện kiểm định tương quan hạng như sau:
4/13/2015
1.4. Kiểm định tương quan hạng của Spearman
32
Bước 1: Ước lượng mô hình hồi quy trên dựa trên bộ mẫu cho trước, thu thập
phần dư ei.
Bước 2: Xếp hạng leil và Xi theo thứ tự tăng dần hay giảm dần, tính d = hạng
leil - hạng Xi, sau đó tính hệ số tương quan hạng Spearman.
Bước 3: Giả sử hệ số tương quan hạng của tổng thể là ρ bằng 0 và n > 8 thì ý
nghĩa của hệ số tương quan hạng mẫu rS có thể được kiểm định bằng tiêu chuẩn
t sau:
t
rs n  2
1  rs2
(11)
4/13/2015
Kết quả phát hiện PSSSTĐ bằng SPSS
33
Correlations
Lai suat
Spearman's rho
Lai suat
Correlation Coefficient
Sig. (2-tailed)
N
ABSres
Correlation Coefficient
Sig. (2-tailed)
N
ABSres
1.000
-.248
.
.489
10
10
-.248
1.000
.489
.
10
10
H0: Hệ số tương quan hạng của tổng thể bằng 0
Nhìn vào giá trị sig. của kiểm định là 0,489 > mức ý nghĩa
 = 5%  Chấp nhận giả thuyết H0, tức là mô hình không
xảy ra hiện tượng phương sai sai số thay đổi.
4/13/2015
1.5. Kiểm định Goldfeld – Quandt
34
Xét mô hình hồi quy 2 biến: Yi = β1 + β2Xi + ui
Giả sử i2 có quan hệ dương với biến X theo cách sau: i2 = 2Xi2
(12)
Trong đó i2 là hằng số. Giả thuyết này có nghĩa là i2 tỷ lệ với bình phương của biến X.
Nếu giả thuyết (12) là thích hợp thì điều này có nghĩa là khi X tăng thì i2 cũng tăng. Các bước
thực hiện kiểm định Goldfeld - Quandt như sau:
Bước 1: Sắp xếp các quan sát theo thứ tự tăng dần về giá trị của biến X.
Bước 2: Bỏ qua quan sát ở giữa theo cách sau:
Đối với mô hình 2 biến:
c = 4 nếu cỡ mẫu khoảng n = 30;
c = 10 nếu cỡ mẫu khoảng n = 60.
nc
và chia số quan sát còn lại thành 2 nhóm, trong đó mỗi nhóm có 2 quan sát.
4/13/2015
1.5. Kiểm định Goldfeld – Quandt
35
Bước 3: Sử dụng phương pháp bình phương bé nhất để ước lượng tham số của các
nc
hàm hồi quy đối với 2 quan sát đầu và cuối; thu thập tổng bình phương của các
phần dư RSS1 và RSS2 tương ứng. Trong đó RSS1 đại diện cho RSS từ hồi quy ứng
với các giá trị của Xi nhỏ hơn và RSS2 ứng với các giá trị Xi lớn hơn. Bậc tự do
nc
n  c  2k
. Trong đó, k là các tham số được ước lượng
tương ứng là 2 - k hoặc
2
kể cả hệ số chặn.
4/13/2015
1.5. Kiểm định Goldfeld – Quandt
36
Bước 4: Tính tỷ số  
RSS2 / df
RSS1 / df
Nếu ui theo phân phối chuẩn và nếu giả định về phương sai có điều kiện không đổi
được thỏa mãn thì λ tuân theo phân phối F với bậc tự do ở tử số và mẫu số là
n  c  2k
.
2
Khi thực hành, nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa mong
muốn, thì chúng ta có thể bác bỏ giả thuyết H 0: phương sai có điều kiện không
đổi, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi.
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
2.1. Trường hợp đã biết i
37
2
Chúng ta hãy xem xét trường hợp mô hình hồi quy tổng thể 2 biến:
Yi = β1 + β2Xi + ui
(13)
Chúng ta giả sử rằng phương sai sai số i2 đã biết; nghĩa là
phương sai sai số của mỗi quan sát đã biết. Bây giờ, chúng ta xem xét “sự chuyển
đổi” của mô hình (13) như sau:
Yi
i

X
u
1
 2 i  i  (14)
i
i i
Đặt vi =
ui

i
Chúng ta có thể gọi vi là phần sai số “được chuyển đổi”. Chúng ta sẽ chứng minh
vi đồng đều. Chúng ta có:
vi2
=
ui2

2
i
 . Do đó:
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
38
2.2. Trường hợp chưa biết i2
Trường hợp 1: Phương sai sai số tỷ lệ với bình phương biến giải thích:
E(ui2) = 2 Xi2
Trong đó, hằng số i2 là nhân tố tỷ lệ.
Chia 2 vế mô hỉnh (13) cho Xi:
u
Yi 1
1

 2  i  1
 2 vi 
(15). Tương tự như trường hợp đã
Xi Xi
Xi
Xi
biết i2 trên, chúng ta có thể dễ dàng chứng minh phần dư v i này là đồng
đều và chúng ta có thể áp dụng phương pháp WLS để ước lượng
(15) như phần trước.
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
39
Trường hợp 2: Phương sai sai số tỷ lệ với biến giải thích: E(ui2) = 2 Xi.
Chia 2 vế mô hỉnh (13) cho X i :
Yi
Xi

1
Xi
 2 X i 
Trong đó vi =
ui
Xi
 1
1
Xi
 2 X i vi  (16)
ui
và có thể thấy ngay rằng E(vi2) = 2
Xi
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
40
Trường hợp 3: Phương sai của sai số tỷ lệ với bình phương của giá trị kỳ vọng
của Y. Điều này nghĩa là: E(u i2) = 2[E(Yi)]2 . Trong trường hợp này, chúng ta
thực hiện việc biến đổi như sau:
ui
Yi
1
2
1
1


X i 
 1
 2
X i vi  (17)
E (Yi ) E (Yi ) E (Yi )
E (Yi )
E (Yi )
E (Yi )
Trong đó vi =
ui
, var(vi) = 2
E (Yi )
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
41
Bước 1: Ước lượng mô hình hồi quy Yi = β1 + β2Xi + ui bằng phương pháp OLS


thông thường, từ đó ta thu được Yi . Sau đó, sử dụng Yi để biến đổi mô hình gốc
về dạng như sau:
Yi

Yi
 1
1

Yi
 2
Xi

vi  (18)
Trong đó, vi =
ui

Yi
Yi

Bước 2: Ước lượng hồi quy (18), dù Yi không chính xác là E(Yi), nhưng chúng là
ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Y i). Do
vậy, phép biến đổi (18) có thể dùng được khi cỡ mẫu tương đối lớn.
4/13/2015
2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ
THAY ĐỔI
42
Trường hợp 4: Phép biến đổi loga
Đôi khi thay vì dự đoán về i2, chúng ta có thể định lại dạng của mô hình để làm
giảm ảnh hưởng của phương sai sai số không đồng nhất. Chẳng hạn, thay vì ước
lượng mô hình hồi quy gốc (13), ta có thể ước lượng mô hình hồi quy:
lnYi = β1 + β2lnXi + ui (19)
4/13/2015
HIỆN TƯỢNG TỰ TƯƠNG QUAN
43
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
Thuật ngữ tự tương quan có thể được định nghĩa như là
“quan hệ tương quan giữa các thành viên của chuỗi của
các quan sát được sắp xếp theo thời gian [như trong dữ
liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu
chéo].”
4/13/2015
1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN
44
Hình 1: Các dạng phân phối của sai số ui hoặc (ei)
4/13/2015
*Nguyên nhân của sự tự tương quan
45
Tính ì
Hiện tượng mạng nhện
Các độ trễ
Xử lí số liệu
Một cách xử lý khác là phép nội suy và ngoại suy số liệu
Sai lệch do lập mô hình
4/13/2015
2. HẬU QUẢ CỦA TỰ TƯƠNG QUAN
46
Ước lượng hệ số hồi quy vẫn là ước lượng không thiên
lệch, nhưng không còn là ước lượng hiệu quả nhất
Công thức ta dùng để tính phương sai ở các chương trước
không thể áp dụng trong trừơng hợp này. Do đó, kiểm
định giả thuyết, tính khoảng tin cậy, khoảng dự báo sẽ sai.
4/13/2015
CÁCH PHÁT HIỆN VÀ KHẮC PHỤC TỰ TƯƠNG QUAN
47
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
Phương pháp kiểm định có ý nghĩa nhất để phát hiện ra tự tương quan là kiểm
định d Durbin – Watson.
Thống kê d. Durbin – Watson được định nghĩa như sau:
là tỷ số giữa tổng bình phương sai lệch của các phần dư kế tiếp nhau với RSS.
4/13/2015
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
48

Người ta đã chứng minh khi n đủ lớn thì: Giá trị d ≈ 2(1-  ) với
4/13/2015
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
49
4/13/2015
1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN
50
b
Model Summary
Model
1
R
R Square
a
.927
.859
Adjusted R
Std. Error of the
Square
Estimate
.855
11.17237
Durbin-Watson
.234
Tra bảng Durbin-Watson, ở mức ý nghĩa α = 5%, dL= 1,393 và dU = 1,514. Theo kết
quả chạy mô hình 0 < d = 0,234 < dL nên mô hình xảy ra hiện tượng tự tương quan
dương.
4/13/2015
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
51
2.1. Trường hợp đã biết cấu trúc của tự tương quan
Giả sử yếu tố nhiễu ui có tự tương quan bậc 1, nghĩa là:
ut = ρut-1 + et
(1)
Trong đó  < 1 và et thoả mãn các giả định của phương pháp OLS. Giả sử (1) là
đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tương
quan ρ đã biết. Để làm sáng tỏ vấn đề này, ta xét mô hình hai biến:
Yt = β1 + β2Xt + ut
(2)
Nếu (2) đúng với t thì cũng đúng với t – 1 nên: Yt-1 = β1 + β2Xt-1 + ut-1
Nhân 2 vế phương trình (3) cho ρ, ta được: ρYt-1 = ρβ1 + ρβ2Xt-1 + ρut-1
(3)
(4)
4/13/2015
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
52
Lấy phương trình (2) – (4), ta được:
Yt - ρYt-1 = β1(1- ρ) + β2(Xt - ρXt-1) + (ut - ρut-1). Đây là phương trình sai phân cấp
1 tổng quát.
Đặt Yt* = Yt - ρYt-1 , β1* = β1(1- ρ) , Xt* = Xt - ρXt-1, β2* = β2, et = ut - ρut-1
Ta có phương trình: Yt* = β1* + β2*Xt* + et
Vì et thoả mãn các giả thuyết của phương pháp bình phương nhỏ nhất thông
thường đối với các biến Y* và X*, và các ước lượng tìm được có tất cả các tính
chất tối ưu, nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Để tránh mất một quan sát, quan sát thứ nhất của X và Y có thể được biến đổi như
sau:
4/13/2015
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
53
2.2. Trường hợp chưa biết cấu trúc của tự tương quan
Trường hợp ước lượng ρ dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã biết công thức:


d ≈ 2(1 -  ) Hoặc  ≈ 1 -
d
2
Đối với các mẫu nhỏ có thể sử dụng thống kê d cải biên của Theil – Nagar. Theil
và Nagar đã đề xuất rằng trong các mẫu nhỏ:
trong đó n là tổng số các quan sát; d là Durbin – Watson d và k là số các hệ số
(bao gồm cả tung độ gốc) cần phải ước lượng.
4/13/2015
2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN
54
Phương pháp Durbin-Watson hai bước để ước lượng ρ
Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng quát dưới dạng
sau:
Yt = β1(1- ρ) + β2Xt - ρ β2Xt-1 + ρYt-1 + et
(5)
Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ:
Bước 1: Coi (5) như một mô hình hồi quy đa biến, hồi quy Y t theo Xt, Xt-1, Yt-1 và
giá trị ước lượng được của các hệ số hồi quy của Yt-1 là giá trị ước lượng của ρ. Mặc
dầu là ước lượng chệch nhưng ta có ước lượng vững của ρ.



Bước 2: Sau khi ước lượng được  , hãy đổi biến Yt = Yt -  Yt-1 , Xt = Xt -  Xt-1
*
*
Và ước lượng hồi quy Yt* = β1* + β2*Xt* + et bằng phương pháp bình phương nhỏ
nhất thông thường.
4/13/2015
BIẾN GIẢ VÀ CÁCH XÁC ĐỊNH MÔ HÌNH HỒI QUY
CÓ SỰ XUẤT HIỆN CỦA BIẾN GIẢ
55
1. TỔNG QUAN VỀ BIẾN GIẢ
Trong nhiều tình huống, cùng với các biến định lượng còn
có những biến định tính. Ví dụ khi nghiên cứu tiêu dùng
của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có
thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc
thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của
chính phủ là các biến không định lượng được.
4/13/2015
2. KỸ THUẬT BIẾN GIẢ
56
2.1. Hồi quy với biến giải thích là biến định tính
2.1.1. Biến định tính có hai phạm trù
VD: Thu nhập có phụ thuộc giới tính ?
Yi : thu nhập
1
Di = 
0
Mô hình :
Nếu quan sát là Nam
Nếu quan sát là Nữ
Yi =  1 + 2Di + ui
Thu nhập trung bình của nam
E(Y/Di = 1) = 1 + 2
Thu nhập trung bình của nữ E(Y/Di = 0) = 1
Nếu 2  0 thì thu nhập trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả.
4/13/2015
2. KỸ THUẬT BIẾN GIẢ
57
Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm.
STT
Lương
(Y: nghìn $)
Giới
D
1
22
Nam
1
2
19
Nữ
0
3
18
Nữ
0
4
21,7
Nam
1
5
18,5
Nữ
0
6
21
Nam
1
7
20,5
Nam
1
8
17
Nữ
0
9
17,5
Nữ
0
10
21,2
Nam
1
Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei
4/13/2015
Quy tắc đặt biến giả
58
Biến giả chỉ nhận giá trị 0 và 1
Cá thể nào cũng phải có giá trị
Biến giả chia tổng thể thành những thành phần riêng biệt
4/13/2015
2.1. Hồi quy với biến giải thích là biến định tính
59
1.1.2. Biến định tính có k phạm trù
Lúc đó dùng k-1 biến giả để thay thế cho chúng.
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Yi: Chi phí cho văn hoá phẩm.
D2i =
1: Trình độ tiểu học
0: Trình độ khác
D3i =
1: Trình độ trung học
0: Trình độ khác
D4i =
1: Trình độ đại học
0: Trình độ khác
Mô hình có dạng:
Yi = 1 + 2D2i + 3D3i + 4D4i + ui
4/13/2015
2.1. Hồi quy với biến giải thích là biến định tính
60
2.1.3. Mô hình có hai biến định tính
Ví dụ: Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, giữa nam và
nữ?
Nếu là nam
1
0
D2 = 
Nếu là nữ
1
0
D3 = 
Nếu làm việc ở thành thị
Nếu làm việc ở nông thôn
E(Y/D2i, D3i) = 1 +  2D2i + 3D3i + ui
Các chú ý:

Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n 1,
n2, . . . nk thì phải dùng k – 1 biến giả.

Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùng để so sánh với các
phạm trù khác.

Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.

Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như
thông lệ.
4/13/2015
2.1. Hồi quy với biến giải thích là biến định tính
61
2.1.4. Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng.
Để tính đến điều đó ta thêm vào mô hình biến tương tác.
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình 1:
Yi =  1 + 2D2i + 3D3i + 5Xi + ui
Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác.
Mô hình 2:
Yi =  1 + 2D2i + 3D3i + 4D2i*D3i + 5Xi + ui
Kiểm định
H0: 4 = 0 (không có tương tác)
H1: 4  0 (có tương tác)
Lúc đó mức độ tương tác bằng  4.
4/13/2015
2.2. Dùng biến giả để phân tích biến động mùa vụ
62
Xét mô hình: Yi =  1 + 2Xi + ui
Nếu có sự biến động mùa vụ, chẳng hạn theo quý thì dùng 3 biến giả để đặc
trưng cho chúng:
D2 =
1: Quý II
0: Quý khác
D3 =
1: Quý III
0: Quý khác
D4 =
1: Quý II
0: Quý khác
Ta có mô hình: Yi =  1 + 2D2i + 3D3i + 4D4i + 5Xi + ui
Như vậy phạm trù cơ sở là quý I, nếu có ảnh hưởng theo mùa của từng quý khác
nhau thì các hệ số 2, 3, 4 khác nhau có ý nghĩa thống kê.
4/13/2015