Transcript File

TẠI SAO PHẢI NGHIÊN
CỨU MÔ HÌNH HỒI
QUY ĐA BIẾN?
HỒI QUY ĐA BIẾN
(Multiple Regression)
Yi  1  2 X 2i  3 X 3i  ..... k X ki   i
Các giả thiết:
i. Các đặc trưng của mô hình được biểu diễn bởi
phương trình (7.1)
ii.
Các biến X không ngẫu nhiên, không có quan hệ tuyến
tính giữa 2 hay nhiều biến độc lập.
iii.a. Số hạng sai số có kỳ vọng bằng không và phương sai
không đổi với tất cả các quan sát.
iii.b. Các sai số tương ứng với các quan sát khác nhau là
độc lập.
iii.c. Biến sai số có phân phối chuẩn.
MÔ HÌNH HỒI QUY BA BIẾN
Yi  0  1 X1i  2 X 2i   i
Ước lượng các tham số hồi quy:
Ước lượng các tham số hồi quy:
X 2    X 2i / N 
X 3    X 3i / N 
ˆ2

x y  x    x y  x


 x  x    x x 
2i
2
3i
i
2
2i
3i
2
3i
i
2
2 i 3i
x
2 i 3i

Ước lượng các tham số hồi quy:
ˆ
3

x y  x    x y  x x 


 x  x   x x 
3i
2
2i
i
2
2i
2i
2
3i
i
2 i 3i
2
2 i 3i
ˆ1  Y  ˆ2 X 2  ˆ3 X 3
Ví dụ:
Y: Bushels per acre of corn;
X1: Fertilizer;
X2: Insecticides
ˆ
Yi  31,98 0,65X1 1,11X 2
KIỂM ĐỊNH F, R2
VÀ R2 HIỆU CHỈNH

 Y  Y 

 Yi  Yˆi
TSS
=
ESS
2
i
Hệ số xác định:

ˆ
Y
 i Y

2

+

2

 Yˆi  Y

2
RSS
2
ˆ
i
RSS
R 

 1
2
2
TSS  Yi  Y 
 Yi  Y 
2
Hệ số xác định đo lường tỷ lệ biến động của Y
được “giải thích” bởi hàm hồi qui bội.
Hệ số hiệu chỉnh:
Var (ˆ )
R  1
Var (Yˆ )
2
Các phương sai mẫu của ε và y được tính:
Var (ˆ)  s
2
ˆ


2
i
N k
s
N k
R  1
Var(Yˆ ) N  1
2
2


Y

Y

Var (Yˆ ) 
2
i
N 1

R  1 1 R
2
2
 N  1
N k
Mối quan hệ giữa hệ số xác định và hệ số điều chỉnh:
i. Nếu k =1, thì
R2
ii. Nếu k >1, thì
R2
iii. R 2 có thể âm.
= R
2
>= R
2
Yˆi  31,98 0,65X1 1,11X 2
KIỂM ĐỊNH TỪNG PHẦN
Kiểm định hệ số
ˆ2  0
2
2
ˆ
ˆ


x
2  2  2  i

3
t2 

S ˆ2 
2
2
2
S ˆ 
N  k  x2  x3  ( x2 x3 )
2
Kiểm định hệ số
ˆ3  0
2
ˆ    2  ˆi2
x2

3
3
t3 

S ˆ3 
2
2
2
S ˆ 
N  k  x2  x3  ( x2 x3 )
3
Ước lượng khoảng tin cậy
ˆ2  t / 2,df S ˆ
ˆ3  t / 2,df S ˆ
2
3
Kiểm định toàn phần
Fk 1, N k
( ˆ2  yi x2i  ˆ3  yi x3i ) / 2
RSS / 2


2
( ˆi ) /( N  3)
ESS /( N  3)
Mối quan hệ giữa hệ số xác định và F:
R
N k


2
1 R
k 1
2
Fk 1, N k
Giải thích phương trình HQ
Yˆ  31,98  0,65X1 1,11X 2
R  0,991(99,1%)
2
F  413,17
Khi thêm biến mới vào mô hình
Fq , N k
( ESSR  ESSUR ) / q

ESSUR /( N  k )
q: Số biến độc lập mới được đưa thêm vào mô hình
k: Số các thông số trong mô hình mới
Restricted (R): Mô hình gốc, Unrestricted (UR): Mô hình mở
rộng
Nếu 2 mô hình có cùng biến phụ thuộc có thể sử dụng
công thức:
Fq, N  k
(R  R ) / q

2
(1  RUR ) / N  k
2
UR
2
R
Lưu ý:
1. Khi đưa thêm 01 biến mới vào thì
dùng kiểm định t cho thông số của
biến mới.
2. Khi thêm một nhóm biến mới vào
thì ta dùng kiểm định F cho tất cả
các tham số của biến thêm vào.
HÀM SẢN XUẤT
COBB DOUGLAS
2
3  i
Yi  1 X 2i X 3i e
Y: Sản lượng
X2: nhập lượng về lao động
X3: nhập lượng về vốn
εi: số hạng ngẫu nhiên
e: cơ số logarit tự nhiên
Đặc tính của hàm
Cobb Douglas
β2 là độ co dãn (riêng phần) của sản
lượng so với nhập lượng lao động,
giữ cho nhập lượng vốn không đổi.
β 3 là độ co dãn (riêng phần) của sản
lượng so với nhập lượng vốn, giữ cho
nhập lượng lao động không đổi.
Tổng của β2 và β3 cho ta thông tin về
sinh lợi theo quy mô
 Β2 + β3=1 thì không có sinh lợi cố định
theo quy mô, có nghĩa là tăng gấp hai lần
nhập lượng sẽ làm tăng sản lượng lên
gấp hai lần, tăng nhập lượng lên 3 lần sẽ
tăng sản lượng lên 3 lần...
 β2 + β3 < 1 thì sinh lợi giảm dần theo quy
mô
 β2 + β3 > 1 thì sinh lợi tăng dần theo quy
mô
Ví dụ:
Tổng sản lượng thực (triệu
đôla mới của ĐL), ngày lao
động (triệu ngày) và nhập
lượng vốn (Triệu đôla mới ĐL)
trong khu vực nông nghiệp
của Đài Loan, 1958-1972
Năm
Y
X2
X3
1958
16,607.70
275.50
17,803.70
1959
17,511.30
274.40
18,096.80
1960
20,171.20
269.70
19,271.80
1961
20,932.90
267.00
19,167.30
1962
20,406.00
267.80
19,647.60
1963
20,831.60
275.00
20,803.50
1964
24,806.30
283.00
22,076.60
1965
26,465.50
300.70
23,445.20
1966
27,403.00
304.50
24,939.00
1967
28,628.70
303.70
26,713.70
1968
29,904.50
304.70
29,957.80
1969
27,508.20
298.60
31,585.90
1970
29,035.50
295.50
33,474.50
1971
29,281.50
299.00
34,821.80
1972
31,535.80
288.10
41,794.30
KẾT QUẢ XỬ LÝ TRÊN EXCEL
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.94442475
R Square
0.891938109
Adjusted R Square
0.873927794
Standard Error
0.073823215
Observations
15
KẾT QUẢ XỬ LÝ TRÊN EXCEL
ANOVA
Regression
Residual
Total
Significan
df
SS
MS
F
ce F
2 0.539796 0.269898 49.5234 1.59E-06
12 0.065398 0.00545
14 0.605194
Standard
Coefficients
Error
Intercept
Lower Upper
t Stat P-value 95%
95%
-3.69529 2.469172 -1.496
0.160 -9.075
1.684
X2
1.55930
0.54518
2.860
0.014
0.371
2.747
X3
0.49119
0.10274
4.780
0.000
0.267
0.715
Nhận xét:
• Trong gia đoạn được xem xét này,
giữ nhập lượng vốn không đổi, gia
tăng 1 % trong lao động dẫn đến
trung bình vào khoảng 1,5 % gia
tăng trong sản lượng.
• Tương tự như vậy giữ nhập lượng
lao động không đổi, gia tăng 1%
trong vốn dẫn đến trung bình vào
0,5% gia tăng trong sản lượng
Mô hình hồi quy biến giả
(Dummy Variable)
1. Mô hình hồi quy với một biến định tính
(một biến giả).
2. Mô hình hồi quy theo một biến định
lượng và một biến định tính.
3. Mô hình hồi quy theo một biến định
lượng và hai biến định tính.
4. Cách sử dụng biến giả trong phân tích
mùa vụ.
5. Tương tác trong hồi quy biến giả.
Mô hình hồi quy với một biến
định tính (biến giả)
Yi  1  2 Di   i
Y: là biến phụ thuộc
D: Là biến giả chỉ nhận hai giá trị 1 và 0
Hàm bậc thang
ˆ1  ˆ2
ˆ2
ˆ1
HQ theo 1 biến đ.lượng và 1 biến đ.tính
Biến giả có 2 phạm trù:
Yi  1  2 Di  3 X i   i
Yˆi  (ˆ1  ˆ2 )  ˆ3 X i
ˆ1  ˆ2
ˆ1
ˆ2
Yˆi  ˆ1  ˆ3 X i
HQ theo 1 biến đ.lượng và 1 biến
đ.tính
Biến giả có 3 phạm trù:
Yi  1  2 D1i  3 D2i  4 X i   i
Yˆi  (ˆ1  ˆ3 )  ˆ4 Xi
Yˆi  (ˆ1  ˆ2 )  ˆ4 X i
ˆ1  ˆ3
ˆ1  ˆ2
ˆ1
ˆ3
ˆ2
Yˆi  ˆ1  ˆ4 X i
HQ theo 1 biến Đ.lượng và 2 biến
Đ.tính
Yi  1  2 D1i  3 D2i  4 D3i  5 X i   i
Trong hai biến định tính:
- Biến thứ nhất có 2 phạm trù (only one dummy variable)
- Biến thứ hai có 3 phạm trù (Two dummy variables)
 Các hồi quy chỉ khác nhau về tung độ gốc, nhưng có
cùng hệ số gốc là β5.
 Ước lượng OLS cho phép ta kiểm định giả thuyết:
- Thêm vào 1 biến thì dùng kiểm định t
- Thêm vào 1 nhóm biến thì dùng kiểm định F
 Ta có thể mở rộng mô hình cho trường hợp nhiều biế
định lượng, nhiều biến định tính.
Biến giả trong phân tích mùa vụ
Giả sử ta muốn thực hiện hồi quy về hoa hồng tại một
thành phố CT theo giá cả của hoa hồng trong các giai
đoạn theo quí từ năm 2002 đến năm 2006. Xem xét số liệu
cho thấy trong năm nhu cầu về hòa hồng đều cao nhất
vào quí 1, có lẽ quí 1 có tác động mùa. Vì vậy nhà nghiên
cứu đề nghị mô hình:
Yi  1  2 D1i  3D2i  4 D3i  5 X i   i
Một năm có 4 quí, vì vậy biến mùa có 4 phạm trù, nên ta
dùng 3 biến giả, phạm trù cơ sở là quí 1.
Tương tác trong HQ biến giả
Người ta thấy rằng dễ dàng kiếm sống bằng
nhiều việc nếu sống ở Miên Nam, hay nói
cách khác là có ảnh hưởng tương tác, sự
khác biệt giữa người sống tại MN và người
sống ở Miền khác lên thu nhập. Do đó ta có
mô hình để đo lường sự ảnh hưởng đó:
Yi  1  2 D1i  3 D2i  4 (D2i X i )   i
Để kiểm định sự tương tác có ý nghĩa không
về mặt thống kê ta dùng kiểm định t.
Một số lưu ý khi sử dụng biến giả
1.
Nếu biến giả có m phạm trù thì chỉ đưa ra (m-1)
biến giả (để tránh đa cộng tuyến hoàn hảo).
2.
Trong việc giải thích kết quả của mô hình sử dụng
biến giả, điều then chốt là phải biết được giá trị 1 &
0 được gắn như thế nào.
3.
Phạm trù được gắn cho giá trị 0 thường được gọi là
phạm trù cơ sở, mốc, kiểm soát, so sánh, tham
chiếu hay loại bỏ. Nó là cơ sở xét trên khía cạnh là
ta thực hiện các so sánh với phạm trù đó.
4.
Hệ số gắn với biến giả có thể được gọi là hệ số
tung độ gốc chênh lệch do nó cho biết giá trị của
tung độ gốc của phạm trù nhận giá trị 1 khác giá trị
tung độ của phạm trù cơ sở là bao nhiêu