Click here to

Download Report

Transcript Click here to

Phương pháp phân tích định
lượng trong quan hệ quốc tế
Ths. Ncs. Ngô Quang Thành
1
Nội dung



Đo lường định lượng
Thực hiện phân tích định lượng
Một số dạng mô hình phân tích định
lượng chủ yếu
2
I. Đo lường định lượng





Tại sao phải đo lường?
So sánh đo lường định lượng với đo lường
định tính
Các bước trong đo lường định lượng
Yêu cầu đối với đo lường định lượng
Một số dạng đo lường định lượng phổ biến
3
Tại sao phải đo lường?

Nếu thế giới không được “đo
lường”????
4
So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)



Thời gian (timing):
Q1 liên quan đến các biến số xảy ra
trước và tách biệt với việc thu thập hay
phân tích số liệu;
Q2 xảy ra trong suốt quá trình thu thập
số liệu
5
So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)



Số liệu (data):
Q1 sử dụng các kỹ thuật khác nhau để
tạo ra các con số định lượng;
Q2 (có thể ở dạng con số) đa phần ở
dạng viết, nói, hành động, âm thanh,
hình ảnh, vật thể.
6
So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)
Mối liên kết (mối quan
hệ) (linkages) giữa khái
niệm và số liệu:
Q1 xây dựng kỹ thuật đo
lường làm cầu nối (suy
diễn)

7
So sánh đo lường định lượng
(Q1) với đo lường định tính (Q2)
Q2: Phát triển nhiều khái
niệm trong khi thu thập dữ
liệu;
Đồng thời tái xem xét dữ liệu
và khái niệm trong mối quan
hệ qua lại;
Trong quá trình thu thập dữ
liệu và tạo ra cách thức đo
lường, có thể phát các ý tưởng
mới (quy nạp)

8
Các bước trong đo lường định
lượng


Suy diễn hay quy nạp?
Conceptualization (khái niệm hóa) vs.
Operationalization (thao tác hóa)
9
Conceptualization vs.
Operationalization
10
Chỉ số đo lường (5 điều cần nhớ)





Luôn ghi nhớ conceptual definition
Giữ an open mind
Vay mượn từ nguồn khác
Dự báo khó khăn
Không được quên đơn vị đo lường
11
Yêu cầu đối với đo lường định
lượng: reliability & validity


Reliability (mức độ tin cậy):
dependability (tin cậy) hoặc consistency
(chính xác)
Validity (mức độ phù hợp của đo
lường): match bw a construct and a
measure
12
Reliability


Kết quả định lượng không thay đổi bởi
các đặc điểm của quá trình đo lường
hay công cụ đo lường
Hiếm khi đạt được cái gọi là perfect
reliability!!!
13
Cải thiện reliability: 4 cách




Xây dựng các khái niệm rõ ràng: các
khái niệm phân biệt nhau và (thường)
mỗi một sự đo lường ứng với một và chỉ
một khái niệm
Dùng đơn vị/mức độ/ thang đo lường
chính xác
Sử dụng các kiểm tra thí điểm
Sử dụng nhiều chỉ tiêu cùng lúc cho 1
đo lường
14
15
Validity

Mức độ phù hợp đo lường giữa
conceptual definition (định nghĩa khái
niệm)và operational definition (định
nghĩa thao tác)
16
Có thể đạt được:
17
Nhưng,


hiếm khi đạt được cái gọi là absolute
validity!!!
Bởi ý tưởng và khái niệm là trừu tượng
trong khi các chỉ tiêu là cụ thể.
18
Ba kiểu của validity
Face validity: Đánh giá của cộng đồng
khoa học (sự đồng thuận)
Ví dụ: Tăng trưởng kinh tế (GDP hay
GNP?), lạm phát (chỉ số giá tiêu dùng
CPI hay chỉ số giá sản xuất PPI?)

19
Content validity: Đánh giá nội dung của
định nghĩa của một cấu trúc và xây dựng
chỉ số bao hàm các nội dung ấy
(3 bưới tiến hành: a. Chỉ ra toàn bộ nội
dung của định nghĩa của cấu trúc; b. chọn
mẫu từ các khía cạnh khác nhau của
định nghĩa; c. phát triển một chỉ số bao
hàm tất cả các bộ phận của định nghĩa)

20
Criterion validity: Đánh giá dựa vào các
tiêu chuẩn
 Concurrent validity: Chỉ số xây dựng
phải đồng thuận/tương hợp (không
nhất thiết phải perfectly) với các chỉ số
đã có trước đó (có face validity)

21
Predictive validity: Khả năng tiên đoán
tương lai (không phải là dự báo tương
lai!)
Ví dụ: Điểm SAT cao đo lường năng lực
học tập: SAT cao -> học tốt: có
predictive validity)

22


Concurrent validity: Chỉ số phải có
tương quan cao với 1 chỉ số khác đã có
face validity
Predictive validity: Chỉ số dự báo sự
kiện tương lai có quan hệ lô gích với
cấu trúc (ý tưởng và khái niệm)
23
Một số lưu ý về đo lường định
lượng: Mức độ đo lường (levels)
Biến liên tục và biến rời rạc
Biến liên tục: số thực
Biến rời rạc: theo các phạm trù, phân
loại, phân nhóm, tình trạng
 Bốn mức độ đo lường

24




Nominal: định danh
Ordinal: định danh + trật tự, thứ hạng
Interval: định danh + trật tự, thứ hạng
+ khoảng cách
Ratio: above + phần trăm, tỷ số
25
Bốn mức độ đo lường
26
II. Thực hiện phân tích định
lượng



Mã hóa, nhập liệu và làm sạch số liệu
Thống kê mô tả (đơn biến, nhị biến, đa
biến)
Suy luận thống kê
27
Mã hóa, nhập liệu và làm sạch
số liệu


Possible code cleaning (or wild code
checking): kiểm tra loại dữ liệu
Contingency cleaning (or consistency
cleaning): kiểm tra độ chính xác (kiểm
tra chéo)
28
Thống kê mô tả: đơn biến

Bảng phân
phối tần số
29

Histogram, bar
chart, pie chart
30

Frequency polygon (đa giác tần số)
31
Thống kê mô tả: đơn biến

Các đo
lường xu
hường
trung tâm:
mean,
mode,
median
32
Thống kê mô tả: đơn biến

Đo
lường
phương
sai, độ
lệch
chuẩn
33
Thống kê mô tả: nhị biến (mối
quan hệ)


Covariation: xu hướng vận động của
means
Independence (độc lập): không có
xu hướng, không có mối quan hệ
34
Thống kê mô tả: nhị biến

Scattergram
35
Thống kê mô tả: nhị biến

Cross-tabulation
36
37
38
Suy luận thống kê: Sai lầm
Loại I và sai lầm Loại II


Sai lầm Loại I (anpha): Nhà nghiên cứu
nói mối quan hệ tồn tại (tham chiếu giả
thuyết đối) nhưng thực tế mối quan hệ
ấy KHÔNG tồn tại
Sai lầm Loại II (beta): Nhà nghiên cứu
nói mối quan hệ KHÔNG tồn tại (tham
chiếu giả thuyết không) nhưng thực tế
mối quan hệ ấy tồn tại
39
Null
Hypothesis
(H0) is true
Fail to Reject
Null
Hypothesis
Reject Null
Hypothesis
Right decision
Wrong decision
Type I Error
False Positive
Alternative
Hypothesis
(H1) is true
Wrong decision
Type II Error
False Negative
Right decision
40
Suy luận thống kê: mức ý
nghĩa
Có ý nghĩa thống kê:
 Mức ý nghĩa thống kê (thường là 0.1,
0.05, và 0.01): Xác suất bác bỏ sai giả
thuyết không, nếu nó thực sự đúng
 Significance Level = P(type I error)
=anpha
(Luôn biết chính xác từ mẫu)

41
Suy luận thống kê: power

Power là khả năng bác bỏ giả thuyết
không khi nó thật sự sai
Power = 1 - P(type II error) = 1- beta
Lý tưởng khi Power tiến tới 1
(Không biết chính xác)
42
Luật



Khi cỡ mẫu lớn (>1000), chọn mức ý
nghĩa thấp hơn 1%.
Khi cỡ mẫu vừa, chọn mức ý nghĩa 5%,
1%.
Khi cỡ mẫu nhỏ (nhưng vẫn đảm bảo
chạy mô hình), chọn mức ý nghĩa 10%
43
III. Mô hình phân tích định
lượng


Ảnh hưởng của xuất khẩu đến tăng
trưởng kinh tế, đến chuyển dịch cơ cấu
kinh tế, đến đổi mới công nghệ
Ảnh hưởng của FDI đến tăng trưởng
kinh tế, đến chuyển dịch cơ cấu kinh tế,
đến đổi mới công nghệ, đến thay đổi
chất lượng lao động
44
III. Mô hình phân tích định
lượng



Mục đích nghiên cứu quyết định
phương pháp nghiên cứu!!!
Câu hỏi nghiên cứu quyết định việc sử
dụng phương pháp nghiên cứu định
tính hay định lượng
Dạng số liệu quyết định mô hình phân
tích định lượng cụ thể
45
Mô hình phân tích định lượng





Số liệu liên tục dạng chéo (crosssectional)
Số liệu liên tục theo thời gian (time
series)
Số liệu dạng bảng (panel: vừa crosssectional vừa time series)
Số liệu rời rạc
Số liệu phân tầng
46
Mô hình phân tích định lượng
1. Mô hình hồi quy tuyến tính sử dụng số liệu
chéo
2. Mô hình hồi quy tuyến tính theo thời gian
3. Mô hình hồi quy tuyến tính với số liệu dạng
bảng (panel)
4. Các mô hình lựa chọn với biến rời rạc
(discrete choice models)
47
Mô hình phân tích định lượng
5. Mô hình tuyến tính thứ bậc
(hierarchical)
6. Phân tích thành tố (factors)
7. Phân tích phi tham số (non-parametric)
8. Kinh tế lượng không gian (spatial
econometrics)
 (Ghi chú: phần chữ đỏ dành cho nâng
cao)
48
Mô hình hồi quy tuyến tính




Phân tích hồi quy quan tâm:
Ước lượng giá trị trung bình của biến phụ
thuộc (Y) với giá trị đã cho của biến độc lập
(Xi): E(Y/Xi)
Kiểm định giả thiết về bản chất của sự phụ
thuộc
Dự đoán giá trị trung bình của biến phụ
thuộc khi biết giá trị của các biến độc lập
49
Mô hình hồi quy tuyến tính



Hồi quy và tương quan:
Phân tích hồi quy đo mức độ quan hệ tuyến
tính giữa hai biến; ước lượng hay dự báo một
biến trên cơ sở giá trị đã cho của một biến
khác; các biến không có tính đối xứng; biến
phụ thuộc là đại lượng ngẫu nhiên, biến giải
thích là phi ngẫu nhiên.
Phân tích tương quan không có sự phân biệt
giữa các biến, chúng có tính chất đối xứng.
50
Mô hình hồi quy tuyến tính




Hàm hồi quy và quan hệ nhân quả:
Quan hệ nhân quả nếu biến X là nguyên
nhân mang lại kết quả Y và ngược lại, nếu có
kết quả Y thì có thể suy luận do nguyên nhân
X.
Quan hệ nhân quả tồn tại dựa trên các xác
lập của lý thuyết kinh tế.
Phân tích hồi quy không nhất thiết phải là
phân tích quan hệ nhân quả
51
Mô hình hồi quy tuyến tính
Quan hệ thống kê và quan hệ hàm số:

Phân tích hồi quy nghiên cứu quan hệ thống kê của
một biến phụ thuộc vào một biến (hay nhiều biến)
độc lập theo nghĩa, ứng với một giá trị của biến độc
lập có thể có nhiều giá trị khác nhau của biến phụ
thuộc. Đo đó biến phụ thuộc là đại lượng ngẫu nhiên.
Có phân phối xác suất.

Quan hệ hàm số: Ứng với mỗi giá trị của biến độc
lập có duy nhất một giá trị của biến phụ thuộc; các
biến số không phải là ngẫu nhiên.
52
53
Mô hình hồi quy tuyến tính
Tên Mô hình
Tuyến tính
Tuyến tính log (log-linear)
Log – lin
Lin – log
Nghịch đảo
Dạng mô hình
Y=1+2X
LnY=1+2LnX
LnY=1+2X
Y=1+2LnX
Y=1+2(1/X)
54
Mô hình hồi quy tuyến tính
Tên Mô
hình
Dạng mô hình Hệ số
hồi
quy
Tuyến tính Y=1+2X
1, 2
Tuyến tính LnY=1+2Ln 1, 2
log
X
1, 2
Log – lin
LnY=1+2X
Lin – log
Nghịch
đảo
Y=1+2LnX 1, 2
Y=1+2(1/X) 1, 2
Hệ số góc
Hệ số co
dãn
2
2(Y/X)
2 (X/Y)
2
 2Y
2 X
2(1/X)
-2(1/X2)
2 (1/Y)
-2
(1/XY)
55
Hệ số co dãn


Cho mô hình (1) : ln Yi     2 ln Xi  Ui
Hệ số co dãn của Y đối với X (EY/X) định
nghĩa như sau:
EY


/ X
dY / Y
dY X


dX / X
dX Y
(EY/X) cho biết khi X tăng 1% thì Y tăng
(hay giảm) bao nhiêu %.
Beta2 là hệ số co dãn trong mô hình (1)
56
Mô hình hồi quy tuyến tính




Kiểm định một giả thuyết thống kê
Mức độ giải thích của mô hình
Ý nghĩa kinh tế của mô hình, hệ số hồi
quy
Dự báo
57
Ví dụ

Thu nhập bình quân đầu người (Y,
USD) phụ thuộc “tỷ lệ lao động trong
nông nghiệp, x1 (%)” và “số năm được
đào tạo đối với lao động trên 25 tuổi,
x2 (số năm)”
58
Giả thuyết lý thuyết vs. giả
thuyết thống kê
Hai giả thuyết kinh tế trong bài toán này:
Giả thuyết 1: Mức thu nhập của nền kinh tế phụ
thuộc vào mức độ phụ thuộc vào nông nghiệp
của nền kinh tế đó. Cụ thể, thu nhập bình quân
đầu người có quan hệ nghịch với mức độ phụ
thuộc vào nông nghiệp của nền
kinh tế.

59
Giả thuyết 2: Mức thu nhập của nền kinh
tế phụ thuộc vào trình độ đào tạo của lao
động. Nói cách khác, trình độ đào tạo của
lao động cao có xu hướng đi cùng với thu
nhập bình quân cao.
60
Biến lý thuyết vs. biến đại diện
61
Biến đại diện (proxy variable)



“tỷ lệ lao động trong nông nghiệp, x1 (%)”
-> biến số kinh tế “mức độ phụ thuộc vào
nông nghiệp của nền kinh tế”.
“số năm được đào tạo đối với lao động trên
25 tuổi, x2 (số năm)” -> biến số kinh tế
“trình độ đào tạo của người lao động”.
“thu nhập bình quân (USD)” -> “mức thu
nhập”.
62
Kiểm định giả thuyết thống kê

Giả sử chúng ta phải kiểm định giả
thuyết hệ số hồi quy của x1 bằng không
và đồng thời nêu ý nghĩa kinh tế của hệ
số này.
63


Giả thuyết không: Tỷ lệ lao động trong
nông nghiệp không ảnh hưởng đến thu
nhập bình quân, H 0 :  2  0
Giả thuyết đối: Tỷ lệ lao động trong nông
nghiệp có ảnh hưởng đến thu nhập bình
quân,
H1:  2  0
64


Kết quả kiểm định: có thể bác bỏ giả thuyết
không nói rằng tỷ lệ lao động trong nông nghiệp
không ảnh hưởng đến thu nhập bình quân ở mức
ý nghĩa 5%. Nói cách khác, chúng ta chấp nhận
giả thuyết cho rằng tỷ lệ lao động trong nông
nghiệp có ảnh hưởng đến thu nhập bình quân ở
mức ý nghĩa 5%.
Kết quả kiểm định còn cho thấy mối quan hệ giữa
thu nhập bình quân và tỷ lệ lao động trong nông
nghiệp là nghịch chiều.
65
Giả thuyết lý thuyết vs. giả
thuyết thống kê

Quy trình: Từ giả thuyết kinh tế đi
đến giả thuyết thống kê, trình bày kết
quả kiểm định, phát biểu kết quả kiểm
định (bác bỏ hay chấp nhận giả
thuyết không), phát biểu mối quan hệ
theo giả thuyết thống kê, và phát biểu
mối quan hệ theo giả thuyết kinh tế.
66
Ý nghĩa kinh tế của biến liên tục
Tên Mô
hình
Dạng mô hình
Ý nghĩa kinh tế của hệ số hồi
quy 2
Tuyến tính Y=1+2X
X tăng 1 đơn vị, Y tăng 2
đơn vị
Tuyến tính LnY=1+2LnX
log
X tăng 1%, Y tăng 2%
Log – lin
LnY=1+2X
Lin – log
Y=1+2LnX
X tăng 1 đơn vị, Y tăng
100*2(%)
X tăng 1%, Y tăng 0.01*2
đơn vị
Ý nghĩa kinh tế của biến liên
tục
Nghịch đảo
Y=1+2(1/X)
(2 dương)
X tăng 1 đơn vị, Y
giảm 2*(1/X2)
Y=1+2(1/X)
(2 âm)
X tăng 1 đơn vị, Y
tăng 2*(1/X2)
1 Là giá trị ngưỡng (giới hạn) khi X tiến
tới vô cùng
Ghi chú (vi phân): 2 =d(biến phụ thuộc)/d(biến giải thích)
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
69
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
70
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
71
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
72
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
73
Các mô hình lựa chọn với biến
rời rạc (discrete choice models)
74
Binary choice model






Khái niệm: Biến ẩn (latent variable)
Giả sử biến “tình trạng hộ” (yi*) là biến liên tục
thuộc (-, +) tùy thuộc vào mức độ thu nhập của
hộ. Giả sử yi* là hàm tuyến tính như sau:
yi* = xi’ + ui = jxji + ui, trong đó ui ~ (0,2)
Nhưng: Không quan sát được yi* mà chỉ quan sát
được yi lấy hai giá trị như sau:
Khi yi*  0, yi = 1
Khi yi*  0, yi = 0
75
Binary choice model
Ta có:
prob (yi = 1) = prob (yi* > 0) = prob (ui > - xi’)
ui có phân phối đối xứng:
prob (ui > - xi’)= prob (ui <xi’)
ui có hàm mật độ xác suất là f(ui ):

x ' i
prob (yi = 1)=

f(ui )du  F ( x ' i  )

prob (yi = 0)=1- F(x’i)
76
Nếu F là hàm phân phối logistic:
prob( yi  1) 


e
x ' i
1 e
x ' i
prob( yi  0)  1 
e
x ' i
1 e
x ' i
Khi x’i nhận các giá trị từ -  đến + thì pi
nhận giá trị từ 0 đến 1.pi phi tuyến với cả tham
số và biến số  Ước lượng hợp lý tối đa
(Maximum likelihood) để ước lượng tham số.
Các ước lượng nhận được (hat, hat) là các
ước lượng TỐI ĐA HÓA giá trị của hàm hợp
lý L, với mẫu cho trước.
Nếu F là hàm phân phối logistic:




Hàm hợp lý L:
L(,2|data) = prob(y1=0)*prob(y2=0) *… *
prob(yr=0) * prob(yr+1=1) *…* prob(yn=1)
Trong đó n0=r, n1=n-r (n0: số các giá trị 0;
n1: số các giá trị 1)
0Lhat1 cho nên -logLhat0
Nếu F là hàm phân phối logistic:

Sau khi ước lượng được hat, ta có thể tính
ước lượng xác suất pi=P(Y=1/Xi) như sau:
ˆi 
p

e
x ' i
1 e
x ' i
Ảnh hưởng của Xk đến pi như sau:

exp( Xiˆ ) ˆ
pi 
k
Xk
(1  exp( Xiˆ )
Nếu F là hàm phân phối logistic:

pi  pˆ i *(1  pˆ i )*0.051
X
Giả sử đi bằng phương tiện công cộng chậm
hơn đi bằng phương tiện cá nhân 30 phút,
khả năng phương tiện cá nhân được lựa
chọn và mức gia tăng khả năng được chọn
là bao nhiêu?
e0.221  0.051X
ˆi 
p
0.2221  0.051X
1 e

Nếu F là hàm phân phối logistic:





-0.221+0.051X= -0.221+0.051*30= 1.309
exp(1.309)= 3.702
pihat=3.702/4.702=0.7873

pi =0.7873*(1-0.7873)*0.051=0.009
X
Như vậy khi chênh lệch thời gian đi bằng phương tiện
công cộng và phương tiện cá nhân là 30 phút thì xác
suất chọn phương tiện cá nhân là 0.7873. Nếu mức
chênh lệch này tăng thêm 1 phút thì mức xác suất
chọn phương tiện cá nhân sẽ tăng 0.009
Trường hợp: F là hàm PROBIT






Nếu F là hàm phân phối chuẩn tắc:
prob (yi = 1) = (xi’ ) và
prob (yi = 0) = 1-(xi’ ) . Cụ thể:
Độ thỏa dụng I: Y sẽ nhận giá trị 1 hoặc 0 tùy
độ thỏa dụng I được xác định bởi các biến độc
lập.
I =1+2X, giả sử tồn tại một mức giới hạn I*
để: Y=1 nếu I>I*; Y=0 nếu I<I*
I* không quan sát được, giả sử I*=I + U
Trường hợp: F là hàm PROBIT




I* =1+2X+ui
Giả sử u có phân phối chuẩn hóa N(0,1), ta
có:
pi=P(Y=1/X)=P(I*i<Ii)=F(Ii), trong đó F là
hàm phân bố xác suất tích lũy của u. Vì ui
phân bố chuẩn hóa nên:
F(Ii=1+2X)=   X 1
t2
1

2

(2 )
1/ 2
exp(
2
)dt
Trường hợp: F là hàm PROBIT

Sau khi ước lượng được độ khả dụng I*, ta
có thể tính ước lượng xác suất pi=P(Y=1/Xi)
như sau:
pˆ i  F ( Xi )  f ( I *)
Trường hợp: F là hàm PROBIT

Ảnh hưởng của Xk đến pi như sau:

pi  f ( Xi  ) ˆ k
Xk
1
( Xi  ) 2 ˆ

exp( 
) k
1/ 2
(2 )
2
Trường hợp: F là hàm PROBIT

Cũng như mô hình LOGIT, mô hình
PROBIT không nghiên cứu ảnh hưởng trực
tiếp của biến độc lập Xk lên Y mà xem xét
ảnh hưởng của Xk đến xác suất để Y nhận
giá trị bằng 1 hay kỳ vọng của Y
Trường hợp: F là hàm PROBIT

Ví dụ 1: probit y x

Iteration
Iteration
Iteration
Iteration
Iteration

Probit regression




0:
1:
2:
3:
4:
log
log
log
log
log
likelihood
likelihood
likelihood
likelihood
likelihood


=
=
=
=
=
-11.090355
-6.3946952
-6.1358723
-6.1321415
-6.1321402
Number of obs
LR chi2(1)
Prob > chi2
Pseudo R2
=
=
=
=
16
9.92
0.0016
0.4471

Log likelihood = -6.1321402

-----------------------------------------------------------------------------y |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------x |
.0291607
.0109793
2.66
0.008
.0076416
.0506799
_cons | -.0613481
.4022493
-0.15
0.879
-.8497423
.7270461
------------------------------------------------------------------------------





Trường hợp: F là hàm PROBIT





2hat>0 nghĩa là nếu ta tăng được sự khác biệt
giữa thời gian đi phương tiện công cộng và
thời gian đi bằng phương tiện cá nhân thì xác
suất đi bằng phương tiện cá nhân sẽ tăng.
Tính độ khả dụng với X=30 (Phút)
I*= 1hat+2hat*X= -0.06+0.03*30=0.83
Tính pihat=F(Xi)=F(I*)=F(0.83)=0.79

pi =0.0084
X k
Phân tích thành tố (factors
analysis): mục đích
Các phương pháp thống kê (hồi quy) được sử
dụng để nghiên cứu mối quan hệ thống kê (hồi
quy) giữa biến độc lập và biện phụ thuộc.
Phân tích thành tố được sử dụng để nghiên cứu
hình mẫu về mối quan hệ giữa các biến phụ
thuộc, với mục tiêu là khám phá ra cái gì đó
thuộc về bản chất của các biến độc lập có ảnh
hưởng đến các biến phụ thuộc
89
Phân tích thành tố (factors
analysis): ví dụ
Giả sử có 500 người đều quen thuộc với tất cả các
loại xe gắn máy. Bạn có thể hỏi “Bạn thích chiếc xe gắn máy
nào?” (Dĩ nhiên là bạn có thể hỏi bằng câu hỏi khác để có
thể đo lường ở chiều kích khác). Lý thuyết về nhân tố thứ
nhất cho rằng người ta chỉ giản đơn thích loại xe mắc tiền
nhất. Lý thuyết về nhân tố thứ hai cho rằng người ta thích
loại xe thể thao, trong khi đó một số người khác thì thích loại
xe sang trọng. Lý thuyết thành tố thứ ba và thứ tư có thể là
an toàn và tin cậy. Thay vì xe gắn máy để nghiên cứu hành
vi thì người ta có thể chọn lương thực, chính sách chính trị,
ứng viên chính trị hoặc nhiều vật khác.

90
Phân tích thành tố (factors
analysis): ví dụ
A
B
C
D
E
F
Chạy êm Không
Chạy
Dễ điều
gây tiếng nhanh
khiển
động
5
4
2
1
4
3
2
1
4
3
3
2
5
5
2
2
4
3
2
1
5
5
3
2
4,50
3,83
2,33
1,50
91
Phân tích thành tố (factors
analysis): ví dụ
Nghi ngờ về 2 biến đầu và 2 biến cuối có
mối liên hệ với nhau. Người nào cho điểm
cao về tính chất “chạy êm” thì cũng cho
điểm cao về tính chất “không gây tiếng
ồn”. Các nhà phân tích phải kết hợp 4
tính chất thành 2 nhóm tính chất là “sang
trọng” và “công suất”
92
A
B
C
D
E
F
Sang trọng
4,5
3,5
3,5
5,0
3,5
5,0
4,25
Công suất
1,5
1,5
2,5
2,0
1,5
2,5
1,92
93
Những điểm yếu của phương
pháp phân tích trên
1.
2.
3.
4.
Cho trước trọng số bằng nhau. Tính chất “chạy êm”
có thể đóng góp vào cảm nhận sang trọng hơn là
“không gây tiếng động”
Cộng các tính chất có tương quan lại với nhau. Rất có
thể các cá nhân trả lời không cảm thấy theo cái cách
như vậy
Hai tính chất nghịch nhau có thể có khuynh hướng bù
trừ chênh lệch nhau
Một số tính chất có thể thuộc về cả 2 thành tố. Chẳng
hạn như “chạy nhanh” có thể liên đến cả 2 “sang
trọng” và “công suất”
Thành tố
Phân tích thành tố thực chất là sự kết hợp tuyến
tính giữa các biến. Qua phương pháp phân tích
thành tố, có thể tính toán điểm của các thành tố.
F1 = 0,40X1 + 0.30X2 + 0,02X3 + 0,05X4
F2 = 0,01X1 + 0,04X2 + 0,45X3 + 0,37X4
Trọng số càng lớn thì đóng góp của biến đó đối
với biến động của thành tố đó là lớn và ngược
lại. Chúng ta có thể tính toán điểm thành tố của
từng cá nhân A, B, C, D, E và F
Giải thích Eigenvalue
Bước tiếp theo của phân tích thành tố là xác
định tác động của phân tích trong bộ số liệu.
Mỗi Eigenvalue cho biết mỗi thành tố giải
thích bao nhiêu trong bộ dữ liệu.
Factor 1: 2,2 giải thích 55,0%
Factor 2: 1,5 giải thích 37,5%
Factor 3: 0,2 giải thích 5,0%
Factor 4: 0,1 giải thích 2,5%
Eigenvalue
Có 4 thành tố giải thích tất cả các sự biến
thiên (4 đơn vị thông tin) trong bộ dữ
liệu.
Thành tố thứ nhất giải thích 55% thông
tin (2,2/4) trong khi đó thì thành tố thứ
hai giải thích 37,5% thông tin (1,5/4).
Bao nhiêu thành tố?
Trong phân tích thành tố, các nhà phân tích phải
đương đầu với tình huống là bao nhiêu thành tố giữ
lại. Trong ví dụ trên thì chúng ta giữ lại hai thành tố:
thành tố thứ nhất giải thích 55% và thành tố thứ hai
giải thích 37,5%. Cả hai thành tố giải thích tổng
cộng 92,5%.
Cách thứ hai là ta phải chọn Eigenvalue lớn hơn 1,
bởi vì giải thích hơn 1 đơn vị biến thiên của thông
tin thì sẽ làm cho bộ dự liệu đơn giản hơn.
Các thứ ba chúng ta có thể nhìn vào đồ thị Screen
Plot giữa số các thành tố đưa vào và Eigenvalue.
Tài liệu đọc


Chương 1, 2, 7, 8 trong Byrne D. (2002)
Chương 5 trong Neuman, W. L. (2007)
99
Thông tin liên lạc và resources



Email: [email protected]
Facebook: kinhteluongftu2.facebook.com,
(đăng tải bài giảng, readings và…. chat!:)
after adding!!!)
Web: phattrienkinhte.wordpress.com
100
Tài liệu tham khảo
Byrne D. (2002), Interpreting Quantitative Data,
SAGE Publications, UK.
Balnaves M., và Caputi, P.(2001), Introduction to
Quantitative Research Methods An Investigative
Approach, SAGE Publications, UK.
Neuman, W. L. (2007), Basics of Social Research
Qualitative and Quantitative Approaches, 2nd
Edition, Pearson Education, Inc., USA.
101
Tài liệu tham khảo
Hancock, G. R., và Mueller R. O. (ed.), (2010),
The Reviewer’s Guide to Quantitative Methods in the
Social Sciences, Routledge, UK.
Nguyễn, H.B. (2010), Bài giảng phương pháp nghiên
cứu khoa học, Tài liệu khóa học.
Verbeek, M. (2004), A Guide to Modern Econometrics,
John Wiley & Sons Ltd., UK.
102