Thong ke kinh te

Download Report

Transcript Thong ke kinh te

THỐNG KÊ KINH TẾ
Nguyễn Văn Vũ An
Bộ môn Tài chính – Ngân hàng (TVU)
TÀI LIỆU THAM KHẢO
4/13/2015 6:45 AM
[email protected]
2
TÀI LIỆU THAM KHẢO
4/13/2015 6:45 AM
[email protected]
3
CHƯƠNG 1. GIỚI THIỆU MÔN HỌC
1. KHÁI NIỆM
 Thống kê là một nhánh của toán học liên quan đến
việc thu thập, phân tích, diễn giải hay giải thích và
trình bày các dữ liệu
 Thống kê mô tả và thống kê suy diễn tạo thành
thống kê trong ứng dụng
4/13/2015 6:45 AM
[email protected]
4
2. TỔNG QUAN VỀ THỐNG KÊ
 Thống kê mô tả: Là pháp sử dụng để tóm tắt hoặc
mô tả một tập hợp dữ liệu
 Thống kê suy diễn: Là phương pháp mô hình hóa
trên các dữ liệu quan sát để giải thích được những
biến thiên “dường như” có tính ngẫu nhiên và tính
không chắc chắn của các quan sát
4/13/2015 6:45 AM
[email protected]
5
3. MỘT SỐ KHÁI NIỆM TRONG THỐNG KÊ
 Tổng thể thống kê là tập hợp các đơn vị thuộc hiện
tượng nghiên cứu, cần quan sát, thu thập và phân
tích mặt lượng của chúng theo một hoặc một số
tiêu thức nào đó
 Mẫu là tổng thể bao gồm một số đơn vị được chọn
ra từ tổng thể chung theo một phương pháp lấy
mẫu nào đó
4/13/2015 6:45 AM
[email protected]
6
3. MỘT SỐ KHÁI NIỆM TRONG THỐNG KÊ
 Quan sát là cơ sở thu thập số liệu và thông tin cần
nghiên cứu
 Dữ liệu định tính phản ánh tính chất, sự hơn kém
của đối tượng của các đối tượng nghiên cứu, là các
dữ liệu ban đầu không được thể hiện dưới dạng số
 Dữ liệu định lượng phản ánh mức độ hay mức độ
hơn kém, là các dữ liệu có thể cân, đong, đo, đếm
được
4/13/2015 6:45 AM
[email protected]
7
4. QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ
Xác định vấn đề nghiên cứu, mục tiêu,
nội dung, đối tượng nghiên cứu
Xây dựng hệ thống các khái niệm,
Các chỉ tiêu thống kê
Thu thập dữ liệu thống kê
Xử lý số liệu:
• Kiểm tra, chỉnh lý, sắp xếp số liệu
• Phân tích thống kê sơ bộ
• Phân tích thống kê thích hợp
Phân tích và giải thích kết quả
Báo cáo và truyền đạt kết quả nghiên cứu
4/13/2015 6:45 AM
[email protected]
8
5. CÁC LOẠI THANG ĐO
 Thang đo định danh
 Thang đo thứ bậc
 Thang đo khoảng
 Thang đo tỷ lệ
4/13/2015 6:45 AM
[email protected]
9
CHƯƠNG 2. THU THẬP DỮ LIỆU
 Vấn đề đầu tiên của công việc thu thập dữ liệu là
xác định rõ những dữ liệu nào cần thu thập, thứ tự
ưu tiên của các dữ liệu này
 Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban
đầu từ đối tượng nghiên cứu
 Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn
có sẵn, đó chính là những dữ liệu đã qua tổng hợp,
xử lý
4/13/2015 6:45 AM
[email protected]
10
CHƯƠNG 2. THU THẬP DỮ LIỆU
 Các phương pháp thu thập dữ liệu sơ cấp
o Thực nghiệm
o Khảo sát qua điện thoại
o Thư hỏi
o Quan sát trực tiếp
o Phỏng vấn cá nhân
4/13/2015 6:45 AM
[email protected]
11
CHƯƠNG 2. THU THẬP DỮ LIỆU
 Các kỹ thuật chọn mẫu
o Kỹ thuật lấy mẫu xác suất
• Lấy mẫu ngẫu nhiên đơn giản
• Lấy mẫu hệ thống
• Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn
• Lấy mẫu phân tầng
o Kỹ thuật lấy mẫu phi xác suất
• Lấy mẫu thuận tiện
• Lấy mẫu định mức
• Lấy mẫu phán đoán
4/13/2015 6:45 AM
[email protected]
12
CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ
LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
1. BẢNG TẦN SỐ
Trị số của biến (Xi) Tần số (fi) Tần suất (%)
4/13/2015 6:45 AM
X1
f1
f1/n
X2
f2
f2/n
---
---
---
Xk
fk
fk/n
Tổng
fi = n
100
[email protected]
13
CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ
LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
1. BẢNG TẦN SỐ
Công việc của chủ hộ
Tần số (người) Tần suất (%)
Có hoạt động kinh tế
658
63,45
47
4,53
332
32,02
1.037
100
Không hoạt động kinh tế
Không có việc làm
Tổng
4/13/2015 6:45 AM
[email protected]
14
CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ
LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
1. BẢNG TẦN SỐ
Độ tuổi (tuổi) Tần số (người) Tần suất (%)
Tần suất
tích lũy (%)
15 - 20
146
12,9
12,9
21 - 30
410
36,3
49,2
31 - 40
293
26,0
75,2
41 - 50
187
16,6
91,8
51 - 60
93
8,2
100
1.129
100
Tổng
4/13/2015 6:45 AM
[email protected]
15
CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ
LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
1. BẢNG TẦN SỐ
4/13/2015 6:45 AM
[email protected]
16
2. TÓM LƯỢC VÀ TRÌNH BÀY DỮ LIỆU
BẰNG ĐỒ THỊ
4/13/2015 6:45 AM
[email protected]
17
2. TÓM LƯỢC VÀ TRÌNH BÀY DỮ LIỆU
BẰNG ĐỒ THỊ
4/13/2015 6:45 AM
[email protected]
18
CHƯƠNG 4. TÓM TẮT DỮ LIỆU
BẰNG CÁC ĐẠI LƯỢNG SỐ

x

Trung bình mẫu (Mean): x 
i
n
 Trung bình có trọng số: XW
fx


f
i i
i
 Trung vị - Me (Median): Là giá trị đứng giữa của
tập dữ liệu đã được sắp xếp theo thứ tự tăng dần

Mode (Mo): Giá trị gặp nhiều nhất trong tập dữ
liệu
4/13/2015 6:45 AM
[email protected]
19
CHƯƠNG 4. TÓM TẮT DỮ LIỆU
BẰNG CÁC ĐẠI LƯỢNG SỐ
 Trung bình nhân (Geometric mean): x  n x1 x2 ...xn
 Khảo sát hình dạng của các đa giác tần số tương
ứng với các kiểu phân phối
Lệch trái
Mean < Me < Mo
4/13/2015 6:45 AM
Cân đối
Mean = Me = Mo
[email protected]
Lệch phải
Mo < Me < Mean
20
CHƯƠNG 4. TÓM TẮT DỮ LIỆU
BẰNG CÁC ĐẠI LƯỢNG SỐ
 Phương sai: Trung bình của các biến thiên bình
phương giữa từng quan sát trong tập dữ liệu so với
trung bình của nó
2
2


x

x
 fi


x

x
 i
Hoặc
 i
2
2
s 
n 1
s 
f
i
1
 Độ lệch chuẩn: Lấy căn bậc hai của phương sai
4/13/2015 6:45 AM
[email protected]
21
CHƯƠNG 4. TÓM TẮT DỮ LIỆU
BẰNG CÁC ĐẠI LƯỢNG SỐ
Tuổi
4/13/2015 6:45 AM
[email protected]
22
CHƯƠNG 4. TÓM TẮT DỮ LIỆU
BẰNG CÁC ĐẠI LƯỢNG SỐ
Xi

 Trung bình tổng thể:  
N
 Phương sai tổng thể: 2 
2


X


 i
N
 Chuẩn hóa dữ liệu: Biến đổi chúng thành dữ liệu ở
1 thang đo chuẩn
x
z

o Chuẩn hóa z cho dữ liệu tổng thể:
xx 
o Chuẩn hóa z cho dữ liệu mẫu: z 
s
4/13/2015 6:45 AM
[email protected]
23
CHƯƠNG 5. XÁC SUẤT, BIẾN NGẪU
NHIÊN VÀ LUẬT PHÂN PHỐI
1. XÁC SUẤT CĂN BẢN
 Phép thử
 Biến cố: Kết cục của phép thử
o Biến cố chắc chắn (Ω)
o Biến cố không thể có (Ø)
o Biến cố ngẫu nhiên (A, B, C,…)
 Xác suất của một biến cố
4/13/2015 6:45 AM
[email protected]
24
1. XÁC SUẤT CĂN BẢN
 Biến cố tổng C = A ∪ B hay C = A + B là biến cố
xảy ra khi và chỉ khi A hoặc B xảy ra
 Biến cố tích C = A ∩ B hay C = A*B là biến cố
xảy ra khi và chỉ khi A và B cùng xảy ra
 Biến cố xung khắc
 Biến cố độc lập
1. XÁC SUẤT CĂN BẢN
 P(A) = m/n
 Tính chất:
o 0 ≤ P(A) ≤ 1
o P(Ω) = 1
o P(Ø) = 0
2. BIẾN NGẪU NHIÊN
 Biến ngẫu nhiên là những biến mà giá trị của nó
được xác định 1 cách ngẫu nhiên
o Biến ngẫu nhiên rời rạc
o Biến ngẫu nhiên liên tục
3. CÁC PHÂN PHỐI LÝ THUYẾT QUAN TRỌNG
 Phân phối nhị thức (Binominal distribution)
 Phân phối Poisson (Poisson distribution)
 Phân phối bình thường (Normal distribution)
 Phân phối bình thường chuẩn hóa (Standard
normal distribution)
 Dùng phân phối bình thường tính xấp xỉ một số
phân phối rời rạc
 Phân phối đều (Uniform distribution)
 Phân phối mũ (Exponential distribution)
CHƯƠNG 6. PHÂN PHỐI CỦA CÁC
THAM SỐ MẪU
1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU

Trung bình mẫu là ước lượng không chệch của
trung bình tổng thể vì giá trị trung bình tính được
từ tất cả các trị trung bình mẫu của mẫu cỡ n có
thể lấy được từ tổng thể cỡ N sẽ đúng trị trung
bình của tổng thể

Ví dụ: Tuổi có cỡ N = 4 như sau {18, 20, 22, 24}
Ta có μ = (18 + 20 + 22 + 24)/4 = 21
1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU
Các mẫu
18
20
22
24
18
18; 18 18; 20 18; 22 18; 24
20
20; 18 20; 20 20; 22 20; 24
22
22; 18 22; 20 22; 22 22; 24
24
24; 18 24; 20 24; 22 24; 24
Nếu tất cả các cỡ mẫu có
2 người được chọn theo
kiểu hoàn lại từ tổng thể
thì có 16 mẫu theo
nguyên tắc Nn
(18  19  20  ...  24) 336
x 

 21  
16
16
1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU

Sai số chuẩn của trung bình mẫu

x 
 X
i  
2
N

n

(18  21) 2  ...  (24  21) 2

 5  2,236
4
2,236
 1,58
2
Như vậy: Khi cỡ mẫu tăng
thì sai số chuẩn của trung
bình giảm xuống
Khi n/N > 0,05


N n
x 
 FPC 

N 1
n
n
Với FPC (Finite population
correction) là yếu tố hiệu chỉnh
tổng thể hữu hạn
1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU

Chọn mẫu từ một tổng thể có phân phối bình thường
x  
o
x 
x
n
Z
X  X
X
Ví dụ: Xem ví dụ P. 176 (Thống kê ứng dụng)
1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU
 Chọn mẫu từ một tổng thể không có phân phối
bình thường
o Lý thuyết giới hạn trung tâm (Central limit theorem)
• Tổng thể có phân phối bình thường thì trung bình mẫu cũng là
phân phối bình thường dù cỡ mẫu là bao nhiêu
• n ≥ 30, phân phối mẫu xấp xỉ phân phối bình thường
• Hình dáng của phân phối tổng thể khá đối xứng thì phân phối
mẫu xấp xỉ phân phối bình thường nếu cỡ mẫu n ≥ 15
o Ví dụ: P.179 (Thống kê ứng dụng)
4/13/2015 6:45 AM
[email protected]
33
2. PHÂN PHỐI CỦA TỶ LỆ MẪU
 Tỷ lệ mẫu:
Ps 
X
n
o X: Số quan sát có thuộc tính quan tâm
P  p
s
P 
s
p(1  p)
n
Z
ps  p
p (1  p )
n
o Ví dụ: P. 182 (Thống kê ứng dụng)
Khi n/N > 0,05
x 
p(1  p)
 FPC 
n
p(1  p)
N n

n
N 1
o Ví dụ: P. 183 (Thống kê ứng dụng)
CHƯƠNG 7. ƯỚC LƯỢNG CÁC THAM
SỐ TỔNG THỂ
1. ƯỚC LƯỢNG TRUNG BÌNH TỔNG THỂ
 Vấn đề đặt ra là ước lượng các đặc trưng của tổng
thể (chưa biết) từ các đặc trưng của mẫu dữ liệu
thu thập được
 Ước lượng điểm là phương pháp dùng một tham
số thống kê mẫu đơn lẻ để ước lượng về giá trị thật
của tham số tổng thể
 Ước lượng khoảng là phương pháp dựa vào dữ liệu
của mẫu, với một độ tin cậy cho trước, xác định
khoảng giá trị mà đặc trưng của tổng thể có thể rơi
vào
[email protected]
35
4/13/2015 6:45 AM
1. ƯỚC LƯỢNG TRUNG BÌNH TỔNG THỂ
 Ước lượng khoảng trung bình tổng thể khi đã biết
phương sai tổng thể:
o Ví dụ: P. 189 (Thống kê ứng dụng)
 Ước lượng khoảng trung bình tổng thể khi không
biết phương sai tổng thể:
o Nếu n ≥ 30:
o Nếu n < 30:
o Ví dụ: P. 193 (Thống kê ứng dụng)
4/13/2015 6:45 AM
[email protected]
36
web
 nguyenvanvuantvu.yolasite.com
4/13/2015 6:45 AM
[email protected]
37
2. ƯỚC LƯỢNG TỈ LỆ TỔNG THỂ
ps  z / 2
ps (1  ps )
ps (1  ps )
 p  ps  z / 2
n
n
Ví dụ: P. 195 (Thống kê ứng dụng)
4/13/2015 6:45 AM
[email protected]
38
3. XÁC ĐỊNH CỠ MẪU CHO BÀI
TOÁN ƯỚC LƯỢNG

Đối với trung bình tổng thể: n   z / 2   
 e 
o Ví dụ: P. 196 (Thống kê ứng dụng)
2
2
z
 Đối với tỷ lệ tổng thể: n   / 2 p(1  p)
e2
o Ví dụ: P. 197 (Thống kê ứng dụng)
nN
 Trong tình huống tổng thể hữu hạn: n' 
n  ( N  1)
4/13/2015 6:45 AM
[email protected]
39
4. ƯỚC LƯỢNG TRÊN HAI MẪU
 Ước lượng khác biệt hai trung bình tổng thể trong
trường hợp mẫu độc lập
o Trường hợp biết phương sai tổng thể:
( x1  x2 )  z / 2
 12
n1

 22
n2
• Ví dụ: P. 199 (Thống kê ứng dụng)
o Trường hợp chưa biết phương sai tổng thể, mẫu lớn:
( x1  x2 )  z / 2
4/13/2015 6:45 AM
2
1
2
2
s
s

n1 n2
[email protected]
40
4. ƯỚC LƯỢNG TRÊN HAI MẪU
o Trường hợp chưa biết phương sai tổng thể, mẫu nhỏ:
Độ lệch chuẩn mẫu gộp:
(n1  1) s12  (n2  1) s22
sp 
n1  n2  2
( x1  x2 )  t / 2;df s p
1 1

n1 n2
với df = n1+ n2 -2
Trong tình huống mẫu nhỏ, phương sai tổng thể không
2
2
2
bằng nhau thì:
 s1 s2 
  
n1 n2 

df 
2 2
2 2
 s1   s2 
   
 n1    n2 
4/13/2015 6:45 AM
41
n1  1 n2  1
4. ƯỚC LƯỢNG TRÊN HAI MẪU
 Ước lượng khác biệt hai trung bình tổng thể trong
trường hợp mẫu cặp
o B1: Tính từng cặp chênh lệch di = x1i – x2i
o B2: Tính trung bình các chênh lệch trên mẫu
d

d
o B3: Tính độ lệch chuẩn của chênh lệch:
sd 
 d
d
2
i
n 1
o B4: Xây dựng khoảng ước lượng:
o Ví dụ: P. 204 (Thống kê ứng dụng)
4/13/2015 6:45 AM
n
[email protected]
d  t / 2;n 1
sd
n
42
4. ƯỚC LƯỢNG TRÊN HAI MẪU
 Ước lượng tỷ lệ hai mẫu
 ps1  ps 2   z / 2
ps1 (1  ps1 ) ps 2 (1  ps 2 )

n1
n2
o Ví dụ: P. 206 (Thống kê ứng dụng)
4/13/2015 6:45 AM
[email protected]
43
CHƯƠNG 8. KIỂM ĐỊNH GIẢ
THUYẾT VỀ THAM SỐ TỔNG THỂ
1. CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH
 Đặt giả thuyết về tham số tổng thể
o Giả thuyết H0 thường mô tả hiện tượng lúc bình
thường, mô tả tình trạng nguyên thủy, hoặc tình trạng
không chịu tác động gì của hiện tượng; Giả thuyết H0
luân có dấu bằng (P.209)
o Giả thuyết H1 mô tả tình trạng ngược lại với H0
4/13/2015 6:45 AM
[email protected]
44
1. CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH
 Xác suất sai lầm loại I là xác suất để chúng ta bác
bỏ H0 trong khi nó thật sự đúng
 Xác suất sai lầm loại II là xác suất để chúng ta
không bác bỏ H0 trong khi nó sai
 Mức ý nghĩa α của kiểm định (Significance level)
 Giá trị tới hạn (Critical value) là biên giới chia đôi
hai vùng chấp nhập và bác bỏ H0
 Kiểm định một bên và kiểm định hai bên (P.213)
4/13/2015 6:45 AM
[email protected]
45
2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU
 Kiểm định giả thuyết về trung bình tổng thể
o Khi biết độ lệch chuẩn
B1: Nhận định tình hình của tham số tổng thể
B2: Đặt giả thuyết
B3: Xác định α
x
B4: Tính giá trị kiểm định ztt 
/ n
B5: Bác bỏ H0 nếu kiểm định hai bên thì ztt > zα/2 hoặc
ztt < -zα/2; nếu kiểm định bên trái ztt < -zα; nếu kiểm
định bên phải ztt > zα
B6: Kết luận (P.217)
4/13/2015 6:45 AM
[email protected]
46
2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU
 Kiểm định giả thuyết về trung bình tổng thể
o Khi không biết độ lệch chuẩn
B1- B3: Giống TH biết độ lệch chuẩn
B4: Tính giá trị kiểm định
x
n ≥ 30 thì ztt 
s/ n
x
n < 30 thì ttt  s / n
B5: Bác bỏ H0 nếu kiểm định hai bên thì ztt > zα/2 hoặc
ztt < -zα/2(ttt > tα/2;n-1 hoặc ttt < -tα/2;n-1 ); nếu kiểm định
bên trái ztt < -zα (ttt < -tα;n-1); nếu kiểm định bên phải ztt
> zα(ttt > tα;n-1)
47
B6: Kết luận (P218 – 219)
2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU
 Tiếp cận p-value (P.221)
o P-value ≥ α thì chấp nhận H0
o P-value < α thì bác bỏ H0
4/13/2015 6:45 AM
[email protected]
48
2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU
 Kiểm định giả thuyết về tỷ lệ tổng thể:
ztt 
ps  p0
p(1  p) / n
Vì chúng ta giả định p = p0 nên dùng p0 thay thế
cho p như một cách tính sắp xỉ
Quyết định chấp nhận hay bác bỏ H0 (P. 223)
4/13/2015 6:45 AM
[email protected]
49
2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU
 Kiểm định giả thuyết về phương sai tổng thể:
(P.226)
 tt2 
(n  1) s 2
 02
Bác bỏ H0 trong trường hợp:
2
2
2
2






Kiểm định hai bên: tt n1;1 / 2 Hoặc tt
n 1; / 2
Kiểm định bên phải: tt  n1;
2
2
Kiểm định bên trái: tt2  n21;1
4/13/2015 6:45 AM
[email protected]
50
3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU
 Kiểm định giả thuyết cho khác biệt của hai trung
bình tổng thể, biết phương sai của hai tổng thể, hai
mẫu độc lập

x1  x2   ( 1  2 )
ztt 
 12  22

n1 n2
 Kiểm định giả thuyết cho khác biệt của hai trung
bình tổng thể, không biết phương sai của hai tổng
thể, hai mẫu độc lập cỡ mẫu lớn z  x1  x2   (1  2 )
tt
(P.230)
4/13/2015 6:45 AM
[email protected]
s12 s22

n1 n2
51
3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU
 Kiểm định giả thuyết cho khác biệt của hai trung
bình tổng thể, không biết phương sai của hai tổng
thể, hai mẫu độc lập cỡ mẫu nhỏ (P.232)

x1  x2   ( 1  2 )
ttt 
(n1  1) s12  (n2  1) s22 1 1

(n1  1)  (n2  1)
n1 n2
Quy tắc bác bỏ H0:
Kiểm định hai bên:ttt  tn n 2; / 2 Hoặc ttt  tn n 2; / 2
1
1
2
2
Kiểm định bên phải: ttt  tn n 2;
1
2
Kiểm định bên trái: ttt  tn n 2;
1
4/13/2015 6:45 AM
2
[email protected]
52
3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU
 Kiểm định giả thuyết cho khác biệt của hai trung
bình tổng thể, hai mẫu không độc lập (Mẫu phối
hợp từng cặp)
o B1: Tính từng cặp chênh lệch di = x1i – x2i
o
d

B2: Tính trung bình các chênh lệch trên mẫu d 
o B3: Tính độ lệch chuẩn của chênh lệch:
sd 
 d
i d
2
n 1
o B4: Tính toán giá trị kiểm định:
ttt 
o Ví dụ: P. 236 (Thống kê ứng dụng)
4/13/2015 6:45 AM
n
[email protected]
d  d
sd
n
53
3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU
 Kiểm định giả thuyết khác biệt giữa hai tỷ lệ tổng
thể
o Phương pháp dùng phân phối z: ztt 
n1 ps1  n2 ps 2 X 1  X 2

Với ps 
n1  n2
n1  n2
(P.242)
4/13/2015 6:45 AM
[email protected]
( p1s  p2 s )  ( p1  p2 )
1 1
ps (1  ps )(  )
n1 n2
54
CHƯƠNG 9. PHÂN TÍCH PHƯƠNG SAI
1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
 B1: Tính các trung bình mẫu của các nhóm
1
x11
x12
...
x1n1
4/13/2015 6:45 AM
TOÅNG THEÅ
2
...
x21
...
x22
...
...
...
x2n2
...
[email protected]
k
Xk1
xk1
...
xknk
55
1. PHÂN TÍCH PHƯƠNG SAI MỘT
YẾU TỐ
 B1: Tính các trung bình mẫu của các nhóm
o Tính trung bình mẫu
ni
xi 
x
j 1
ij
ni
o Trung bình chung của k mẫu
k
x
n x
i 1
k
[email protected]
i
n
i 1
4/13/2015 6:45 AM
i
i
56
1. PHÂN TÍCH PHƯƠNG SAI MỘT
YẾU TỐ
 B2: Tính tổng các chênh lệch bình phương
o Tổng các chênh lệch bình phương trong nội bộ nhóm
(SSW)n
n
2
SS1   ( x1 j  x1 ) SS2   ( x2 j  x2 )
2
1
2
j 1
j 1
Tương tự ta có SSW = SS1 + SS2+ … + SSk
k ni
Hay SSW =   ( xij  xi )2
i  1 j 1
o Tổng chênh lệch bình
phương giữa các nhóm (SSG)
k
SSG   ni ( xi  x ) 2
i 1
o Tổng các chênh lệch bình phương toàn bộ (SST)
k
ni
SST   ( xij  x ) 2
Hay: SST = SSW + SSG
i 1 j 1
4/13/2015 6:45 AM
[email protected]
57
1. PHÂN TÍCH PHƯƠNG SAI MỘT
YẾU TỐ
 B3: Tính các phương sai (Trung bình chênh lệch
của các chênh lệch bình phương)
o Tính phương sai trong nội bộ nhóm (MSW)
SSW
MSW 
nk
o Tính phương sai giữa các nhóm (MSG)
SSG
MSG 
k 1
 B4: Kiểm định giả thuyết:
F
MSG
MSW
Nếu F > F(k-1;n-k);α thì bác bỏ H0
4/13/2015 6:45 AM
[email protected]
58
1. PHÂN TÍCH PHƯƠNG SAI MỘT
YẾU TỐ
(P.257)
4/13/2015 6:45 AM
[email protected]
59
2. PHÂN TÍCH SÂU ANOVA
 Khi H0 bị bác bỏ thì cần phân tích sâu hơn để xác
định nhóm nào khác với nhóm nào (Turkey)
 Nếu có k nhóm thì số lượng cặp cần so sánh là:
Ck2
k (k  1)
k!


2
2! (k  2)!
 VD: k= 3 thì số cặp cần so sánh là 3
 Các giả thuyết cần kiểm định
1. H0: µ1 = µ2
2. µ2 = µ3
3. µ1 = µ3
H1: µ1 ≠ µ2
µ2 ≠ µ3
µ1 ≠ µ3
4/13/2015 6:45 AM
[email protected]
60
2. PHÂN TÍCH SÂU ANOVA
 Giá trị tới hạn Turkey: T  q , k , n  k
MSW
ni
 Bác bỏ H0 khi độ lệch tuyệt đối giữa các cặp trung
bình mẫu lớm hơn hay bằng T giới hạn (P.266)
4/13/2015 6:45 AM
[email protected]
61
2. PHÂN TÍCH SÂU ANOVA
4/13/2015 6:45 AM
[email protected]
62
CHƯƠNG 10. KIỂM ĐỊNH PHI THAM SỐ
1. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON VỀ
TRUNG VỊ CỦA MỘT TỔNG THỂ
B1: Thu thập thông tin mẫu
B2: Tính toán chênh lệch di giữa các giá trị quan sát được và giá trị
trung vị
B3: Lấy giá trị tuyệt đối của chênh lệch
B4: Xếp hạng tuyệt đối của chênh lệch
B5: Với các giá trị di dương thì vào cột R+, ngược lại thì đặt vào cột RB6: Tính giá trị thống kê W:
Hai bên: W = min[Σ(cột R+); Σ(cột R-)]
Bên phải W=Σ(cột R+)
Bên trái W=Σ(cột R-)
B7: Bác bỏ H0 khi W ≤ Wα (Ta chỉ xét cận trái) (P.286)
63
1. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON VỀ
TRUNG VỊ CỦA MỘT TỔNG THỂ
 Khi cỡ mẫu lớn (n > 20):
z
n(n  1)
4
n(n  1)(2n  1)
24
W
Quy tắc bác bỏ H0: (P.287)
Hai bên: z < -zα/2
Một bên: z < -zα
4/13/2015 6:45 AM
[email protected]
64
2. KIỂM ĐỊNH TỔNG HẠNG WILCOXON CHO
TRUNG BÌNH HAI MẪU ĐỘC LẬP
 Trường hợp n1 và n2 không bằng nhau chúng ta
quy ước n1 là cỡ mẫu nhỏ và n2 là cỡ mẫu lớn và
giá trị tổng hạng Wilcoxon T1 được tính là tổng tất
cả các hạng trong mẫu 1
o H0: M1 = M2
o Bác bỏ H0:
• Hai bên: T1 ≥ giới hạn trên hoặc T1 ≤ giới hạn dưới
• Bên phải: T1 ≥ giới hạn trên
• Bên trái: T1 ≤ giới hạn dưới (P.289)
4/13/2015 6:45 AM
[email protected]
65
3. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON
CHO MẪU PHỐI HỢP TỪNG CẶP

Tính khác biệt Di cho từng cặp quan sát

Xác định các giá trị tuyệt đối Di

Xác định cỡ mẫu thực tế

Tách riêng các hạng – và + theo dấu của Di gốc

Tính tổng hạng riêng cho các chênh lệch dương, đó chính
là trị thống kê kiểm định W=ΣRi(+)
o H0: MD = 0
o Bác bỏ H0:
• Hai bên: W ≥ giới hạn trên hoặc W ≤ giới hạn dưới
• Bên phải: W ≥ giới hạn trên
• Bên trái: W ≤ giới hạn dưới (P.292)
4/13/2015 6:45 AM
[email protected]
66
4. KIỂM ĐỊNH KRUSKAL WALLIS
Ri2
12
W
 3(n  1)

n(n  1)
ni
W  k21, (P.293)
4/13/2015 6:45 AM
[email protected]
67
5. KIỂM ĐỊNH CHI BÌNH PHƯƠNG
VỀ TÍNH ĐỘC LẬP
 Eij = [(Tổng hàng i) x (Tổng cột j)]/ Cỡ mẫu
(P.297)
 2  
 
2
tt
4/13/2015 6:45 AM
O
ij  Eij 
2
Eij
2
( r 1)( c 1);
[email protected]
68
6. KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ
SỰ PHÙ HỢP
2
(
O

E
)
i
tt2   i
Ei
 
2
tt
2
k 1;
(P.299)
4/13/2015 6:45 AM
[email protected]
69