BAI 6. KIEM DINH PHI THAM SO

Download Report

Transcript BAI 6. KIEM DINH PHI THAM SO

BÀI 6: KIỂM ĐỊNH PHI THAM SỐ
1
2
Kiểm định phi tham số (Nonparametric Tests)
được sử dụng trong những trường hợp dữ liệu
không có phân phối chuẩn, hoặc cho các mẫu nhỏ
có ít đối tượng.
Kiểm định phi tham số cũng được dùng cho các
dữ liệu định danh (nominal), dữ liệu thứ bậc
(ordinal) hoặc dữ liệu khoảng cách (interval)
không có phân phối chuẩn.
Nhược điểm của kiểm định phi tham số là khả
năng tìm ra được sự sai biệt kém, không mạnh
như các phép kiểm có tham số (T student, phân
tích phương sai…). Sau đây là các kiểm định phi
tham số được dùng
2
Bảng 1. So sánh kiểm định phi
tham số và kiểm định có tham số
KIỂM ĐỊNH
KIỂM ĐỊNH PHI THAM SỐ
KIỂM ĐỊNH THAM SỐ
Mẫu bắt cặp Kiểm định dấu (Sign
Phép kiểm T với
test) hoặc kiểm định
mẫu phối hợp từng
dấu và hạng Wilcoxon cặp (Paired(Wilcoxon test)
Samples t test)
3
Hai mẫu độc Kiểm định Mannlập
Whitney
Phép kiểm T với 2
mẫu độc lập
(IndependentSamples t test)
Lớn hơn 2
mẫu độc lập
Kiểm định KruskalWallis
ANOVA một chiều
Kiểm định
tương quan
Spearman
Pearman
1. Kiểm định dấu và hạng Wilcoxon
Kiểm định này sử dụng luôn các thông tin về độ lớn
của chênh lệch vì vậy nó mạnh hơn kiểm định dấu.
 Xếp thứ hạng theo giá trị tuyệt đối (không kể dấu)
từ nhỏ đến lớn (trong trường hợp có nhiều giá trị bằng
nhau thì hạng của chúng được tính bình quân)
 Tính tổng các hạng đối với chênh lệch (+)và chênh
lệch (-).
 W = Tổng hạng ứng chênh lệch dương (+)
n(n  1) 

 W
4 

Z
n(n+1)(2n+1)
24
4
1. Kiểm định dấu và hạng Wilcoxon
Ví dụ: Điều trị 10 bệnh nhân có ferritin máu cao, với lượng
ferritin máu trước và sau điều trị được ghi nhận như sau:
Thứ tự
Lượng ferritin máu (ng/ml)
Trước điều trị
5
Sau điều trị
1
1800
800
2
1200
500
3
1000
400
4
900
1000
5
800
950
6
700
450
7
600
400
8
500
200
9
550
550
10
400
100
2. Kiểm định Mann-Whitney
Được dùng để kiểm định các giả thiết về 2 mẫu
độc lập không có phân phối chuẩn.
Tính giá trị kiểm định bằng công nthức:
2
n 2 (n 2  1)
U  n1n 2 
  Ri
2
i  n1 1
Trong đó
n1:số đối tượng nhóm 1
n2: số đối tượng nhóm 2
Ri: hạng của các đối tượng ở nhóm 2
Z
6
n1n 2 

 U
2


n1n 2 (n1 +n 2 +1)
12
6
2. Kiểm định Mann-Whiney
Ví dụ: So sánh lượng ferritin máu giữa 2 nhóm bệnh nhân
có và không uống rượu.
Thứ tự
Lượng ferritin máu (ng/ml)
Không uống rượu
7
Có uống rượu
1
400
4500
2
360
1200
3
300
900
4
100
700
5
80
400
6
70
350
7
50
90
8
30
60
7
3. Kiểm định Kruskall- Wallis:
Tính giá trị kiểm định bằng công thức:
k
2
i
12
R
 
 3(n  1)

n(n  1) i1 n i
2
Trong đó
n:số đối tượng
ni: số đối tượng nhóm thứ i
Ri: tổng hạng của các đối tượng ở nhóm thứ i
Điều kiện bác bỏ giả thuyết Ho
 
2
8
2
k 1,
8
3. Kiểm định Kruskall- Wallis:
Sử dụng để kiểm định sự khác biệt về trung bình giữa ba (hoặc
nhiều hơn ba) nhóm không có phương sai tương đương nhau.
Ví dụ. So sánh lượng ferritin máu giữa 3 nhóm BN: (0): Không
uống rượu; (1) Có uống rượu và (2) BN viêm gan mãn.
Thứ tự
Lượng ferritin máu (ng/ml)
không uống rượu
9
có uống rượu
Bệnh viêm gan mãn
1
400
4500
2000
2
360
1200
1100
3
300
900
800
4
100
700
700
5
80
400
600
6
70
350
500
7
50
90
200
8
30
60
100
9
4. Kiểm định Chi - Square:
(Kiểm định giả thuyết về phân phối)
Tính giá trị kiểm định bằng công thức:
k
 Oi  Ei 
i 1
Ei
 
2
2
Trong đó
Oi: Tần số thực nghiệm nhóm thứ i
Ei: Tần số lý thuyết nhóm thứ i, Ei = n*pi
Điều kiện bác bỏ giả thuyết Ho
 
2
10
2
k 1,
10
4. Kiểm định Chi - Square:
Bài 9: Một công ty dự định đưa ra thị trường một loại
sản phẩm mới với 4 màu sắc khác nhau. Giám đốc công
ty muốn tìm hiểu thị hiếu của khách hàng về màu sắc của
sản phẩm. Một mẫu gồm 120 khách hàng được chọn ngẫu
nhiên, mỗi khách hàng được cho xem sản phẩm với các
màu sắc khác nhau và cho biết sở thích của mình đối với
các màu sắc sản phẩm. Kết quả được ghi nhận như sau:
Trắng
25
Xanh
27
Đỏ
16
Vàng
52
Ở mức ý nghĩa 5%, có thể kết luận rằng:
1. Sở thích của khách hàng đối với 4 màu sắc là như
nhau?
2. 50% khách hàng thích màu vàng, đối với các màu
11 còn lại sở thích là như nhau.
11
5. Kiểm định Chi – Square (tính độc lập):
Tính giá trị kiểm định bằng công thức:
r
c
  
2
O
 Eij 
ij
2
Eij
i 1 j1
Trong đó
Oij: Tần số thực nghiệm nhóm thứ i,j
Eij: Tần số lý thuyết nhóm thứ i,j
Eij 
R iC j
n
Ri: Tổng theo dòng; Cj: Tổng theo cột
Điều kiện bác bỏ giả thuyết Ho
12
 
2
2
(r 1)(c 1),
12
5. Kiểm định Chi – Square (tính độc lập):
Bài 18: Một cuộc điều tra xã hội được tiến hành ở các
thành phố lớn để tìm hiểu những vấn đề về giới tính. Kết
quả ghi nhận được như sau:
Trình độ học vấn
Tiểu học
Trung học
Cao đẳng, đại học
Sau đại học
Giới tính
Nam
Nữ
10
20
35
50
25
40
56
14
Với mức ý nghĩa 5%, có thể kết luận rằng trình độ học vấn
và giới tính độc lập với nhau hay không?
13
13