等级资料定义

Download Report

Transcript 等级资料定义

等级资料常用
检验方法
临床流行病学应用研究室
周罗晶
等级资料定义:
在医学资料中,特别是临床医学资料中,常
常遇到一些定性指标,如临床疗效的评价、疾病
的临床分期、症状严重程度的临床分级、中医诊
断的一些临床症状等,对这些指标常采用分成若
干等级然后分类计数的办法来解决它的量化问题,
这样的资料我们在统计学上称为有序变量
(ordered variable)或半定量资料,也称为等
级资料(ranked data)。
特点:观察结果具有等级差别。
等级资料划分的两种情况:
按性质划分:如药物疗效分为痊愈、显效、好转
、无效;麻醉效果分为Ⅰ、Ⅱ、Ⅲ、Ⅳ级等。
按数量分组:数据两端不能确切测定的计量资料
。如抗体滴度分为>1:20,1:20,1:40,1:80,<1:80;
年龄分为<10,10~, 20~,40~,≥60等。
?
等级资料的分析方法是否和
一般计数资料的检验方法相同呢?
等级资料的分析应该选用什么方法?
实例1
考察硝苯地平治疗老年性支气管炎的疗效,治疗
组60人,用硝苯地平治疗,对照组58人,常规治疗,两组
患者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较
组别
例数
治疗组
对照组
例 数
百分比(%)
无效
有效
显效
无效
有效
显效
60
6
19
35
10.00
31.67
58.33
58
14
20
24
24.14
34.48
41.38
1、建立数据库
 在变量窗口“variable view”中设定变量
 在数据窗口“data view”中录入数据
 使用“Weight Cases”过程权重记录
SPSS软件默认一行就是一条记录,而我们
是以频数格式录入数据,即相同的观测值只录
入一次,另加一个频数变量(count)用于记录
该数值共出现的次数。因此我们使用此过程:
2、卡方检验
分析结果:
Asymp. Sig.
Value
df
(2-sided)
Pearson Chi-Square
5.244
2
.073
Likelihood Ratio
5.346
2
.069
5.046
1
.025
Linear-by-Linear
Association
N of Valid Cases
118
结论:
两组疗效的构成百分比差异无统
计学意义。
两组的疗效无差别。(×)
注意:
一般的 χ2 检验不适用于有序
分类资料——“等级”、“程度”、
“优劣”的比较分析。因为检验只
利用了两组构成比提供的信息,损
失了有序指标包含的“等级”信息。
例如,假定两组的显效例数和有效例数互换,见表2。
表 2 治疗组与对照组疗效比较
组别
例数
治疗组
对照组
例 数
百分比(%)
无效
有效
显效
无效
有效
显效
60
6
35
19
10.00
58.33
31.67
58
14
24
20
24.14
41.38
34.48
显然,两组反映的信息是不同的,但由于两组的结构百分比无变化
(仅仅是位置不同),不改变检验结果。(χ2=5.224,P>0.05)
等级资料正确的统计分析方法:






非参数统计的秩和检验
Kendall 、spearman等级相关
CMH卡方检验
Ridit分析
线性趋势卡方检验
有序变量的Logistic回归分析
一、非参秩和检验
由于非参数检验法不考虑数据的分
布规律,检验不涉及总体参数,检验统
计量多是人们在总结经验的基础上创造
出来的,所以这类检验方法的特点是针
对性强。但是不同设计、不同目的所用
的非参数检验法是不同的。
 单向有序行列表
在表的两个方向上的分类中,一
个方向(横向)无顺序和等级概念,
另一个方向(纵向)是有顺序的分类,
称为单向有序行列表。
a. 两组独立样本等级资料比较的MannWhitney秩和检验
以表1为例。将无效、有效、显效三个疗效等级数量化,
数值用平均秩号,然后比较各组平均秩号的大小。
治疗组
对照组
合计
秩次范围 平均秩次
无效
6
14
20
1-20
10.5
有效
19
20
39
21-59
40
显效
35
24
59
60-118
89
合计
60
58
118
计算两组秩号并进行秩和检验
两组的平均秩号分别为:
治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6
对照组:R2=(14×10.5+20×40+24×89)/58=53.1
经秩和检验,u=2.169,P<0.05,两组疗效差异有
统计学意义,因为治疗组平均秩号大于对照组,所以治
疗组疗效好。
SPSS 窗 口 操 作 过 程 :




Analyze ——
Nonparametric Tests ——
2 independent Samples ——
Test variable List :result ——
Grouping variable :group ——
Define groups:group1:1;group2:2 ,——
Test Type :Mann-Whitney ——
OK
分析结果:
Ranks
Sum of
GROUP
N
Mean Rank
Ranks
RESULT
1
60
65.63
3938.00
2
58
53.16
3083.00
Total
118
μ=-2.169,P<0.05
结论:两组疗效差异有统计学意义,且治疗
组效果好于对照组。
Test Statistics
RESULT
Mann-Whitney U
1372.000
Wilcoxon W
3083.000
Z
-2.169
Asymp. Sig. (2-tailed)
.030
同样方法,对表2数据进行秩和检验,结果如下:
RESULT
GROUP
N
Mean Rank
Sum of
Ranks
1
60
61.57
3694.00
2
58
57.36
3327.00
Total
118
μ=0.731,P>0.05
结论:两组疗效差异没有统计学意义。
Test Statistics
RESULT
Mann-Whitney U
1616.000
Wilcoxon W
3327.000
Z
-.731
Asymp. Sig. (2-tailed)
.465
b. 两 组 配 对 样 本 等 级 资 料 比 较 的
Wilcoxon秩和检验
c. 多组等级资料比较的Kruskal-Wallis
秩和检验
该方法对K (K>2)组独立样本进行K个
总体分布函数相同假设的检验,是在
Wilcoxon秩和检验基础上扩展的方法,称
为K-W检验。
例2 对54例牙病患者的64颗患牙的根端形态不同分
为3种,X线片显示喇叭口状为A型,管壁平行状为B
型,管壁由聚状为C型
比较不同根端形态患牙的疗效有否差别。
表3
不同根端形态分型的疗效比较
根端形态
牙数
成功
进步
失败
A型
18
3
9
6
B型
24
10
10
4
C型
22
10
11
1
合计
64
23
30
11
SPSS软件操作步骤:
1、建立数据库
1.1定义变量 group: 1 A型 2 B型 3 C型
result: 1成功 2进步 3失败
count: 例数
1.2录入数据
1.3权重频数
2、分析:
Analyze ——

Nonparametric Tests ——

K independent Samples ——
Test variable List :result ——
Grouping variable :group ——
Define range:minimum:1;maximum:3——
Continue ——
Test Type :Kruskal-Wallis H——
OK
3、结果
Ranks
RESULT
GROUP
N
Mean Rank
1
18
40.92
2
24
30.88
3
22
27.39
Total
64
H =6.528,P =0.038
Test Statistics
RESULT
Chi-Square
6.528
df
2
Asymp. Sig.
.038
结论:按α=0.05的检验水平,三组间差异有统计学意义。
注意:
计算结果中显示的χ2值并不是
χ2检验,只是Kruskal-Wallis Test的
检验统计量H,此时近似χ2分布,所以
按χ2分布的近似值来确定概率,它的
自由度υ = 组数-1。
 双向有序资料行列表——Kendall等级相
关法和Spearman等级相关分析法
例3
某病病情与疗效的关系
表 4 某病病情与疗效的关系(1)
疗效
病
情
极重
重
中
轻
恶化
30
20
20
10
无效
20
30
10
20
有效
10
10
30
30
两表的区别仅在于病情“极重”组和
“中”组的数据进行了互换。
表 5 某病病情与疗效的关系(2)
疗效
病
情
极重
重
中
轻
恶化
20
20
30
10
无效
10
30
20
20
有效
30
10
10
30
分别对上面两个表格数据进行 χ2 检验和
多组等级资料比较的Kruskal-Wallis秩和检
验。
对于表4:
χ2=40.000,P=0.000
H=24.896 ,P=0.000
对于表5:
χ2=40.000,P=0.000
H=24.896 ,P=0.000
两种检验都
无法表达表4
和表5的差别,
直观地看,
表4的资料显
示病情越轻
者疗效越好,
表5却未显示
这种趋势来。
此时我们选用Kendall和Spearman等级相
关分析法分别计算相关系数t和rs。
计算公式:
2S
t=
2  m  1
n 

 m 
n:总例数
m:最长对角线上的格子数
S:专用统计量
Kendall等级相关意义:当一个变量的等级为标准时,
另一个变量的等级与它不一致的情况(可分析两个以
及多个变量间的等级相关性)。
Spearman等级相关公式:
rs = 1-
6 d 2
n(n  1)
n:总例数
d:每一对值的等级差
Spearman等级相关意义:两个变量之
间的等级相关性。
(只适用于分析两个变量关系)
SPSS操作演示:
1.建立数据库
2.录入数据
3.权重频数
4.界面操作(以表4为例):
Analyze —— Correlate —— Bivariate
——Row(s):疗效 —— Column(s) :病
情 —— Statistics —— Kendall’s tau-b ,
Spearman—— OK
表4检验结果:
病情
Kendall's
tau_b
疗效
病情
Spearman's
rho
疗效
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
病情
疗效
1.000
.275
.
240
.000
240
.275
1.000
.000
240
.
240
1.000
.320
.
240
.000
240
.320
1.000
.000
240
.
240
表5检验结果:
病情
Kendall's
tau_b
疗效
病情
Spearman's
rho
疗效
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
Correlation
Coefficient
Sig. (2-tailed)
N
病情
疗效
1.000
.039
.
240
.480
240
.039
1.000
.480
240
.
240
1.000
.046
.
240
.482
240
.046
1.000
.482
240
.
240
 重复测量等级资料时间趋势检验 —
—CMH卡方检验
实例4 在某药治疗闭塞性动脉炎的临床试验中,治疗26例下肢溃
疡的病人溃疡改善情况见表6,评价该药有无促进溃疡愈合的作用。
表 6 溃疡改善程度(例数)
溃疡改善程度
第1周
第2周
第3周
溃疡面积不变
14
12
7
溃疡面积缩小≤20%
2
4
5
溃疡面积缩小 20%~50%
8
7
6
溃疡面积缩小≥50%
2
3
6
完全治愈
0
0
2
合计
26
26
26
本例特点: 1.个体的重复测量
2. 溃 疡 随 时
间的变化趋势
CMH卡方检验, Cochran-Mantel-
Hansel检验简称 ,包括非零相关、行平分差
和一般联系3种检验方法。对于这种重复测量
的等级变量,行列变量均为等级变量,应该作非
零相关检验。本方法仅限于检验线性趋势。
计算公式:
Qcs =
2


(n  1)  ci  u c ai  u a nij 
 i 1 j 1

c


 r

2
2
 c j  u c  ni    ai  u a  n j 
 i 1
  j 1

r
c
结果:χ2 = 4.7424,P = 0.0294
结论:溃疡改善程度随着治疗时间延长有变好的趋势。
多组等级资料的两两比较——Ridit分析
Ridit是“Relative to an
identified distribution integral
transformation”的首个字母缩写,意指对于
一个确认的分布作积分变换。
Ridit分析是一种关于等级资料进行
对比组与标准组比较的假设检验方法,其基本
思想是先确定一个标准组作为特定总体,求得
各等级的Ridit值,标准组平均Ridit值理论上
可以证明等于0.5,其他各组与标准组比较,
看其可信区间是否与0.5重叠,来判断组间的
统计学显著性,最后得出专业解释。
Ridit分析适用范围:
1.两组或两组以上等级资料
的比较和分析
2.两端数据不确切的计量资
料分组转换成计数资料的分析,如
血清滴度等。
特点:简便、直观、适用性广。
Ridit分析关键步骤:
一、确定标准组:
1.利用已知的标准分布(传统方法)
作为标准组。如某药物大规模的观察研究结
果,计算不同疗效的R值。
2.以例数最多的一组作为标准组。
3.各组的例数都差不多时,可把各
组观察结果合并起来作为标准组。
Ridit分析关键步骤:
二、计算标准组的Ridit值:
三、利用对照组计算各组的平均R值
四、置信区间判断
五、统计检验:
u检验、t检验、χ2检验
Ridit分析(实例5 ):
表7 三种方剂对某妇科病患者治疗效果比较
无效
好转
显效
控制
合计
糖衣
48
184
77
52
361
黄体酮
5
16
18
19
58
复方
13
36
11
17
77
合计
66
126
106
88
496
PEM3.1操作过程:
1.建立数据库
1.1 定义变量名
1.2 录入数据
2.界面操作:
其他统计分析 —— Ridit分析 ——
分析目的:多个样本比较 —— 分组变
量:分组 —— 类别变量 :类别 —— 频
数变量:例数 —— 确定
主要结果:
检验水准: α=0.05
选用同一参照组 (各样本合计为参照组)
样本数
k=3
等 级 数: 4
主要结果:
参照组各等级 R 值的计算
等级
频数
(2)/2
(1)
(2)
(3)
(2)累
(3)+(4)
R=(5)/N
计
移下一行
(6)
(4)
(5)
1
66
33
0
33
0.0665
2
236
118
66
184
0.3710
3
106
53
302
355
0.7157
4
88
44
408
452
0.9113
主要结果:
各样本平均R
───────────────────
样本名
频数合计
平均R
───────────────────
第1组
361
0.4819
第2组
58
0.6287
第3组
77
0.4881
───────────────────
主要结果:
卡方检验:
卡方值
= 13.0887
自由度 v= 3
概
率 P= 0.0044
结论:三种药物对妇科病的疗效差异有统计
学意义。
三者之间究竟有何种差异呢?
1.标准组平均R值 : = 248.00/496 =0.5
2.标准组方差、标准差的计算:
 fR 

2
S 
2
R
 fR
2
n 1
n
SR 
S
2
R
标准组方差、标准差的计算
标准组
无效
好转
显效
控制
合计
f
66
236
106
88
496
R
0.0665
0.3710
0.7157
0.9113
fR
4.39
87.56
75.86
80.19
248.00
fR2
0.29
32.48
54.30
73.08
160.15
方差 = [160.16 – 248^2/496]/(496-1)= 0.0730
标准差 = 0.2702
对比组平均R值
无效
好转
显效
控制
合计
糖衣
48
184
77
52
361
黄体酮
5
16
18
19
58
fR

R
n
复方
13
36
11
17
77
合计
66
126
106
88
496
48  0.0665  184  0.3710  77  0.7157  52  0.9113
糖衣组=
48  184  77  52
= 0.4819
黄体酮组 = 0.6287
复方组 = 0.4881
注意:
如果等级是由劣到优的顺序排
列,则平均 Ridit值越大越好,否则越
小越好。但我们不能单纯以各组平均
Ridit值的大小来判断各组的差异,因
为Ridit值是一个点估计,没有考虑抽
样误差,而样本正好等于总体指标的可
能性很小,因此应该结合可信区间或统
计检验方法综合判断。
计算对比组可信区间
对比组标准误:
对比组95%可信区间:
SR 
SR
n
R  2S R
计算对比组95%CI并进行判断
糖衣组95%CI:0.4534~0.5103
黄体酮组95%CI:0.5578~0.6997
复方组95%CI:0.4265~0.5497
判断:通过可信区间比较对比组与标准组的差
别。看对比组95%可信区间是否包括标准组
Ridit值(0.5),不包括,则P<0.05,差别有
统计学意义。否则反之。
对比组95%CI图
Ridit值
1.0
0.5
0.0
糖
衣
黄
体
酮
复
方
标准组
图1 不同方剂对妇科病疗效比较
多个对比组的两两比较
u
R1  R2
S S
2
R1
2
R2

R1  R2
n1  n 2
S
n1 n 2
2
R
U 1, 2 
R1  R2
1
1

12N1 12N 2
统计界限:u<1.96,P>0.05,差异无统计意义
u≥1.96,P≤0.05,差异有统计意义
u≥2.58,P≤0.01,差异有统计意义
u 1,2 =3.84, u 1,3=0.18, u 2,3 =2.99
小
结