Transcript 等级资料定义
等级资料常用 检验方法 临床流行病学应用研究室 周罗晶 等级资料定义: 在医学资料中,特别是临床医学资料中,常 常遇到一些定性指标,如临床疗效的评价、疾病 的临床分期、症状严重程度的临床分级、中医诊 断的一些临床症状等,对这些指标常采用分成若 干等级然后分类计数的办法来解决它的量化问题, 这样的资料我们在统计学上称为有序变量 (ordered variable)或半定量资料,也称为等 级资料(ranked data)。 特点:观察结果具有等级差别。 等级资料划分的两种情况: 按性质划分:如药物疗效分为痊愈、显效、好转 、无效;麻醉效果分为Ⅰ、Ⅱ、Ⅲ、Ⅳ级等。 按数量分组:数据两端不能确切测定的计量资料 。如抗体滴度分为>1:20,1:20,1:40,1:80,<1:80; 年龄分为<10,10~, 20~,40~,≥60等。 ? 等级资料的分析方法是否和 一般计数资料的检验方法相同呢? 等级资料的分析应该选用什么方法? 实例1 考察硝苯地平治疗老年性支气管炎的疗效,治疗 组60人,用硝苯地平治疗,对照组58人,常规治疗,两组 患者的性别、年龄、病程无显著性差异,治疗结果见表1。 表 1 治疗组与对照组疗效比较 组别 例数 治疗组 对照组 例 数 百分比(%) 无效 有效 显效 无效 有效 显效 60 6 19 35 10.00 31.67 58.33 58 14 20 24 24.14 34.48 41.38 1、建立数据库 在变量窗口“variable view”中设定变量 在数据窗口“data view”中录入数据 使用“Weight Cases”过程权重记录 SPSS软件默认一行就是一条记录,而我们 是以频数格式录入数据,即相同的观测值只录 入一次,另加一个频数变量(count)用于记录 该数值共出现的次数。因此我们使用此过程: 2、卡方检验 分析结果: Asymp. Sig. Value df (2-sided) Pearson Chi-Square 5.244 2 .073 Likelihood Ratio 5.346 2 .069 5.046 1 .025 Linear-by-Linear Association N of Valid Cases 118 结论: 两组疗效的构成百分比差异无统 计学意义。 两组的疗效无差别。(×) 注意: 一般的 χ2 检验不适用于有序 分类资料——“等级”、“程度”、 “优劣”的比较分析。因为检验只 利用了两组构成比提供的信息,损 失了有序指标包含的“等级”信息。 例如,假定两组的显效例数和有效例数互换,见表2。 表 2 治疗组与对照组疗效比较 组别 例数 治疗组 对照组 例 数 百分比(%) 无效 有效 显效 无效 有效 显效 60 6 35 19 10.00 58.33 31.67 58 14 24 20 24.14 41.38 34.48 显然,两组反映的信息是不同的,但由于两组的结构百分比无变化 (仅仅是位置不同),不改变检验结果。(χ2=5.224,P>0.05) 等级资料正确的统计分析方法: 非参数统计的秩和检验 Kendall 、spearman等级相关 CMH卡方检验 Ridit分析 线性趋势卡方检验 有序变量的Logistic回归分析 一、非参秩和检验 由于非参数检验法不考虑数据的分 布规律,检验不涉及总体参数,检验统 计量多是人们在总结经验的基础上创造 出来的,所以这类检验方法的特点是针 对性强。但是不同设计、不同目的所用 的非参数检验法是不同的。 单向有序行列表 在表的两个方向上的分类中,一 个方向(横向)无顺序和等级概念, 另一个方向(纵向)是有顺序的分类, 称为单向有序行列表。 a. 两组独立样本等级资料比较的MannWhitney秩和检验 以表1为例。将无效、有效、显效三个疗效等级数量化, 数值用平均秩号,然后比较各组平均秩号的大小。 治疗组 对照组 合计 秩次范围 平均秩次 无效 6 14 20 1-20 10.5 有效 19 20 39 21-59 40 显效 35 24 59 60-118 89 合计 60 58 118 计算两组秩号并进行秩和检验 两组的平均秩号分别为: 治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6 对照组:R2=(14×10.5+20×40+24×89)/58=53.1 经秩和检验,u=2.169,P<0.05,两组疗效差异有 统计学意义,因为治疗组平均秩号大于对照组,所以治 疗组疗效好。 SPSS 窗 口 操 作 过 程 : Analyze —— Nonparametric Tests —— 2 independent Samples —— Test variable List :result —— Grouping variable :group —— Define groups:group1:1;group2:2 ,—— Test Type :Mann-Whitney —— OK 分析结果: Ranks Sum of GROUP N Mean Rank Ranks RESULT 1 60 65.63 3938.00 2 58 53.16 3083.00 Total 118 μ=-2.169,P<0.05 结论:两组疗效差异有统计学意义,且治疗 组效果好于对照组。 Test Statistics RESULT Mann-Whitney U 1372.000 Wilcoxon W 3083.000 Z -2.169 Asymp. Sig. (2-tailed) .030 同样方法,对表2数据进行秩和检验,结果如下: RESULT GROUP N Mean Rank Sum of Ranks 1 60 61.57 3694.00 2 58 57.36 3327.00 Total 118 μ=0.731,P>0.05 结论:两组疗效差异没有统计学意义。 Test Statistics RESULT Mann-Whitney U 1616.000 Wilcoxon W 3327.000 Z -.731 Asymp. Sig. (2-tailed) .465 b. 两 组 配 对 样 本 等 级 资 料 比 较 的 Wilcoxon秩和检验 c. 多组等级资料比较的Kruskal-Wallis 秩和检验 该方法对K (K>2)组独立样本进行K个 总体分布函数相同假设的检验,是在 Wilcoxon秩和检验基础上扩展的方法,称 为K-W检验。 例2 对54例牙病患者的64颗患牙的根端形态不同分 为3种,X线片显示喇叭口状为A型,管壁平行状为B 型,管壁由聚状为C型 比较不同根端形态患牙的疗效有否差别。 表3 不同根端形态分型的疗效比较 根端形态 牙数 成功 进步 失败 A型 18 3 9 6 B型 24 10 10 4 C型 22 10 11 1 合计 64 23 30 11 SPSS软件操作步骤: 1、建立数据库 1.1定义变量 group: 1 A型 2 B型 3 C型 result: 1成功 2进步 3失败 count: 例数 1.2录入数据 1.3权重频数 2、分析: Analyze —— Nonparametric Tests —— K independent Samples —— Test variable List :result —— Grouping variable :group —— Define range:minimum:1;maximum:3—— Continue —— Test Type :Kruskal-Wallis H—— OK 3、结果 Ranks RESULT GROUP N Mean Rank 1 18 40.92 2 24 30.88 3 22 27.39 Total 64 H =6.528,P =0.038 Test Statistics RESULT Chi-Square 6.528 df 2 Asymp. Sig. .038 结论:按α=0.05的检验水平,三组间差异有统计学意义。 注意: 计算结果中显示的χ2值并不是 χ2检验,只是Kruskal-Wallis Test的 检验统计量H,此时近似χ2分布,所以 按χ2分布的近似值来确定概率,它的 自由度υ = 组数-1。 双向有序资料行列表——Kendall等级相 关法和Spearman等级相关分析法 例3 某病病情与疗效的关系 表 4 某病病情与疗效的关系(1) 疗效 病 情 极重 重 中 轻 恶化 30 20 20 10 无效 20 30 10 20 有效 10 10 30 30 两表的区别仅在于病情“极重”组和 “中”组的数据进行了互换。 表 5 某病病情与疗效的关系(2) 疗效 病 情 极重 重 中 轻 恶化 20 20 30 10 无效 10 30 20 20 有效 30 10 10 30 分别对上面两个表格数据进行 χ2 检验和 多组等级资料比较的Kruskal-Wallis秩和检 验。 对于表4: χ2=40.000,P=0.000 H=24.896 ,P=0.000 对于表5: χ2=40.000,P=0.000 H=24.896 ,P=0.000 两种检验都 无法表达表4 和表5的差别, 直观地看, 表4的资料显 示病情越轻 者疗效越好, 表5却未显示 这种趋势来。 此时我们选用Kendall和Spearman等级相 关分析法分别计算相关系数t和rs。 计算公式: 2S t= 2 m 1 n m n:总例数 m:最长对角线上的格子数 S:专用统计量 Kendall等级相关意义:当一个变量的等级为标准时, 另一个变量的等级与它不一致的情况(可分析两个以 及多个变量间的等级相关性)。 Spearman等级相关公式: rs = 1- 6 d 2 n(n 1) n:总例数 d:每一对值的等级差 Spearman等级相关意义:两个变量之 间的等级相关性。 (只适用于分析两个变量关系) SPSS操作演示: 1.建立数据库 2.录入数据 3.权重频数 4.界面操作(以表4为例): Analyze —— Correlate —— Bivariate ——Row(s):疗效 —— Column(s) :病 情 —— Statistics —— Kendall’s tau-b , Spearman—— OK 表4检验结果: 病情 Kendall's tau_b 疗效 病情 Spearman's rho 疗效 Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N 病情 疗效 1.000 .275 . 240 .000 240 .275 1.000 .000 240 . 240 1.000 .320 . 240 .000 240 .320 1.000 .000 240 . 240 表5检验结果: 病情 Kendall's tau_b 疗效 病情 Spearman's rho 疗效 Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N 病情 疗效 1.000 .039 . 240 .480 240 .039 1.000 .480 240 . 240 1.000 .046 . 240 .482 240 .046 1.000 .482 240 . 240 重复测量等级资料时间趋势检验 — —CMH卡方检验 实例4 在某药治疗闭塞性动脉炎的临床试验中,治疗26例下肢溃 疡的病人溃疡改善情况见表6,评价该药有无促进溃疡愈合的作用。 表 6 溃疡改善程度(例数) 溃疡改善程度 第1周 第2周 第3周 溃疡面积不变 14 12 7 溃疡面积缩小≤20% 2 4 5 溃疡面积缩小 20%~50% 8 7 6 溃疡面积缩小≥50% 2 3 6 完全治愈 0 0 2 合计 26 26 26 本例特点: 1.个体的重复测量 2. 溃 疡 随 时 间的变化趋势 CMH卡方检验, Cochran-Mantel- Hansel检验简称 ,包括非零相关、行平分差 和一般联系3种检验方法。对于这种重复测量 的等级变量,行列变量均为等级变量,应该作非 零相关检验。本方法仅限于检验线性趋势。 计算公式: Qcs = 2 (n 1) ci u c ai u a nij i 1 j 1 c r 2 2 c j u c ni ai u a n j i 1 j 1 r c 结果:χ2 = 4.7424,P = 0.0294 结论:溃疡改善程度随着治疗时间延长有变好的趋势。 多组等级资料的两两比较——Ridit分析 Ridit是“Relative to an identified distribution integral transformation”的首个字母缩写,意指对于 一个确认的分布作积分变换。 Ridit分析是一种关于等级资料进行 对比组与标准组比较的假设检验方法,其基本 思想是先确定一个标准组作为特定总体,求得 各等级的Ridit值,标准组平均Ridit值理论上 可以证明等于0.5,其他各组与标准组比较, 看其可信区间是否与0.5重叠,来判断组间的 统计学显著性,最后得出专业解释。 Ridit分析适用范围: 1.两组或两组以上等级资料 的比较和分析 2.两端数据不确切的计量资 料分组转换成计数资料的分析,如 血清滴度等。 特点:简便、直观、适用性广。 Ridit分析关键步骤: 一、确定标准组: 1.利用已知的标准分布(传统方法) 作为标准组。如某药物大规模的观察研究结 果,计算不同疗效的R值。 2.以例数最多的一组作为标准组。 3.各组的例数都差不多时,可把各 组观察结果合并起来作为标准组。 Ridit分析关键步骤: 二、计算标准组的Ridit值: 三、利用对照组计算各组的平均R值 四、置信区间判断 五、统计检验: u检验、t检验、χ2检验 Ridit分析(实例5 ): 表7 三种方剂对某妇科病患者治疗效果比较 无效 好转 显效 控制 合计 糖衣 48 184 77 52 361 黄体酮 5 16 18 19 58 复方 13 36 11 17 77 合计 66 126 106 88 496 PEM3.1操作过程: 1.建立数据库 1.1 定义变量名 1.2 录入数据 2.界面操作: 其他统计分析 —— Ridit分析 —— 分析目的:多个样本比较 —— 分组变 量:分组 —— 类别变量 :类别 —— 频 数变量:例数 —— 确定 主要结果: 检验水准: α=0.05 选用同一参照组 (各样本合计为参照组) 样本数 k=3 等 级 数: 4 主要结果: 参照组各等级 R 值的计算 等级 频数 (2)/2 (1) (2) (3) (2)累 (3)+(4) R=(5)/N 计 移下一行 (6) (4) (5) 1 66 33 0 33 0.0665 2 236 118 66 184 0.3710 3 106 53 302 355 0.7157 4 88 44 408 452 0.9113 主要结果: 各样本平均R ─────────────────── 样本名 频数合计 平均R ─────────────────── 第1组 361 0.4819 第2组 58 0.6287 第3组 77 0.4881 ─────────────────── 主要结果: 卡方检验: 卡方值 = 13.0887 自由度 v= 3 概 率 P= 0.0044 结论:三种药物对妇科病的疗效差异有统计 学意义。 三者之间究竟有何种差异呢? 1.标准组平均R值 : = 248.00/496 =0.5 2.标准组方差、标准差的计算: fR 2 S 2 R fR 2 n 1 n SR S 2 R 标准组方差、标准差的计算 标准组 无效 好转 显效 控制 合计 f 66 236 106 88 496 R 0.0665 0.3710 0.7157 0.9113 fR 4.39 87.56 75.86 80.19 248.00 fR2 0.29 32.48 54.30 73.08 160.15 方差 = [160.16 – 248^2/496]/(496-1)= 0.0730 标准差 = 0.2702 对比组平均R值 无效 好转 显效 控制 合计 糖衣 48 184 77 52 361 黄体酮 5 16 18 19 58 fR R n 复方 13 36 11 17 77 合计 66 126 106 88 496 48 0.0665 184 0.3710 77 0.7157 52 0.9113 糖衣组= 48 184 77 52 = 0.4819 黄体酮组 = 0.6287 复方组 = 0.4881 注意: 如果等级是由劣到优的顺序排 列,则平均 Ridit值越大越好,否则越 小越好。但我们不能单纯以各组平均 Ridit值的大小来判断各组的差异,因 为Ridit值是一个点估计,没有考虑抽 样误差,而样本正好等于总体指标的可 能性很小,因此应该结合可信区间或统 计检验方法综合判断。 计算对比组可信区间 对比组标准误: 对比组95%可信区间: SR SR n R 2S R 计算对比组95%CI并进行判断 糖衣组95%CI:0.4534~0.5103 黄体酮组95%CI:0.5578~0.6997 复方组95%CI:0.4265~0.5497 判断:通过可信区间比较对比组与标准组的差 别。看对比组95%可信区间是否包括标准组 Ridit值(0.5),不包括,则P<0.05,差别有 统计学意义。否则反之。 对比组95%CI图 Ridit值 1.0 0.5 0.0 糖 衣 黄 体 酮 复 方 标准组 图1 不同方剂对妇科病疗效比较 多个对比组的两两比较 u R1 R2 S S 2 R1 2 R2 R1 R2 n1 n 2 S n1 n 2 2 R U 1, 2 R1 R2 1 1 12N1 12N 2 统计界限:u<1.96,P>0.05,差异无统计意义 u≥1.96,P≤0.05,差异有统计意义 u≥2.58,P≤0.01,差异有统计意义 u 1,2 =3.84, u 1,3=0.18, u 2,3 =2.99 小 结