PPT - Empower Stats

Download Report

Transcript PPT - Empower Stats

医学论文写作系列讲座 I
数据统计分析思路
第二部分:回归分析基础
哈佛大学医学院: 陈常中
2012年11月
[email protected]
[email protected]
回归方程 与
t检验 / 方差分析 /卡方检验等
原来你也能做我的工作,不
会抢我的饭碗吧?哈哈!
Yi = β0 + β1 * Xi + ei
β0
ei
X=0
β1
ei
β0 + β1
X=1
?β1= 0
X = 0,1
Y = β 0 + β1 * X
X=0,
Y = β0
X=1,
Y = β0 + β1
X = 0,1,2
I:Y = β0 + β1 * X
X=0, Y = β0
X=1, Y = β0 + β1
X=2, Y = β0 + β1*2
II:Y = β0 + β1 * (X=1) + β2 * (X=2)
X=0, Y = β0
X=1, Y = β0 + β1
X=2, Y = β0 + β2
Y5 = β0 + β1*(X6=1) + β2*(X6=2)
统计量
β(95% CI ) p 值
0 (A)
140 (35%)
0
1 (B)
140 (35%)
2.50 ( 0.07, 4.92) 0.044
2 (C)
120 (30%)
5.26 ( 2.74, 7.79) <0.001
X6
Y5 = β0 + β1*X6
X6
0.95 + 0.81
2.63 ( 1.37, 3.89) <0.001
文献中的回归分析应用
广义线性回归方程
f(Y) = β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ ……
Y:收缩压值? f(y)=Y
Y: 是否高血压?f(y)=logit(y)
三组(X=0、1、2)率的比较
Y=0
Y=1
合计
率(p)
比值
X=0, n00
n01
N0
n01/N0 n01/n00
X=1, n10
n11
N1
n11/N1 n11/n10
X=2, n20
n21
N2
n21/N2 n21/n20
率与比值
率:
p = N(y=1) / N(total)
比值: odd = N(y=1) / N(y=0)
odd = p / (1-p)
logit(Y) = log( p / (1-p) )
两组比值比: Odds ratio (OR)
=( P1/(1-P1) ) / ( P0/(1-P0 ) )
0-1
0-∞
三组(X=0、1、2)率的比较
log(P/(1-P)) = β0 + β1*(X=1) + β2*(X=2)
X=0, log(P0/(1-P0)) = β0
X=1, log(P1/(1-P1)) = β0 + β1
X=2, log(P2/(1-P2)) = β0 + β2
log( P1/(1-P1) ) - log( P0/(1-P0) ) = β1
log( ( P1/(1-P1) ) / ( P0/(1-P0) ) ) = β1
OR(X=1 vs.
β1
=
e
x=0)
OR(X=2 vs. x=0) = e β2
文献中的回归分析应用
练习
读入 regdd.xls
1. 用单因素分析模块分析X6 与Y5 关系
2. 将X6转换成连续性变量X6.CONT分析其余
Y5 的关系
3. 将Y5转换成2分类变量Y5.P80,取最高的
20%为1,下面的80%为0。分析X6、
X6.CONT 与Y5.P80的关系