统计学傻瓜指南! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM 翻译:acred(DXY) 定义 统计学是搜集、整理、 总结、分析数据以及 依据数据进行推断的科学 统计描述,包括搜集数据、 整理数据、总结数据、分析 数据以及将数据呈现出来 统计推断,包括进行推测、 假设检验、确定关系然后作 出预测 变量 定量的(Quantitative) 定性的(Qualitative) •离散的(Discrete) •有序的(Ordinal) •连续的(Continuous) •分类的(Categorical) 参数检验与非参数检验 • 参数检验:需要知道样本统计量的分布才 能作出决断 • 非参数检验:不需要知道样本统计量的分 布就可以作出决断.

Download Report

Transcript 统计学傻瓜指南! Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM 翻译:acred(DXY) 定义 统计学是搜集、整理、 总结、分析数据以及 依据数据进行推断的科学 统计描述,包括搜集数据、 整理数据、总结数据、分析 数据以及将数据呈现出来 统计推断,包括进行推测、 假设检验、确定关系然后作 出预测 变量 定量的(Quantitative) 定性的(Qualitative) •离散的(Discrete) •有序的(Ordinal) •连续的(Continuous) •分类的(Categorical) 参数检验与非参数检验 • 参数检验:需要知道样本统计量的分布才 能作出决断 • 非参数检验:不需要知道样本统计量的分 布就可以作出决断.

统计学傻瓜指南!
Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM
翻译:acred(DXY)
1
定义
统计学是搜集、整理、
总结、分析数据以及
依据数据进行推断的科学
统计描述,包括搜集数据、
整理数据、总结数据、分析
数据以及将数据呈现出来
2
统计推断,包括进行推测、
假设检验、确定关系然后作
出预测
变量
定量的(Quantitative)
3
定性的(Qualitative)
•离散的(Discrete)
•有序的(Ordinal)
•连续的(Continuous)
•分类的(Categorical)
参数检验与非参数检验
• 参数检验:需要知道样本统计量的分布才
能作出决断
• 非参数检验:不需要知道样本统计量的分
布就可以作出决断
4
t-检验
• 在样本中比较连续变量的平均数,以检验
两个均值之间的差异是否大于能被机遇所
解释的差异
均值有差异,概率是多少?
5
应用条件
• 观测值(变量)相互独立
• 从正态分布的总体中抽样得到
• 样本量<30;如果>30,则使用正态曲线的z
检验(二项检验,binomial test)
6
t-检验的类型
• 单样本t检验:某个变量的样本均数与给定总体的
已知均数相比,其差异是否有意义
• 非配对或独立t检验:检验由两个独立样本估计的
总体均数之间的差异是否有意义(如男性群体和女
性群体)
• 配对t检验:检验由相关样本估计的总体均数之间
的差异是否有意义(如给同一组病人施加处理前后,
测量值的均数)
7
χ2检验
• 用来检验定性变量间关联的强度
• 用于分类数据
8
应用条件
• 数据应以频数的形式呈现
• 被观察的病例总数应大于20
• 任一类别或单元格内的理论频数应>5(当任
一单元格观测频数<5:yate’s 校正)或(当任一单元格理
论频数<5:fisher精确概率)
• 相比较的组别应大致相似
9
相关与回归
• 研究两个或两个以上变量之间关联的强度
以及函数关系的方法
10
相关
• 指明变量间关联的强度
11
r=+1
r=-1
r=0
曲线
回归
• 揭示一个因变量与一个或多个自变量间数
学关系的方法
• 简单线性回归和多重回归适用于连续变量
如血压、体重
• Logistic回归适用于二值响应,如生/死
12
测量值
• 若为参数
• Pearson相关系数
 连续变量
 线性关系
• 若为非参数
• Spearman等级相关
 两个均为连续变量
• Kendall等级相关 (Kendall’s τ)
 两个均为有序变量或一个有序另一个连续
13
方差分析(ANOVA)
• 用来揭示作用于一个因变量的几个分类自
变量(称为因素)的主效应和交互效应
14
方差分析的类型
• 单因素方差分析(One-way ANOVA):检验
一个因变量在一个分类自变量两组、三组
或多组类别间的差异
15
• 两因素方差分析(Two-way ANOVA):分析
一个因变量在两个自变量所形成的组间的
差异,其中一个自变量可看作处理变量
• 多因素方差分析*(n-way ANOVA):简言之,
多因素方差分析处理多个自变量。应当注
意,自变量的个数越多,可能的交互作用
的数量也随之增多
16
如何选择恰当的统计检验方法
• 变量类型
• 定量的(血压)
• 定性的(性别)
• 所研究问题的类型
• 关联
• 比较
• 危险因素
• 数据的构成
• 独立的
• 配对的
• 匹配的
17
所研究的中心问题
两变量(因变量,自变量)之间的联系
变量类型
因变量
自变量
分类
分类
分类
定量
18
定量
分类
定量
定量
检验方法
χ2
Logistic回归
2个结局:T检验
3个以上结局:方差分析
Spearman相关
线性回归
变量间比较(差异)
2组
自变量的个数
配对数据
>2组
定量
T检验
配对T检验
方差分析
有序
MannWhitney
Wilcoxon
Kruskalwallis
分类
χ2 *
McNemar
χ2
变量
*有1个单元格理论频数<5,用fisher精确概率法
有1个单元格观测频数<5,用yate’s校正
19
寻找危险因素
变量类型
检验方法
因变量
多个自变量
分类
分类
logistic回归
定量
分类
方差分析
定量
线性回归,
logistic回归
定量
20