生物统计学介绍

Download Report

Transcript 生物统计学介绍

生物统计学
Biostatistics
第十章 一元回归及简单相
关分析
Simple Regression & Correlation
2013.11
§10.1 基本概念
相关(correlation)
 回归(regression)

因变量(dependent
两个随机变量X和Y之间
变量X和随机变量Y之间
variable)
自变量(independent
variable)
学习小组任务
 请说明回归与相关的不同之处,并举例
说明现实生活或实验工作中的相关或回
归。
 尝试讲解p198 10.1例题 。
 尝试讲解p216 概率对数变换及10.12例
题。
比如…
 分析年龄、身高、体重、血压与肺活量之间
的关系
 林业司法鉴定工作中的运用
 紫外诱变酵母菌中照射剂量与细胞存活率的
关系
 分析男女生性别比与学习成绩的关系
 标准曲线的制作
 红脚隼翼展、体长、体重和年龄之间的关系
 云南省降雨量与日期的关系
 ……
回归与相关的异同之处
 回归与相关既有联系又有区别
http://tj.100xuexi.com/view/specdata/20100206/D29FEF68-92C1-4EA2-B6713C02C0C0F7B5.html
1.意义:相关反映两变量的相互关系,两个变量中任何一个
变化都会引起另一个的变化,是双向的关系。回归是反映两
变量的依存关系,一个变量的改变会引起另一个变量的变化,
是单向的关系。
2.应用:研究两变量相互关系用相关分析;研究两变量的依
存关系用回归分析。
3.研究性质:相关是对两变量间关系进行描述,看两变量是
否有关,是否密切,关系的性质是正相关还是负相关。回归
是对两变量做定量描述,研究两变量数量关系,已知一个变
量值可以预测出另一个变量值,可得到定量结果。
4.相关系数r与回归系数b:r的绝对值越大,散点图中的点越
趋向于一条直线,表明两变量的关系越密切,相关程度越高。
b的绝对值越大,回归直线越陡,说明当X变化一个单位时,
Y的平均变化就越大。
http://hi.baidu.com/healthstat/item/e568c30a6ae6363ff2eafc54
相关和回归的区别主要就在于这里。比如身高和体重,
如果我没有主次之分,就是想看看他们的关系有多强,
那就是相关。如果我想看体重是怎么随着身高的变化
而变化的,那就有了主次之分,主要的是想看体重的
变化,那么体重是怎么变化的呢,是随着身高的变化
而变化。这时候就应该用回归。
 对于两个或多个变量,到底该用回归还是相关,不在
于你的变量是什么,也不在于你的变量的实际意义是
什么,更重要的在于你的研究目的是什么。

http://zhidao.baidu.com/question/17893213.html
(一)函数关系。它反映着现象之间存在着严密的依存
关系,在这种关系中,对于某一变量的一个数值,
都有另一变量的确定的值与之对立,如:S=πR2圆
的面积S与半径R是函数关系,R值发生变化,则有
确定的S值与之对应。
(二)相关关系。它是指现象之间确实存在的,但关系
值不固定的相互依存关系。即对于某一变量的每一
个数值,另一变量有若干个数值与之相适应。如:
身高1.75米的人可以表现为许多不同的体重。
http://el.uoh.edu.cn/wljxpt/kcFrame.action?kcdm=1801110001&yhb_id=&kc
lmb_id=9&kclmszb_id=4837
§10.2 一元回归方程
散
点
图
实验重复的重要
一元正态线性回归模型
Y的条件
平均数
直线的截距
斜率
一元正态线性回归模型
(simple normal linear regression model)
参数α和β的估计
最小二乘法(method of least square)
β的最小二乘估计
α的最小二乘估计
学习小组任务
 举例说明现实生活或实验工作中的相关
或回归。
 自学并讲解p198 10.1例题 。
 自学并讲解p216 概率对数变换及10.12
例题 。
回归方程的计算

上图中R和R Square分别是相关系数和决定系数,
ANOVA为方差分析,结果说明两变量间是极显著的
回归关系

此图中Constant是截距(582.185),斜率为21.712,
因此回归方程为Y=21.712X+582.185,从t检验结果
来看,两变量间是极显著的回归关系。
§10.3 一元线性回归的检验
b和a的显著性检验
1. b的显著性检验
Similar to One Sample T-test
由10.17,10.18公式得:
2. a的显著性检验
10.16, 10.18, 10.20 公式得:
类似成组数据t检验
首先要做方差齐性检验
合并方差
由10.16公式得:
10.3.6 一元线性回归分析的意义
 预报
由一个变量去预报另一个变量。分为点预报和
区间预报。
由X预报Y是不能随意超出计算回归方程时所研
究的范围的。
§10.4 一元非线性回归
变换(transform)
对数变换
学习小组任务
 举例说明现实生活或实验工作中的相关
或回归。
 自学并讲解p198 10.1例题 。
 自学并讲解p216 概率对数变换及10.12
例题 。
概率对数坐标变换
正态分布累计分布曲线
P344 附表11
SPSS中的曲线拟合及相关检验方法
 有时候两变量间并不是直线线性关系,而是
曲线回归。
 理论课本上p212-217介绍的数据变换方法可
以使曲线回归转变为线性回归。
 除此之外,SPSS还提供了一些处理曲线回归
的方法,其中简单易行的是曲线拟合。
体长和体重分别为自变量和因变量
此表中首先是决定系数R Square,然后是方差分析检验,结果在Sig.列,
最后是截距Constant和斜率(回归系数)b1、b2、b3。
决定系数最高的是S模型(0.989),说明用S形曲线方程拟合该数据最
优,所有模型的显著性均为极显著回归,根据上表中截距和斜率,
根据下表中各模型方程(表中b0为截距),可以给出拟合该数据的
最佳回归方程为y=e(5.392-382.771)/x。
§10.5 相关
相关系数(correlation
回归系数(regression
coefficient)
coefficient )
相关系数的性质
相关系数的计算
只是存在相
关,需要检
验显著性。

结果中第一个表是描述性统计,第二个表中0.776为火柴和蚊香
间相关系数,显著性为0.002<0.01,因此是极显著相关关系。
相关系数检验
p345
p346
相关系数与回归系数的关系
相关指数(决定系数)R2
 曲线拟合可以用相
关指数(决定系数)
140
衡量,即复相关系
120
数的平方。
100
80
 R260越大,曲线拟合
0
1
2
越好
y = 10.063x + 85.579
R2 = 0.9992
3
4
5
6
学习小组任务
 举例说明现实生活或实验工作中的相关
或回归。
 自学并讲解p198 10.1例题 。
 自学并讲解p216 概率对数变换及10.12
例题 。
作业
 P236
10.10
编码、列表,求回归方程和相关系数。
10.18
编码列表,只计算相关系数。
 请翻译以下术语/Try
to translate these terms
please:
回归、相关、相关系数、自变量。