Transcript 生物统计学介绍
生物统计学 Biostatistics 第十章 一元回归及简单相 关分析 Simple Regression & Correlation 2013.11 §10.1 基本概念 相关(correlation) 回归(regression) 因变量(dependent 两个随机变量X和Y之间 变量X和随机变量Y之间 variable) 自变量(independent variable) 学习小组任务 请说明回归与相关的不同之处,并举例 说明现实生活或实验工作中的相关或回 归。 尝试讲解p198 10.1例题 。 尝试讲解p216 概率对数变换及10.12例 题。 比如… 分析年龄、身高、体重、血压与肺活量之间 的关系 林业司法鉴定工作中的运用 紫外诱变酵母菌中照射剂量与细胞存活率的 关系 分析男女生性别比与学习成绩的关系 标准曲线的制作 红脚隼翼展、体长、体重和年龄之间的关系 云南省降雨量与日期的关系 …… 回归与相关的异同之处 回归与相关既有联系又有区别 http://tj.100xuexi.com/view/specdata/20100206/D29FEF68-92C1-4EA2-B6713C02C0C0F7B5.html 1.意义:相关反映两变量的相互关系,两个变量中任何一个 变化都会引起另一个的变化,是双向的关系。回归是反映两 变量的依存关系,一个变量的改变会引起另一个变量的变化, 是单向的关系。 2.应用:研究两变量相互关系用相关分析;研究两变量的依 存关系用回归分析。 3.研究性质:相关是对两变量间关系进行描述,看两变量是 否有关,是否密切,关系的性质是正相关还是负相关。回归 是对两变量做定量描述,研究两变量数量关系,已知一个变 量值可以预测出另一个变量值,可得到定量结果。 4.相关系数r与回归系数b:r的绝对值越大,散点图中的点越 趋向于一条直线,表明两变量的关系越密切,相关程度越高。 b的绝对值越大,回归直线越陡,说明当X变化一个单位时, Y的平均变化就越大。 http://hi.baidu.com/healthstat/item/e568c30a6ae6363ff2eafc54 相关和回归的区别主要就在于这里。比如身高和体重, 如果我没有主次之分,就是想看看他们的关系有多强, 那就是相关。如果我想看体重是怎么随着身高的变化 而变化的,那就有了主次之分,主要的是想看体重的 变化,那么体重是怎么变化的呢,是随着身高的变化 而变化。这时候就应该用回归。 对于两个或多个变量,到底该用回归还是相关,不在 于你的变量是什么,也不在于你的变量的实际意义是 什么,更重要的在于你的研究目的是什么。 http://zhidao.baidu.com/question/17893213.html (一)函数关系。它反映着现象之间存在着严密的依存 关系,在这种关系中,对于某一变量的一个数值, 都有另一变量的确定的值与之对立,如:S=πR2圆 的面积S与半径R是函数关系,R值发生变化,则有 确定的S值与之对应。 (二)相关关系。它是指现象之间确实存在的,但关系 值不固定的相互依存关系。即对于某一变量的每一 个数值,另一变量有若干个数值与之相适应。如: 身高1.75米的人可以表现为许多不同的体重。 http://el.uoh.edu.cn/wljxpt/kcFrame.action?kcdm=1801110001&yhb_id=&kc lmb_id=9&kclmszb_id=4837 §10.2 一元回归方程 散 点 图 实验重复的重要 一元正态线性回归模型 Y的条件 平均数 直线的截距 斜率 一元正态线性回归模型 (simple normal linear regression model) 参数α和β的估计 最小二乘法(method of least square) β的最小二乘估计 α的最小二乘估计 学习小组任务 举例说明现实生活或实验工作中的相关 或回归。 自学并讲解p198 10.1例题 。 自学并讲解p216 概率对数变换及10.12 例题 。 回归方程的计算 上图中R和R Square分别是相关系数和决定系数, ANOVA为方差分析,结果说明两变量间是极显著的 回归关系 此图中Constant是截距(582.185),斜率为21.712, 因此回归方程为Y=21.712X+582.185,从t检验结果 来看,两变量间是极显著的回归关系。 §10.3 一元线性回归的检验 b和a的显著性检验 1. b的显著性检验 Similar to One Sample T-test 由10.17,10.18公式得: 2. a的显著性检验 10.16, 10.18, 10.20 公式得: 类似成组数据t检验 首先要做方差齐性检验 合并方差 由10.16公式得: 10.3.6 一元线性回归分析的意义 预报 由一个变量去预报另一个变量。分为点预报和 区间预报。 由X预报Y是不能随意超出计算回归方程时所研 究的范围的。 §10.4 一元非线性回归 变换(transform) 对数变换 学习小组任务 举例说明现实生活或实验工作中的相关 或回归。 自学并讲解p198 10.1例题 。 自学并讲解p216 概率对数变换及10.12 例题 。 概率对数坐标变换 正态分布累计分布曲线 P344 附表11 SPSS中的曲线拟合及相关检验方法 有时候两变量间并不是直线线性关系,而是 曲线回归。 理论课本上p212-217介绍的数据变换方法可 以使曲线回归转变为线性回归。 除此之外,SPSS还提供了一些处理曲线回归 的方法,其中简单易行的是曲线拟合。 体长和体重分别为自变量和因变量 此表中首先是决定系数R Square,然后是方差分析检验,结果在Sig.列, 最后是截距Constant和斜率(回归系数)b1、b2、b3。 决定系数最高的是S模型(0.989),说明用S形曲线方程拟合该数据最 优,所有模型的显著性均为极显著回归,根据上表中截距和斜率, 根据下表中各模型方程(表中b0为截距),可以给出拟合该数据的 最佳回归方程为y=e(5.392-382.771)/x。 §10.5 相关 相关系数(correlation 回归系数(regression coefficient) coefficient ) 相关系数的性质 相关系数的计算 只是存在相 关,需要检 验显著性。 结果中第一个表是描述性统计,第二个表中0.776为火柴和蚊香 间相关系数,显著性为0.002<0.01,因此是极显著相关关系。 相关系数检验 p345 p346 相关系数与回归系数的关系 相关指数(决定系数)R2 曲线拟合可以用相 关指数(决定系数) 140 衡量,即复相关系 120 数的平方。 100 80 R260越大,曲线拟合 0 1 2 越好 y = 10.063x + 85.579 R2 = 0.9992 3 4 5 6 学习小组任务 举例说明现实生活或实验工作中的相关 或回归。 自学并讲解p198 10.1例题 。 自学并讲解p216 概率对数变换及10.12 例题 。 作业 P236 10.10 编码、列表,求回归方程和相关系数。 10.18 编码列表,只计算相关系数。 请翻译以下术语/Try to translate these terms please: 回归、相关、相关系数、自变量。