Transcript 下载6
第六章 数理统计的基本概念 关键词: 总 体,个 体,样 本, 统 计 量 分布 t 分 布 F 分布 2 1 数理统计学 是一门以数据为基础的科学, 可以定义为 收集数据, 分析数据和由数据得出结论的一组概念、 原则和方法。 例如:若规定灯泡寿命低于1000小时者为次品,如何确定 次品率?由于灯泡寿命试验是破坏性试验,不可能把整批 灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验, 以样本的信息来推断总体的信息,这是数理统计学研究的 问题之一。 2 §6.1随机样本与统计量 总体:研究对象的全体; 个体:总体中的成员; 总体的容量:总体中包含的个体数; 有限总体:容量有限的总体; 无限总体:容量无限的总体,通常将容量非 常大的总体也按无限总体处理。 3 例:现要研究某一个公司员工工资水平 及其影响工资水平的因素. 这个公司的 每个员工就是"个体", 而所有的员工构 成一个"总体". 由于公司的员工总数是 有限的, 因此, 是一个有限总体. 每个员 工都附着有年龄, 性别, 工种, 工资, 受 教育程度等指标(变量). 4 总体的某个指标X, 对于不同的个 体来说有不同的取值, 这些取值可 以构成一个分布, 因此X可以看成 一个随机变量. 有时候就把X称为 总体. 假设X的分布函数为F(x), 也 称F(x)为总体. 5 数理统计主要任务是从总体中抽取 一部分个体, 根据这部分个体的数 据对总体分布给出推断. 被抽取的 部分个体叫做总体的一个 样本. 6 随机样本:从总体中随机地取n个个体, 称为 一个随机样本。 简单随机样本:满足以下两个条件的随机样 本(X1,X2,…,Xn)称为容量是n的简单随机样本 。 1. 每个Xi与X同分布; 2. X1,X2,…,Xn是相互独立的随机变量。 7 [说明]:后面提到的样本均指简单随机样本。 由概率论知,若总体X具有概率密度f(x),则 样本(X1,X2,…,Xn)具有联合密度函数: f n x1 , x2 , n xn f xi i 1 8 [注意]:一个容量为n的样本 X1 , X 2 , Xn 是指n个独立与总体分布相同的随机变量。 一旦对样本进行观察,得到实际数值 x1 , x2 , xn 称为样本观察值(或样本值)。 两次观察,样本值可能是不同的。 9 如何取得的样本才称是简单随机样本? 对于有限总体, 采用放回抽样就能得到简单随 机样本. 但当总体容量很大的时候,放回抽样有时候很 不方便, 因此在实际中当总体容量比较大时,通常 将不放回抽样所得到的样本近似当作简单随机样 本来处理. 对于无限总体, 一般采取不放回抽样. 10 统计量:样本的不含任何未知参数的函数。 常用统计量:设(X1,X2,…,Xn)为取自总体X 的样本。常用的统计量如下: n 1. 样本均值 X 1 X i n i 1 n 2. 样本方差 S 2 1 ( X i X ) 2 , S 为样本标准差 n 1 i 1 n 3. 样本矩 k阶矩:Ak 1 X ik n i 1 k 1, 2, n k 1 k阶中心矩:Bk ( X i X ) n i 1 k 1, 2, 11 [思考题]: 对于总体X , X 1 , , X n是来自总体的样本, 设下列数字特征存在, E ( X ) , D( X ) ,E ( X ),E[( X ) ], 2 k k 问:(1)X 与,(2)S 与 , 2 2 (3)Ak 与E ( X ),(4)Bk 与E[( X ) ] k k 是一回事吗? 答:不是。前者是随机变量,观察两次得到的统计 值可能不一样;后者是数,可能已知也可能未知。 12 当总体数字特征未知时 一般, 用样本均值 X 作为总体均值 E ( X ) 的估计; 用样本方差 S 2 作为总体方差 2 E( X )2 的估计; 用样本的原点矩 Ak 作为总体原点矩 k E( X k ) 的估计; 用样本的中心矩 Bk 作为总体中心矩 k E( X )k 的估 计. (假设总体各阶矩存在) 13 2 总体方差的估计可以用 S 也可以 B2 , 2 主要的区别是 S 作为 总体方差估计是无偏估计, 但 B2 作为总体方差的估计是有偏的 (关于估计的无偏性将在下一节讨论). 14 §6.2 2 分 布 t 分 布 F 分 布 统计量的分布称为抽样分布. 在数理统计中, 最重要的三个分布 分别为: 分布 t 分 布 F 分布 2 15 分布 2 定义:设随机变量X 1 , X 2 , X i N 0,1 i 1, 2, n 则称 X 2 n i 1 2 i X n 相互独立, , n 1 服从自由度为n 的 2分布,记为 2 2 n 自由度指 1 式右端包含的独立变量的个数. 16 分布 2 2 n 分布的概率密度为: y 1 2 f n y 2 n 2 0 其中 0 x n 1 2 e 2y y0 y0 1 x e dx 17 f ( x) n 1 n4 0 n 10 分布的概率密度函数 2 x 18 2分 布 的 一 些 重 要 性 质 : 1. 设 n , 则 有 E n , D 2 n 2 2 2 2 2. 设 Y1 2 n1 , Y2 2 n 2 , 且 Y1 , Y2 相 互 独 立 , 则 有 Y1 Y2 2 n1 n 2 性质2称为 2分布的可加性,可推广到有限个的情形: Yi ~ 2 ni , i 1,2,m ,并假设 Y1 , Y2 ,Ym 相互独立, m 2 则 Yi ~ ni i 1 i 1 m 19 对给定的概率 , 0 1, 称满足条件 2 n f n y dy 的点2 n 为 2 n 分布的上 分位数, 上 分位数2 n 的值可查 2分布表 20 例:求 2 0.1 25 通过Excel给出. (1)具体如下: 在Excel表单的任一单元格输入“=” ; (2)在主菜单中点击“插入”,点击“函数(F)” ; (3)在选择类别的下拉式菜单中选择“统计” 选择 “CHIINV” 点击“确定”在函数参数表单中输入 Probability=0.9. (注意:Probability输入的应该是1-0.1=0.9) (4) Deg\_freedom=25, 点击''确定" 即在单元格中出 现 ''34.382". 21 例:设总体X N , 2 , , 2 已知。 X1, X 2 , , X n 是取自总体X 的样本 求(1)统计量 2 12 n 2 ( X ) 的分布; i i 1 (2)设n 5,若a(X 1 X 2 ) 2 b(2 X 3 X 4 X 5 ) 2 ~ 2 (k ), 则a, b, k 各为多少? 22 Xi 解:( 1) 作变换 Yi i 1,2, , n 显然Y1, Y2 , , Yn相互独立,且Yi N 0,1 i 1,2, , n n 于是 ( 2 i 1 Xi n ) Yi 2 2 i 1 2 n 23 (2) X1 X 2 ~ N (0, 2 ), 2 2 X 3 X 4 X 5 ~ N (0, 6 ), 2 X1 X 2 ~ N (0, 1) 2 2X3 X4 X5 6 X1 X 2 2 X 3 X 4 X 5 与 相互独立, 2 6 ( X 1 X 2 )2 (2 X 3 X 4 X 5 ) 2 2 故 ~ (2) 2 2 2 6 ~ N (0, 1) a 1 , 2 1 b , 2 6 k 2. 2 24 t 分布 设 X ~ N (0,1) ,Y ~ 则称随机变量 T 2 n ,并且假设 X , Y 相互独立, X Y /n 服从自由度为 n 的 t 分布。 记为 T ~ t (n) t n 分布的概率密度为:f t , n 率密度为:f t , n n 1 t n n 2 n 1 2 2 n21 n21 n n2 , t 25 t n 分布概率密度函数 26 t 分布 对给定的 , 0 1, 称满足条件 t n f t , n dt 的点t n 为t n 分布的上 分位数。t分布的上 分位数可查t分布表 t1 (n) t (n) 27 例:求 t0.05 25 通过Excel给出. (1)具体如下: 在Excel表单的任一单元格输入 “=” ; (2)在主菜单中点击“插入”,点击“函数(F)” ; (3)在选择类别的下拉式菜单中选择“统计” 选择 “TINV” 点击“确定“在函数参数表单中输入 Probability=0.95. (4) Deg\_freedom=25, 点击“确定” 即在单元格中 出现 “1.708”. 28 F分布 定义: 且Xn,2Y独立,则 , 且X , Y 独立, 设设X X n1 ,Yn1 , Y n 2 , 2 2 2 2 X / n1 X / n1 n1 , n2 的F 分布, 称随机变量F 服从自由度 则称随机变量 服 从自由度 n1 , Y / nF 2 记为F ~ F n1 , n2 Y / n2 其中 n1称为第一自由度, n2 称为第二自 其中 n1称为第一自由度, n2 称为第二自由度 性质:F ~ F (n1, n2 ), 则F 1~ F (n2 , n1 ) 29 .5: F n1 , n2 分布的概率密度为: n1 n2 n n n 1 2 1 1 1 2 2 2 n n x n2 n1 x 2 1 2 B n1 , n2 f x; n1 , n2 2 2 0 1 a b b 1 1 其中B a, b x 1 x dx 0 a b x0 x0 30 F 5,10 分布概率密度函数 31 对于给定的 , 0 1, 称满足条件 F n1 , n2 f x; n1 , n2 dx 的点F n1 , n2 为F n1 , n2 分布的上 分位数。 F n1 , n2 的值可查F 分布表 F1 (n1, n2 ) [ F (n2 , n1 )]1 32 例:求 F0.1 9,10 通过Excel给出. (1)具体如下: 在Excel表单的任一单元格输入“=” ; (2)在主菜单中点击“插入”,点击“函数(F)” ; (3)在选择类别的下拉式菜单中选择“统计” 选择 “FINV” 点击“确定”在函数参数表单中输入 Probability=0.9. (4) Deg\_freedom1=9, Deg\_freedom2=10点击 “确定” 即在单元格中出现 “2.347”. 33 §6.3正态总体下的抽样分布 定理 6.3.1 设 X1 , X 2 , N ( , ) 2 , X n 为来自正态总体 的简单随机样本, X 是样本均值, 2 S 是样本方差, 则有: X ~ N , n 2 . 34 定理 6.3.2 设 X1 , X 2 , , X n 为来自正态总体 N (, ) 的 简 单 随 机 样 本 , X 是 样 本 均 值 , 2 S 2 是样本方差, 则有: (1) (n 1) S 2 2 ~ 2 (n 1) , 2 (2) X 与 S 相互独立. 35 [思考题]: 设X 1 , X 2 , , X n是来自正态总体N ( , 2 ) 的简单随机样本,X 和S 2分别是样本均值 和样本方差。问: n (X (1)i 1 i X) 2 2 服从什么分布? n 2 ( X ) i (2)i 1 服从什么分布? 2 答:(1) (n 1),(2) (n). 2 2 36 定理 6.3.3 设 X1 , X 2 , , X n 为来自正态总体 N (, ) 的简单随机样本, X 是样本均值, S 2 2 是样本方差, 则有: X ~ t (n 1) S n 37 定理6.3.4 , X n1 定和 , Yn2 分别来自总体 1, : 理Y 6.8 设样本 X , , X 和N Y 6.8:设样本 X 1 , 1 n1 1 并且它们相互独立,其样本方差分别为 S ,S , 总体 N 1 , 1 和N 2 , 2 并且它们相互独立,其样 2 , Yn2 分别来自总体 N 1 , 1 和 N 2 , 2 2 2 n1 和 Y1 , 2 2 2 S1 2 S 2 1 n 1 , S 2则 , :1 F 2 2 F n21 1, 则 : 1 F F n1 2 2 2 2 1 S2 立,其样本方差分别为 S1 , S 2 , 1 S2 X Y 1 2 X Y 1 F n12S1,2n2 12 S 2 2 N2(0,1), 2 2 1 1 2 1 2 1 (1) ~ F (n1 1, n12 1). 2 2 2 2 1 2 2 S n n n1 n2 2 2 2 2 1 2 S 1 2 N (0,1), 2 X 3Y 当 21 22 2时 2 2 2 2 2 2 2 1 2 2 38 (2) X Y 1 2 1 n1 2 2 2 ~ N (0,1) n2 其中X , Y 分别为样本均值. 39 2 1 S 2 1 2 2 2 X Y (3)当 2 1 2 1 1 2 2 2 2 2 2 时, N (0,1), X Yn1 n1 2 2 ~ t n n 2. 1 2 1 1 X Y 1 2 2 2 2 S 3 当 1 w n2 n 时, ~ t n1 1 2 1 1 Sw 其中S 2 w n1 1 S n1 n2 n2 1 S 2 , Sw Sw n1 n2 2 2 1 2 2 40 例:设总体X 的均值,方差 2 存在, X1, , X n 是取自总体X 的样本, X , S 为样本均值和样本方差; 2 求(1)E ( X ), D( X ), E ( S ); 2 (2) X 1与X 的相关系数; (3)若X N , 2 ,求D( S 2). 41 n n 解:( 1) E ( X ) E ( 1 X i ) 1 E ( X i ) , n i 1 n i 1 1 1 D( X ) D( X i ) 2 D( X i ) , n i 1 n n i 1 n n n 2 n 2 2 2 1 1 E (S ) E ( ( X i X ) ) E( ( X i nX )) n 1 i 1 n 1 i 1 2 n 1 ( E ( X i2 ) nE ( X 2 )) n 1 i 1 2 2 2 1 ( ( ) n( 2 )) 2 n 1 i 1 n n 42 n ( 2) Cov( X 1 , X ) Cov( X 1 , 1 X i ) n i 1 1 D( X1 ) , n n 2 X X 1 2 n Cov( X1 , X ) D( X1 ) D( X ) 2 1 , 2 n n 43 (3) X N , 2 , (n 1) S 2 2 ~ 2 (n 1), (n 1)S D 2(n 1) 2 2 D(S ) 2 . n 1 2 4 44 例:设总体X N , , X1, 2 与 Y1 , , X4 , Y9 是取自总体X 的两个独立样本, X , S12和Y , S 22分别为样本均值和样本方差; 求( 1) 若a X Y ~ t (k ), 则a, k 各为多少? S1 4 (2) ( X i ) 2 4 S22 服从什么分布? i 1 45 (1) X ~ N ( , 2 4 ), Y ~ N ( , 2 9 ), 且X 与 Y 相互独立, 13 ( 6 X Y) X Y ~ N (0, ), ~ N (0,1) 36 13 3S12 2 2 又 2 ~ (3), 且X Y 与S1 相互独立, 2 6 X Y 由t分布定义, 13 3S12 6 13 X Y ~ t (3) 2 3 13 S1 6 13 a , k 3. 13 46 (2) 12 4 2 2 ( X ) ~ (4), i i 1 8S22 2 ~ 2 (8), 4 且 ( X i )2与S22独立, i 1 由F 分布定义知, 1 4 2 4 2 ( X ) i i 1 4 8S22 2 2 ( X ) 4 S i 2 ~ F (4,8). 2 8 i 1 47