第2章概率统计复习和EViews简介

Download Report

Transcript 第2章概率统计复习和EViews简介

第2章
概率统计复习和EViews简介
概率统计复习和EViews简介
2.1 概率论复习
2.1.1
2.1.2
2.1.3
2.1.4
随机变量及分布
随机变量数字特征
随机向量
极限定理
2.2 统计学复习
2.2.1 样本和统计量
2.2.2 参数估计
2.2.3 假设检验
2.3 EViews7.2简介
2.3.1 建立工作文件
2.3.2 生成新变量
2.2.3 EViews数据处理
重要概念
2.1 概率论复习
2.1.1
2.1.2
2.1.3
2.1.4
随机变量及分布
随机变量数字特征
随机向量
极限定理
2.1 概率论复习
2.1.1 随机变量及分布
由随机变量可能的取值,将随机变量分
为离散型和连续型随机变量。
离散型随机变量概率分布
二项分布(Binomial Distribution)
P(  i)  C p (1  p) , i  0,1,2,, n
i
n
ni
i
两点分布——二项分布的特例

1
P(  i)  p (1  p)  p (1  p) ,   i  0,1
i
1i
离散型随机变量概率分布
二项分布概率分布图
0.2
p(ξ=k)
n=20,p=0.5
n=40,p=0.5
0.16
0.12
0.08
0.04
k
0
1
6
11
16
21
26
31
36
41
连续随机变量的概率分布
一般用概率密度函数来描述连续随机变
量,概率密度函数满足两个条件:
(i)取非负值  ( x)  0
(ii)在 (,)上的积分等于1
连续随机变量的取值统一规定为全部实
数 (,) ,如果实际取值为实数的一部分,如
正数 (0,) ,只需要将取其它值时的概率密度
设为0即可。
连续随机变量的概率分布
• 正态分布
x2

2
1
 ( x) 
e ,   x  
密度函数为
2
X若
X ~ N (0,1)
X 则称
服从标准正态分布,即
。
( x )2
若X密度函数为
1  2
f ( x) 
e
2
2 
(, 2 )
则称X服从参数为
,
,    x  ,   0
 ~ N ( , )
2
的分布,记为
连续随机变量的概率分布
• 正态分布
◆参数  决定着密度函数的位置(中心), 2 决定着图
形的陡峭程度。
◆正态分布累积分布函数:(可查表) t 2
1
( x)    (t )dt 

2
x
x
e


2 2
dt
◆正态分布是对称分布,因此有 ( x)  1  ( x)
◆一般正态分布与标准正态关系:
2
若  ~ N (, ) ,则   (   ) /  ~ N (0,1)
◆正态分布具有可加性:联合正态随机变量的线性组合仍
然服从正态分布。
连续随机变量的概率分布
• 正态分布
连续随机变量的概率分布
• 正态分布的衍生分布
2
(i) 分布(Chi-square Distribution)
(ii)t 分布(t-Distribution)
对称分布,自由度增加时趋于标准正态
(iii)F 分布(F-Distribution)
概率分布的统一表示—分布函数
定义:F ( x)  P(  x)
分布函数可统一描述离散型和连续性
随机变量,且由定义知它:
(i)单调递增;
(ii)右连续;
(iii)0  F ( x)  1 ;
(iv) lim
F ( x)  0 , lim
F ( x)  1
x
x
2.1 概率论复习
2.1.2 随机变量数字特征
人们希望得到描述随机变量总体特征的
综合信息,需要期望、方差、偏度、峰度等
数字特征。
随机变量数字特征
• 数学期望: E
• 方差
Var ( )  E(  E( ))2  E 2  (E )2
• 矩
k
k 阶矩:E
k 阶中心矩: E(  E( ))k
E(  E )3
• 偏度:   [Var ( )]3 / 2
E(  E ) 4
2
• 峰度:  
[Var ( )]
随机变量的偏度峰度常与正态分布相比,以
判断是正偏还是负偏,薄尾还是厚尾。
2.1 概率论复习
2.1.3 随机向量
X  ( , )
联合分布 F ( x, y)  P(  x,  y)
连续型随机变量还有联合密度函数
b d
P{a 使得
  b, c    d}     ( x, y)dxdy
 ( x, y )
a c
 (y)
 (x)  和 的概率密度
  的概率密度
X
称为
的边际概率密度。
联合密度唯一确定概率密度,反之不然。
2.1 概率论复习
2.1.3 随机向量
X  ( , )
协方差
Cov( , )  E[(  E )(  E )]  E( )  E( )E( )
相关系数
 ( ,)  Cov( ,) / Var( )Var()
相关系数为零仅意味不线性相关。
2.1 概率论复习
2.1.3 随机向量
X  ( , )
条件分布
F| ( y |   x)  P(  y |   x)
 ( x, y)
 ( y |   x) 
 ( x)
条件期望和条件方差

E( |   x)   x ( y |   x)dy

2
Var ( |   x)  E( |   x)  [E( |   x)]
条件期望性质
2.1 概率论复习
2.1.3 随机向量
X  ( , )
条件期望性质
(i) E[E( |  )]  E
(ii)E(g ( ) |  )  g ( )E( |  )
(iii)若 E( |  )  0
E(g ( ))  0
 ,  独立
强
于
E( |  )  0
强
于
,则
 ,  不相关
2.1 概率论复习
2.1.4 极限定理
极限定理讨论一组随机变量的平均值当随
机变量个数趋于无穷大时的极限,用于研究样
本量无限增加时样本均值的性质。大数定律讨
论随机变量均值的概率极限,中心极限定理则
讨论分布极限。
极限定理
• 大数定理(LLN)
(1)独立同分布大数定理
(2)独立但不同分布大数定理
(3)既不独立也不同分布的大数定理
极限定理
• 中心极限定理(CLT)
(1)独立同分布中心极限定理
(2)不独立、不同分布中心极限定理
2.2 统计学复习
2.2.1 样本和统计量
2.2.2 参数估计
2.2.3 假设检验
2.2 统计学复习
2.2.1 样本和统计量
• 总体和样本
• 样本均值和样本方差
n
1 n
1
2
X   Xi , S 2 
(
X

X
)

i
n i1
n  1 i1
• 若总体服从正态分
X ~ N ( , 2 )
布
 2 
(n  1) S 2 ,则2
X ~ N   , ,
~  (n  1)
2

 n 
2.2 统计学复习
2.2.2 参数估计
• 参数估计是指通过样本提供的信息对总体
的概率分布中包含的未知参数进行估计的
过程。
设总体 X 服从 F ( x, ) ,从样本 X1 , X 2 ,, X n
中得出对参数的估计 ˆ  h( X1, X 2 ,, X n ) 即
为参数估计
参数估计
估计量评价标准
ˆ)  
ˆ
E
(



无偏性:如果
,称
为
的无偏估
ˆ 
p limn计

ˆ 

一致性:如果
,称
为
的一致
ˆ1 , ˆ2

Var(ˆ1 ) 估计
Var(ˆ2 )
ˆ1 ˆ2
有效性: 设
都是参数
的无
偏估计,如
参数估计
估计量的求法
• 矩估计法(用样本矩代替总体矩:类推原
则)
• 极大似然估计(使抽取到的样本发生的可
能性最大:表现为密度或概率之乘积)
两种估计量均具有一致性和渐进正态
性(矩条件正确,假设分布正确)。
极大似然估计更为有效。
参数估计(举例)
• 例子2.1(矩估计)
2
X
总体 的数学期望  和方差  为未知参数,
X1 , X 2 ,, X n 为从 X 中抽取的样本,总体矩条
件
2
2
2
E( X   )  0, E[ X  (   )]  0
n
1
样本矩条件
( X i  ˆ )  0,

n i1
1 n
矩估计值 ˆ   X i  X ,
n i1
1 n 2
2
2
[ X i  (ˆ  ˆ )]  0

n i1
n
1
2
2
2
ˆ
  (Xi  X )
n i1
参数估计(举例)
• 例子2.1(续)(极大似然估计)
2
2
总体 X ~ N (, ) , 和  为未知参数,
X1 , X 2 ,, X n 为从 X 中抽取的样本,似然函数为
n
( xi  )2

1
2 2
L( x1 , x2 ,, xn ;  ,  )  
e
2 
i 1
对数化后对未知参数求导,得极大似然估计
2
n
1
ˆ  X , ˆ 2   ( X i2  X ) 2
n i1
2.2 统计学复习
2.2.3 假设检验
参数估计是随机变量,当以参数估计值
代替参数值进行推断时,必须考虑估计带来
的随机成分。
• 原理(具体见课本)
• 步骤
2.2 统计学复习
2.2.3 假设检验
• 步骤
第一步:根据检验的问题提出原假设和备择假设。
(注意是单边还是双边检验)
第二步:根据检验的需要设计检验统计量,推导原
假设下检验统计量的分布。
第三步:给定检验显著水平,求出检验的拒绝域。
第四步:根据样本值计算检验统计量的值,如果检
验统计量的值落入拒绝域,拒绝原假设,否则不
能拒绝原假设。
2.3 EViews7.2简介
2.3.1 建立工作文件
2.3.2 生成新变量
2.2.3 EViews数据处理
2.3 EViews7.2简介
2.3.1 建立工作文件
Eviews启动界面
2.3 EViews7.2简介
2.3.1 建立工作文件
• 工作文件是由各种EViews对象形成的一个整
体,可以包含数据集(data set)、图形
(Graph)、模型(Equation)等,是进行
各种计量分析的平台。
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
• 先在EViews中建立数据文件结构,然后直接
在EViews中输入数据。
• 读入外部数据建立数据文件
点击主菜单File→Open→Foreign Data as Workfile,
在对话框中按路径找到外部数据文件(如Excel),
在对话框下端的Files of Type 要选为Excel file (*.xls)
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
• 读入外部数据建立数据文件
选择全部
数据
打开文件出现
第一步:
选择想要的数据,
具体要求通过右
边下拉框选择
通过起始
和终止单
元控制想
要选择的
数据
2.3 EViews7.2简介
2.3.1 建立工作文件
列名所
占行数
数据文件的建立
• 读入外部数据建立数据文件
可改变列名,
但先要点到页
面左下方对应
的列
第二步:
缺失变量
的标记符
号
变量类型
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
• 读入外部数据建立数据文件
第三步:
数据导入
的结构
若为有固定
频率的数据,
选择其频率
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
• 读入外部数据建立数据文件
建立好的工作文件
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
表示数据库中的变量, 表示参数, 表示模
型估计结果(估计并保存后才会显示), 和
是Eviews的保留名,分别保存回归的常数项和残
差项。
2.3 EViews7.2简介
2.3.1 建立工作文件
数据文件的建立
在进行某项分析时经常要将多个变量合在一
起座位数据组分析,此时应当选择相应数据,以
组的形式打开:直接用Ctr键和鼠标选中变量,点
击鼠标右键,在弹出菜单中选择Open→as Group
在关闭组时可以将其保存,其将显示为
2.3 EViews7.2简介
2.3.2 生成新变量
运算符
• 算术运算符:
+、-、*、/和^,从左到右,先乘除后加
减,有括号先算括号
• 比较运算符:
>、<、=、<>、>=、<=,逻辑为真取1,假则取0
• 逻辑运算符:
or、and,如(v>2)and(v<4)、(x>3.5)or(z<-6)
2.3 EViews7.2简介
2.3.2 生成新变量
常用函数
• 基本数学函数:
abs( x) sqr ( x) ,
exp(x) log(x,
)
,还有一些以@开头的函数。
• 时间序列函数:
差分:一阶差分d(x),n阶差分d(x,n)
滞后:n阶滞后x(-n)
时间趋势变量生成函数:@trend
,
2.3 EViews7.2简介
2.3.2 生成新变量
生成新变量在Eviews的Genr按钮下实现,
形式为:变量名=表达式,生成的变量将
会在工作文件的变量序列中出现。
2.3 EViews7.2简介
2.3.3 EViews数据处理
数据的编辑
以组打开相关变量,点击数据表格窗口顶
端的Edit+/-按钮,点击数据单元可以直接修改数
据,要在某观测(行)前插入一行观测,先点击
表格最右边obs列选中整行,在选中行点击鼠标右
键,在弹出的菜单上选择Insert obs…(插入观测
),
2.3 EViews7.2简介
2.3.3 EViews数据处理
数据的编辑
如果要插入一列,则点击表头上某变量名,点
击鼠标右键并在弹出的菜单上选择Insert Series,
输入要插入的列名,若要插入多列,用空格将列
名隔开。
2.3 EViews7.2简介
2.3.3 EViews数据处理
数据作图
以组的形式打开所涉及的变量,在打
开后表格界面上,点击菜单View→Graph,弹出图
形选择Graph Options对话
框:
2.3 EViews7.2简介
2.3.3 EViews数据处理
数据作图(具体见课本)
(1)折线图
(2)区域带状图
(3)X-Y线图
(4)分布图
2.3 EViews7.2简介
2.3.3
EViews数据处理
描述统计和方差分析
• 点击View→Descriptive Stats→Individual Samples,
会弹出描述统计的窗口。
• 点击View→Covariance Analysis,弹出协方差分析
对话框Covariance Analysis
计算方法选择ordinary,勾
选Covariance和Correlation,
输出方式选择Single table,
就会输出(下页):
2.3 EViews7.2简介
2.3.3
EViews数据处理
描述统计和方差分析
2.3 EViews7.2简介
2.3.3 EViews数据处理
点击主窗口中File→Export→Write TextLotus-Excel,表示将数据导出为文本(Text
)、Lotus表格或者Excel表格,在弹出的保
存窗口(Save As)底端选择保存的类型Files
of type:(Text-ASCII)、Lotus(*.wk1)、
Lotus(*.wk3)和Excel
重要概念
1. 随机变量分为离散和连续两种,离散随机变量用概率函数
或者分布律描述其概率分布,连续随机变量则用概率密度
函数描述其分布。概率函数和概率密度函数中包含参数。
2.随机变量的数学期望是随机变量的一阶矩,方差是二阶中
心矩。矩是随机变量分布的数字特征,是概率分布中参数
的函数,决定了概率分布的位置和形状。由概率分布可以
求出矩,但矩不能确定概率分布,概率分布对随机变量的
描述比矩更为详细。
3. 随机向量的联合分布,不仅给出了各个随机变量概率分布,
更为重要的是给出了随机变量之间的相互作用和影响。协
方差和相关系数刻画了随机变量本身之间的相互影响,并
不涉及随机变量函数之间的相互影响。条件期望和条件方
差能够更深入地刻画随机变量之间的关系。E( |  )  0
 和

给出的
之间的关系强于不相关,但弱于独立。
重要概念
4. 条件期望满足迭代率,即对随机变量先取条件期望再取无条件
期望,其结果等同于该随机变量的无条件期望。条件期望的另
一条重要性质可以叙述为被条件确定的量可以移到条件期望的
外面。
5. 极限定理是研究一组随机变量的平均值的极限性质。大数定律
表明,随机变量的平均值中X 的随机成分(用方差衡量)随机
变量的个数增加而减少直至趋于0,X 以概率趋于常数。中心
极限定理则表明,不管参与平均的随机变量服从什么分布,随
2
X
n
(
X


)
~
(
a
)
N
(
0
,

)
机变量个数足够大时,
近似服从正态分
2
布:   limn Var( n X ) n
,其
X
中
。
越大,近似
效果越好,渐进正态分布称为
的大样本分布。
Eh( X , )  0
6. 参数估计分为矩估计方法和极大似然估计方法。矩估计法需要
n
1
n
ˆ
知道总体的矩条件 i1 h( X i ,ˆ)  0
,在得到样本后采
用类推原则得出样本矩条件
并从中解出参数估计量
。矩估计法的基础是大数定律。矩
重要概念
7. 极大似然估计是将似然函数看作未知参数的函数,
极大化似然函数得出的。极大似然估计具有一致性和
渐进正态性,比矩法估计量更有效,但极大似然估计
需要设定总体的分布,分布设置不当会导致估计量的
不一致性。
8. 假设检验是以小概率事件原理为基础的对未知参数
的推断。对应同样的原假设,备择假设可以是单边和
双边的,不同备择假设对应不同的拒绝域。假设检验
的核心是根据待检验假设构造合适的检验统计量,并
求出原假设下检验统计量的分布或者渐进分布。
9. EViews是一款操作简单,功能齐全的计量经济学软
件,可以通过菜单操作实现大部分计量经济学计算。