一描述性统计检验

Download Report

Transcript 一描述性统计检验

第二节 描述性统计量及检验
2.1. 描述性统计量
 随机变量的期望:  =E(X)
2
2
 随机变量的方差:  =E[(X- ) ]





k-阶矩:E(Xk)
k-阶中心矩:E[(X-)k]
偏度(skewness) :S=E[(X-)3/3]
峰度(kurtosis) : K=E[(X-)4/4]
第二节 描述性统计量及检验


偏度和峰度都是用来测定收益率分布的形状,且
都以正态分布为基准的。
正态分布:偏度=0,峰度=3。
第二节 描述性统计量及检验





偏度的符号反映了分布偏斜的方向:
当偏度S 值=0时,序列分布是对称的。
当偏度S >0时,称为正偏,意味着序列分布有长的
右拖尾。
当偏度S <0时,称为负偏,意味着序列分布有长的
左拖尾。
偏度的大小反映了分布偏斜的程度。
第二节 描述性统计量及检验
S=0
均值=中位数
S>0
均值>中位数
S<0
均值<中位数
第二节 描述性统计量及检验




峰度反应分布隆起的程度:
当峰度K>3时,序列分布曲线的凸起程度大于正态
分布,即相对于正态分布更隆起;
当峰度K<3时,序列分布曲线的凸起程度小于正态
分布,即相对于正态分布更平坦。
正态分布的峰度K=3。
第二节 描述性统计量及检验
K=3
正态分布的峰度=3
K>3
K<3
第二节 描述性统计量及检验





峰度也反映了分布尾部的厚薄。
正态分布的峰度K=3。K-3称为超出峰度。
具有正的超出峰度的分布称为尖峰分布。
尖峰分布具有厚尾性,即该分布在其支撑的尾部有
比正态分布更大的概率。
用公式表示为:P{  <c}>p{X<c},c是一个比较小的
数。  服从尖峰分布随机变量,X服从正态分布。
第二节 描述性统计量及检验



在实际中,意味着来自于尖峰分布的随机样本会有
更多的极端值。
如果小概率事件发生的可能性大于正态分布所描述
的情形,那该变量的分布应当用尖峰分布来描述。
这在金融市场风险研究中有着重要的意义。
第二节 描述性统计量及检验
样本均值
1 T
E (r )     rt
T t 1

样本方差
1 T
2
var(r )   
(
r


)
 t
T  1 t 1

样本偏度
1 T
s
(rt   )3  3

T  1 t 1

样本峰度

2
1 T
k
(rt   ) 4  4

T  1 t 1
第二节 描述性统计量及检验








Eviews操作:
主菜单:File/New/Filework
工作窗口:
Unstructured/Deservation/OK
主菜单窗口:
Data/空格/变量名/回车
工作窗口:
导入数据/view/Descriptive Ststistics(描述统计量)
/Histogram and Stats(直方图和统计量)
第二节 描述性统计量及检验
例2.1
右表是我国1992-2003
年的实际GDP增长率(可比价
格),对其进行描述性统计分
析。
1992
14.2
1993
13.5
1994
12.6
1995
10.5
1996
9.6
1997
8.8
1998
7.8
1999
7.1
2000
8.0
2001
7.5
2002
8.0
2003
9.1
例2.1中GDP增长率的统计量:
第二节 描述性统计量及检验


例2.1中GDP增长率的偏度是0.78,峰度K为2.14 ,
说明GDP增长率的分布是不对称的,相对于正态分
布也是平坦的。
第二节 描述性统计量及检验
2.2. 统计量的检验
 Jarque-Bera检验
 统计量
n 2 ( K  3) 2
JB  [ S 
]
6
4



其中n是样本个数,S是偏度,K是峰度
由于正态分布的偏度S=0,峰度K=3,所以 JB 统计量
是用来衡量偏度和峰度偏离0和3的程度。
JB 统计量是用来检验时间序列是否服从正态分布的。
第二节 描述性统计量及检验





检验步骤:
原假设:时间序列服从正态分布。
计算S、K,并计算JB统计量。
在原假设下,JB 统计量服从自由度为2的X^2分布,
即 JB ~ X^2(2)。以检验水平5%为例,对应的临界值
=5.99,即P(X>5.99)=0.05。
若计算的JB >5.99,则拒绝原假设,分布不是正态
分布。否则接受原假设。
上证综合指数收盘价曲线
SH
7,000
6,000
5,000
4,000
3,000
2,000
1,000
0
250
500
750
1000
上证综合指数收盘价曲线统计量
240
Series: SH
Sample 1 1000
Observations 1000
200
160
120
80
40
0
1000
2000
3000
4000
5000
6000
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
2501.364
1743.640
6092.060
1011.500
1460.333
0.783449
2.267514
Jarque-Bera
Probability
124.6544
0.000000
上证综合指数收益率曲线
SHR
.100
.075
.050
.025
.000
-.025
-.050
-.075
-.100
250
500
750
1000
上证综合指数收益率统计量
240
Series: SHR
Sample 1 1000
Observations 999
200
160
120
80
40
0
-0.05
0.00
0.05
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
0.000550
0.000353
0.088875
-0.092562
0.018805
-0.460843
6.365833
Jarque-Bera
Probability
506.9232
0.000000
第二节 描述性统计量及检验



Quantile—Quantile图
Q-Q图是借助分位数来比较两个分布的一种简单而
重要的工具(比JB统计量的用途更加广泛)。
分位数(Quantile):对于介于0,1之间的数 q,满
足如下条件的数 x(q) 称为 q 的分位数:
P( x< x(q) ) < q
第二节 描述性统计量及检验




分位数的计算:
对于一组观察值,取概率:Pi=(i-0.5)/n ,i=1,…,n。
与Pi对应的分位数是把数据从小到大排列后的第i个
数,记为Q(Pi)。
对任意概率P:Pi <P< Pi+1,有P=Pi +a( Pi+1-Pi),
那么
Q(P)=(1-a)Q(Pi) +aQ(Pi+1)
第二节 描述性统计量及检验









例:数据为 1.1,3.1,0.9,4.2,0.7
从小到大排列为:0.7,0.9,1.1,3.1,4.2
与概率P对应的分位数:
P1=(1-0.5)/5=0.1, ,P2=0.3,
P3=0.5,
P4=0.7, P5=0.9
Q(0.1)=0.7,
Q(0.3)=0.9, Q(0.5)=1.1, Q(0.7)=3.1,Q(0.9)=4.2
对于概率0.2,由于介于P1和P2之间,且有
0.2=0.1+0.5X (0.3-0.1),
所以
Q(0.2)=(1-0.5) X Q(0.1)+0.5X Q(0.3)=0.5X0.7+0.5X0.9=0.8
第二节 描述性统计量及检验

随机变量分位数的计算:
若已知某个随机变量的分布函数,给定概率q,由公
式
P( x< x(q) )=q

即可求解出分位数 x(q)


第二节 描述性统计量及检验

Q-Q图----把已知分布的分位数标在纵轴上,样本分
位数标在横轴上,所得到的图形称为Q-Q图

Q-Q图方法是根据Q-Q图的形状来判定样本数据分
布是否与已知分布相同:
若样本数据分布与已知分布相同,则Q-Q图在一条
直线上。
若Q-Q图不在一条直线上,则样本数据分布与已知
分布不相同。


第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:


双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options
第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:


双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options, 出现右边的对话
框
第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:
双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
 点击QQ graph中的
options, 在出现对话框
中distribution 选择对比
的分布,如Normal
第二节 描述性统计量及检验







可选与如下的理论分布的分位数相比较:
Normal(正态)分布:钟形并且对称的分布.
Uniform(均匀)分布:矩形密度函数分布.
Exponential(指数)分布:联合指数分布是一个有着一条长
右尾的正态分布.
Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近
似于正态的对称分布.
Extreme value(极值)分布:I型极小值分布是有一条左长尾
的负偏分布,它非常近似于对数正态分布.
可以在工作文件中选择一些序列来与这些典型序列的分位数
相比较,也可以在编辑框中键入序列或组的名称来选择对照
的序列或组,EViews将针对列出的每个序列计算出QQ图。
第二节 描述性统计量及检验



Q-Q图的Eviews 6 操作:
双击文件名(sh), 选择
View/Graph … /QuantileQuantile
点击QQ graph中的options,
在出现对话框中distribution
选择对比的分布,如Normal
第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:

6,000
Quantiles of Normal

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options, 在出现对话框
中distribution 选择对比
的分布,如Normal
点击OK,再点击确定,即
出现上证综指收盘价sh与
正态分布的QQ图
8,000
4,000
2,000
0
-2,000
-4,000
0
2,000
4,000
Quantiles of SH
6,000
8,000
第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:

12,000
Quantiles of Exponential

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options, 在出现对话框
中distribution 选择对比
的分布,如Normal
点击OK,再点击确定,即
出现上证综指收盘价sh与
指数分布的QQ图
14,000
10,000
8,000
6,000
4,000
2,000
0
0
2,000
4,000
Quantiles of SH
6,000
8,000
第二节 描述性统计量及检验
Q-Q图的Eviews 6 操作:

.06
.04
Quantiles of Normal

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options, 在出现对话框
中distribution 选择对比
的分布,如Normal
点击OK,再点击确定,即
出现上证综指收盘价sh与
正态分布的QQ图
.08
.02
.00
-.02
-.04
-.06
-.08
-.10
-.05
.00
Quantiles of SHR
.05
.10
第二节 描述性统计量及检验


Excel表格的编辑
表格的编辑