一描述性统计检验

Transcript 一描述性统计检验

第二节描述性统计量及检验
2.1. 描述性统计量
 随机变量的期望：  =E(X)
2
2
 随机变量的方差：  =E[(X- ) ]





k-阶矩：E(Xk)
k-阶中心矩：E[(X－)k]
偏度(skewness) ：S=E[(X-)3/3]
峰度(kurtosis) ： K＝E[(X-)4/4]
第二节描述性统计量及检验


偏度和峰度都是用来测定收益率分布的形状，且
都以正态分布为基准的。
正态分布：偏度=0，峰度=3。
第二节描述性统计量及检验





偏度的符号反映了分布偏斜的方向：
当偏度S 值=0时，序列分布是对称的。
当偏度S >0时，称为正偏，意味着序列分布有长的
右拖尾。
当偏度S <0时，称为负偏，意味着序列分布有长的
左拖尾。
偏度的大小反映了分布偏斜的程度。
第二节描述性统计量及检验
S=0
均值＝中位数
S>0
均值>中位数
S<0
均值<中位数
第二节描述性统计量及检验




峰度反应分布隆起的程度：
当峰度K>3时，序列分布曲线的凸起程度大于正态
分布，即相对于正态分布更隆起；
当峰度K<3时，序列分布曲线的凸起程度小于正态
分布，即相对于正态分布更平坦。
正态分布的峰度K=3。
第二节描述性统计量及检验
K=3
正态分布的峰度＝3
K>3
K<3
第二节描述性统计量及检验





峰度也反映了分布尾部的厚薄。
正态分布的峰度K=3。K-3称为超出峰度。
具有正的超出峰度的分布称为尖峰分布。
尖峰分布具有厚尾性，即该分布在其支撑的尾部有
比正态分布更大的概率。
用公式表示为：P{  <c}>p{X<c}，c是一个比较小的
数。  服从尖峰分布随机变量，X服从正态分布。
第二节描述性统计量及检验



在实际中，意味着来自于尖峰分布的随机样本会有
更多的极端值。
如果小概率事件发生的可能性大于正态分布所描述
的情形，那该变量的分布应当用尖峰分布来描述。
这在金融市场风险研究中有着重要的意义。
第二节描述性统计量及检验
样本均值
1 T
E (r )     rt
T t 1

样本方差
1 T
2
var(r )   
(
r


)
 t
T  1 t 1

样本偏度
1 T
s
(rt   )3  3

T  1 t 1

样本峰度

2
1 T
k
(rt   ) 4  4

T  1 t 1
第二节描述性统计量及检验








Eviews操作：
主菜单：File/New/Filework
工作窗口:
Unstructured/Deservation/OK
主菜单窗口：
Data/空格/变量名/回车
工作窗口：
导入数据/view/Descriptive Ststistics（描述统计量）
/Histogram and Stats（直方图和统计量）
第二节描述性统计量及检验
例2.1
右表是我国1992-2003
年的实际GDP增长率（可比价
格），对其进行描述性统计分
析。
1992
14.2
1993
13.5
1994
12.6
1995
10.5
1996
9.6
1997
8.8
1998
7.8
1999
7.1
2000
8.0
2001
7.5
2002
8.0
2003
9.1
例2.1中GDP增长率的统计量：
第二节描述性统计量及检验


例2.1中GDP增长率的偏度是0.78，峰度K为2.14 ，
说明GDP增长率的分布是不对称的，相对于正态分
布也是平坦的。
第二节描述性统计量及检验
2.2. 统计量的检验
 Jarque-Bera检验
 统计量
n 2 ( K  3) 2
JB  [ S 
]
6
4



其中n是样本个数，S是偏度，K是峰度
由于正态分布的偏度S=0，峰度K=3，所以 JB 统计量
是用来衡量偏度和峰度偏离0和3的程度。
JB 统计量是用来检验时间序列是否服从正态分布的。
第二节描述性统计量及检验





检验步骤：
原假设：时间序列服从正态分布。
计算S、K，并计算JB统计量。
在原假设下，JB 统计量服从自由度为2的X^2分布，
即 JB ~ X^2(2)。以检验水平5%为例，对应的临界值
=5.99，即P(X>5.99)=0.05。
若计算的JB >5.99，则拒绝原假设，分布不是正态
分布。否则接受原假设。
上证综合指数收盘价曲线
SH
7,000
6,000
5,000
4,000
3,000
2,000
1,000
0
250
500
750
1000
上证综合指数收盘价曲线统计量
240
Series: SH
Sample 1 1000
Observations 1000
200
160
120
80
40
0
1000
2000
3000
4000
5000
6000
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
2501.364
1743.640
6092.060
1011.500
1460.333
0.783449
2.267514
Jarque-Bera
Probability
124.6544
0.000000
上证综合指数收益率曲线
SHR
.100
.075
.050
.025
.000
-.025
-.050
-.075
-.100
250
500
750
1000
上证综合指数收益率统计量
240
Series: SHR
Sample 1 1000
Observations 999
200
160
120
80
40
0
-0.05
0.00
0.05
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
0.000550
0.000353
0.088875
-0.092562
0.018805
-0.460843
6.365833
Jarque-Bera
Probability
506.9232
0.000000
第二节描述性统计量及检验



Quantile—Quantile图
Q-Q图是借助分位数来比较两个分布的一种简单而
重要的工具（比JB统计量的用途更加广泛）。
分位数（Quantile）：对于介于0，1之间的数 q，满
足如下条件的数 x(q) 称为 q 的分位数：
P( x< x(q) ) < q
第二节描述性统计量及检验




分位数的计算：
对于一组观察值，取概率：Pi=(i-0.5)/n ，i=1,…,n。
与Pi对应的分位数是把数据从小到大排列后的第i个
数，记为Q(Pi)。
对任意概率P：Pi <P< Pi+1,有P=Pi +a( Pi+1-Pi)，
那么
Q(P)=(1-a)Q(Pi) +aQ(Pi+1)
第二节描述性统计量及检验









例：数据为 1.1，3.1，0.9，4.2，0.7
从小到大排列为：0.7，0.9，1.1，3.1，4.2
与概率P对应的分位数：
P1=(1-0.5)/5=0.1, ，P2=0.3，
P3=0.5，
P4=0.7， P5=0.9
Q(0.1)=0.7，
Q(0.3)=0.9， Q(0.5)=1.1， Q(0.7)=3.1，Q(0.9)=4.2
对于概率0.2，由于介于P1和P2之间，且有
0.2=0.1+0.5X (0.3-0.1)，
所以
Q(0.2)=(1-0.5) X Q(0.1)+0.5X Q(0.3)=0.5X0.7+0.5X0.9=0.8
第二节描述性统计量及检验

随机变量分位数的计算：
若已知某个随机变量的分布函数，给定概率q，由公
式
P( x< x(q) )=q

即可求解出分位数 x(q)


第二节描述性统计量及检验

Q-Q图----把已知分布的分位数标在纵轴上，样本分
位数标在横轴上，所得到的图形称为Q-Q图

Q-Q图方法是根据Q-Q图的形状来判定样本数据分
布是否与已知分布相同：
若样本数据分布与已知分布相同，则Q-Q图在一条
直线上。
若Q-Q图不在一条直线上，则样本数据分布与已知
分布不相同。


第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：


双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options
第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：


双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options，出现右边的对话
框
第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：
双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
 点击QQ graph中的
options，在出现对话框
中distribution 选择对比
的分布，如Normal
第二节描述性统计量及检验







可选与如下的理论分布的分位数相比较:
Normal(正态)分布：钟形并且对称的分布.
Uniform(均匀)分布：矩形密度函数分布.
Exponential(指数)分布：联合指数分布是一个有着一条长
右尾的正态分布.
Logistic(逻辑)分布：除比正态分布有更长的尾外是一种近
似于正态的对称分布.
Extreme value(极值)分布：I型极小值分布是有一条左长尾
的负偏分布,它非常近似于对数正态分布.
可以在工作文件中选择一些序列来与这些典型序列的分位数
相比较，也可以在编辑框中键入序列或组的名称来选择对照
的序列或组，EViews将针对列出的每个序列计算出QQ图。
第二节描述性统计量及检验



Q-Q图的Eviews 6 操作：
双击文件名(sh), 选择
View/Graph … /QuantileQuantile
点击QQ graph中的options，
在出现对话框中distribution
选择对比的分布，如Normal
第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：

6,000
Quantiles of Normal

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options，在出现对话框
中distribution 选择对比
的分布，如Normal
点击OK，再点击确定，即
出现上证综指收盘价sh与
正态分布的QQ图
8,000
4,000
2,000
0
-2,000
-4,000
0
2,000
4,000
Quantiles of SH
6,000
8,000
第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：

12,000
Quantiles of Exponential

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options，在出现对话框
中distribution 选择对比
的分布，如Normal
点击OK，再点击确定，即
出现上证综指收盘价sh与
指数分布的QQ图
14,000
10,000
8,000
6,000
4,000
2,000
0
0
2,000
4,000
Quantiles of SH
6,000
8,000
第二节描述性统计量及检验
Q-Q图的Eviews 6 操作：

.06
.04
Quantiles of Normal

双击文件名(sh), 选择
View/Graph …
/Quantile-Quantile
点击QQ graph中的
options，在出现对话框
中distribution 选择对比
的分布，如Normal
点击OK，再点击确定，即
出现上证综指收盘价sh与
正态分布的QQ图
.08
.02
.00
-.02
-.04
-.06
-.08
-.10
-.05
.00
Quantiles of SHR
.05
.10
第二节描述性统计量及检验


Excel表格的编辑
表格的编辑

一描述性统计检验

Transcript 一描述性统计检验

Directory