灰色理论模型

Download Report

Transcript 灰色理论模型

灰色理论模型(预测)
主讲:黄厚辉
1
三个问题
1.
2.
3.
什么是灰色理论?
什么是灰色模型?
如何建立和使用灰色模型?
2
什么是灰色理论?

通过对灰数进行灰运算、灰生成,以建立起灰
色模型,通过模型再对客观事物进行预测、控
制、优化…等等,这一套方法体系,我们就称
之为灰色理论。
3
几个概念
1.
2.
3.
灰数
灰运算
灰生成
4
灰数
灰数是指信息不完全的数,例如:“那个小姑娘的
身高大约有165公分左右,体重只有40公斤左
右”.这里的165左右和40公斤左右都是灰数,可以
 (165)
 (40)
分别记为
 (T )  [38,39]
和
.再如:“他的体温大约在38度~39度
之间”,关于体温是灰数,记为
.
5
灰运算
6
灰运算
7
灰生成(灰色生成数列 )
1.
2.
对灰数的处理主要是利用某种数据处理方法去寻求
数据间的内在规律,通过对已知数据列中的数据进
行处理而产生新的数据列,以此来研究寻找数据的
规律性,这种方法称为数据的生成.
数据的生成方式有多种,常用的方法有累加生成、
累减生成和均值生成等.
8
例如: x(0)=(1,3,2,5,8)
x(1)=(1,4,6,11,19)
x(2)=(1,5,11,22,41)
一、累加生成(AGO)
设原始数列为

x (0)  x (0) (1), x (0) (2),, x (0) (n)

k
x (k )   x ( 0) (i) (k  1,2,, n)
令
(1)
i 1
则称 x (1) (k ) 为数列 x ( 0 ) 的1- 次累加生成,数列

x (1)  x (1) (1), x (1) (2),, x (1) (n)
 称为数列 x ( 0 )
的1- 次累加生成数列
k
类似地有 x (k )   x ( r 1) (i) (k  1,2,, n, r  1) 称之为 x ( 0 ) 的
(r )
i 1
r- 次累加生成.记 x (r )  x (r ) (1), x (r ) (2),, x (r ) (n)
,称之为 x
(0)
的
r- 次累加生成数列.
9
例如: x(1)=(1,4,6,11,19)
x(0)=(3,2,5,8)
二、逆累加生成(IAGO)
设原始数列为 x (1)  x (1) (1), x (1) (2),, x (1) (n)
令 x(0) (k )  x(1) (k )  x(1) (k 1)
k  2,3,
,n
则称 x (0) (k ) 为数列 x (1) 的1- 次累减生成。
(r )
(r )
(r )
(r )
一般地,对于r- 次累加生成数列 x  x (1), x (2),, x (n)(r  1)
则称 x( r 1) (k )  x( r ) (k )  x( r ) (k 1)
k  2,3,
, n 为数列 x ( r ) 的
r -次累减生成。
累加生成与累减生成互为逆过程。
10
例如: x(0)=(1,4,6,11,19)
z(0)=(2.5,5,8.5,15)
a=0.5
三、均值生成(MEAN)
设原始数列为:x (0)  x (0) (1), x (0) (2),, x (0) (k  1), x (0) (k ),, x (0) (n)
对于常数:  [0,1]
称 :z (0) (k )  x (0) (k )  (1   ) x (0) (k  1)
为数列 x ( 0 ) 在生成系数(权) 下的邻值生成数
(或生成值)。
  0.5 时,则称:
特别地,当生成系数
z (0) (k )  0.5x (0) (k )  0.5x (0) (k  1)
为邻均值生成数,即等权邻值生成数.
11
灰色模型—GM(1,1)
1.
定义:设x(0)为n个元素的数列:x(0)=(x(0)(1), x(0) (2),…, x(0) (n)),
x(0) 的累加生成数列为:x(1)=(x(1)(1), x(1) (2),…, x(1) (n)),
k
其中: (1)
x (k )   x (0) (i)(k  1,2,  , n)
i 1
定义x(1)(k)的灰导数为:
x(1) (k )  x(1) (k  1)
d (k )  x (k ) 
k  (k  1)
令z(1)为数列x(1)的均值数列,即
(0)
z (1) (k )  0.5x (1) (k )  0.5x (1) (k  1)(k  2,3,, n)
z (1)   z (1) (2), z (1) (3),
, z (1) (n) 
于是定义GM(1,1)的灰微分方程模型为
d (k )  az (k )  b
(1)
( 0)
(1)
x
(
k
)

az
(k )  b
亦即
12

其中x(0)(k)称为灰导数,a称为发展系统,z(1)(k)称为白
化背景值,b称为灰作用量.
将k=2,3,…,n代入上式则有:  ( 0)
(1)
x (2)  az (2)  b
令:
 ( 0)
(1)
 x (3)  az (3)  b


 x ( 0) (n)  az (1) (n)  b

 z (1) (2)
 (1)
 z (3)
YN  ( x ( 0 ) (2), x ( 0) (3),, x ( 0) (n))T , u  (a, b) T , B  
 
 (1)
 z (n)
1

1


1
13

参数向量μ的确定方法:
由最小二乘法则有:
uˆ  (aˆ, bˆ)T  (BT  B) 1 BT YN
具体地:
CD  (n  1) E ˆ
DF  CE
aˆ 
,b 
2
(n  1) F  C
(n  1) F  C 2
其中:
n
n
n
n

C   z (k ), D   x (k ), E   z (k )x (k ), F   z (k )
(1)
k 2
( 0)
k 2
(1)
k 2
( 0)
(1)

2
k 2
14
2.
GM(1,1)的白化型
得到GM(1,1)的灰微分方程对应的白微分方程为:
dx(1)
 ax(1) (t )  b
dt
GM(1,1)的白化型是一个真正的微分方程,如果白化
型模型精度高,则表明所用数列建立的模型GM(1,1)
与真正的微分方程模型吻合较好,反之亦然.
该方程揭示 x (1) (k ) 具有指数规律。
15
小结

灰色建模的方法
① 累加生成原数据列x(0)得到x(1)
② 均值生成x(1)得到z(1)
( 0)
(1)
③ 写出灰微分模型 x (k )  az (k )  b
④ 回带数据利用最小二乘法求得参数a,b的估计值
⑤ 代入a,b的估计值解出相应的白微分方程可得:
b
b

xˆ (1) (k  1)   x ( 0) (1)  e ak 
(k  1,2, , n  1)
a
a

⑥ 还原x(0)(k)=x(1)(k+1)-x(1)(k)
16
灰色预测

1.
2.
3.
4.
灰色预测的步骤
数据的检验与处理
建立模型GM(1,1)
检验预测值
预测预报
17
1.

数据的检验与处理
为了保证建模方法的可行性,需要对已知数据列做必要的检验
处理.设参考数据为:
x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),
( 0)
计算数列的级比  (k )  x (k  1) (k  2,3,, n)
x ( 0 ) (k )

2
n 1
2
n 1
, e 内,
)
如果所有的级比λ(k)都落在可容覆盖 X  (e
则数列x(0)可以作为模型GM(1,1)和进行数据灰色预测.
( 0)
( 0)
y
(
k
)

x
(k )  c (k  1,2,, n)
否则取适当的常数c做变换:
( 0)
( 0)
( 0)
( 0)
使得数列 y  ( y (1), y (2),, y (n)) 的级比:
y (0) (k  1)
 y (k )  ( 0 )
X
y (k )
(k  2,3,, n)
18
2.
建立模型GM(1,1)

按前面的方法建立模型GM(1,1),则可以得到预测值:
b
b

xˆ (1) (k  1)   x ( 0) (1)  e ak 
(k  1,2, , n  1)
a
a

而且:
xˆ (0) (k  1)  xˆ (1) (k  1)  xˆ (1) (k ) (k  1,2,, n  1)
19
3.
检验预测值
1.
残差检验:令残差为  (k ),计算 :
x (0) (k )  xˆ (0) (k )
 (k ) 
(k  1,2, , n)
( 0)
x (k )
2.
如果  (k )  0.2 ,则可认为达到一般要求;如果  (k )  0.1
则认为达到较高的要求.
级比偏差值检验:首先由参考数据 x (0) (k  1), x (0) (k ) 计算
出级比 0 (k ) ,再用发展系数a求出相应的级比
偏差:
 1  0.5a 
 (k )  1  
 0 ( k )
 1  0.5a 
如果  (k )  0.2 ,则可认为达到一般要求;
如果  (k )  0.1 ,则认为达到较高的要求.
20
4.

预测预报
由模型GM(1,1)所得到的指定时区内的预测值,实际
问题的需要,给出相应的预测预报.
21
例子(SARS疫情对某些经济指标影响问题 )

2003年的SARS疫情对中国部分行业的经济发展产生了
一定的影响,特别是对部分疫情较严重的省市的相关
行业所造成的影响是明显的,经济影响主要分为直接
经济影响和间接影响.直接经济影响涉及到商品零售业、
旅游业、综合服务等行业.很多方面难已进行定量地评
估,现仅就SARS疫情较重的某市商品零售业、旅游业
和综合服务业的影响进行定量的评估分析.已知该市的
从1997年1月到2003年10月的商品零售额、接待旅游
人数和综合服务收入的统计数据如下表1、表2和表3.
试根据这些历史数据建立预测评估模型,评估2003年
SARS疫情给该市的商品零售业、旅游业和综合服务业
所造成的影响.
22
表1:商品的零售额(单位:亿元)
年代
1月 2月 3月 4月 5月 6月 7月 8月
1997
1998
1999
2000
2001
2002
2003
83.0 79.8 78.1 85.1 86.6 88.2 90.3 86.7 93.3 92.5 90.9 96.9
101.7 85.1 87.8 91.6 93.4 94.5 97.4 99.5 104.2 102.3 101.0 123.5
92.2 114.0 93.3 101.0 103.5 105.2 109.5 109.2 109.6 111.2 121.7 131.3
105.0 125.7 106.6 116.0 117.6 118.0 121.7 118.7 120.2 127.8 121.8 121.9
139.3 129.5 122.5 124.5 135.7 130.8 138.7 133.7 136.8 138.9 129.6 133.7
137.5 135.3 133.0 133.4 142.8 141.6 142.9 147.3 159.6 162.1 153.5 155.9
163.2 159.7 158.4 145.2 124 144.1 157.0 162.6 171.8 180.7 173.5 176.5
9月 10月 11月 12月
23
表2:接待海外旅游人数(单位:万人)
年代
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
1997
1998
1999
2000
2001
2002
2003
9.4 11.3 16.8 19.8 20.3
9.6 11.7 15.8 19.9 19.5
10.1 12.9 17.7 21.0 21.0
11.4 26.0 19.6 25.9 27.6
11.5 26.4 20.4 26.1 28.9
13.7 29.7 23.1 28.9 29.0
15.4 17.1 23.5 11.6 1.78
18.8 20.9
17.8 17.8
20.4 21.9
24.3 23.0
28.0 25.2
27.4 26.0
2.61 8.8
24.9
23.3
25.8
27.8
30.8
32.2
16.2
24.7 24.3 19.4 18.6
21.4 24.5 20.1 15.9
29.3 29.8 23.6 16.5
27.3 28.5 32.8 18.5
28.7 28.1 22.2 20.7
31.4 32.6 29.2 22.9
20.1 24.9 26.5 21.8
24
表3:综合服务业累计数额(单位:亿元)
年代
2月 3月 4月 5月 6月 7月
1997
1998
1999
2000
2001
2002
2003
96
111
151
164
182
216
241
144
169
238
263
318
361
404
194
235
335
376
445
504
584
276
400
425
531
576
642
741
383
459
541
600
708
818
923
466
565
641
711
856
979
1114
8月
9月 10月 11月 12月
554 652 747 832 972
695 805 881 1011 1139
739 866 975 1087 1238
913 1038 1173 1296 1497
1000 1145 1292 1435 1667
1142 1305 1479 1644 1920
1298 1492 1684 1885 2218
25
一、模型的分析与假设


根据所掌握的历史统计数据可以看出,在正常情况下,全年的平
均值较好地反映了相关指标的变化规律,这样可以把预测评估分
成两部分:
(1) 利用灰色理论建立GM(1,1)模型,由1997~2002年的平均值
预测2003年平均值;
(2) 通过历史数据计算每个月的指标值与全年总值的关系,从而
可预测出正常情况下2003年每个月的指标值,再与实际值比
较可以估算出SARS疫情实际造成的影响.
给出下面两条假设:
(1) 假设该市的统计数据都是可靠准确的;
(2) 假设该市在SARS疫情流行期间和结束之后,数据的变化只与
SARS疫情的影响有关,不考虑其它随机因素的影响.
26
二、建立并求解灰色预测模型GM(1,1)
1.
数据的检验与处理
由已知数据,对于1997~2002年某项指标记为矩阵
A6*12,计算每年的年平均值,记为
X(0)=[87.6167 98.5000 108.4750 118.4167 132.8083 145.4083]
并求得级比为:[0.8895 0.9080 0.9160 0.8916 0.9133]
X=[0.7515
1.3307]
所以数据可以使用。
27
2.
建立模型GM(1,1)
①一次累加得到:
X(1)=[87.6167 186.1167 294.5917 413.0083 545.8167
691.2250]
②对x(1)均值生成(参数取0.4 ?)可得:
Z(1)=[127.0167 229.5067 341.9583 466.1317 603.9800]
③最小二乘求得参数:
[a b]=[-0.0993 85.5985]
28
由:
b
b

xˆ (1) (t  1)   x ( 0) (1)    e at 
a
a

求得:x(1)(7)=861.0677, x(1)(6)= 698.1884
( 0)
(1)
(1)
回代:xˆ (k  1)  xˆ (k  1)  xˆ (k ) (k  1,2,, n  1)
求得:x(0)(7)=861.0677- 698.1884=162.8793
即2003年月平均产值为:162.8793,所以2003
年总产值为:X=162.8793*12=1954
29
由历史数据计算可得每月产值占全年产值比为:
6
ui   aij
j 1
12
6
 a
i 1 j 1
ij
(i  1,2,,12)
代入数据得到:
u=(0.0794, 0.0807, 0.0749, 0.0786, 0.0819, 0.0818,0.0845, 0.0838,0.0872,
0.0886 0.0866, 0.0920)
所以2003年月产值为:
Y=u*X=(155.2,157.8,146.4,153.6,160.1,159.9,
165.2,163.8,170.5,173.2,169.3,179.9)(亿元)
30

将预测值与实际统计值进行比较如下表4所示.
表4:2003年商品的零售额(单位:亿元)
月份
1月 2月
预测值
实际值
155.2 157.8 146.4 153.6 160.1 159.9 165.2 163.8 170.5 173.2 169.3 179.9
163.2 159.7 158.4 145.2 124.0 144.1 157.0 162.6 171.8 180.7 173.5 176.5
3月 4月 5月
6月 7月
8月
9月 10月 11月 12月
31
同理, 接待海外旅游人数 :
表5:2003年接待海外旅游人数(单位:万人)
月份
1月 2月 3月 4月
预测值
实际值
14.8 26.6 25.5 31.9 33.0 30.8 30.4 37.1 36.7 37.8 33.2 25.5
15.4 17.1 23.5 11.6 1.78 2.61 8.8 16.2 20.1 24.9 26.5 21.8
5月 6月
7月 8月 9月 10月 11月 12月
32
表6:2003年综合服务业累计数额(单位:亿元)
月份
2月 3月 4月 5月 6月 7月 8月 9月
预测值
实际值
244 397 555 757 933 1121 1340 1445 1740 1942 2242
241 404 584 741 923 1113 1298 1492 1684 1885 2218
10月 11月 12月
33
模型的结果分析

根据该市的统计报告显示,2003年4、5、6三个月的
实际商品零售额分别为145.2、124、144.1亿元.在这
之前,根据统计部门的估计4、5、6三个月份SARS疫
情对该市的商品零售业的影响最为严重,这三个月估
计大约损失62亿元左右.从我们的模型预测结果来计算,
4、5、6三个月的损失为60.3亿元,这个数据基本与专
家的估算值相符,8月份基本恢复正常,这也说明了模
型的正确性和可靠性.
34
模型的结果分析(续1)


对于旅游业来说是受影响最严重的行业之一,最严重
的4、5、6、7四个月就损失100多万人,按平均每人
消费1002美元计算,大约损失10亿美元.全年大约损失
160万人,约合16亿美元,到年底基本恢复正常.
对于综合服务业中的部分行业影响较大,如航空交通
运输、宾馆餐饮等,但有些行业影响不大,如电信、
通讯等,总平均来看,影响还不算太大,5、6、7、8
四个月大约损失70亿元
35
模型的结果分析(续2)


从预测结果可以看出,虽然下半年没有发生疫情,但
人们一直担心SARS会卷土重来,所以,对这些行业还
是有一定的影响的,即SARS影响的延续性的作用.
该模型虽是就某经济指标的发展规律进行评估预测而
建立的,但类似地也适用于其它方面的一些数据规律
的评估预测问题,即该模型具有很广泛的应用性.
36