离散模型

Download Report

Transcript 离散模型

第五章
离散模型
离散模型是 将实际问题直接抽象成离散的数、符号
或图形,然后以离散数学为主要研究工具来解决的数学
模型。连续模型进行离散化所得到的数学模型不在此讨
论。
一、过河问题
问题
有三名商人各带一名随从要乘一条小船过河,
这条船每次最多只能容纳两个人,并且由于某种原因,
商人们总是提防着随从们,预感到一旦在任何地方只要
随从人数多于商人数,就会对商人构成危害。但是由于
商人们控制着如何乘船的指挥权,所以商人们就可以制
定一个过河方案,以确保商人们的安全。试求出这个方
案。
建模
设在渡河过程中,此岸的商人个数为 x, 随从个数为
y,以  x, y 表示此岸的状态向量,即
E
 x, y  x, y  0,1, 2,3.
在 E 中有一部分对商人是安全的,称为容许状态集合,
记为 S , 即有

S   3, y  y  0,1, 2,3;  0, y  y  0,1, 2,3,
 x, y  x  y  1, 2.
y
2
1
o
1
2
3
x
在上图中, 实点即表示为容许状态的集合.
 x, y  来表示,
乘船的方案称为决策,仍然用向量
即 x名商人和 y 名随从同坐一条船. 在这些决策中, 有
是符合条件的,称为容许决策。容许决策的全体组成集
合构成容许决策的集合,记为 D.
在这个问题中,容许决策的集合为
D   x, y  1  x  y  2.
小船从此岸到彼岸的一次航行,会使两岸的状态发生
一次变化,此称为状态的转移。用
s1  x, y  , s2  x, y  , s3  x, y  ,
表示状态的转移。其中 si
 S ,  i  1, 2,3,
 用 d i  x, y 
表示在状态 si 下的决策。当 i 为奇数时,表示从此岸到
彼岸,当 i 为偶数时,表示从彼岸到此岸。所以
si 1  si   1 di .
i
⑴
公式⑴称为状态转移公式。
所以,该问题转变成寻找一系列的决策di
态 si
 S ,  i  1, 2,3,
转移达到 s n .
 D, 使状
 按⑴由初始状态经过有限次的
解模
建立坐标系统,并在坐标平面上建立的刻度单位。做
网格线,网格线上的每一个交点代表一个状态(用实点
表示)。黄色曲线弧表示向彼岸渡人,绿色曲线弧表示
从彼岸返回。容许决策d i 表现为
y
s1  3,3
从一个实点向另一个实点的转移。
当 i 为奇数时,容许决策表现的是 2
向下及向左的移动,当i 为偶数时
1
容许决策表现的是向上及向右的移 o
1
2
3
x
动。
整个状态的转移用下面的表格来表示。
序号
1
2
3
4
5
6
状态
决策
 3,3  0, 2 
 3,1  0,1
 3, 2   0, 2 
 3, 0   0,1
 3,1  2,0 
1,1 1,1
序号
7
8
9
10
11
12
状态
决策
 2, 2 
 0, 2 
 0,3
 0,1
 0, 2 
 0,0 
 2,0 
 0,1
 0, 2 
 0,1
 0, 2 
分析
从上表中可以看到,该方案是可行的。
二、马氏链及其应用
1.一个简单的例子
我们知道,人寿保险公司最为关心的是投保人的健康
与疾病以及相应的风险。通过下面的例子我们来看保险
公司是如何处理这类问题的。
问题的提出
设t
 1,2,3,
表示年龄的时段,假定在一年中,今
年健康而明年患病的概率是0.2, 而今年患病明年转为健
康的概率为 0.7, 假设一个人在投保时处于健康状态,我
们来研究若干年之后他分别处于这两种状态的概率。
建模
用随机变量 X n 表示第 n 年的状态,
以 n
1 表示健康,
Xn  
n  1,2,3,
2 表示疾病。
 i 表示第 n 年状态为i 的概率。即
n i   P  X n  i .
以 pij 表示今年状态处于i 明年状态处于j 的概率,即
pij  P  X n1  j X n  i  .
⑴
由全概率公式得到:
 n 1  i    n  i  pii   n  j  p ji , i, j  1, 2.
⑵
即
 n 1 1   n 1 p11   n  2  p21 ,
 n 1  2    n 1 p12   n  2  p22 .
由假设,
p11  0.8, p12  0.2, p21  0.7, p22  0.3,
⑶
再由于投保人处于健康状态,即  0 1  1,  0  2   0.
由此得到
n
0 1
2
3
4
1 0.8 0.78 0.778 0.7778
 n 1
 n  2  0 0.2 0.22 0.222 0.2222

7 / 9.
2/9
若投保人在开始时处于疾病状态,即 0 1  0,  0  2   1.
则有
n
0 1
2
3
4
0 0.7 0.77 0.777 0.7777
 n 1
 n  2  1 0.3 0.23 0.223 0.2223

7 / 9.
2/9
从两张表中可以看到,无论投保人在初始时处于什么
状态,当时间趋于无穷大时,该时刻的状态趋于稳定,
且与初始值无关。即
7
2
lim  n 1  , lim  n  2   .
n 
9 n
9
0.7
1
0.8
意义
0.3
2
两种状态的转移概率
0.2
若将众多投保人处于两种状态的比例,视为投
保人处于两种状态的概率,例如健康人占3/4,病人占
1/4,即  0 1  3/ 4,  0  2   1/ 4, 则同样可计算出
7
2
lim  n 1  , lim  n  2   .
n 
9 n
9
由上面的分析可以看出,对于给定的状态转移概率,
n   时的状态概率, n 1 , n  2  趋向于稳定值,该
值与初始值无关,这是马氏链的重要性质。
把人的死亡看作第三种状态,用 X n
 3来表示,相
应的转移概率如下图表示。
仍以 n  i  i  1, 2,3表示状态
为 i 时的概率,pij 表示状态转移概
率,即有
p11  0.8, p12  0.18, p13  0.02,
p21  0.65, p22  0.25, p23  0.1,
p31  p32  0, p33  1,
0.65
1
0.8
0.25
2
0.18
0.02
0.1
3
1
三种状态的转移概率
平行于⑴式,有
 n 1 1   n 1 p11   n  2  p21   n  3 p31 ,
 n 1  2    n 1 p12   n  2  p22   n  3 p32 , ⑷
 n 1  3   n 1 p31   n  2  p32   n  3 p33 ,
设投保人在期初处于健康状态,则由⑷可计算出若
干
年后他处于各个状态的概率。
n
 n 1
n  2
 n  3
0
1
2
3
1 0.8 0.757 0.7285
0 0.18 0.189 0.1835
0 0.02 0.054 0.0880
30
50
0.2698 0.01293
0.0680 0.0326
0.6621 0.8381

0
0
1
表中最后一列数据是通过预测得到的。从表中的数据
又可以看到,无论投保人在期初处于什么状态,当
n  时,总有
lim  n  3  1.
n 
2.马尔可夫链
假设 1.系统是随时间的发展而离散为 t
 0,1,2,3,
;
2.在任何时刻,系统的状态为有限多个。在时间 t 时,
系统的状态的 S 的取值为S
3.在时刻 t
 1, 2,3,
, n;
 1时系统处于各状态的概率只与时刻 t 时
系统所处的概率与转移概率有关。
满足以上三个假设的系统的随机发展过程称为马尔可
夫过程或马氏链。
设在时刻 t 时系统处于状态 i 的概率为
i  t  , i  1, 2,3, , n; t  1, 2,3, .
行向量
  t   1  t  , 2  t  , , n  t  
⑸
称为状态概率向量,由概率的意义,向量应该满足
i  t   0, i  1, 2, , n, t  0,1, 2, .
⑹
及
n
  t   1.
i 1
i
t  0,1, 2,
.
⑺
设在时刻 t 处于状态 si的系统转移到 t
 1时刻处于s j
的概率为 pij , 它应该满足
1. pij  0, i, j  1, 2,
, n,
n
2.
 pij  1, i  1, 2,
j 1
引如概率转移矩阵
n.
⑻
P   pij 
n n
 p11
p
21




 pn1
p12
p22
pn 2
p1n 

p2 n 
.


pnn 
由假设3,再由全概率公式得
1  t  1  1  t  p11   2  t  p21   n  t  pn1

 2  t  1  1  t  p12   2  t  p22   n  t  pn 2 ⑼
.


  t  1    t  p    t  p    t  p
1
1n
2
2n
n
nn
 n
简单地可以写成
n
i  t  1   j  t  p ji .
j 1
用矩阵的方法来表示的话,⑼可以写成
  t  1    t  P.
由此可得系统在时刻 t 时的状态向量为
t
 t     0 P ,
其中  0 为时刻 t
状态初始向量。
⑽
 0时系统的状态概率向量,又称为
例
在前两例中,初始向量与概率转移矩阵分别为
  0    0.8,0.2  ,
 0.8 0.2 
P
,

 0.7 0.3 
 0.8 0.18 0.02 


  0    0.75,0.25,0  , P   0.65 0.25 0.1  .
 0

0
1


我们通过下面的例子具体说明:
 2  t  1  1  t  p12   2  t  p22  3  t  p32 ,
上式表明在时刻 t
 1时投保人处于患病状态的概率
为:
 2  t  1  1  t  p12   2  t  p22   3  t  p32
 1  t   0.18   2  t   0.25.
从上面的例子中可以看出,对于马氏链模型,最重要
的是构造状态 S 及概率转移矩阵 P, 由此对于给定的初始
状态  0  , 由⑽可计算出任意时刻 t 的状态  t  .
正则链
定义
一个有 n 个状态的马氏链,如果存在正整数 N ,
使从任意状态 i , 经 N 次的转移,能以大于零的概率到
达状态  j
定理1
 i, j  1, 2,
, n  . 则称这样的链为正则链.
设马氏链的转移矩阵为 P, 则该链为正则链的
充分必要条件是存在 N , 使得 P
N
 0.
定理2
正则链存在唯一的极限状态概率
w   w1 , w2 ,
, wn  ,
满足 lim   t   w, w 与初始状态概率  0  无关,且
t 
wP  w,
及
n
w
i 1
i
 1.
⑾
⑿
例1 设
 0.8 0.2 
P
,

 0.7 0.3 
则由此确定的马氏链为正则链。令 w 
 w1 , w2  , 满足
⑾式,即有
 0.8 0.2 
  w1 , w2  ,
 w1 , w2  

 0.7 0.3 
由此得到方程组
0.8w1  0.7 w2  w1
,

0.2 w1  0.3w2  w2
联系⑿则得到
2w1  7 w2  0,

2w1  2 w2  2,
故方程组的解为
7 2
 w1 , w2    ,  .
9 9
这和前面的结果是相吻合的。
例2
设
1
2

1

P
4

 0

因
1
2
1
2
1
2

0

1
,
4

1

2
3
8

1
2

P 
4

1

8
1
2
1
2
1
4
1
8

1
 0,
4

3

8
故由此确定的马氏链是正则链。令
w   w1 , w2 , w3  ,
由方程⑾,⑿确定方程组
1
1
w1  w2  w1 ,
2
4
1
1
1
w1  w2  w3  w2 ,
2
2
2
w1  w2  w3  1.
1
1
1
从方程中解出 w1  , w2  , w3  , 即
4
2
4
1 1 1
 w1 , w2 , w3    , ,  .
4 2 4
吸收链
定义
如果存在某个状态转移概率 pii  1, 则称状态 i是
吸收的. 如果马氏链中含有吸收状态, 并且从每一个非
吸收状态出发都可以达到某个吸收状态,则称这个马氏
链为吸收链。
例如在前面三个状态的转移概率中,转移概率矩阵
为
 0.8 0.18 0.02 


P   0.65 0.25 0.1  .
 0

0
1


并且从每个状态最终都转移到第三种状态, 因而这样的
链是吸收链。
注
吸收链的特征是:任一状态一旦进入该状态就
将停留在该状态。
含有 m个吸收状态和 n  m 非吸收状态的吸收链的
状态转移概率矩阵的标准形式是
Pnn
 I mm

 R

其中 R  0, I 是单位矩阵。

,

Q n  m n  m 

0
定理3
对于具有标准形式的状态转移概率矩阵,有如
下的性质:
t
⑴矩阵 Q 具有零极限,即 lim Q
 0.
t
t 
⑵矩阵 I
 Q 可逆且
 I  Q
1

 Q .
t
t 0
⑶记
N   I  Q
1
i
则矩阵的第
行元素之和值是从非
i
,
吸收状态出发被某个吸收状态吸收之前的平均转移次
数。
⑷记 B 
NR 则矩阵 B 的元素 bij 是从非吸收状态 i 出
发而被状态 j 吸收的概率。
在前面的例2中,将 P改写成
0
0. 
 1


P   0.1 0.25 0.65  ,
 0.02 0.18 0.8 


则
 0.25 0.65 
 0.1 
Q
,R  
.


 0.18 0.8 
 0.02 
则
 I  Q
 0.25 0.65 
 0.1 
Q
,R  
.


 0.18 0.8 
 0.02 
1
1
 0.75 0.65 
1  0.2 0.65 


,



0.033  0.18 0.75 
 0.18 0.2 
1  0.2 0.65  0.1 
1  0.033 
B
 0.18 0.75  0.02  
 0.033  ,
0.033 

 0.033 

应用
基因遗传问题
生物的外部特征是由生物体内的基因决定的。基因分
优势与劣势基因两种。分别表示为d , r. 对于生物的某
个外部特征,体内有两个基因与之对应。由于体内的每
个基因都可以是两种基因之一,因此体内的基因对类型
可能有三种:dd , dr , rr. 分别被称为优种、混种和劣
种。按基因理论:含优种和混种的基因个体类型,其外
部特征呈优势;而含劣势基因类型的个体,其外部特征
呈劣势。
生物在繁殖时,后代随机地继承父亲和母亲的两个基
因中的各一个而形成自己的基因对。因此后代成为优
种、劣种、混种基因类型的概率是不同的。
下面讨论两种基因繁殖后代的情况
一、永远与混种繁殖后代的情况
假设一个个体是优种,而另一个个体是混种,则它们
的直接后代成为优种 D 、混种H、劣种 R 的概率分别为
1 1
, ,0.
2 2
假设一个个体是混种,而另一个个体是混种,则它们
的直接后代成为优种 D 、混种H、劣种 R 的概率分别为
1 1 1
, , .
4 2 4
假设一个个体是劣种,而另一个个体是混种,则它们
的直接后代成为优种 D 、混种H、劣种 R 的概率分别为
1 1
0, , .
2 2
由此得到概率转移矩阵
1
2

1

P
4

 0

1
2
1
2
1
2

0

1
,

4

1

2
由前面的例2知该链为正则链,极限状态概率向量为
1 1 1
 w1 , w2 , w3    , ,  .
4 2 4
上式表明,经过长时间的繁殖过程,后代的外部特征
呈优势的概率是优种和混种概率的和,这个量与初始的
个体所含基因的种类无关。
2.近亲繁殖的结果
假设最初的父母可以是优种、混种或劣种,它们有大
量的后代,这些后代又随机地雌雄交配后代,今来分析
它们后代的演变情况。
由于每次繁殖都是随机地配对父亲和母亲,而父亲和
母亲可以是 D, H , R中的一种,组合后就有 DD, RR,
DH , DR, HH , HR 六种状态,分别记为1,2,3,4,5,6.
当父母都是优种 D 时,后代必然是优种 D, 因此有
p11  1, p1 j  0. j  2,3, 4,5,6.
同理,当父母都是劣种时,后代只能是劣种,由此得
p22  1, p2 j  0. j  1,3, 4,5,6.
当父母一方为 D 而另一方为 H 时,当前状态可能是
,
 D, H 因而再次配对产生的可能结果有
 D, D  ,  D, H  ,  H , D  ,  H , H  .
因此,有
1
1
1
p31  , p33  , p35  .
4
2
4
当父母方为  D, R  对时,其后代只可能是 H ,因而再
次配对之后之可能产生  H , H  , 所以
p45  1, p4 j  0. j  1, 2,3, 4,6.
当父母方为  H , H  对时,其后代可能是  d , d  ,  d , r  ,
 r, d  ,  r, r  ,
甲
 D, H , H , R  ,
乙
 D, H , H , R  ,
因而相应的概率为
1
1
1
1
1
1
p51  , p52  , p53  , p54  , p55  , p56  .
16
16
4
8
4
4
所以概率转移矩阵为
0
0
0
0
0 
 1
 0

1
0
0
0
0 

 1/ 4
0 1/ 2 0 1/ 2 0 
P

0
0
0
1
0 
 0
1/16 1/16 1/ 4 1/ 8 1/ 4 1/ 4 


1/ 4
0
0 1/ 4 1/ 2 
 0
从上面中可以看到状态1和状态2是吸收状态。所以该链
为吸收链。
由前面的计算公式得到
8 1 4 2
 5
3 6 3 3
46


 
4 4 8 4
6 2 
3 3 3 3
 3
N 
 , N 的行和 =   ,
4 1 8 4
5 2 
3 3 3 3
 3
2 1 4 8
 5


4 
3 6 3 3
 6
3
4

1
2
B
1

2
1

4
1
4

1
2
.
1
2
3

4
5
根据矩阵 N 和 B 的性质,上式表明从状态3出发经过 4
6
代后它们的后代都会变成优种或劣种,从状态3出发其
3
后代全变为优种的概率为 .
4
上面表明:近亲繁殖的后代变成劣种的可能性很大。
三、钢琴销售的存储策略
问题的提出
一家商店根据以往经验, 平均每周只能售出1架钢琴.
现在经理指定的存储策略是: 每周末检查库存量. 仅当
库存量为零时, 才订购3架供下周销售; 否则不订购. 试
估计在这种策略下失去销售机会的可能性有多大? 以及
每周的平均销售量是多少?
问题分析
对钢琴这类比较昂贵的商品, 其销售一般被认为服从
泊松分布. 即设 X 为每周的销售量, 则
P X  k  
k
k!
e  .
   0
周末的库存可能为0,1,2,3.而周初的库存可能为1,2,3.
注意到需求的改变将引起库存的改变. 而当需求大于库
存时又会失去销售的机会. 今来计算这种变化的规律.
模型假设
1.钢琴每周的需求量服从泊松分布,且均值为1.
2存储策略是:当周末库存量为零时, 订购3架, 周初到货,
否则不订购.
3.以每周初的库存为状态变量, 状态转移具有无后效性.
4.在稳定状态下计算该存储策略失去销售机会的概率,
和每周的平均销售量.
模型建立
记第 n 周的需求量为 Dn , 则 Dn 服从均值为1的泊松分
布, 即有
P  Dn  k  
k
 k =0,1,2,    0 ⑴
k!
再记第 n 周初的库存量为 Sn , Sn  1, 2,3 为该系统的状
e  .
态变量, 则有
Sn 1
 Sn  Dn , Dn  Sn ,

Dn  Sn .
 3,
⑵
由⑴得
P  Dn  0   P  Dn  1  e  0.368.
1
1 1
P  Dn  2   e  0.184.
2
1 1
P  Dn  3  e  0.061.
6
P  Dn  3  0.019.
并由此计算概率转移矩阵
 p11

P   p21
p
 31
p12
p22
p32
p13 

p23  .
p33 
p11  P  Sn1  1 Sn  1  0.368.
p12  P  Sn1  2 Sn  1  0.
p13  P  Sn1  3 Sn  1  0.632.
p21  P  Sn1  1 Sn  2  0.368.
p22  P  Sn1  2 Sn  2  0.368.
p23  P  Sn1  3 Sn  2  0.264.
*
p31  P  Sn1  1 Sn  3  0.184.
p32  P  Sn1  2 Sn  3  0.368.
p33  P  Sn 1  3 Sn  3
 P  Dn  0   P  Dn  3  0.448.
即
0
0.632 
 0.368


P   0.368 0.368 0.264  .
 0.184 0.386 0.448 


记状态概率为 i
 n   P  Sn  i  , i  1, 2,3,
  n   1  n  , 2  n  ,3  n   ,
即有
注意到 P
  n  1    n  P.
2
 0, 即马氏链为正则链. 令w   w1 , w2 , w3 
满足 wP  w, 且 w1
 w2  w3  1. 解之得
w   0.285,0.263,0.452 
假定初始状态为1架钢琴, 即状态概率为
  0   1,0,0  ,
则
0
0.632 
 0.368
 1    0  P   0,0,1  0.368 0.368 0.264 
 0.184 0.386 0.448 


  0.368,0,0.632  .
  2    1 P
0
0.632 
 0.368
  0.368,0,0.632   0.368 0.368 0.264 
 0.184 0.386 0.448 


  0.251712,0.243952,0.504336  .
该存储策略在第 n 周失去销售机会的概率为
3
P  Dn  Sn    P  Dn  i Sn  i   P  Sn  i  .
i 1
当 n   时可近似认为 P
 Sn  i   wi .则有
P  Dn  Sn   0.264  0.285
0.080  0.263  0.019  0.452  0.105.
即从长期看, 失去销售的机会为10%.
最后计算平均销售量(用数学期望):
3
En   iP  Dn  i  .
i 1
但当库存量为 i 时, 销售量的最大取值为i , 因而上式为
3
En   iP  Dn  i 
i 1
 i 1

   jP  Dn  j | Sn  j   iP  Dn  i  | Sn  i 
i 1  j 1

3
P  Sn  i  .
同样, 当 n   时, 用稳态概率wi 来代替 P
 Sn  i  .
则
En  0.632  0.285  0.896  0.263  0.977  0.452
 0.857.
即从长期看, 每周的平均销售量为0.857.
讨论
在原问题中, 若将订购策略改为: 若当周末的库存量
为零时, 订购量为销售量加2, 否则不订购, 试建立相应
的马氏链.
解
当概率不变时, 则概率分布为
P  Dn  1  P  Dn  1  0.368, P  Dn  2   0.184,.
P  Dn  3  0.061, P  Dn  4   0.015
P  Dn  5  0.003, P  Dn  6   0.001, P  Dn  6   0.
由此得到状态变量S n 的取值为S n ,1, 2,3,
P11

概率转移矩阵为 P 
P
 21
P12 
其中
.

P22 
,8.
0
0.632
0 
 0.368
 0.368 0.368

0
0.264 

P11 
,
 0.184 0.368 0.368
0 


 0.061 0.184 0.368 0.368 
0
 0
 0
0

P12 
 0.080
0

0.019
 0
0 0

0 0
,
0 0

0 0
 0.015
 0.003
P21  
 0.001

 0
0.061 0.184 0.368 

0.015 0.061 0.184 
,
0.003 0.015 0.061 

0.001 0.003 0.015 
0
0.004
0 
 0.368
 0.368 0.368

0
0.001 

P22 
.
 0.184 0.368 0.368
0 


 0.061 0.184 0.368 0.368 
四、合作对策模型
在经济或社会活动中,几个个体相互合作或结成联
盟,常常能或得比他们单独行动能获得的经济效益或社
会效益。怎样来合理分配所获取的效益是合作对策的研
究题目。
1.三人联合经商的利润分配问题
假设有 A, B, C 三人在经商。
若三人都独自经商,则每人每月都只能获得利润1万
圆;
若 A和 B 合作经商, 则他们每月可获得利润7万圆;
若 A和 C 合作经商, 则他们每月可获得利润5万圆;
若B和 C 合作经商, 则他们每月可获得利润4万圆;
若三人合作经商, 则他们每月可获得利润10万圆;
则问题转变为这10万圆的利润应如何分配给三人。
先给出合作对策的一般模型
记I
 1, 2,
任一子集合 s
, n , 为有 n个人的集合,若对于 I 的
 I , 都有一个实数v  s  与之对应,且满
足下面条件:
⑴
v     0;
⑵对 I 的任意两个子集合 s1 , s2 , s1
s2  , 有
v  s1
s2   v  s1   v  s2  ,
⑴
则称 v  s  为定义在 I 上的一个特征函数。
所谓合作对策就是要确定已定义有特征函数的 I 中的
n个人合作的结果,它表现为向量
 v  1  v  ,2  v  , ,n  v .
⑵
在实际问题中,常把 I 中各种组合的合作所获得的利
益定义为特征函数,向量  v  就是n 个人合作获利的
分配。
Shapley提出了应该满足的如下几个公理:
是 I  1, 2, , n的一个排列,对于I
的任一子集 s  i1 , i2 , , ik  , 令
 s   i1 ,  i2 , ,  ik  ,
再定义 I 上的特征函数 w:w  s   v  s  .则对于每
公理1
设
个i  I , 有
i  w   i   v  .
上式表明:合作获利对每个人的分配与记号无关。
⑶
公理2 若对所有包含 i的子集 s, 都有
v  s  i  v  s  , 则 i  v   0.
公理2表明如果有人对他所参加的所有项目都没有贡
献,那么他就不应该从全体的合作中获利。
公理3
n
  v   v  I  .
i 1
i
公理3表明各个人的分配之和等于合作获利。
⑷
公理4
若 v 也是定义在 I 上的特征函数,且w  v  v,
则
  w     v     v  .
⑸
公理4表明,若 n个人同时进行两个项目的合作,则获
利的分配为两个独立项目分配之和。
Shapley证明了满足着四条公理的
且解的公式为:
 v 是唯一的,并
i  v    w  s  v  s   v  s  i ,
⑹
sSi
其中 S i 是 I 中所有含i的子集,s 是集合 s 中的人数,
w  s  是加权因子,其值为
w s 
s  1! n  s !


.
n!
⑺
v  s   v  s  i   可看作为成员i对合作 s 的贡献。
 表示对所有含i的子集 s 求和。
sSi
在例1中,将 A, B, C 分别记为1 , 2 , 3. 当i
1
时,经计算得下表:
s
v s
1
1, 2 1,3 1, 2,3
1
7
5
10
0
1
1
4
1
6
4
6
s
1
2
2
3
w s 
1/3
1/6
1/6
1/3
1/3
1
2/3
2
v  s  1
v  s   v  s  1
w  s  v  s   v  s  1  
代入⑹得
1
2
1  v    1   2  4.
3
3
即 A应分得利润4万圆。同理可计算对i  2 时,有相应
的值:
s
v s
2
1, 2 2,3 1, 2,3
1
7
4
10
0
1
1
5
1
6
3
5
s
1
2
2
3
w s 
1/3
1/6
1/6
1/3
1/3
1
1/2
5/3
v  s  2
v  s   v  s  2
w  s  v  s   v  s  2  
代入⑹,得
2  v   3.5.
最后计算,得
3  v   2.5.
2.三城镇的污水处理方案
沿河有城镇1、2、3,地理位置入图所示,城镇的污
水必须经过处理后才能排入河中,因此三个城镇将单独
或联合建造污水处理厂,用管道将污水集中处理(污水
应从位于河流的上游向位于下游的城镇输送)。
以 Q 表示污水量,L 表示管道长
度,由经验公式,建厂费为
CT  73Q
0.712
(万圆).
20
1
河
2
流
38
3
铺管费为
CP  0.66Q
0.51
L(万圆).
 5  t / s  , Q2  3  t / s  ,
Q3  5  t / s  , 城镇间的距离分别为 L12  20, L23  38,
已知三城镇的污水量分别为Q1
试从节约总投资的角度出发,为三个城镇制定一个建
造
污水处理厂的方案。如果联合建厂,各城镇应如何分担
费用?
以I 
1, 2,3代表三城镇,考虑
三城镇污水处理的如下5种方案
⑴分别建厂,投资费用为
C 1  73  50.712  230, C  2   160, C  3  230.
总投资D1  C 1  C  2   C  3  620.
⑵1,2合作在城镇2建立厂,则投资为
C 1, 2   73   5  3
0.712
 0.66  50.51  20  350,
总投资为 D2  C 1, 2   C  3  580.
⑶2,3合作在城镇3建厂,则投资为
C  2,3  73   5  3
0.712
 0.66  30.51  38  365,
总投资为 D3  C  2,3  C 1  595.
⑷1,3合作在城镇3建厂,则投资为
C 1,3  73   5  3
0.712
 0.66  30.51  58  463,
该费用超过了1,3分别建厂的费用 C
故该方案无意义。
1  C  3  460,
⑸三城合作在城镇3建厂,则总费用为
D5  C 1, 2,3  73   5  3  5 
0.66  5
0.51
 20  0.66   5  3
0.712
0.51
 38  556.
比较结果,
D  min D1 , D2 , D3 , D5 
 min 620,580,595,556  556.
即:选择联合建厂是一个最佳方案。但问题是应该如
何分担费用。
总费用 D由三部分构成:联合建厂费
d1  73   5  3  5
0.712
 453,
城1至城2的管道费
d2  0.66  5
0.51
 20  30.
城2至城3的管道费
d3  0.66   5  3
0.51
 38  73.
d 2 , d3 是
城3提出:d1由三城镇按5 : 3: 5 的比例分担,
城1、2铺设的管道费用,则由他们承担,城2同意,并
提出 d 3 由城1、2按污水量5 : 3 的比例分担,而d 2 由城
1独自承担,城1不同意。 现计算按上面的想法各城应承
担的费用:
5
3
3
 174. 城2:d1   d3  132.
城3:d1 
13
13
8
5
5
城1:d1 
 d3  d 2  250.
13
8
上面结果表明:城2、3的分担费用比单独建厂的费用
要低,而城1的费用要比单独建厂所花费的费用要高,
因而城1不能赞同这种方案。
为了促成三城联合建厂,应当寻找合理分担费用的方
案。三城的合作节约了投资,产生了效益,可以将其看
作是一个 n个人的合作问题。联合建厂比单独建厂节约
的投资定义为特征函数,于是有
v     0, v 1  v  2   v  3  0,
v 1, 2   C 1  C  2   C 1, 2   40,
v  2,3  C  2   C  3  C  2,3  25,
v 1,3  0,
v  I   C 1  C  2   C  3  C 1, 2,3  64,
三城联合建厂的效益为64, 由Shapley值作为这个效益
的分配,则有表
s
v s
1, 2 1,3 1, 2,3
0
40
0
64
0
0
0
25
0
40
0
39
s
1
2
2
3
w s 
1/3
1/6
1/6
1/3
0
6.7
0
13
v  s  1
v  s   v  s  1
w  s  v  s   v  s  1  
得1
1
 v   19.7,
s
v s
1, 2 2,3 1, 2,3
0
40
25
64
0
0
0
0
0
40
25
64
s
1
2
2
3
w s 
1/3
1/6
1/6
1/3
0
6.7
4.17
21.3
v  s  2
v  s   v  s  2
w  s  v  s   v  s  2  
得2
2
 v   32.2,最后得3  v   12.2.
结果分析:
三城镇联合投资建厂的分担费用为:
城镇1 C 1  1  v   210.4.
城镇2 C  2   2  v   127.8
城镇3 C  3  3  v   217.8.
与按比例分担比较:250,132,174. 城镇1收益最大,
而城镇3“吃亏”。
3.股东在公司中的权重
某股份公司有4个股东分别持有40%,30%,20%,10%
的股份,公司的决策必须经持有半数以上股份的股东同
意才可通过,问这 4个股东在公司决策中的权重各多大?
该问题可看作为 4 个人的合作对策,记 I
 1, 2,3, 4.
其中1,2,3,4分别代表持有40%,30%,20%,10% 股份
的股东。特征函数定义为:对 I 中的任一子集 s, 当其持
有的股份超过 50%时,v  s   1, 其余 v  s   0.于是
v  s   1的子集为
1, 2 ,1,3 ,1, 2,3 ,1, 2, 4 , 1,3, 4, 2,3, 4, 1, 2,3, 4,
由公式⑹,⑺可计算各个股东的Shapley值i  v  .
其余 9个子集的v  s   0.
对i
 1, 经计算可得
s
v s
1
1, 2 1,3 1, 4
0
1
1
0
0
0
0
0
0
1
1
0
s
1
2
2
2
w s 
1/4
1/12
1/12
1/12
0
1/12
1/12
0
v  s  1
v  s   v  s  1
w  s  v  s   v  s  1  
s
v s
1, 2,3 1, 2, 4 1,3, 41, 2,3, 4
1
1
1
1
0
0
0
1
1
1
1
0
s
3
3
3
4
w s 
1/12
1/12
1/12
1/4
1/12
1/12
1/12
0
v  s  1
v  s   v  s  1
w  s  v  s   v  s  1  
由此得到
5
1  v   .
12
对i  2, 相应的数值为
s
v s
2
1, 2 2,3 2, 4
0
1
0
0
0
0
0
0
0
1
0
0
s
1
2
2
2
w s 
1/4
1/12
1/12
1/12
0
1/12
0
0
v  s  2
v  s   v  s  2
w  s  v  s   v  s  2  
s
v s
1
1
1
1
1
0
0
1
0
1
1
0
s
3
3
3
4
w s 
1/12
1/12
1/12
1/4
0
1/12
1/12
0
v  s  2
v  s   v  s  2
w  s  v  s   v  s  2  
得2
1, 2,3 1, 2, 4 2,3, 41, 2,3, 4
 v   1/ 4.
同理可计算
3  v   1/ 4, 4  v   1/12.
即权重向量为
5 1 1 1
 v   , ,
.
 12 4 4 12 
Shapley值方法的确定及解决方法
Shapley值方法以严格的公理为基础,在处理合作对
策的分配问题时具有公正、合理等优点,但是它需要知
道所有合作者的获利,即要定义 I
 1, 2,
, n的所有
子集的特征函数,通常情况下这很难办到。例如n 个单
位合作治理污染,第i 方单独治理的投资 yi 和n 方合作治
理的投资Y 是已知的,还要知道第i 方不参加合作时其
余 n  1 方所需的投资 zi ,特征函数定义为合作的获利,即
节约的投资。为此有 v  i   0  i  1, 2,
, n,
n
n
i 1
i 1
v  I    yi  Y , v Y  i   yi  zi ,
除此之外还要计算其它的 v  s  . 这在计算上有一定的困
难。
以三人经商为例,我们介绍其余的几种方法:
记 v  I   B, 无 i 参加时其余 n  1 方合作的获利记作
v  I  i  bi  i  1, 2,

, n  , 记 b  b1 , b2 ,
试确定各方对全体合作获利的分配。记作
z   x1 , x 23 
, b.n

五、团体决策模型
参加评选优秀运动员、优秀产品,选举代表都要有一
定的办法。该方法能从各位评判人员对评选对象的评价
综合地得出对各个评选对象的总的评价,从而选出优秀
者或排出名次。这样一类问题称为团体决策问题,各种
评选方法构成团体决策模型。
一、团体决策函数
设 I  1, 2,
, n是由 n 位评选人组成的集合;
设 A  O1 , O2 ,
, Om 是由 m 个被评选对象组成的
集合。
假设评选方法如此规定:
⑴要求每位评选人员i对所有在候选对象集合 A中的
候选对象给出一个排序 pi
 i  1, 2,  ,
这里序的定义为:
1.对任意的评选对象 x, y  A,
和x
必有 x
 y, x  y
 y 三种关系之一,且只有一种关系成立;
2.对任意三个评选对象 x, y, z  A, 若 x 
则必有 x 
y, y  z,
z.
⑵评选人员的排序组成一个排序组  p1 , p2 ,
, pn  ,
称为 I对 A 的一个分布,要求以此分布为基础确定整个
评选人员集合 I对候选对象 A的所有对象的一个排序 p,
这个评选结果是由分布  p1 , p2 ,
, pn  的一种对应关
系,称为团体一致函数,记作 F .
(一)、简单多数原则
x  y成立,则称有 x  y i ,
如果在排序 p 中有关系 x  y成立,则称有 x  y  .
如果在排序 pi中有关系
,
 x  y i 成立的
i超
过 n的一半时,就认为有 x  y  成立。然后根据一系
简单多数原则是:当且仅当有
列对象间的上述形式的关系来排出总序。
例如,取 I
 1, 2,3 , A   x, y, u, v , 给出分布
p1 : x  y  u  v, p2 : y  x  u  v,
p3 : x  u  v  y.
显然,使
 x  y  成立的i 的个数是 2  3/ 2,
⑴
故有
 x  y  . 使 y  u i 成立的i的个数为 2  3/ 2,
 y  u  , 同理,最后得排序为
x  y  u  v.
故有
简单多数原则的一个缺陷:产生循环。
例
I  1, 2,3 , A   x, y, z ,
p1 : x  y  z , p2 : y  z  x; p3 : z  x  y.
结果:x
 y  z  x. 从而无法给出排序。
⑵
(二)、Borda数原则
记 Bi  x 为排序 pi 中劣于 x的 A 的元素的个数,称为 x
对i的Borda数,而称
n
B  x    Bi  x 
⑶
i 1
为 x的Borda数。
Borda数原则是:当且仅当 B  x   B  y 时就认为有
x  y,且两个式中的等号是同时成立的。然后再根据一
系列对象间的上述形式的关系来派出总序。
在排序⑴中,各个对象的Borda数依次为
B1  
B2  
B3  
B  
x
y
3
2
2
7
2
3
0
5
u
v
0
1
2
3
0
0
1
1
再由⑶,得
B  x   7, B  y   5, B  u   3, B  v   1.
由此得相应的排序为:
P : x  y  u  v.
此与用简单多数原则所获得的结果是一致的。
但是, Borda也有失效的时候。例如对 I
A   x, y, z, u, v, w , 分布
 1, 2,3, 4,5 ,
p1  p2  p3  p4 : x  y  z  u  v  w,
p5  y  z  u  v  w  x.
⑷
相应的Borda数表为
B1  
B2   B3   B4   B5   B 
x
5
5
5
5
0
20
y
4
4
4
4
5
21
z
u
v
w
3
3
3
3
4
16
2
2
2
2
3
11
1
1
1
1
2
6
0
0
0
0
1
1
于是有
B  y   B  x   B  z   B u   B  v   B  w .
得出总的排序
p : y  x  z  u  v  w.
但是,按简单多数原则来排序的话,则排序为
p : x  y  z  u  v  w.
此排序似乎更为合理。
二、Arrow公理
i i  1, 2,
设
, n, 为选民的集合,A   x, y,
候选人的集合。称一个分布p   p1 , p2 ,
为
, pn 为一次投
票,称 pi 为选民 i的投票;称团体决策 p为选举结果,
团体一致函数 F 是从每个选民的投票来确定选举结果的
选举程序。Arrow在1951年提出选举程序应满足的四条
公理:
公理1
对任何一对候选人 x和 y都可能存在一次投
票,根据选举程序能确定  x  y  .
公理2
如果选举程序根据第一次投票的结果确定了
 x  y  , 在第二次投票时每个选民i的投票 pi 中 x 的次
序与第一次相同,或则是提前了,而其他候选人的次序
不变,则选举程序根据第二次投票也应该有  x  y  .
公理3
设 A1为 A 的一个子集,如果在两次投票中每
个选民对在 A1中的的各候选人的排序不变,则在选举
中排序不变,则在选举程序所确定的两次选举结果中,
A1中的各候选人的排序相同。
公理4
不能存在这样的选民 i ,使得对任一对候选
人 x 和 y , 只要他的投票
 x  y .
pi 中有  x  y i 就能确定有
现在的问题是,有没有满足这四条公理的选举程序
呢?下面的情况说明这个问题与候选人数和选民人数有
关。
①当 m  1或 n
 1时,这样的选举是无意义的;
②当 m  2 或 n  2时,简单多数原则所确定的选举
程序就是满足四条Arrow公理的选举程序。
③当 m  3 且 n  2 情况时,不存在满足四条Arrow
公理的选举程序。
该结论说明了:如果你认为只有满足Arrow公理的选
举程序才是公平合理的,那么这样的选举程序是不存
在的!
三、联合尺度
对于某种评选对象(例如酒)可以按照某个指标(例
如甜度)在区间  0,1上标记出它的位置;而每位评选者
都按自己的标准认定了在区间  0,1上的某个位置是最理
想的。于是在区间  0,1 上就有两个尺度,称它为联合尺
度。
设 x, y, u , v 为四个候选对象,它们各处于 0,0.1,0.9,
和 0.7的位置上;有1, 2,3三位评选者,他们各认定 1,0.4
和 0.6 是最佳位置。我们将评判者i 所认定的理想位置
也记作 i.
按联合尺度可得到每位评判者的排序:如果对象离
开i近的就排在前面,距离相等的就认为名次相同。
于是按下图所确定的排列为:
p1 : u  v  y  x; p2 : y  v  x  u;
p3 : v  u  y  x.
xy
再由简单多数原则决定出的排列是

v u

2 3

1
p : v  u  y  x.
可以看到:3为标准在联合尺度的居中的评判者,而他
的排序正好是与简单多数原则确定的排序 p 相同。
定理
设候选人集合为 A, 选民集合为I , 且选民的个数为
奇数个,又设按联合尺度得到的投票结果记为
 p1 , p2 ,
, p2 k 1 ,
而所有这样的投票结果的全体组成集合 R2 k 1  A .
设有 R2 k 1  A 中的一次投票,而  j是在联合尺度上
居中的那位选民,则按照简单多数原则所确定的选举结
p 与p j 是一致的,并且简单多数原则符合Arrow公理。
六、层次分析模型
层次分析法是T.L.Saaty等人在70年代初提出和广泛应
用的方法。它不仅可用来在工程技术、经济管理、社会
管理、社会生活等方面进行决策,而且可用来进行分析
和预报,它是近年来发展起来的系统分析的重要数学工
具之一。
假设有三个旅游地点 x1 , x2 , x3 可供选择,要考虑的
的因素有五个:费用 y1 , 景色 y 2 , 居住条件 y3 , 饮食条件
y4 , 和交通条件 y5 , 旅游者的最后决策为z.
设每个因素对三个地点的权重都是以知的,它们为
wyi  x j  , i  1, 2,3, 4,5; j  1, 2,3,
 w  x   1, i  1, 2,,3, 4,5.
3
i 1
yi
j
设旅游者在考虑旅游地点时对每个因素的(偏爱)权
重是已知的,它为
3
wz  yi  , i  1, 2,3, 4,5;  wz  yi   1.
i 1
设旅游者对地点的权重为
wz  x j  j  1, 2,3;  wz  x j   1,
3
i 1
则它可以用下列公式来计算:
wz  x j    wz  yi   wy1  x j  . j  1, 2,3.
3
i 1
这样,旅游者就可选择权重繁荣的地点作为选中的旅游
地点。
然而,权重 wyi
 x   i  1, 2,3, 4,5; j  1, 2,3 和
j
wz  yi   i  1, 2,3都是不容易确定的。因此引处了许
多进一步的问题。
(一)、成对比较法,正互反阵和一致阵
要判断 n 个因素 y
  y1 , y2 ,
响,即确定各个因素在
, yn  对目标 z的影
z 中的比重是比较困难的。如果
每次取两个因素 yi 和 y j 来比较容易多了。
设 aij 为 yi 和 y j 对
果可用矩阵表示为
z 的影响之比,则全部的比较结
A   aij 
称为成对比矩阵,显然有性质
nn
,
⑴
aij  0, i, j  1, 2, , n.
1
aij 
, i, j  1, 2, , n.
a ji
⑵
⑶
满足⑵和⑶的矩阵称为正互反矩阵。对于正互反矩阵,
则有
aii  1,
i  1, 2,
, n.
我们的目标是从正互反矩阵出发,得到比重向量
w   w1 , w2 ,
, wn  ,
⑷
其中 wi 表示因素 yi 对目标 z的影响所占的比重。
若比重向量 w已知,则容易得到成对比矩阵
wi
A   aij  , aij 
,
nn
wj
i, j  1, 2,
, n.
⑹
注意到这个矩阵中的每一个列向量都是成比例的,并
且满足关系
wi wi wk
aij 

 aik  akj ,
w j wk w j
i, j, k  1, 2,
, n.
⑺
若正互反矩阵 A 
a 
aij  aik  akj ,
ij nn
满足
i, j, k  1, 2,
, n,
则称该矩阵是一致性矩阵,简称为一致阵。
性质1
n
⑻
七、练习
1.某甲(农民)有一块土地,若他在这块土地上从事
农业生产,每年可收入10000元;若他将这块土地出租
给某乙(企业家)用于工业生产,则每年可获得收入
20000元;若租给某丙(旅店老板)用于旅游业,则可
获得收入30000元;若旅店老板请企业家参与经营时每
年收入可达40000元。试用Shapley值方法求分享甲乙丙
三人合作所得的40000元收入。
2.某委员会有100个席位,有三个派别分别拥有34席、
33席和33席。法律规定每一提案需要有超过半数的赞成
票时方能通过。假定每个派别的成员同时头赞成或反对
票,试用合作对策模型求三个派别在表决时各自占的比
重。如果三个派别分别拥有49,48和3席时,结果又如
何?