Transcript 第13讲动态规划方法
Slide 1
Slide 2
Slide 3
第十三章 动态规划方法
动态规划的基本问题;
动态规划的基本概念与条件;
动态规划的基本方程;
动态规划的求解方法;
动态规划的应用案例分析。
3
2015年11月1日
Slide 4
一、动态规划的一般问题
动态规划是一种用于处理多阶段决策问题
的数学方法。主要是先将一个复杂的问题分
解成相互联系的若干阶段,每个阶段即为一
个小问题,然后逐个解决,当每个阶段的决
策确定之后,整个过程的决策也就确定了。
阶段一般用时间段表示(即与时间有关),
这就是“动态”的含义,把这种处理问题的
方法称为动态规划方法。
4
2015年11月1日
Slide 5
1. 引例:最短路线问题
(1) 问题的提出
假设从 A 地到 G 地要铺设一条管道,如图
所示,中间经过 5 个中转站,第一个中转站可
以在{B1,B2 }中任一个,第二、三、四、五个中
转站分别在{C1 ,C2 ,C3 ,C4}、{D1,D2 ,D3 }、
{E1 ,E2 ,E3 }、{F1 ,F2 }中任选一个.
由于地理条件的限制,有些站点之间不可直
接铺设管道(图中无连线的站点),连线上的数
据表示相应管道的成本(距离、费用、时间等)
.试
求从 A 到 G 使得成本最低的一条管道铺设线路.
5
2015年11月1日
Slide 6
1. 引例:最短路线问题
(2) 问题的分析
由题意可知,从 A 到 G 可分为 6 个阶段:
A
B
C
D
E
F
G ,
1
2
3
4
5
6
共有 48 条路线,现在的问题是要求每一个阶段的最小值
(距离、费用,或时间)
。
6
2015年11月1日
Slide 7
1. 引例:最短路线问题
2 .用动态规划的方法分步考虑
(1) 求一个阶段最优选择:
从 F 到 G: d ( F1 , G ) 4 , d ( F 2 , G ) 3 ,最优选择
为 f 6 ( F1 ) d ( F1 , G ) 4 , f 6 ( F 2 ) d ( F 2 , G ) 3 ,所
以最短路线为 F 2 G ;
(2) 求两个阶段最优选择:
从 E 到 G,有三个出发点 E 1 , E 2 , E 3 :
d ( E 1 , F1 ) f 6 ( F1 )
3 4
f 5 ( E 1 ) min
min
7 , E 1 F1 G
5 3
d ( E1 , F2 ) f 6 ( F2 )
7
2015年11月1日
Slide 8
2 .用动态规划的方法分步考虑
(2) 求 两 个 阶 段 最 优 选 择 :
从 E 到 G, 有 三 个 出 发 点 E 1 , E 2 , E 3 :
d ( E 1 , F1 ) f 6 ( F1 )
3 4
f 5 ( E 1 ) min
min
7 , E 1 F1 G ,
5 3
d ( E1 , F2 ) f 6 ( F2 )
d ( E 2 , F1 ) f 6 ( F1 )
5 4
f 5 ( E 2 ) min
min
5, E 2 F 2 G
2 3
d ( E 2 , F2 ) f 6 ( F2 )
d ( E 3 , F1 ) f 6 ( F1 )
6 4
f 5 ( E 3 ) min
min
9, E 3 F2 G
6 3
d ( E 3 , F2 ) f 6 ( F2 )
所以最短路线为 E 2 F 2 G ;
8
2015年11月1日
Slide 9
2 .用动态规划的方法分步考虑
(3)求三个阶段最优选择:
d ( D1 , E1 ) f 5 ( E1 )
2 7
f 4 ( D 1 ) min
min
7, D1 E 2 F2 G
2 5
d ( D1 , E 2 ) f 5 ( E 2 )
d ( D2 , E 2 ) f5 ( E 2 )
1 5
f 4 ( D 2 ) min
min
6 , D 2 E 2 F2 G ,
2 9
d (D2 , E3 ) f5 (E3 )
d ( D 3 , E 2 ) f 5 ( E 2 )
3
f 4 ( D 3 ) min
min
3
d ( D3 , E 3 ) f 5 ( E 3 )
所以最短路线为 D 2
E 2 F2 G
9
5
8, D 3 E 2 F 2 G
9
;
2015年11月1日
Slide 10
2 .用动态规划的方法分步考虑
(4) 求四个阶段最优选择:
从 C 到 G 有四个出发点 C 1 , C 2 , C 3 , C 4 :最优选择为
d (C 1 , D1 ) f 4 ( D1 )
6 7
f 3 ( C 1 ) min
min
13 , C 1 D 1 E 2 F 2 G
8 6
d (C 1 , D 2 ) f 4 ( D 2 )
d ( C 2 , D1 ) f 4 ( D1 )
f 3 ( C 2 ) min
min
d (C 2 , D 2 ) f 4 ( D 2 )
10
3 7
10 , C 2 D 1 E 2 F 2 G
5 6
2015年11月1日
Slide 11
2 .用动态规划的方法分步考虑
(4)求四个阶段最优选择:
f 3 ( C1 ) 13, C1 D1 E 2 F2 G
f 3 ( C 2 ) 10, C 2 D1 E 2 F2 G
d (C 3 , D 2 ) f 4 ( D 2 )
3 6
f 3 ( C 3 ) min
min
9 , C 3 D 2 E 2 F2 G
3 8
d (C 3 , D 3 ) f 4 ( D 3 )
d (C 4 , D 2 ) f 4 ( D 2 )
8 6
f 3 ( C 4 ) min
min
12 , C 4 D 3 E 2 F 2 G
4 8
d (C 4 , D 3 ) f 4 ( D 3 )
所以最短路线为 C 3 D 2
E 2 F2 G ;
11
2015年11月1日
Slide 12
2 .用动态规划的方法分步考虑
(5) 求五个阶段最优选择:
从 B 到 G 有 两 个 出 发 点 B1 , B 2 :
最 优 选 择 为
d ( B1 , C 1 ) f 3 ( C 1 )
1 13
f 2 ( B1 ) min d ( B1 , C 2 ) f 3 ( C 2 ) min 3 10 13 , B1 C 2 D1 E 2 F 2 G
d ( B , C ) f (C )
6 9
1
3
3
3
d ( B 2 , C 2 ) f 3 (C 2 )
8 10
f 2 ( B 2 ) min d ( B 2 , C 3 ) f 3 ( C 3 ) min 7 9 16 , B 2 C 2 D 1 E 2 F 2 G
d ( B , C ) f (C )
6 12
2
4
3
4
所 以 最 短 路 线 为 B1 C 2
D1 E 2 F2 G
12
2015年11月1日
Slide 13
2 .用动态规划的方法分步考虑
(6) 求 六 个 阶 段 最 优 选 择 : 从 A 到 G 有 一 个 出 发 点 A: 最 优 选 择 为
d ( A , B1 ) f 2 ( B1 )
5 13
f 1 ( A ) min
min
18 ,
3 16
d ( A, B2 ) f 2 ( B2 )
A B1 C 2 D 1 E 2 F 2 G
所以最优路线为
A B 1 C 2 D 1 E 2 F 2 G , 总 距 离 为 18
13
2015年11月1日
Slide 14
二. 动态规划的基本概念与条件
1 . 动态规划的基本概念
(1)阶段(stage)和阶段变量
阶段是指一个问题需要作出决策的步
骤,即把问题的过程分为若干个相互联系
的阶段,使能按阶段的次序求解。
描述阶段的变量称为阶段变量,常用k
表示。
14
2015年11月1日
Slide 15
(2)状态与状态变量
在多阶段决策过程中,每一阶段都具有一些特
征(自然状况,或客观条件),这就是状态,用来
描述状态的变量称为状态变量。
通常第 k 阶段的状态变量用 s k ( k 1, 2 , , n ) 表示,它的
取值可以是一个数、一组数或一个向量等。
状态变量可取值的全体所构成的集合称为可达状态集
合(或允许状态集合),用 S k ( k 1, 2 , , n ) 表示。
15
2015年11月1日
Slide 16
(3)决策和决策变量
当过程处于某一阶段的某个状态时,可以作出
不同的决定(或选择),从而确定下一阶段的状态,
这种决定称为决策。描述决策的变量称为决策变
量,用 x k ( s k ) 表示第 k 阶段 s k ( k 1, 2 , , n ) 状态
的决策变量。
决策变量的取值范围称为允许决策集合,用 D k ( s k )
表示第 k 阶段状态 s k ( k 1, 2 , , n ) 的允许决策集合,即
x k ( s k ) D k ( s k )( k 1, 2 , , n ) 。
16
2015年11月1日
Slide 17
(4)策略与子策略
策略是一个按顺序排列的决策组成的集合。
由第 k 阶段开始到终止状态为止的过程,称为问
题的后部子过程或 k 子过程.
由 k 子过程的每一阶段的决策按顺序排列组成的决策
函数序列 x k ( s k ), , x n ( s n ) ,称为 k 子过程策略,记为
p k , n ( s k ) ,即
p k , n ( s k ) x k ( s k ), x k 1 ( s k 1 ), , x n ( s n ) ,
17
2015年11月1日
Slide 18
(4)策略与子策略
当 k=1 时,此决策函数序列称为全过程的一个策
略,记为 p 1, n ( s k ) ,即
p 1, n ( s 1 ) x 1 ( s 1 ), x 2 ( s 2 ), , x n ( s n ) 。
可供选择的策略范围称为允许策略集合,用 P 表示,
从允许策略集合中找出达到最优效果的策略称为最
优策略。
18
2015年11月1日
Slide 19
(5)状态转移函数
状态函数是在确定多阶段决策过程中,由一个
状态到另个状态的演变过程。
如果给定了第 k 阶段状态变量 s k 和该阶段的决
策变量 x k ( s k ) ,则第 k+1 阶段的状态变量 s k 1 的值也
随之而定,即 s k 1 随 s k 和 x k ( s k ) 的变化而变化。
这种对应关系记为 s k 1 T k ( s k , x k ( s k )) ,称为状态
转移方程, T k ( s k , x k ) 称为状态转移函数。
19
2015年11月1日
Slide 20
(6) 指标函数(回收函数)
在多阶段决策过程中,用来衡量所实现过程优
劣的一种数量指标,称为指标函数。
它是定义在全过程或所有后部子过程上的数量函数,即
是各阶段的状态和决策变量的函数,记为 V k , n ,即
V k , n V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) ,
指标函数具有可分离性和递推关系:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
k [ s k , x k , V k 1 , n ( s k 1 , x k 1 , , s n , x n , s n 1 )]
20
2015年11月1日
Slide 21
常见的两种指标函数
1) 全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的和,即
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v
j
(s j , x j )
jk
递推关系为:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) v k ( s k , x k )
V k 1, n ( s k 1 , x k 1 , , x n , s n 1 )
21
2015年11月1日
Slide 22
常见的两种指标函数
2)全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的乘积,即
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) v j ( s j , x j )
jk
递推关系为:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v k ( s k , x k ) V k 1, n ( s k 1 , x k 1 , , x n , s n 1 )
22
2015年11月1日
Slide 23
(7) 最优值函数
从第 k 阶段的状态 s k 开始到第 n 阶段的终止状态 s n 1 的
过程,采取最优策略所得到的指标函数值,称为最优值函数,
记为 f k ( s k )( k 1, 2 , , n ) ,即
f k (sk )
opt
x k , x k 1 , , x n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
23
2015年11月1日
Slide 24
二. 动态规划的基本概念与条件
2 . 动态规划的基本条件
(1)将问题化为恰当的 n 个阶段;
(2)正确选择状态变量 s k ,使它既能表达过程,
又要具有无后效性和可知性:
*无后效性:如果某阶段状态已给定,则以后过程
的发展不受以前各阶段状态的影响,也就是说当
前状态就是未来过程的初始状态;
**可知性:规定的各阶段状态变量的值,由直接
或间接都是可以知道的。
24
2015年11月1日
Slide 25
2 . 动态规划的基本条件
(3)确定决策变量 x k 及每一阶段的允许决策集合 D k ( s k );
(4)写出状态转移方程: s k 1 T k ( s k , x k ), k 1, 2 , , n ;
(5) 正确写出指标函数 V k , n 的关系,它满足下列三个性质:
1) 它是过程各阶段状态变量和决策变量的函数;
2) 具有可分离性和递推关系,即
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
k [ s k , x k , V k 1, n ( s k 1 , x k 1 , , s n , x n , s n 1 )]
3) k [ s k , x k , V k 1, n ( s k 1 , x k 1 , , s n , x n , s n 1 )] 是关于 V k 1, n 严格单调的。
25
2015年11月1日
Slide 26
三. 动态规划的基本方程
1 . 动态规划的逆序解法
设动态规划指标函数的形式为
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v
j
(s j , x j )
jk
且具有上面的三条性质,则
V k , n v k ( s k , x k ) V k 1 ( s k 1 , x k 1 , , x n , s n 1 )
如果初始状态 s k 给定,则决策变量 x k ( s k ) 随之确定,k 子过
程的策略 p k , n ( s k ) 也就确定,从而指标函数 V k , n 也同时确定了,
26
2015年11月1日
Slide 27
1 . 动态规划的逆序解法
如果用 p k , n ( s k ) 表示以第 k 阶段状态 s k 为初始状态的
*
后部子过程所有子策略中的最优子策略,则最优值函数为
f k ( s k ) V k ,n [ s k , p
*
k ,n
( s k )]
opt
V k , n [ s k , p k , n ( s k )]
pk ,n
动态规划逆序解法的基本方程:
f k ( s k ) opt v k ( s k , x k ) f k 1 ( s k 1 ), k n , n 1, , 2 ,1
xk Dk ( sk )
边界条件为 : f ( s ) 0 , 或 f ( s ) v ( s , x )
n 1
n 1
n
n
n
n
n
27
2015年11月1日
Slide 28
三. 动态规划的基本方程
2 . 动态规划的顺序解法
设过程的第 k 阶段的状态为 s k ,其决策变量 x k
表示当状态处于 s k 1 的决策,即由 x k ( s k 1 ) 确定,则
状态转移方程为 s k T k ( s k 1 , x k ) ,k 阶段的允许决
r
r
k
策集合记为 D ( s k 1 ) ,指标函数定义为:
V k ( s k 1 , x k , s k , x k 1 , , x 1 , s 1 )
28
2015年11月1日
Slide 29
2 . 动态规划的顺序解法
最优值函数:
f k ( s k 1 )
opt V
k
( s k 1 , x k , , x 1 , s 1 )
r
x k D k ( s k 1 )
则
f k ( s k 1 ) opt v k ( s k 1 , x k ) f k 1 ( s k ), k 1, 2 , , n
r
x k D k ( s k 1 )
边界条件为 : f ( s ) 0
0
1
此为动态规划顺序解法的基本方程。
29
2015年11月1日
Slide 30
四. 动态规划的求解方法
1 . 动态规划的逆序解法
设已知初始状态为 s 1 ,用 f k( s k ) 表示从第
k 阶段初始状态 s k 到第 n 阶段的最优值。
第 n 阶段:指标函数的最优值记为
f n( s n )
opt
xn Dn ( sn )
vn (sn , xn ) ,
此为一维极值问题,不妨设有最优解 x n x n ( s n ) ,则有
最优值 f n( s n ) 。
30
2015年11月1日
Slide 31
1 . 动态规划的逆序解法
第 n-1 阶段:类似地有
f
( s n 1 )
n 1
opt
x n 1 D n 1 ( s n 1 )
v n 1 ( s n 1 , x n 1 ) *
f n ( s n )
其中 s n T n 1 ( s n 1 , x n 1 ) ,可解得最优解 x n 1 x n 1 ( s n 1 ) ,
则最优值为 f
( s n 1 ) 。
n 1
不妨设第 k+1 阶段的最优解为 x k 1 x k 1 ( s k 1 ) 和最优值 f
则对于第 k 阶段有 f k( s k ) opt
xk Dk ( sk )
( s k 1 ) ,
k 1
v k ( s k , x k ) * f k 1 ( s k 1 )
其中 s k 1 T k ( s k , x k ) ,可解得最优解 x k x k ( s k ) 和最优值为 f k( s k ) 。
31
2015年11月1日
Slide 32
1 . 动态规划的逆序解法
依此类推,直到第 1 阶段,有
f 1( s 1 )
opt
x1 D 1 ( s1 )
v 1 ( s 1 , x 1 ) *
f 2 ( s 2 ) ,
其中 s 2 T1 ( s 1 , x 1 ) ,可解得最优解 x 1 x 1 ( s 1 ) 和最优值
为 f 1( s 1 ) 。
由于已知 s 1 ,则可知 x 1 与 f 1( s 1 ) 。从而可知
s 2 , x 2 , f 2( s 2 ) ,按上面的递推过程反推回去,即可得
到每一阶段和全过程的最优决策。
32
2015年11月1日
Slide 33
四. 动态规划的求解方法
2 . 动态规划的顺序解法
设已知终止状态为 s n 1 ,用 f k( s k 1 ) 表示从第
1 阶段初始状态 s 1 到第 k 阶段末的结束状态 s k 1 的
最优值。
第一阶段:指标函数的最优值记为
f 1( s 2 )
opt
x1 D 1 ( s1 )
v 1 ( s 1 , x 1 ) , s 1 T1 ( s 2 , x 1 ) ,
可解得最优解 x 1 x 1 ( s 2 ) 和最优值 f 1( s 2 ) 。
33
2015年11月1日
Slide 34
2 . 动态规划的顺序解法
第二阶段:类似地有:
f 2( s 3 )
opt
x2D2 ( s2 )
v 2 ( s 2 , x 2 ) *
f 1 ( s 2 )
其中 s 2 T 2 ( s 3 , x 2 ) ,可解得最优解 x 2 x 2 ( s 3 ) ,于是
最优值为 f 2( s 3 ) 。
不妨设第 k 阶段有
f k( s k 1 ) opt
xk Dk ( sk )
v k ( s k , x k ) * f k 1 ( s k ) , s k
T k ( s k 1 , x k )
解得最优解为 x k x k ( s k 1 ) 和最优值 f k( s k 1 ) 。
34
2015年11月1日
Slide 35
2 . 动态规划的顺序解法
依次类推,直到第 n 阶段有
f n( s n 1 )
opt
xn Dn ( sn )
v n ( s n , x n ) *
f n 1 ( s n ) ,
其中 s n T n ( s n 1 , x n ) ,可解得最优解 x n x n ( s n 1 ) 和最优
值为 f n( s n 1 ) 。
由于已知 s n 1 ,则可知 x n 与 f n( s n 1 ) 。从而可知
s n , x n 1 , f
( s n ) ,按上面的递推过程反推回去,直到
n 1
s 1 , x 1 , f 1( s 2 ) ,即得到整个过程和各阶段的最优决策。
35
2015年11月1日
Slide 36
1.问题的提出
现假设有20名队员准备参加数学建模竞赛,根
据队员的能力和水平要选出18名优秀队员分别组成
6个队,每个队3名队员去参加比赛。选择队员主要
考虑的条件依次为有关学科成绩、智力水平、动手
能力、写作能力、外语水平、协作能力和其它特长。
假设所有队员接受了同样的培训,外部环境
相同,竞赛中不考虑其他的随机因素,竞赛水平的
发挥只取决于表中所给的各项条件,并且,参赛队
员都能正常发挥自己的水平。
36
2015年11月1日
Slide 37
1.问题的提出
现在的问题:
(1)在20名队员中选择18名优秀队员参
加竞赛;
(2)确定一个最佳的组队使竞赛技术水
平最高;
(3)给出由18名队员组成6个队的组队方
案,使整体竞赛技术水平最高;并给出每
个队的竞赛技术水平。
37
2015年11月1日
Slide 38
2.模型的假设
(1)假设问题中提供队员的基本条件充分地反映
了每个队的真实能力和水平;
(2)假设每个队员的能力和水平在比赛中可以
100%的发挥,不受外界因素和环境的影响;
(3)同一个队三名队员的单项条件互不影响,
且具有互补性,即一个队的水平为最高者的水平;
(4)6个队整体技术水平最高是在确定的最佳
组队保持不变的条件下整体技术水平最高.
38
2015年11月1日
Slide 39
3.模型的建立与求解
问题(1):利用层次分析法得到每个队员的水
平指标,按大小排序结果如下表:
序
号
1
2
3
队
员
L
M
G
水平指标 0.0533642 0.0531373 0.0530848
4
D
0.0518990
5
F
0.0514261
6
P
0.0514320
7
R
0.0512626
序
号
8
9
10
队
员
O
T
E
水平指标 0.0511709 0.0511465 0.0502659
序
号
15
16
17
队
员
S
N
J
11
Q
0.0500917
18
B
12
A
0.0496756
19
I
13
C
0.0496028
20
H
14
K
0.0492494
水平指标 0.048988 0.0488254
0.0471768
0.0463575
0.0462886
0.0456541
由排序结果,陶汰 H 和 I 两名队员,其余的 18 名为
入选参赛的优秀队员。
39
2015年11月1日
Slide 40
3.模型的建立与求解
问题(2):确定一个最佳的组队使竞赛技术水平最高.
最佳组队原则:设 m i ( x ) 表示队员 x 的第 i 项水平指标,
M i ( x , y , z ) 表示由队员 x , y , z 组队 ( x , y , z ) 的第 i 项水平指
标,则
M i ( x , y , z ) max m i ( x ), m i ( y ), m i ( y )( i 1, 2 , , 7 )
令 M M 1 ( x , y , z ), M 2 ( x , y , z ), , M 7 ( x , y , z ) , 于 是 用
T
v ( x , y , z ) M W 0 表示 ( x , y , z ) 队的整体技术水平指标.最
佳组队是从 18 名队员中选出 x , y , z 使 v ( x , y , z ) 最高.
40
2015年11月1日
Slide 41
3.模型的建立与求解
组队方案:根据组队原则,
最佳组队中的队员一定是前
四项水平指标的最高者.由问题(1)的结果可得
m 1 ( L ) 0 . 0556199 为最高,于是 M 1 m 1 ( L ) 0 . 0556199 ,
则队员L是首先入选的队员.
其次 m 2 ( G ) m 2 ( M ) 0 . 0557168 ,而 m 3 ( G )
故M
2
m3 (M )
,
m 2 ( G ) 0 . 0557168 ,则G是第二个入选的队员.
另外, m 3 ( S ) 0 .0553953 ,于是 M 3 m 3 ( S ) 0 . 0553953 ,
而且 M 4 m 4 ( L ) 0 . 0619137
的队员.
41
,则队员S应是第三个入选
2015年11月1日
Slide 42
3.模型的建立与求解
M7
注意到 M 5 m 5 ( G ) 0 .0520297 , M 6 m 6 ( L ) 0 .0518717 , ,
m 7 ( G ) 0 .0708661 也都是相对的较高者,即
M (0.0556199, 0.0557168, 0.0553953, 0.0619137,
0.0520297, 0.0518717, 0.0708661)
因此,由队员 L,G ,S 组成(L,G,S)队的技术水平指标为
T
v ( L , G , S ) M W 0 0 . 563246 是最高的,所以最佳组队为(L,G,
S).
42
2015年11月1日
Slide 43
3.模型的建立与求解
问题(3):给出由18名队员组成6个队的组队方案
用动态规划的方法,分决策过程为5个阶段,分步
给出 5 个队的组队方案.在除了队员 L , G , S 外的 15 名
队员中组成5个队,每一阶段确定一个队.
决策变量: X k ( x , y , z ) k ( k 1, 2 ,3, 4 ,5 ) ,即任取三
名队员 ( x , y , z ) 所组成的一个组队方案.
状态变量:S k ( k 1, 2 ,3, 4 ,5 ) ,即从第 k (1 k 5 )
个 到第 5 个组 队的 组队方 案所 包含的 队员 ,其中
S 1 A , B , C , , T .
43
2015年11月1日
Slide 44
3.模型的建立与求解
状态转移方程: S k 1 S k X k ( k 1, 2 ,3, 4 ) .
允许决策集合:
D k ( x , y , z ); x , y , z S k , v k ( x , y , z ) W ( k 1, 2 ,3, 4 ,5 ) .
指标函数: v k ( S k , X k ) 表示决策 X k (一个组队)关于
状态 S k 的技术水平指标,即 v k ( S k , X k ) M W 0 .
最优值函数: f k ( S k ) 表示在状态 S k 下确定的 k (1 k 5 )
个组队的技术水平指标之和的最大值.则有逆序解法的基
本方程:
44
2015年11月1日
Slide 45
3.模型的建立与求解
f k ( S k ) max v k ( S k , X k ) f k 1 ( S k 1 ), k 5 , 4 ,3 , 2 ,1
xk Dk
( L , G , S )队的技术水平指标
f 6 ( S 6 ) v 6 0 . 0563246
其中 S k 1 S k X k ( k 1, 2 ,3, 4 ) .
编程求解可以得到最优的组队方案,其最优值为 f 1 ( S 1 ) 0 . 323164 .
表:最优的组队方案
组队 X
k
X1
X
X3
2
X
4
X5
X6
队员(x,y,z) (C,J,K) (A,N,O) (B,P,R) (D,F,T) (E,M,Q) (G,L,S)
水平 v k ( x , y , z ) 0.051647 0.051935 0.053262 0.054647 0.055348 0.056325
45
2015年11月1日
Slide 46
Slide 2
Slide 3
第十三章 动态规划方法
动态规划的基本问题;
动态规划的基本概念与条件;
动态规划的基本方程;
动态规划的求解方法;
动态规划的应用案例分析。
3
2015年11月1日
Slide 4
一、动态规划的一般问题
动态规划是一种用于处理多阶段决策问题
的数学方法。主要是先将一个复杂的问题分
解成相互联系的若干阶段,每个阶段即为一
个小问题,然后逐个解决,当每个阶段的决
策确定之后,整个过程的决策也就确定了。
阶段一般用时间段表示(即与时间有关),
这就是“动态”的含义,把这种处理问题的
方法称为动态规划方法。
4
2015年11月1日
Slide 5
1. 引例:最短路线问题
(1) 问题的提出
假设从 A 地到 G 地要铺设一条管道,如图
所示,中间经过 5 个中转站,第一个中转站可
以在{B1,B2 }中任一个,第二、三、四、五个中
转站分别在{C1 ,C2 ,C3 ,C4}、{D1,D2 ,D3 }、
{E1 ,E2 ,E3 }、{F1 ,F2 }中任选一个.
由于地理条件的限制,有些站点之间不可直
接铺设管道(图中无连线的站点),连线上的数
据表示相应管道的成本(距离、费用、时间等)
.试
求从 A 到 G 使得成本最低的一条管道铺设线路.
5
2015年11月1日
Slide 6
1. 引例:最短路线问题
(2) 问题的分析
由题意可知,从 A 到 G 可分为 6 个阶段:
A
B
C
D
E
F
G ,
1
2
3
4
5
6
共有 48 条路线,现在的问题是要求每一个阶段的最小值
(距离、费用,或时间)
。
6
2015年11月1日
Slide 7
1. 引例:最短路线问题
2 .用动态规划的方法分步考虑
(1) 求一个阶段最优选择:
从 F 到 G: d ( F1 , G ) 4 , d ( F 2 , G ) 3 ,最优选择
为 f 6 ( F1 ) d ( F1 , G ) 4 , f 6 ( F 2 ) d ( F 2 , G ) 3 ,所
以最短路线为 F 2 G ;
(2) 求两个阶段最优选择:
从 E 到 G,有三个出发点 E 1 , E 2 , E 3 :
d ( E 1 , F1 ) f 6 ( F1 )
3 4
f 5 ( E 1 ) min
min
7 , E 1 F1 G
5 3
d ( E1 , F2 ) f 6 ( F2 )
7
2015年11月1日
Slide 8
2 .用动态规划的方法分步考虑
(2) 求 两 个 阶 段 最 优 选 择 :
从 E 到 G, 有 三 个 出 发 点 E 1 , E 2 , E 3 :
d ( E 1 , F1 ) f 6 ( F1 )
3 4
f 5 ( E 1 ) min
min
7 , E 1 F1 G ,
5 3
d ( E1 , F2 ) f 6 ( F2 )
d ( E 2 , F1 ) f 6 ( F1 )
5 4
f 5 ( E 2 ) min
min
5, E 2 F 2 G
2 3
d ( E 2 , F2 ) f 6 ( F2 )
d ( E 3 , F1 ) f 6 ( F1 )
6 4
f 5 ( E 3 ) min
min
9, E 3 F2 G
6 3
d ( E 3 , F2 ) f 6 ( F2 )
所以最短路线为 E 2 F 2 G ;
8
2015年11月1日
Slide 9
2 .用动态规划的方法分步考虑
(3)求三个阶段最优选择:
d ( D1 , E1 ) f 5 ( E1 )
2 7
f 4 ( D 1 ) min
min
7, D1 E 2 F2 G
2 5
d ( D1 , E 2 ) f 5 ( E 2 )
d ( D2 , E 2 ) f5 ( E 2 )
1 5
f 4 ( D 2 ) min
min
6 , D 2 E 2 F2 G ,
2 9
d (D2 , E3 ) f5 (E3 )
d ( D 3 , E 2 ) f 5 ( E 2 )
3
f 4 ( D 3 ) min
min
3
d ( D3 , E 3 ) f 5 ( E 3 )
所以最短路线为 D 2
E 2 F2 G
9
5
8, D 3 E 2 F 2 G
9
;
2015年11月1日
Slide 10
2 .用动态规划的方法分步考虑
(4) 求四个阶段最优选择:
从 C 到 G 有四个出发点 C 1 , C 2 , C 3 , C 4 :最优选择为
d (C 1 , D1 ) f 4 ( D1 )
6 7
f 3 ( C 1 ) min
min
13 , C 1 D 1 E 2 F 2 G
8 6
d (C 1 , D 2 ) f 4 ( D 2 )
d ( C 2 , D1 ) f 4 ( D1 )
f 3 ( C 2 ) min
min
d (C 2 , D 2 ) f 4 ( D 2 )
10
3 7
10 , C 2 D 1 E 2 F 2 G
5 6
2015年11月1日
Slide 11
2 .用动态规划的方法分步考虑
(4)求四个阶段最优选择:
f 3 ( C1 ) 13, C1 D1 E 2 F2 G
f 3 ( C 2 ) 10, C 2 D1 E 2 F2 G
d (C 3 , D 2 ) f 4 ( D 2 )
3 6
f 3 ( C 3 ) min
min
9 , C 3 D 2 E 2 F2 G
3 8
d (C 3 , D 3 ) f 4 ( D 3 )
d (C 4 , D 2 ) f 4 ( D 2 )
8 6
f 3 ( C 4 ) min
min
12 , C 4 D 3 E 2 F 2 G
4 8
d (C 4 , D 3 ) f 4 ( D 3 )
所以最短路线为 C 3 D 2
E 2 F2 G ;
11
2015年11月1日
Slide 12
2 .用动态规划的方法分步考虑
(5) 求五个阶段最优选择:
从 B 到 G 有 两 个 出 发 点 B1 , B 2 :
最 优 选 择 为
d ( B1 , C 1 ) f 3 ( C 1 )
1 13
f 2 ( B1 ) min d ( B1 , C 2 ) f 3 ( C 2 ) min 3 10 13 , B1 C 2 D1 E 2 F 2 G
d ( B , C ) f (C )
6 9
1
3
3
3
d ( B 2 , C 2 ) f 3 (C 2 )
8 10
f 2 ( B 2 ) min d ( B 2 , C 3 ) f 3 ( C 3 ) min 7 9 16 , B 2 C 2 D 1 E 2 F 2 G
d ( B , C ) f (C )
6 12
2
4
3
4
所 以 最 短 路 线 为 B1 C 2
D1 E 2 F2 G
12
2015年11月1日
Slide 13
2 .用动态规划的方法分步考虑
(6) 求 六 个 阶 段 最 优 选 择 : 从 A 到 G 有 一 个 出 发 点 A: 最 优 选 择 为
d ( A , B1 ) f 2 ( B1 )
5 13
f 1 ( A ) min
min
18 ,
3 16
d ( A, B2 ) f 2 ( B2 )
A B1 C 2 D 1 E 2 F 2 G
所以最优路线为
A B 1 C 2 D 1 E 2 F 2 G , 总 距 离 为 18
13
2015年11月1日
Slide 14
二. 动态规划的基本概念与条件
1 . 动态规划的基本概念
(1)阶段(stage)和阶段变量
阶段是指一个问题需要作出决策的步
骤,即把问题的过程分为若干个相互联系
的阶段,使能按阶段的次序求解。
描述阶段的变量称为阶段变量,常用k
表示。
14
2015年11月1日
Slide 15
(2)状态与状态变量
在多阶段决策过程中,每一阶段都具有一些特
征(自然状况,或客观条件),这就是状态,用来
描述状态的变量称为状态变量。
通常第 k 阶段的状态变量用 s k ( k 1, 2 , , n ) 表示,它的
取值可以是一个数、一组数或一个向量等。
状态变量可取值的全体所构成的集合称为可达状态集
合(或允许状态集合),用 S k ( k 1, 2 , , n ) 表示。
15
2015年11月1日
Slide 16
(3)决策和决策变量
当过程处于某一阶段的某个状态时,可以作出
不同的决定(或选择),从而确定下一阶段的状态,
这种决定称为决策。描述决策的变量称为决策变
量,用 x k ( s k ) 表示第 k 阶段 s k ( k 1, 2 , , n ) 状态
的决策变量。
决策变量的取值范围称为允许决策集合,用 D k ( s k )
表示第 k 阶段状态 s k ( k 1, 2 , , n ) 的允许决策集合,即
x k ( s k ) D k ( s k )( k 1, 2 , , n ) 。
16
2015年11月1日
Slide 17
(4)策略与子策略
策略是一个按顺序排列的决策组成的集合。
由第 k 阶段开始到终止状态为止的过程,称为问
题的后部子过程或 k 子过程.
由 k 子过程的每一阶段的决策按顺序排列组成的决策
函数序列 x k ( s k ), , x n ( s n ) ,称为 k 子过程策略,记为
p k , n ( s k ) ,即
p k , n ( s k ) x k ( s k ), x k 1 ( s k 1 ), , x n ( s n ) ,
17
2015年11月1日
Slide 18
(4)策略与子策略
当 k=1 时,此决策函数序列称为全过程的一个策
略,记为 p 1, n ( s k ) ,即
p 1, n ( s 1 ) x 1 ( s 1 ), x 2 ( s 2 ), , x n ( s n ) 。
可供选择的策略范围称为允许策略集合,用 P 表示,
从允许策略集合中找出达到最优效果的策略称为最
优策略。
18
2015年11月1日
Slide 19
(5)状态转移函数
状态函数是在确定多阶段决策过程中,由一个
状态到另个状态的演变过程。
如果给定了第 k 阶段状态变量 s k 和该阶段的决
策变量 x k ( s k ) ,则第 k+1 阶段的状态变量 s k 1 的值也
随之而定,即 s k 1 随 s k 和 x k ( s k ) 的变化而变化。
这种对应关系记为 s k 1 T k ( s k , x k ( s k )) ,称为状态
转移方程, T k ( s k , x k ) 称为状态转移函数。
19
2015年11月1日
Slide 20
(6) 指标函数(回收函数)
在多阶段决策过程中,用来衡量所实现过程优
劣的一种数量指标,称为指标函数。
它是定义在全过程或所有后部子过程上的数量函数,即
是各阶段的状态和决策变量的函数,记为 V k , n ,即
V k , n V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) ,
指标函数具有可分离性和递推关系:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
k [ s k , x k , V k 1 , n ( s k 1 , x k 1 , , s n , x n , s n 1 )]
20
2015年11月1日
Slide 21
常见的两种指标函数
1) 全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的和,即
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v
j
(s j , x j )
jk
递推关系为:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) v k ( s k , x k )
V k 1, n ( s k 1 , x k 1 , , x n , s n 1 )
21
2015年11月1日
Slide 22
常见的两种指标函数
2)全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的乘积,即
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 ) v j ( s j , x j )
jk
递推关系为:
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v k ( s k , x k ) V k 1, n ( s k 1 , x k 1 , , x n , s n 1 )
22
2015年11月1日
Slide 23
(7) 最优值函数
从第 k 阶段的状态 s k 开始到第 n 阶段的终止状态 s n 1 的
过程,采取最优策略所得到的指标函数值,称为最优值函数,
记为 f k ( s k )( k 1, 2 , , n ) ,即
f k (sk )
opt
x k , x k 1 , , x n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
23
2015年11月1日
Slide 24
二. 动态规划的基本概念与条件
2 . 动态规划的基本条件
(1)将问题化为恰当的 n 个阶段;
(2)正确选择状态变量 s k ,使它既能表达过程,
又要具有无后效性和可知性:
*无后效性:如果某阶段状态已给定,则以后过程
的发展不受以前各阶段状态的影响,也就是说当
前状态就是未来过程的初始状态;
**可知性:规定的各阶段状态变量的值,由直接
或间接都是可以知道的。
24
2015年11月1日
Slide 25
2 . 动态规划的基本条件
(3)确定决策变量 x k 及每一阶段的允许决策集合 D k ( s k );
(4)写出状态转移方程: s k 1 T k ( s k , x k ), k 1, 2 , , n ;
(5) 正确写出指标函数 V k , n 的关系,它满足下列三个性质:
1) 它是过程各阶段状态变量和决策变量的函数;
2) 具有可分离性和递推关系,即
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
k [ s k , x k , V k 1, n ( s k 1 , x k 1 , , s n , x n , s n 1 )]
3) k [ s k , x k , V k 1, n ( s k 1 , x k 1 , , s n , x n , s n 1 )] 是关于 V k 1, n 严格单调的。
25
2015年11月1日
Slide 26
三. 动态规划的基本方程
1 . 动态规划的逆序解法
设动态规划指标函数的形式为
n
V k , n ( s k , x k , s k 1 , x k 1 , , s n , x n , s n 1 )
v
j
(s j , x j )
jk
且具有上面的三条性质,则
V k , n v k ( s k , x k ) V k 1 ( s k 1 , x k 1 , , x n , s n 1 )
如果初始状态 s k 给定,则决策变量 x k ( s k ) 随之确定,k 子过
程的策略 p k , n ( s k ) 也就确定,从而指标函数 V k , n 也同时确定了,
26
2015年11月1日
Slide 27
1 . 动态规划的逆序解法
如果用 p k , n ( s k ) 表示以第 k 阶段状态 s k 为初始状态的
*
后部子过程所有子策略中的最优子策略,则最优值函数为
f k ( s k ) V k ,n [ s k , p
*
k ,n
( s k )]
opt
V k , n [ s k , p k , n ( s k )]
pk ,n
动态规划逆序解法的基本方程:
f k ( s k ) opt v k ( s k , x k ) f k 1 ( s k 1 ), k n , n 1, , 2 ,1
xk Dk ( sk )
边界条件为 : f ( s ) 0 , 或 f ( s ) v ( s , x )
n 1
n 1
n
n
n
n
n
27
2015年11月1日
Slide 28
三. 动态规划的基本方程
2 . 动态规划的顺序解法
设过程的第 k 阶段的状态为 s k ,其决策变量 x k
表示当状态处于 s k 1 的决策,即由 x k ( s k 1 ) 确定,则
状态转移方程为 s k T k ( s k 1 , x k ) ,k 阶段的允许决
r
r
k
策集合记为 D ( s k 1 ) ,指标函数定义为:
V k ( s k 1 , x k , s k , x k 1 , , x 1 , s 1 )
28
2015年11月1日
Slide 29
2 . 动态规划的顺序解法
最优值函数:
f k ( s k 1 )
opt V
k
( s k 1 , x k , , x 1 , s 1 )
r
x k D k ( s k 1 )
则
f k ( s k 1 ) opt v k ( s k 1 , x k ) f k 1 ( s k ), k 1, 2 , , n
r
x k D k ( s k 1 )
边界条件为 : f ( s ) 0
0
1
此为动态规划顺序解法的基本方程。
29
2015年11月1日
Slide 30
四. 动态规划的求解方法
1 . 动态规划的逆序解法
设已知初始状态为 s 1 ,用 f k( s k ) 表示从第
k 阶段初始状态 s k 到第 n 阶段的最优值。
第 n 阶段:指标函数的最优值记为
f n( s n )
opt
xn Dn ( sn )
vn (sn , xn ) ,
此为一维极值问题,不妨设有最优解 x n x n ( s n ) ,则有
最优值 f n( s n ) 。
30
2015年11月1日
Slide 31
1 . 动态规划的逆序解法
第 n-1 阶段:类似地有
f
( s n 1 )
n 1
opt
x n 1 D n 1 ( s n 1 )
v n 1 ( s n 1 , x n 1 ) *
f n ( s n )
其中 s n T n 1 ( s n 1 , x n 1 ) ,可解得最优解 x n 1 x n 1 ( s n 1 ) ,
则最优值为 f
( s n 1 ) 。
n 1
不妨设第 k+1 阶段的最优解为 x k 1 x k 1 ( s k 1 ) 和最优值 f
则对于第 k 阶段有 f k( s k ) opt
xk Dk ( sk )
( s k 1 ) ,
k 1
v k ( s k , x k ) * f k 1 ( s k 1 )
其中 s k 1 T k ( s k , x k ) ,可解得最优解 x k x k ( s k ) 和最优值为 f k( s k ) 。
31
2015年11月1日
Slide 32
1 . 动态规划的逆序解法
依此类推,直到第 1 阶段,有
f 1( s 1 )
opt
x1 D 1 ( s1 )
v 1 ( s 1 , x 1 ) *
f 2 ( s 2 ) ,
其中 s 2 T1 ( s 1 , x 1 ) ,可解得最优解 x 1 x 1 ( s 1 ) 和最优值
为 f 1( s 1 ) 。
由于已知 s 1 ,则可知 x 1 与 f 1( s 1 ) 。从而可知
s 2 , x 2 , f 2( s 2 ) ,按上面的递推过程反推回去,即可得
到每一阶段和全过程的最优决策。
32
2015年11月1日
Slide 33
四. 动态规划的求解方法
2 . 动态规划的顺序解法
设已知终止状态为 s n 1 ,用 f k( s k 1 ) 表示从第
1 阶段初始状态 s 1 到第 k 阶段末的结束状态 s k 1 的
最优值。
第一阶段:指标函数的最优值记为
f 1( s 2 )
opt
x1 D 1 ( s1 )
v 1 ( s 1 , x 1 ) , s 1 T1 ( s 2 , x 1 ) ,
可解得最优解 x 1 x 1 ( s 2 ) 和最优值 f 1( s 2 ) 。
33
2015年11月1日
Slide 34
2 . 动态规划的顺序解法
第二阶段:类似地有:
f 2( s 3 )
opt
x2D2 ( s2 )
v 2 ( s 2 , x 2 ) *
f 1 ( s 2 )
其中 s 2 T 2 ( s 3 , x 2 ) ,可解得最优解 x 2 x 2 ( s 3 ) ,于是
最优值为 f 2( s 3 ) 。
不妨设第 k 阶段有
f k( s k 1 ) opt
xk Dk ( sk )
v k ( s k , x k ) * f k 1 ( s k ) , s k
T k ( s k 1 , x k )
解得最优解为 x k x k ( s k 1 ) 和最优值 f k( s k 1 ) 。
34
2015年11月1日
Slide 35
2 . 动态规划的顺序解法
依次类推,直到第 n 阶段有
f n( s n 1 )
opt
xn Dn ( sn )
v n ( s n , x n ) *
f n 1 ( s n ) ,
其中 s n T n ( s n 1 , x n ) ,可解得最优解 x n x n ( s n 1 ) 和最优
值为 f n( s n 1 ) 。
由于已知 s n 1 ,则可知 x n 与 f n( s n 1 ) 。从而可知
s n , x n 1 , f
( s n ) ,按上面的递推过程反推回去,直到
n 1
s 1 , x 1 , f 1( s 2 ) ,即得到整个过程和各阶段的最优决策。
35
2015年11月1日
Slide 36
1.问题的提出
现假设有20名队员准备参加数学建模竞赛,根
据队员的能力和水平要选出18名优秀队员分别组成
6个队,每个队3名队员去参加比赛。选择队员主要
考虑的条件依次为有关学科成绩、智力水平、动手
能力、写作能力、外语水平、协作能力和其它特长。
假设所有队员接受了同样的培训,外部环境
相同,竞赛中不考虑其他的随机因素,竞赛水平的
发挥只取决于表中所给的各项条件,并且,参赛队
员都能正常发挥自己的水平。
36
2015年11月1日
Slide 37
1.问题的提出
现在的问题:
(1)在20名队员中选择18名优秀队员参
加竞赛;
(2)确定一个最佳的组队使竞赛技术水
平最高;
(3)给出由18名队员组成6个队的组队方
案,使整体竞赛技术水平最高;并给出每
个队的竞赛技术水平。
37
2015年11月1日
Slide 38
2.模型的假设
(1)假设问题中提供队员的基本条件充分地反映
了每个队的真实能力和水平;
(2)假设每个队员的能力和水平在比赛中可以
100%的发挥,不受外界因素和环境的影响;
(3)同一个队三名队员的单项条件互不影响,
且具有互补性,即一个队的水平为最高者的水平;
(4)6个队整体技术水平最高是在确定的最佳
组队保持不变的条件下整体技术水平最高.
38
2015年11月1日
Slide 39
3.模型的建立与求解
问题(1):利用层次分析法得到每个队员的水
平指标,按大小排序结果如下表:
序
号
1
2
3
队
员
L
M
G
水平指标 0.0533642 0.0531373 0.0530848
4
D
0.0518990
5
F
0.0514261
6
P
0.0514320
7
R
0.0512626
序
号
8
9
10
队
员
O
T
E
水平指标 0.0511709 0.0511465 0.0502659
序
号
15
16
17
队
员
S
N
J
11
Q
0.0500917
18
B
12
A
0.0496756
19
I
13
C
0.0496028
20
H
14
K
0.0492494
水平指标 0.048988 0.0488254
0.0471768
0.0463575
0.0462886
0.0456541
由排序结果,陶汰 H 和 I 两名队员,其余的 18 名为
入选参赛的优秀队员。
39
2015年11月1日
Slide 40
3.模型的建立与求解
问题(2):确定一个最佳的组队使竞赛技术水平最高.
最佳组队原则:设 m i ( x ) 表示队员 x 的第 i 项水平指标,
M i ( x , y , z ) 表示由队员 x , y , z 组队 ( x , y , z ) 的第 i 项水平指
标,则
M i ( x , y , z ) max m i ( x ), m i ( y ), m i ( y )( i 1, 2 , , 7 )
令 M M 1 ( x , y , z ), M 2 ( x , y , z ), , M 7 ( x , y , z ) , 于 是 用
T
v ( x , y , z ) M W 0 表示 ( x , y , z ) 队的整体技术水平指标.最
佳组队是从 18 名队员中选出 x , y , z 使 v ( x , y , z ) 最高.
40
2015年11月1日
Slide 41
3.模型的建立与求解
组队方案:根据组队原则,
最佳组队中的队员一定是前
四项水平指标的最高者.由问题(1)的结果可得
m 1 ( L ) 0 . 0556199 为最高,于是 M 1 m 1 ( L ) 0 . 0556199 ,
则队员L是首先入选的队员.
其次 m 2 ( G ) m 2 ( M ) 0 . 0557168 ,而 m 3 ( G )
故M
2
m3 (M )
,
m 2 ( G ) 0 . 0557168 ,则G是第二个入选的队员.
另外, m 3 ( S ) 0 .0553953 ,于是 M 3 m 3 ( S ) 0 . 0553953 ,
而且 M 4 m 4 ( L ) 0 . 0619137
的队员.
41
,则队员S应是第三个入选
2015年11月1日
Slide 42
3.模型的建立与求解
M7
注意到 M 5 m 5 ( G ) 0 .0520297 , M 6 m 6 ( L ) 0 .0518717 , ,
m 7 ( G ) 0 .0708661 也都是相对的较高者,即
M (0.0556199, 0.0557168, 0.0553953, 0.0619137,
0.0520297, 0.0518717, 0.0708661)
因此,由队员 L,G ,S 组成(L,G,S)队的技术水平指标为
T
v ( L , G , S ) M W 0 0 . 563246 是最高的,所以最佳组队为(L,G,
S).
42
2015年11月1日
Slide 43
3.模型的建立与求解
问题(3):给出由18名队员组成6个队的组队方案
用动态规划的方法,分决策过程为5个阶段,分步
给出 5 个队的组队方案.在除了队员 L , G , S 外的 15 名
队员中组成5个队,每一阶段确定一个队.
决策变量: X k ( x , y , z ) k ( k 1, 2 ,3, 4 ,5 ) ,即任取三
名队员 ( x , y , z ) 所组成的一个组队方案.
状态变量:S k ( k 1, 2 ,3, 4 ,5 ) ,即从第 k (1 k 5 )
个 到第 5 个组 队的 组队方 案所 包含的 队员 ,其中
S 1 A , B , C , , T .
43
2015年11月1日
Slide 44
3.模型的建立与求解
状态转移方程: S k 1 S k X k ( k 1, 2 ,3, 4 ) .
允许决策集合:
D k ( x , y , z ); x , y , z S k , v k ( x , y , z ) W ( k 1, 2 ,3, 4 ,5 ) .
指标函数: v k ( S k , X k ) 表示决策 X k (一个组队)关于
状态 S k 的技术水平指标,即 v k ( S k , X k ) M W 0 .
最优值函数: f k ( S k ) 表示在状态 S k 下确定的 k (1 k 5 )
个组队的技术水平指标之和的最大值.则有逆序解法的基
本方程:
44
2015年11月1日
Slide 45
3.模型的建立与求解
f k ( S k ) max v k ( S k , X k ) f k 1 ( S k 1 ), k 5 , 4 ,3 , 2 ,1
xk Dk
( L , G , S )队的技术水平指标
f 6 ( S 6 ) v 6 0 . 0563246
其中 S k 1 S k X k ( k 1, 2 ,3, 4 ) .
编程求解可以得到最优的组队方案,其最优值为 f 1 ( S 1 ) 0 . 323164 .
表:最优的组队方案
组队 X
k
X1
X
X3
2
X
4
X5
X6
队员(x,y,z) (C,J,K) (A,N,O) (B,P,R) (D,F,T) (E,M,Q) (G,L,S)
水平 v k ( x , y , z ) 0.051647 0.051935 0.053262 0.054647 0.055348 0.056325
45
2015年11月1日
Slide 46