第13讲动态规划方法

Transcript 第13讲动态规划方法

Slide 1

Slide 2

Slide 3

第十三章动态规划方法

动态规划的基本问题；
动态规划的基本概念与条件；

动态规划的基本方程；
动态规划的求解方法；

动态规划的应用案例分析。

3

2015年11月1日

Slide 4

一、动态规划的一般问题
动态规划是一种用于处理多阶段决策问题
的数学方法。主要是先将一个复杂的问题分
解成相互联系的若干阶段，每个阶段即为一
个小问题，然后逐个解决，当每个阶段的决
策确定之后，整个过程的决策也就确定了。
阶段一般用时间段表示(即与时间有关)，
这就是“动态”的含义，把这种处理问题的
方法称为动态规划方法。
4

2015年11月1日

Slide 5

1. 引例：最短路线问题
(1) 问题的提出

假设从 A 地到 G 地要铺设一条管道，如图
所示，中间经过 5 个中转站，第一个中转站可
以在{B1,B2 }中任一个，第二、三、四、五个中
转站分别在{C1 ,C2 ,C3 ,C4}、{D1,D2 ,D3 }、
{E1 ,E2 ,E3 }、{F1 ,F2 }中任选一个．
由于地理条件的限制，有些站点之间不可直
接铺设管道（图中无连线的站点），连线上的数
据表示相应管道的成本（距离、费用、时间等）
．试
求从 A 到 G 使得成本最低的一条管道铺设线路．
5

2015年11月1日

Slide 6

1. 引例：最短路线问题
(2) 问题的分析

由题意可知，从 A 到 G 可分为 6 个阶段：
A
 B 
 C 
 D 
 E 
 F 
 G ，
1

2

3

4

5

6

共有 48 条路线，现在的问题是要求每一个阶段的最小值
（距离、费用，或时间）
。
6

2015年11月1日

Slide 7

1. 引例：最短路线问题
2 .用动态规划的方法分步考虑
(1) 求一个阶段最优选择：
从 F 到 G： d ( F1 , G )  4 , d ( F 2 , G )  3 ，最优选择
为 f 6 ( F1 )  d ( F1 , G )  4 , f 6 ( F 2 )  d ( F 2 , G )  3 ，所
以最短路线为 F 2  G ；
(2) 求两个阶段最优选择：
从 E 到 G，有三个出发点 E 1 , E 2 , E 3 ：
 d ( E 1 , F1 )  f 6 ( F1 ) 
3  4 
f 5 ( E 1 )  min 
  min 
  7 , E 1  F1  G
5  3 
 d ( E1 , F2 )  f 6 ( F2 )
7

2015年11月1日

Slide 8

2 .用动态规划的方法分步考虑
(2) 求两个阶段最优选择：
从 E 到 G，有三个出发点 E 1 , E 2 , E 3 ：

 d ( E 1 , F1 )  f 6 ( F1 ) 
3  4 
f 5 ( E 1 )  min 
  min 
  7 , E 1  F1  G ，
5  3 
 d ( E1 , F2 )  f 6 ( F2 )

 d ( E 2 , F1 )  f 6 ( F1 ) 
5  4 
f 5 ( E 2 )  min 
  min 
  5, E 2  F 2  G
2  3
 d ( E 2 , F2 )  f 6 ( F2 )
 d ( E 3 , F1 )  f 6 ( F1 ) 
6  4 
f 5 ( E 3 )  min 
  min 
  9, E 3  F2  G
6  3 
 d ( E 3 , F2 )  f 6 ( F2 )

所以最短路线为 E 2  F 2  G ；
8

2015年11月1日

Slide 9

2 .用动态规划的方法分步考虑
(3)求三个阶段最优选择：
 d ( D1 , E1 )  f 5 ( E1 ) 
2  7
f 4 ( D 1 )  min 
  min 
  7, D1  E 2  F2  G
2  5 
 d ( D1 , E 2 )  f 5 ( E 2 )

d ( D2 , E 2 )  f5 ( E 2 )
1  5 
f 4 ( D 2 )  min 
  min 
  6 , D 2  E 2  F2  G ，
2  9
d (D2 , E3 )  f5 (E3 ) 
d ( D 3 , E 2 )  f 5 ( E 2 )
3 
f 4 ( D 3 )  min 
  min 
3 
d ( D3 , E 3 )  f 5 ( E 3 ) 

所以最短路线为 D 2

 E 2  F2  G

9

5
  8, D 3  E 2  F 2  G
9

；

2015年11月1日

Slide 10

2 .用动态规划的方法分步考虑
(4) 求四个阶段最优选择：
从 C 到 G 有四个出发点 C 1 , C 2 , C 3 , C 4 ：最优选择为
 d (C 1 , D1 )  f 4 ( D1 ) 
6  7 
f 3 ( C 1 )  min 
  min 
  13 , C 1  D 1  E 2  F 2  G
8  6 
 d (C 1 , D 2 )  f 4 ( D 2 ) 

 d ( C 2 , D1 )  f 4 ( D1 ) 
f 3 ( C 2 )  min 
  min
 d (C 2 , D 2 )  f 4 ( D 2 ) 

10

3  7 

  10 , C 2  D 1  E 2  F 2  G
5  6 

2015年11月1日

Slide 11

2 .用动态规划的方法分步考虑
（4)求四个阶段最优选择：
f 3 ( C1 )  13, C1  D1  E 2  F2  G

f 3 ( C 2 )  10, C 2  D1  E 2  F2  G
 d (C 3 , D 2 )  f 4 ( D 2 ) 
3  6 
f 3 ( C 3 )  min 
  min 
  9 , C 3  D 2  E 2  F2  G
3  8 
 d (C 3 , D 3 )  f 4 ( D 3 ) 
 d (C 4 , D 2 )  f 4 ( D 2 ) 
8  6 
f 3 ( C 4 )  min 
  min 
  12 , C 4  D 3  E 2  F 2  G
4  8
 d (C 4 , D 3 )  f 4 ( D 3 ) 

所以最短路线为 C 3  D 2

 E 2  F2  G ；

11

2015年11月1日

Slide 12

2 .用动态规划的方法分步考虑
(5) 求五个阶段最优选择：
从 B 到 G 有两个出发点 B1 , B 2 ：
最优选择为
 d ( B1 , C 1 )  f 3 ( C 1 ) 
1  13 




f 2 ( B1 )  min  d ( B1 , C 2 )  f 3 ( C 2 )   min  3  10   13 , B1  C 2  D1  E 2  F 2  G
 d ( B , C )  f (C ) 
6  9 


1
3
3
3 

 d ( B 2 , C 2 )  f 3 (C 2 ) 
 8  10 




f 2 ( B 2 )  min  d ( B 2 , C 3 )  f 3 ( C 3 )   min  7  9   16 , B 2  C 2  D 1  E 2  F 2  G
 d ( B , C )  f (C ) 
 6  12 


2
4
3
4 


所以最短路线为 B1  C 2

 D1  E 2  F2  G
12

2015年11月1日

Slide 13

2 .用动态规划的方法分步考虑
(6) 求六个阶段最优选择 : 从 A 到 G 有一个出发点 A：最优选择为

 d ( A , B1 )  f 2 ( B1 ) 
 5  13 
f 1 ( A )  min 
  min 
  18 ,
 3  16 
d ( A, B2 )  f 2 ( B2 )
A  B1  C 2  D 1  E 2  F 2  G
所以最优路线为

A  B 1  C 2  D 1  E 2  F 2  G ，总距离为 18

13

2015年11月1日

Slide 14

二. 动态规划的基本概念与条件
1 . 动态规划的基本概念

(1)阶段（stage）和阶段变量
阶段是指一个问题需要作出决策的步
骤，即把问题的过程分为若干个相互联系
的阶段，使能按阶段的次序求解。
描述阶段的变量称为阶段变量,常用k
表示。

14

2015年11月1日

Slide 15

(2)状态与状态变量
在多阶段决策过程中，每一阶段都具有一些特
征（自然状况，或客观条件），这就是状态，用来
描述状态的变量称为状态变量。

通常第 k 阶段的状态变量用 s k ( k  1, 2 ,  , n ) 表示，它的
取值可以是一个数、一组数或一个向量等。

状态变量可取值的全体所构成的集合称为可达状态集
合（或允许状态集合）,用 S k ( k  1, 2 ,  , n ) 表示。
15

2015年11月1日

Slide 16

(3)决策和决策变量
当过程处于某一阶段的某个状态时，可以作出
不同的决定（或选择），从而确定下一阶段的状态，
这种决定称为决策。描述决策的变量称为决策变
量，用 x k ( s k ) 表示第 k 阶段 s k ( k  1, 2 ,  , n ) 状态
的决策变量。

决策变量的取值范围称为允许决策集合，用 D k ( s k )
表示第 k 阶段状态 s k ( k  1, 2 ,  , n ) 的允许决策集合，即
x k ( s k )  D k ( s k )( k  1, 2 ,  , n ) 。
16

2015年11月1日

Slide 17

(4)策略与子策略
策略是一个按顺序排列的决策组成的集合。
由第 k 阶段开始到终止状态为止的过程，称为问
题的后部子过程或 k 子过程.

由 k 子过程的每一阶段的决策按顺序排列组成的决策
函数序列 x k ( s k ),   , x n ( s n ) ，称为 k 子过程策略，记为

p k , n ( s k ) ，即
p k , n ( s k )  x k ( s k ), x k 1 ( s k 1 ),   , x n ( s n ) ，
17

2015年11月1日

Slide 18

(4)策略与子策略
当 k=1 时，此决策函数序列称为全过程的一个策
略，记为 p 1, n ( s k ) ，即
p 1, n ( s 1 )  x 1 ( s 1 ), x 2 ( s 2 ),   , x n ( s n ) 。
可供选择的策略范围称为允许策略集合，用 P 表示，
从允许策略集合中找出达到最优效果的策略称为最
优策略。
18

2015年11月1日

Slide 19

(5)状态转移函数
状态函数是在确定多阶段决策过程中，由一个
状态到另个状态的演变过程。

如果给定了第 k 阶段状态变量 s k 和该阶段的决
策变量 x k ( s k ) ，则第 k+1 阶段的状态变量 s k  1 的值也
随之而定，即 s k  1 随 s k 和 x k ( s k ) 的变化而变化。
这种对应关系记为 s k 1  T k ( s k , x k ( s k )) ，称为状态
转移方程， T k ( s k , x k ) 称为状态转移函数。
19

2015年11月1日

Slide 20

(6) 指标函数（回收函数）
在多阶段决策过程中，用来衡量所实现过程优
劣的一种数量指标，称为指标函数。

它是定义在全过程或所有后部子过程上的数量函数，即
是各阶段的状态和决策变量的函数，记为 V k , n ，即
V k , n  V k , n ( s k , x k , s k 1 , x k 1 ,   , s n , x n , s n 1 ) ，
指标函数具有可分离性和递推关系：
V k , n ( s k , x k , s k  1 , x k  1 ,  , s n , x n , s n  1 )
  k [ s k , x k , V k  1 , n ( s k  1 , x k  1 ,  , s n , x n , s n  1 )]
20

2015年11月1日

Slide 21

常见的两种指标函数
1）全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的和，即
n

V k , n ( s k , x k , s k 1 , x k  1 ,  , s n , x n , s n 1 ) 

v

j

(s j , x j )

jk

递推关系为：
V k , n ( s k , x k , s k 1 , x k 1 ,   , s n , x n , s n 1 )  v k ( s k , x k )
 V k  1, n ( s k 1 , x k 1 ,   , x n , s n 1 )

21

2015年11月1日

Slide 22

常见的两种指标函数
2）全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的乘积，即
n

V k , n ( s k , x k , s k 1 , x k 1 ,  , s n , x n , s n 1 )   v j ( s j , x j )
jk

递推关系为：
V k , n ( s k , x k , s k  1 , x k  1 ,   , s n , x n , s n  1 )
 v k ( s k , x k )  V k  1, n ( s k  1 , x k  1 ,   , x n , s n  1 )
22

2015年11月1日

Slide 23

(7) 最优值函数

从第 k 阶段的状态 s k 开始到第 n 阶段的终止状态 s n 1 的
过程，采取最优策略所得到的指标函数值，称为最优值函数，
记为 f k ( s k )( k  1, 2 ,  , n ) ，即
f k (sk ) 

opt

 x k , x k  1 ,   , x n 

V k , n ( s k , x k , s k 1 , x k 1 ,  , s n , x n , s n 1 )

23

2015年11月1日

Slide 24

二. 动态规划的基本概念与条件
2 . 动态规划的基本条件

（1）将问题化为恰当的 n 个阶段；
（2）正确选择状态变量 s k ，使它既能表达过程，
又要具有无后效性和可知性：
*无后效性：如果某阶段状态已给定，则以后过程
的发展不受以前各阶段状态的影响，也就是说当
前状态就是未来过程的初始状态；
**可知性：规定的各阶段状态变量的值，由直接
或间接都是可以知道的。
24

2015年11月1日

Slide 25

2 . 动态规划的基本条件

（3）确定决策变量 x k 及每一阶段的允许决策集合 D k ( s k );
（4）写出状态转移方程： s k 1  T k ( s k , x k ), k  1, 2 ,  , n ；
(5) 正确写出指标函数 V k , n 的关系，它满足下列三个性质：
1) 它是过程各阶段状态变量和决策变量的函数；
2) 具有可分离性和递推关系，即
V k , n ( s k , x k , s k  1 , x k  1 ,   , s n , x n , s n  1 )
  k [ s k , x k , V k  1, n ( s k  1 , x k  1 ,   , s n , x n , s n  1 )]

3)  k [ s k , x k , V k 1, n ( s k 1 , x k 1 ,  , s n , x n , s n 1 )] 是关于 V k 1, n 严格单调的。
25

2015年11月1日

Slide 26

三. 动态规划的基本方程
1 . 动态规划的逆序解法

设动态规划指标函数的形式为
n

V k , n ( s k , x k , s k  1 , x k  1 ,  , s n , x n , s n  1 ) 

v

j

(s j , x j )

jk

且具有上面的三条性质，则
V k , n  v k ( s k , x k )  V k  1 ( s k  1 , x k  1 ,  , x n , s n  1 )

如果初始状态 s k 给定，则决策变量 x k ( s k ) 随之确定，k 子过
程的策略 p k , n ( s k ) 也就确定，从而指标函数 V k , n 也同时确定了，
26

2015年11月1日

Slide 27

1 . 动态规划的逆序解法
如果用 p k , n ( s k ) 表示以第 k 阶段状态 s k 为初始状态的
*

后部子过程所有子策略中的最优子策略，则最优值函数为
f k ( s k )  V k ,n [ s k , p

*
k ,n

( s k )] 

opt

V k , n [ s k , p k , n ( s k )]

pk ,n

动态规划逆序解法的基本方程:
 f k ( s k )  opt v k ( s k , x k )  f k 1 ( s k 1 ), k  n , n  1,  , 2 ,1

xk Dk ( sk )

 边界条件为 : f ( s )  0 , 或 f ( s )  v ( s , x )
n 1
n 1
n
n
n
n
n


27

2015年11月1日

Slide 28

三. 动态规划的基本方程
2 . 动态规划的顺序解法
设过程的第 k 阶段的状态为 s k ，其决策变量 x k
表示当状态处于 s k  1 的决策，即由 x k ( s k 1 ) 确定，则
状态转移方程为 s k  T k ( s k  1 , x k ) ，k 阶段的允许决
r

r
k

策集合记为 D ( s k 1 ) ，指标函数定义为：

V k ( s k 1 , x k , s k , x k 1 ,  , x 1 , s 1 )

28

2015年11月1日

Slide 29

2 . 动态规划的顺序解法
最优值函数：
f k ( s k 1 ) 

opt V

k

( s k  1 , x k ,  , x 1 , s 1 )

r

x k  D k ( s k 1 )

则
 f k ( s k  1 )  opt v k ( s k  1 , x k )  f k 1 ( s k ), k  1, 2 ,  , n

r
x k  D k ( s k 1 )

 边界条件为 : f ( s )  0
0
1


此为动态规划顺序解法的基本方程。

29

2015年11月1日

Slide 30

四. 动态规划的求解方法
1 . 动态规划的逆序解法

设已知初始状态为 s 1 ，用 f k( s k ) 表示从第

k 阶段初始状态 s k 到第 n 阶段的最优值。
第 n 阶段：指标函数的最优值记为
f n( s n ) 

opt
xn Dn ( sn )

vn (sn , xn ) ，

此为一维极值问题，不妨设有最优解 x n  x n ( s n ) ，则有
最优值 f n( s n ) 。
30

2015年11月1日

Slide 31

1 . 动态规划的逆序解法
第 n-1 阶段：类似地有
f

( s n 1 ) 

n 1

opt
x n 1 D n 1 ( s n 1 )

v n 1 ( s n 1 , x n 1 ) *

f n ( s n )

其中 s n  T n 1 ( s n 1 , x n 1 ) ，可解得最优解 x n 1  x n 1 ( s n 1 ) ，
则最优值为 f

( s n 1 ) 。

n 1

不妨设第 k+1 阶段的最优解为 x k 1  x k 1 ( s k 1 ) 和最优值 f
则对于第 k 阶段有 f k( s k )  opt

xk Dk ( sk )

( s k 1 ) ,

k 1

v k ( s k , x k ) * f k 1 ( s k 1 )

其中 s k 1  T k ( s k , x k ) ，可解得最优解 x k  x k ( s k ) 和最优值为 f k( s k ) 。
31

2015年11月1日

Slide 32

1 . 动态规划的逆序解法
依此类推，直到第 1 阶段，有
f 1( s 1 ) 

opt
x1  D 1 ( s1 )

v 1 ( s 1 , x 1 ) *

f 2 ( s 2 ) ，

其中 s 2  T1 ( s 1 , x 1 ) ，可解得最优解 x 1  x 1 ( s 1 ) 和最优值
为 f 1( s 1 ) 。

由于已知 s 1 ，则可知 x 1 与 f 1( s 1 ) 。从而可知
s 2 , x 2 , f 2( s 2 ) ，按上面的递推过程反推回去，即可得

到每一阶段和全过程的最优决策。

32

2015年11月1日

Slide 33

四. 动态规划的求解方法
2 . 动态规划的顺序解法

设已知终止状态为 s n 1 ，用 f k( s k 1 ) 表示从第
1 阶段初始状态 s 1 到第 k 阶段末的结束状态 s k  1 的
最优值。
第一阶段：指标函数的最优值记为
f 1( s 2 ) 

opt
x1  D 1 ( s1 )

v 1 ( s 1 , x 1 ) ， s 1  T1 ( s 2 , x 1 ) ，

可解得最优解 x 1  x 1 ( s 2 ) 和最优值 f 1( s 2 ) 。
33

2015年11月1日

Slide 34

2 . 动态规划的顺序解法
第二阶段：类似地有：
f 2( s 3 ) 

opt
x2D2 ( s2 )

v 2 ( s 2 , x 2 ) *

f 1 ( s 2 )

其中 s 2  T 2 ( s 3 , x 2 ) ，可解得最优解 x 2  x 2 ( s 3 ) ，于是
最优值为 f 2( s 3 ) 。

不妨设第 k 阶段有
f k( s k  1 )  opt

xk Dk ( sk )

v k ( s k , x k ) * f k 1 ( s k ) ， s k

 T k ( s k 1 , x k )

解得最优解为 x k  x k ( s k 1 ) 和最优值 f k( s k 1 ) 。
34

2015年11月1日

Slide 35

2 . 动态规划的顺序解法
依次类推，直到第 n 阶段有
f n( s n  1 ) 

opt
xn Dn ( sn )

v n ( s n , x n ) *

f n 1 ( s n ) ，

其中 s n  T n ( s n 1 , x n ) ，可解得最优解 x n  x n ( s n 1 ) 和最优
值为 f n( s n 1 ) 。

由于已知 s n 1 ，则可知 x n 与 f n( s n 1 ) 。从而可知
s n , x n 1 , f

( s n ) ，按上面的递推过程反推回去，直到

n 1

s 1 , x 1 , f 1( s 2 ) ，即得到整个过程和各阶段的最优决策。
35

2015年11月1日

Slide 36

1.问题的提出
现假设有20名队员准备参加数学建模竞赛，根
据队员的能力和水平要选出18名优秀队员分别组成
6个队，每个队3名队员去参加比赛。选择队员主要
考虑的条件依次为有关学科成绩、智力水平、动手
能力、写作能力、外语水平、协作能力和其它特长。
假设所有队员接受了同样的培训，外部环境
相同，竞赛中不考虑其他的随机因素，竞赛水平的
发挥只取决于表中所给的各项条件，并且，参赛队
员都能正常发挥自己的水平。
36

2015年11月1日

Slide 37

1.问题的提出

现在的问题：
（1）在20名队员中选择18名优秀队员参
加竞赛；
（2）确定一个最佳的组队使竞赛技术水
平最高；
（3）给出由18名队员组成6个队的组队方
案，使整体竞赛技术水平最高；并给出每
个队的竞赛技术水平。
37

2015年11月1日

Slide 38

2.模型的假设
(1)假设问题中提供队员的基本条件充分地反映
了每个队的真实能力和水平；
(２)假设每个队员的能力和水平在比赛中可以
100％的发挥，不受外界因素和环境的影响；
（3）同一个队三名队员的单项条件互不影响，
且具有互补性，即一个队的水平为最高者的水平；
（4）6个队整体技术水平最高是在确定的最佳
组队保持不变的条件下整体技术水平最高．

38

2015年11月1日

Slide 39

3.模型的建立与求解
问题（1）：利用层次分析法得到每个队员的水
平指标，按大小排序结果如下表：
序
号
1
2
3
队
员
L
M
G
水平指标 0.0533642 0.0531373 0.0530848

4
D
0.0518990

5
F
0.0514261

6
P
0.0514320

7
R
0.0512626

序
号
8
9
10
队
员
O
T
E
水平指标 0.0511709 0.0511465 0.0502659
序
号
15
16
17
队
员
S
N
J

11
Q
0.0500917
18
B

12
A
0.0496756
19
I

13
C
0.0496028
20
H

14
K
0.0492494

水平指标 0.048988 0.0488254

0.0471768

0.0463575

0.0462886

0.0456541

由排序结果，陶汰 H 和 I 两名队员，其余的 18 名为
入选参赛的优秀队员。
39

2015年11月1日

Slide 40

3.模型的建立与求解

问题(2)：确定一个最佳的组队使竞赛技术水平最高.
最佳组队原则:设 m i ( x ) 表示队员 x 的第 i 项水平指标，
M i ( x , y , z ) 表示由队员 x , y , z 组队 ( x , y , z ) 的第 i 项水平指

标，则
M i ( x , y , z )  max m i ( x ), m i ( y ), m i ( y )( i  1, 2 ,  , 7 )

令 M   M 1 ( x , y , z ), M 2 ( x , y , z ),  , M 7 ( x , y , z )  ，于是用
T
v ( x , y , z )  M  W 0 表示 ( x , y , z ) 队的整体技术水平指标．最
佳组队是从 18 名队员中选出 x , y , z 使 v ( x , y , z ) 最高．
40

2015年11月1日

Slide 41

3.模型的建立与求解
组队方案:根据组队原则，
最佳组队中的队员一定是前
四项水平指标的最高者．由问题（1）的结果可得
m 1 ( L )  0 . 0556199 为最高，于是 M 1  m 1 ( L )  0 . 0556199 ，
则队员Ｌ是首先入选的队员．
其次 m 2 ( G )  m 2 ( M )  0 . 0557168 ，而 m 3 ( G ) 
故M

2

m3 (M )

，

 m 2 ( G )  0 . 0557168 ，则Ｇ是第二个入选的队员．

另外， m 3 ( S )  0 .0553953 ，于是 M 3  m 3 ( S )  0 . 0553953 ，
而且 M 4  m 4 ( L )  0 . 0619137
的队员．
41

，则队员Ｓ应是第三个入选

2015年11月1日

Slide 42

3.模型的建立与求解

M7

注意到 M 5  m 5 ( G )  0 .0520297 , M 6  m 6 ( L )  0 .0518717 , ，
 m 7 ( G )  0 .0708661 也都是相对的较高者，即

M  (0.0556199, 0.0557168, 0.0553953, 0.0619137,
0.0520297, 0.0518717, 0.0708661)

因此，由队员 L，G ，S 组成（L，G，S）队的技术水平指标为
T
v ( L , G , S )  M  W 0  0 . 563246 是最高的，所以最佳组队为（L，G，
S）．

42

2015年11月1日

Slide 43

3.模型的建立与求解
问题（3）：给出由18名队员组成6个队的组队方案
用动态规划的方法，分决策过程为５个阶段，分步
给出 5 个队的组队方案．在除了队员 L , G , S 外的 15 名
队员中组成５个队，每一阶段确定一个队．
决策变量： X k  ( x , y , z ) k ( k  1, 2 ,3, 4 ,5 ) ，即任取三
名队员 ( x , y , z ) 所组成的一个组队方案.
状态变量：S k ( k  1, 2 ,3, 4 ,5 ) ，即从第 k (1  k  5 )
个到第 5 个组队的组队方案所包含的队员，其中
S 1  A , B , C ,  , T  .
43

2015年11月1日

Slide 44

3.模型的建立与求解
状态转移方程： S k 1  S k  X k ( k  1, 2 ,3, 4 ) .
允许决策集合：





D k  ( x , y , z ); x , y , z  S k , v k ( x , y , z )  W ( k  1, 2 ,3, 4 ,5 ) .

指标函数： v k ( S k , X k ) 表示决策 X k （一个组队）关于
状态 S k 的技术水平指标，即 v k ( S k , X k )  M  W 0 .

最优值函数： f k ( S k ) 表示在状态 S k 下确定的 k (1  k  5 )
个组队的技术水平指标之和的最大值．则有逆序解法的基
本方程：
44

2015年11月1日

Slide 45

3.模型的建立与求解
 f k ( S k )  max v k ( S k , X k )  f k  1 ( S k 1 ), k  5 , 4 ,3 , 2 ,1
xk Dk



( L , G , S )队的技术水平指标
 f 6 ( S 6 )  v 6  0 . 0563246




其中 S k 1  S k  X k ( k  1, 2 ,3, 4 ) ．
编程求解可以得到最优的组队方案，其最优值为 f 1 ( S 1 )  0 . 323164 ．
表：最优的组队方案
组队 X

k

X1

X

X3

2

X

4

X5

X6

队员(x,y,z) (C,J,K) (A,N,O) (B,P,R) (D,F,T) (E,M,Q) (G,L,S)
水平 v k ( x , y , z ) 0.051647 0.051935 0.053262 0.054647 0.055348 0.056325

45

2015年11月1日

Slide 46

第13讲动态规划方法

Transcript 第13讲动态规划方法

Directory