第13讲动态规划方法

Download Report

Transcript 第13讲动态规划方法

Slide 1


Slide 2


Slide 3

第十三章 动态规划方法

动态规划的基本问题;
动态规划的基本概念与条件;

动态规划的基本方程;
动态规划的求解方法;

动态规划的应用案例分析。

3

2015年11月1日


Slide 4

一、动态规划的一般问题
动态规划是一种用于处理多阶段决策问题
的数学方法。主要是先将一个复杂的问题分
解成相互联系的若干阶段,每个阶段即为一
个小问题,然后逐个解决,当每个阶段的决
策确定之后,整个过程的决策也就确定了。
阶段一般用时间段表示(即与时间有关),
这就是“动态”的含义,把这种处理问题的
方法称为动态规划方法。
4

2015年11月1日


Slide 5

1. 引例:最短路线问题
(1) 问题的提出

假设从 A 地到 G 地要铺设一条管道,如图
所示,中间经过 5 个中转站,第一个中转站可
以在{B1,B2 }中任一个,第二、三、四、五个中
转站分别在{C1 ,C2 ,C3 ,C4}、{D1,D2 ,D3 }、
{E1 ,E2 ,E3 }、{F1 ,F2 }中任选一个.
由于地理条件的限制,有些站点之间不可直
接铺设管道(图中无连线的站点),连线上的数
据表示相应管道的成本(距离、费用、时间等)
.试
求从 A 到 G 使得成本最低的一条管道铺设线路.
5

2015年11月1日


Slide 6

1. 引例:最短路线问题
(2) 问题的分析

由题意可知,从 A 到 G 可分为 6 个阶段:
A
 B 
 C 
 D 
 E 
 F 
 G ,
1

2

3

4

5

6

共有 48 条路线,现在的问题是要求每一个阶段的最小值
(距离、费用,或时间)

6

2015年11月1日


Slide 7

1. 引例:最短路线问题
2 .用动态规划的方法分步考虑
(1) 求一个阶段最优选择:
从 F 到 G: d ( F1 , G )  4 , d ( F 2 , G )  3 ,最优选择
为 f 6 ( F1 )  d ( F1 , G )  4 , f 6 ( F 2 )  d ( F 2 , G )  3 ,所
以最短路线为 F 2  G ;
(2) 求两个阶段最优选择:
从 E 到 G,有三个出发点 E 1 , E 2 , E 3 :
 d ( E 1 , F1 )  f 6 ( F1 ) 
3  4 
f 5 ( E 1 )  min 
  min 
  7 , E 1  F1  G
5  3 
 d ( E1 , F2 )  f 6 ( F2 )
7

2015年11月1日


Slide 8

2 .用动态规划的方法分步考虑
(2) 求 两 个 阶 段 最 优 选 择 :
从 E 到 G, 有 三 个 出 发 点 E 1 , E 2 , E 3 :

 d ( E 1 , F1 )  f 6 ( F1 ) 
3  4 
f 5 ( E 1 )  min 
  min 
  7 , E 1  F1  G ,
5  3 
 d ( E1 , F2 )  f 6 ( F2 )

 d ( E 2 , F1 )  f 6 ( F1 ) 
5  4 
f 5 ( E 2 )  min 
  min 
  5, E 2  F 2  G
2  3
 d ( E 2 , F2 )  f 6 ( F2 )
 d ( E 3 , F1 )  f 6 ( F1 ) 
6  4 
f 5 ( E 3 )  min 
  min 
  9, E 3  F2  G
6  3 
 d ( E 3 , F2 )  f 6 ( F2 )

所以最短路线为 E 2  F 2  G ;
8

2015年11月1日


Slide 9

2 .用动态规划的方法分步考虑
(3)求三个阶段最优选择:
 d ( D1 , E1 )  f 5 ( E1 ) 
2  7
f 4 ( D 1 )  min 
  min 
  7, D1  E 2  F2  G
2  5 
 d ( D1 , E 2 )  f 5 ( E 2 )

d ( D2 , E 2 )  f5 ( E 2 )
1  5 
f 4 ( D 2 )  min 
  min 
  6 , D 2  E 2  F2  G ,
2  9
d (D2 , E3 )  f5 (E3 ) 
d ( D 3 , E 2 )  f 5 ( E 2 )
3 
f 4 ( D 3 )  min 
  min 
3 
d ( D3 , E 3 )  f 5 ( E 3 ) 

所以最短路线为 D 2

 E 2  F2  G

9

5
  8, D 3  E 2  F 2  G
9



2015年11月1日


Slide 10

2 .用动态规划的方法分步考虑
(4) 求四个阶段最优选择:
从 C 到 G 有四个出发点 C 1 , C 2 , C 3 , C 4 :最优选择为
 d (C 1 , D1 )  f 4 ( D1 ) 
6  7 
f 3 ( C 1 )  min 
  min 
  13 , C 1  D 1  E 2  F 2  G
8  6 
 d (C 1 , D 2 )  f 4 ( D 2 ) 

 d ( C 2 , D1 )  f 4 ( D1 ) 
f 3 ( C 2 )  min 
  min
 d (C 2 , D 2 )  f 4 ( D 2 ) 

10

3  7 

  10 , C 2  D 1  E 2  F 2  G
5  6 

2015年11月1日


Slide 11

2 .用动态规划的方法分步考虑
(4)求四个阶段最优选择:
f 3 ( C1 )  13, C1  D1  E 2  F2  G

f 3 ( C 2 )  10, C 2  D1  E 2  F2  G
 d (C 3 , D 2 )  f 4 ( D 2 ) 
3  6 
f 3 ( C 3 )  min 
  min 
  9 , C 3  D 2  E 2  F2  G
3  8 
 d (C 3 , D 3 )  f 4 ( D 3 ) 
 d (C 4 , D 2 )  f 4 ( D 2 ) 
8  6 
f 3 ( C 4 )  min 
  min 
  12 , C 4  D 3  E 2  F 2  G
4  8
 d (C 4 , D 3 )  f 4 ( D 3 ) 

所以最短路线为 C 3  D 2

 E 2  F2  G ;

11

2015年11月1日


Slide 12

2 .用动态规划的方法分步考虑
(5) 求五个阶段最优选择:
从 B 到 G 有 两 个 出 发 点 B1 , B 2 :
最 优 选 择 为
 d ( B1 , C 1 )  f 3 ( C 1 ) 
1  13 




f 2 ( B1 )  min  d ( B1 , C 2 )  f 3 ( C 2 )   min  3  10   13 , B1  C 2  D1  E 2  F 2  G
 d ( B , C )  f (C ) 
6  9 


1
3
3
3 

 d ( B 2 , C 2 )  f 3 (C 2 ) 
 8  10 




f 2 ( B 2 )  min  d ( B 2 , C 3 )  f 3 ( C 3 )   min  7  9   16 , B 2  C 2  D 1  E 2  F 2  G
 d ( B , C )  f (C ) 
 6  12 


2
4
3
4 


所 以 最 短 路 线 为 B1  C 2

 D1  E 2  F2  G
12

2015年11月1日


Slide 13

2 .用动态规划的方法分步考虑
(6) 求 六 个 阶 段 最 优 选 择 : 从 A 到 G 有 一 个 出 发 点 A: 最 优 选 择 为

 d ( A , B1 )  f 2 ( B1 ) 
 5  13 
f 1 ( A )  min 
  min 
  18 ,
 3  16 
d ( A, B2 )  f 2 ( B2 )
A  B1  C 2  D 1  E 2  F 2  G
所以最优路线为

A  B 1  C 2  D 1  E 2  F 2  G , 总 距 离 为 18

13

2015年11月1日


Slide 14

二. 动态规划的基本概念与条件
1 . 动态规划的基本概念

(1)阶段(stage)和阶段变量
阶段是指一个问题需要作出决策的步
骤,即把问题的过程分为若干个相互联系
的阶段,使能按阶段的次序求解。
描述阶段的变量称为阶段变量,常用k
表示。

14

2015年11月1日


Slide 15

(2)状态与状态变量
在多阶段决策过程中,每一阶段都具有一些特
征(自然状况,或客观条件),这就是状态,用来
描述状态的变量称为状态变量。

通常第 k 阶段的状态变量用 s k ( k  1, 2 ,  , n ) 表示,它的
取值可以是一个数、一组数或一个向量等。

状态变量可取值的全体所构成的集合称为可达状态集
合(或允许状态集合),用 S k ( k  1, 2 ,  , n ) 表示。
15

2015年11月1日


Slide 16

(3)决策和决策变量
当过程处于某一阶段的某个状态时,可以作出
不同的决定(或选择),从而确定下一阶段的状态,
这种决定称为决策。描述决策的变量称为决策变
量,用 x k ( s k ) 表示第 k 阶段 s k ( k  1, 2 ,  , n ) 状态
的决策变量。

决策变量的取值范围称为允许决策集合,用 D k ( s k )
表示第 k 阶段状态 s k ( k  1, 2 ,  , n ) 的允许决策集合,即
x k ( s k )  D k ( s k )( k  1, 2 ,  , n ) 。
16

2015年11月1日


Slide 17

(4)策略与子策略
策略是一个按顺序排列的决策组成的集合。
由第 k 阶段开始到终止状态为止的过程,称为问
题的后部子过程或 k 子过程.

由 k 子过程的每一阶段的决策按顺序排列组成的决策
函数序列 x k ( s k ),   , x n ( s n ) ,称为 k 子过程策略,记为

p k , n ( s k ) ,即
p k , n ( s k )  x k ( s k ), x k 1 ( s k 1 ),   , x n ( s n ) ,
17

2015年11月1日


Slide 18

(4)策略与子策略
当 k=1 时,此决策函数序列称为全过程的一个策
略,记为 p 1, n ( s k ) ,即
p 1, n ( s 1 )  x 1 ( s 1 ), x 2 ( s 2 ),   , x n ( s n ) 。
可供选择的策略范围称为允许策略集合,用 P 表示,
从允许策略集合中找出达到最优效果的策略称为最
优策略。
18

2015年11月1日


Slide 19

(5)状态转移函数
状态函数是在确定多阶段决策过程中,由一个
状态到另个状态的演变过程。

如果给定了第 k 阶段状态变量 s k 和该阶段的决
策变量 x k ( s k ) ,则第 k+1 阶段的状态变量 s k  1 的值也
随之而定,即 s k  1 随 s k 和 x k ( s k ) 的变化而变化。
这种对应关系记为 s k 1  T k ( s k , x k ( s k )) ,称为状态
转移方程, T k ( s k , x k ) 称为状态转移函数。
19

2015年11月1日


Slide 20

(6) 指标函数(回收函数)
在多阶段决策过程中,用来衡量所实现过程优
劣的一种数量指标,称为指标函数。

它是定义在全过程或所有后部子过程上的数量函数,即
是各阶段的状态和决策变量的函数,记为 V k , n ,即
V k , n  V k , n ( s k , x k , s k 1 , x k 1 ,   , s n , x n , s n 1 ) ,
指标函数具有可分离性和递推关系:
V k , n ( s k , x k , s k  1 , x k  1 ,  , s n , x n , s n  1 )
  k [ s k , x k , V k  1 , n ( s k  1 , x k  1 ,  , s n , x n , s n  1 )]
20

2015年11月1日


Slide 21

常见的两种指标函数
1) 全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的和,即
n

V k , n ( s k , x k , s k 1 , x k  1 ,  , s n , x n , s n 1 ) 

v

j

(s j , x j )

jk

递推关系为:
V k , n ( s k , x k , s k 1 , x k 1 ,   , s n , x n , s n 1 )  v k ( s k , x k )
 V k  1, n ( s k 1 , x k 1 ,   , x n , s n 1 )

21

2015年11月1日


Slide 22

常见的两种指标函数
2)全过程和任一子过程的指标函数是它所包含的各阶
段的指标函数的乘积,即
n

V k , n ( s k , x k , s k 1 , x k 1 ,  , s n , x n , s n 1 )   v j ( s j , x j )
jk

递推关系为:
V k , n ( s k , x k , s k  1 , x k  1 ,   , s n , x n , s n  1 )
 v k ( s k , x k )  V k  1, n ( s k  1 , x k  1 ,   , x n , s n  1 )
22

2015年11月1日


Slide 23

(7) 最优值函数

从第 k 阶段的状态 s k 开始到第 n 阶段的终止状态 s n 1 的
过程,采取最优策略所得到的指标函数值,称为最优值函数,
记为 f k ( s k )( k  1, 2 ,  , n ) ,即
f k (sk ) 

opt

 x k , x k  1 ,   , x n 

V k , n ( s k , x k , s k 1 , x k 1 ,  , s n , x n , s n 1 )

23

2015年11月1日


Slide 24

二. 动态规划的基本概念与条件
2 . 动态规划的基本条件

(1)将问题化为恰当的 n 个阶段;
(2)正确选择状态变量 s k ,使它既能表达过程,
又要具有无后效性和可知性:
*无后效性:如果某阶段状态已给定,则以后过程
的发展不受以前各阶段状态的影响,也就是说当
前状态就是未来过程的初始状态;
**可知性:规定的各阶段状态变量的值,由直接
或间接都是可以知道的。
24

2015年11月1日


Slide 25

2 . 动态规划的基本条件

(3)确定决策变量 x k 及每一阶段的允许决策集合 D k ( s k );
(4)写出状态转移方程: s k 1  T k ( s k , x k ), k  1, 2 ,  , n ;
(5) 正确写出指标函数 V k , n 的关系,它满足下列三个性质:
1) 它是过程各阶段状态变量和决策变量的函数;
2) 具有可分离性和递推关系,即
V k , n ( s k , x k , s k  1 , x k  1 ,   , s n , x n , s n  1 )
  k [ s k , x k , V k  1, n ( s k  1 , x k  1 ,   , s n , x n , s n  1 )]

3)  k [ s k , x k , V k 1, n ( s k 1 , x k 1 ,  , s n , x n , s n 1 )] 是关于 V k 1, n 严格单调的。
25

2015年11月1日


Slide 26

三. 动态规划的基本方程
1 . 动态规划的逆序解法

设动态规划指标函数的形式为
n

V k , n ( s k , x k , s k  1 , x k  1 ,  , s n , x n , s n  1 ) 

v

j

(s j , x j )

jk

且具有上面的三条性质,则
V k , n  v k ( s k , x k )  V k  1 ( s k  1 , x k  1 ,  , x n , s n  1 )

如果初始状态 s k 给定,则决策变量 x k ( s k ) 随之确定,k 子过
程的策略 p k , n ( s k ) 也就确定,从而指标函数 V k , n 也同时确定了,
26

2015年11月1日


Slide 27

1 . 动态规划的逆序解法
如果用 p k , n ( s k ) 表示以第 k 阶段状态 s k 为初始状态的
*

后部子过程所有子策略中的最优子策略,则最优值函数为
f k ( s k )  V k ,n [ s k , p

*
k ,n

( s k )] 

opt

V k , n [ s k , p k , n ( s k )]

pk ,n

动态规划逆序解法的基本方程:
 f k ( s k )  opt v k ( s k , x k )  f k 1 ( s k 1 ), k  n , n  1,  , 2 ,1

xk Dk ( sk )

 边界条件为 : f ( s )  0 , 或 f ( s )  v ( s , x )
n 1
n 1
n
n
n
n
n


27

2015年11月1日


Slide 28

三. 动态规划的基本方程
2 . 动态规划的顺序解法
设过程的第 k 阶段的状态为 s k ,其决策变量 x k
表示当状态处于 s k  1 的决策,即由 x k ( s k 1 ) 确定,则
状态转移方程为 s k  T k ( s k  1 , x k ) ,k 阶段的允许决
r

r
k

策集合记为 D ( s k 1 ) ,指标函数定义为:

V k ( s k 1 , x k , s k , x k 1 ,  , x 1 , s 1 )

28

2015年11月1日


Slide 29

2 . 动态规划的顺序解法
最优值函数:
f k ( s k 1 ) 

opt V

k

( s k  1 , x k ,  , x 1 , s 1 )

r

x k  D k ( s k 1 )


 f k ( s k  1 )  opt v k ( s k  1 , x k )  f k 1 ( s k ), k  1, 2 ,  , n

r
x k  D k ( s k 1 )

 边界条件为 : f ( s )  0
0
1


此为动态规划顺序解法的基本方程。

29

2015年11月1日


Slide 30

四. 动态规划的求解方法
1 . 动态规划的逆序解法

设已知初始状态为 s 1 ,用 f k( s k ) 表示从第

k 阶段初始状态 s k 到第 n 阶段的最优值。
第 n 阶段:指标函数的最优值记为
f n( s n ) 

opt
xn Dn ( sn )

vn (sn , xn ) ,

此为一维极值问题,不妨设有最优解 x n  x n ( s n ) ,则有
最优值 f n( s n ) 。
30

2015年11月1日


Slide 31

1 . 动态规划的逆序解法
第 n-1 阶段:类似地有
f

( s n 1 ) 

n 1

opt
x n 1 D n 1 ( s n 1 )

v n 1 ( s n 1 , x n 1 ) *

f n ( s n )

其中 s n  T n 1 ( s n 1 , x n 1 ) ,可解得最优解 x n 1  x n 1 ( s n 1 ) ,
则最优值为 f

( s n 1 ) 。

n 1

不妨设第 k+1 阶段的最优解为 x k 1  x k 1 ( s k 1 ) 和最优值 f
则对于第 k 阶段有 f k( s k )  opt

xk Dk ( sk )

( s k 1 ) ,

k 1

v k ( s k , x k ) * f k 1 ( s k 1 )

其中 s k 1  T k ( s k , x k ) ,可解得最优解 x k  x k ( s k ) 和最优值为 f k( s k ) 。
31

2015年11月1日


Slide 32

1 . 动态规划的逆序解法
依此类推,直到第 1 阶段,有
f 1( s 1 ) 

opt
x1  D 1 ( s1 )

v 1 ( s 1 , x 1 ) *

f 2 ( s 2 ) ,

其中 s 2  T1 ( s 1 , x 1 ) ,可解得最优解 x 1  x 1 ( s 1 ) 和最优值
为 f 1( s 1 ) 。

由于已知 s 1 ,则可知 x 1 与 f 1( s 1 ) 。从而可知
s 2 , x 2 , f 2( s 2 ) ,按上面的递推过程反推回去,即可得

到每一阶段和全过程的最优决策。

32

2015年11月1日


Slide 33

四. 动态规划的求解方法
2 . 动态规划的顺序解法

设已知终止状态为 s n 1 ,用 f k( s k 1 ) 表示从第
1 阶段初始状态 s 1 到第 k 阶段末的结束状态 s k  1 的
最优值。
第一阶段:指标函数的最优值记为
f 1( s 2 ) 

opt
x1  D 1 ( s1 )

v 1 ( s 1 , x 1 ) , s 1  T1 ( s 2 , x 1 ) ,

可解得最优解 x 1  x 1 ( s 2 ) 和最优值 f 1( s 2 ) 。
33

2015年11月1日


Slide 34

2 . 动态规划的顺序解法
第二阶段:类似地有:
f 2( s 3 ) 

opt
x2D2 ( s2 )

v 2 ( s 2 , x 2 ) *

f 1 ( s 2 )

其中 s 2  T 2 ( s 3 , x 2 ) ,可解得最优解 x 2  x 2 ( s 3 ) ,于是
最优值为 f 2( s 3 ) 。

不妨设第 k 阶段有
f k( s k  1 )  opt

xk Dk ( sk )

v k ( s k , x k ) * f k 1 ( s k ) , s k

 T k ( s k 1 , x k )

解得最优解为 x k  x k ( s k 1 ) 和最优值 f k( s k 1 ) 。
34

2015年11月1日


Slide 35

2 . 动态规划的顺序解法
依次类推,直到第 n 阶段有
f n( s n  1 ) 

opt
xn Dn ( sn )

v n ( s n , x n ) *

f n 1 ( s n ) ,

其中 s n  T n ( s n 1 , x n ) ,可解得最优解 x n  x n ( s n 1 ) 和最优
值为 f n( s n 1 ) 。

由于已知 s n 1 ,则可知 x n 与 f n( s n 1 ) 。从而可知
s n , x n 1 , f

( s n ) ,按上面的递推过程反推回去,直到

n 1

s 1 , x 1 , f 1( s 2 ) ,即得到整个过程和各阶段的最优决策。
35

2015年11月1日


Slide 36

1.问题的提出
现假设有20名队员准备参加数学建模竞赛,根
据队员的能力和水平要选出18名优秀队员分别组成
6个队,每个队3名队员去参加比赛。选择队员主要
考虑的条件依次为有关学科成绩、智力水平、动手
能力、写作能力、外语水平、协作能力和其它特长。
假设所有队员接受了同样的培训,外部环境
相同,竞赛中不考虑其他的随机因素,竞赛水平的
发挥只取决于表中所给的各项条件,并且,参赛队
员都能正常发挥自己的水平。
36

2015年11月1日


Slide 37

1.问题的提出

现在的问题:
(1)在20名队员中选择18名优秀队员参
加竞赛;
(2)确定一个最佳的组队使竞赛技术水
平最高;
(3)给出由18名队员组成6个队的组队方
案,使整体竞赛技术水平最高;并给出每
个队的竞赛技术水平。
37

2015年11月1日


Slide 38

2.模型的假设
(1)假设问题中提供队员的基本条件充分地反映
了每个队的真实能力和水平;
(2)假设每个队员的能力和水平在比赛中可以
100%的发挥,不受外界因素和环境的影响;
(3)同一个队三名队员的单项条件互不影响,
且具有互补性,即一个队的水平为最高者的水平;
(4)6个队整体技术水平最高是在确定的最佳
组队保持不变的条件下整体技术水平最高.

38

2015年11月1日


Slide 39

3.模型的建立与求解
问题(1):利用层次分析法得到每个队员的水
平指标,按大小排序结果如下表:


1
2
3


L
M
G
水平指标 0.0533642 0.0531373 0.0530848

4
D
0.0518990

5
F
0.0514261

6
P
0.0514320

7
R
0.0512626



8
9
10


O
T
E
水平指标 0.0511709 0.0511465 0.0502659


15
16
17


S
N
J

11
Q
0.0500917
18
B

12
A
0.0496756
19
I

13
C
0.0496028
20
H

14
K
0.0492494

水平指标 0.048988 0.0488254

0.0471768

0.0463575

0.0462886

0.0456541

由排序结果,陶汰 H 和 I 两名队员,其余的 18 名为
入选参赛的优秀队员。
39

2015年11月1日


Slide 40

3.模型的建立与求解

问题(2):确定一个最佳的组队使竞赛技术水平最高.
最佳组队原则:设 m i ( x ) 表示队员 x 的第 i 项水平指标,
M i ( x , y , z ) 表示由队员 x , y , z 组队 ( x , y , z ) 的第 i 项水平指

标,则
M i ( x , y , z )  max m i ( x ), m i ( y ), m i ( y )( i  1, 2 ,  , 7 )

令 M   M 1 ( x , y , z ), M 2 ( x , y , z ),  , M 7 ( x , y , z )  , 于 是 用
T
v ( x , y , z )  M  W 0 表示 ( x , y , z ) 队的整体技术水平指标.最
佳组队是从 18 名队员中选出 x , y , z 使 v ( x , y , z ) 最高.
40

2015年11月1日


Slide 41

3.模型的建立与求解
组队方案:根据组队原则,
最佳组队中的队员一定是前
四项水平指标的最高者.由问题(1)的结果可得
m 1 ( L )  0 . 0556199 为最高,于是 M 1  m 1 ( L )  0 . 0556199 ,
则队员L是首先入选的队员.
其次 m 2 ( G )  m 2 ( M )  0 . 0557168 ,而 m 3 ( G ) 
故M

2

m3 (M )



 m 2 ( G )  0 . 0557168 ,则G是第二个入选的队员.

另外, m 3 ( S )  0 .0553953 ,于是 M 3  m 3 ( S )  0 . 0553953 ,
而且 M 4  m 4 ( L )  0 . 0619137
的队员.
41

,则队员S应是第三个入选

2015年11月1日


Slide 42

3.模型的建立与求解

M7

注意到 M 5  m 5 ( G )  0 .0520297 , M 6  m 6 ( L )  0 .0518717 , ,
 m 7 ( G )  0 .0708661 也都是相对的较高者,即

M  (0.0556199, 0.0557168, 0.0553953, 0.0619137,
0.0520297, 0.0518717, 0.0708661)

因此,由队员 L,G ,S 组成(L,G,S)队的技术水平指标为
T
v ( L , G , S )  M  W 0  0 . 563246 是最高的,所以最佳组队为(L,G,
S).

42

2015年11月1日


Slide 43

3.模型的建立与求解
问题(3):给出由18名队员组成6个队的组队方案
用动态规划的方法,分决策过程为5个阶段,分步
给出 5 个队的组队方案.在除了队员 L , G , S 外的 15 名
队员中组成5个队,每一阶段确定一个队.
决策变量: X k  ( x , y , z ) k ( k  1, 2 ,3, 4 ,5 ) ,即任取三
名队员 ( x , y , z ) 所组成的一个组队方案.
状态变量:S k ( k  1, 2 ,3, 4 ,5 ) ,即从第 k (1  k  5 )
个 到第 5 个组 队的 组队方 案所 包含的 队员 ,其中
S 1  A , B , C ,  , T  .
43

2015年11月1日


Slide 44

3.模型的建立与求解
状态转移方程: S k 1  S k  X k ( k  1, 2 ,3, 4 ) .
允许决策集合:





D k  ( x , y , z ); x , y , z  S k , v k ( x , y , z )  W ( k  1, 2 ,3, 4 ,5 ) .

指标函数: v k ( S k , X k ) 表示决策 X k (一个组队)关于
状态 S k 的技术水平指标,即 v k ( S k , X k )  M  W 0 .

最优值函数: f k ( S k ) 表示在状态 S k 下确定的 k (1  k  5 )
个组队的技术水平指标之和的最大值.则有逆序解法的基
本方程:
44

2015年11月1日


Slide 45

3.模型的建立与求解
 f k ( S k )  max v k ( S k , X k )  f k  1 ( S k 1 ), k  5 , 4 ,3 , 2 ,1
xk Dk



( L , G , S )队的技术水平指标
 f 6 ( S 6 )  v 6  0 . 0563246




其中 S k 1  S k  X k ( k  1, 2 ,3, 4 ) .
编程求解可以得到最优的组队方案,其最优值为 f 1 ( S 1 )  0 . 323164 .
表:最优的组队方案
组队 X

k

X1

X

X3

2

X

4

X5

X6

队员(x,y,z) (C,J,K) (A,N,O) (B,P,R) (D,F,T) (E,M,Q) (G,L,S)
水平 v k ( x , y , z ) 0.051647 0.051935 0.053262 0.054647 0.055348 0.056325

45

2015年11月1日


Slide 46