НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ І

Download Report

Transcript НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ І

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Кафедра автоматики та робототехнічних систем
ДИСЦИПЛІНА: “ МОДЕЛЮВАННЯ ТА ОПТИМІЗАЦІЯ СИСТЕМ УПРАВЛІННЯ”
Лекція № 3.
ДИНАМІЧНЕ ПРОГРАМУВАННЯ (ДИСКРЕТНА
ТА НЕПЕРЕРВНА ФОРМИ)
Навчальна мета: Час: 2 години.
Література: Лисенко В.П., Кузьменко Б.В., Головінський Б.Л. Оптимальні
системи автоматичного управління. – К.: ВЦ НАУ, 2003. -96 с.
Навчальні питання:
Перше питання.
Друге питання.
1
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Нехай динаміка об’єкта описується деяким диференціальним
рівнянням
dx
 f ( x, u ) ,
dt
(41)
I   G1  x, u dt  1 [ x(T )] .
(42)
де х – вектор змінних стану об’єкта;
и – вектор змінних управління.
Задамо функціонал
T
0
Дискретна форма. Параметр Т вважається фіксованим, а тому
кінцевий стан об’єкта залежить від Т. Інтервал [0; Т] розбивається на
N рівних ділянок, довжиною кожного з них   T n . Диференціальне
рівняння (41) у скінчено різницевій формі запишеться у вигляді:
x  k  1  x  k 
де k – номер ділянки, або

 f1 [ x  k  , u  k  ]
x  k  1    f1 [ x  k  , u  k  ]  x  k   f [ x  k  , u  k  ]  x  k  .
(43)
2
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Функціонал (42) наближено замінимо сумою:
N 1
N 1
n 0
n 0
I   G1 [ x  k  , u  k  ]     [ x  N  ]   G[ x  k  ,
u k  ]  [ x N ]
.
Виберемо останню ділянку розбиття і підрахуємо на ньому
значення функціонала I N 1 :
I N 1  G[ x  N  1 , u  N  1 ]   [ x  N  ] .
(44)
(45)
Враховуючи співвідношення (43) матимемо
I N 1  G[ x  N  1 , u  N  1 ]   [ x  N  1  f ( x  N  1 ,
u  N  1 ]  I N 1 [ x  N  1 ]
Таким чином, функціонал залежить від положення системи на кроці
N  1
і від управління на останньому кроці. Виберемо управління так, щоб
функціонал приймав мінімум і позначимо його и*. Тоді матимемо:
I *N 1 [ x  N  1 ]  I *N 1  G[ x  N  1 , u*  N  1 ]   [ x  N  1 
 f  x  N  1 , u*  N  1  ].
(46)
3
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Значення функціонала та управління фіксуються на
передостанньому кроці.
I N 2  G[ x  N  2  , U  N  2  ]  G[ x( N  1 ),
(47)
U( N  1 )   [ x( N )]]  G[ x( N  2 ),U( N  2 )]  I *N 1 [ x( N  1 )].
Останній функціонал у виразі (44) є мінімізованим. Мінімізуючи
функціонал IN-2, підберемо управління U*(N-2):
I *N 2 [ x( N  2 )]  I *N 2  G[ x( N  2 ), U * ( N  2 )] 
I N 2 { x( N  2 )  f [ x( N  2 ), U * ( N  2 )]}.
(48)
Значення I* N-2 та U*(N-2) запам’ятовуються, а величину I* N-1
можна видалити з пам’яті, оскільки вона увійшла до I* N-2.
Переходячи до наступного кроку, маємо:
I N 3  G[ x( N  3 ), U( N  3 )]  I *N 2 [ x( N  2 )]  G{ x( N  3 ),
U( N  3 )}  I N 2 { x( N  3 )  f [ x( N  3 ), U( N  3 )]}.
(49)
4
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Мінімізуючи IN-3 шляхом підбору управління U* (N-3), маємо:
I *N 3 [ x( N  3 )]  I *N 3  G{ x( N  3 ), U * ( N  3 )} 
 I N 2 { x( N  3 )  f [ x( N  3 ), U ( N  3 )]}.
*
(50)
Значення I* N-3 , U*(N-3) запам’ятовуються, а величина I* N-2 з пам’яті
видаляється, оскільки вона увійшла до I* N-3 . Продовжуючи
переходити до інших кроків, матимемо:
I *N i [ x( N  i )]  I *N i  G{ x( N  i ), U * ( N  i )} 
 I N i1{ x( N  i )  f [ xN  i ), U ( N  i )]}.
*
(51)
Формула (51) є рекурентним співвідношенням для визначення
функціонала на будь-якому кроці. Довівши розрахунки до початкової точки
х(0), будемо мати оптимальну траєкторію та оптимальне управління U*i .
Метод динамічного програмування дозволяє здійснити найраціональніші
обчислення для визначення оптимальної траєкторії та оптимального
управління.
Слід зауважити, що не всі задачі оптимального управління, що
розв’язуються методом динамічного програмування слід подавати у
дискретній формі. А тому розглянемо неперервну форму рівнянь
динамічного програмування.
5
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Неперервна форма.
Як і раніше вважаємо відомими:
динамічні властивості об’єкта управління:
dx
= f(x,U) ,
(52)
dt Сил України на 2006 - 2011 роки
Державна програма розвитку Збройних
початкові умови: х(0) = х0, U(0) = U0.
Виберемо критерій оптимальності.

I   G( x,U )dt ,
(53)
0
де U – функція управління, яка мінімізує функціонал I.
Позначимо S(x0) = min I – мінімальне значення функціонала, яке
залежить від початкових умов та управління U.
Припустимо існування оптимальної траєкторії x*(t), що забезпечує
мінімальне значення інтеграла (53). Розіб’ємо цю траєкторію на дві
ділянки: перша від t = 0 до t = , друга від t =  до t = ∞.
6
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Р. Белманом сформульований принцип оптимальності, згідно з
яким майбутня поведінка системи, тобто при t > , не залежить від
“передісторії”, тобто поведінки системи в минулому, і визначається
лише її теперішнім станом, тобто в момент часу t = . Тому якщо
траєкторія від t = 0 до t =  оптимальна, то друга ділянка оптимальної
траєкторії також є оптимальна. Крім цього, друга ділянка може
розглядатися як самостійна траєкторія з початковими умовами x*().
Для використання принципу оптимальності, подамо інтеграл (53) у


вигляді:
S( x0 )  min[  G( x,U )dt   G( x,U )dt ] .
(54)

0
Згідно з принципом оптимальності Беллмана, якщо U(t) надає

мінімум інтегралу
також інтегралу

 G( x,U )dt
, то ця функція надаватиме мінімум
0
 G( x,U )dt . Тому, враховуючи (54), маємо:

S( x0 )  min[  G( x,U )dt ]  S [ x(  )],a
(55)
0
де S[x()] – функція від початкового стану x() у момент t = .
7
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Вважаємо  достатньо малою величиною. У цьому випадку:
S[ x(  )]  S[ x0  x]  S[ x0  f ( x,U )   ].
(56)
Застосовуємо до (56) формулу кінцевих приростів:
S[ x0  f ( x,U )   ]  S( x0 )  f ( x,U ) 
S
 .
x
(57)
З виразу (52) та з врахуванням (53) можна записати:
S
S( x0 )  min[ G( x0 ,U 0 )    S( x0 )  f ( x0 ,U 0 ) 
 ].
x
(58)
Віднімемо з обох частин рівності (55) S(x0), матимемо:
min[ G( x0 ,U 0 )  f ( x0 ,U 0 ) 
S
].
x
(59)
Для одержання мінімуму за U слід продиференціювати (56) по U0.
У результаті отримаємо:
G( x0 ,U 0 ) f ( x0 ,U 0 ) S


 0.
U 0
U 0
x
(60)
8
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Згідно з принципом оптимальності початкові умови x0, U0
можна замінити на поточні координати x, U. Тоді матимемо кінцеві
функціональні рівняння Беллмана:
S

G( x,U )  f ( x,U ) 
 0;


x

 G( x,U )  f ( x,U )  S  0.

U
U
x

(61)
Вираз (61) є нелінійним диференціальним рівнянням у частинних
похідних. Тому застосування цього методу в багатьох випадках
потребує складних розрахунків. Виключимо з (61)
співвідношення:
dS
, матимемо
dx
G( x,U )
f ( x,U )
f ( x,U ) 
G
.
U
U
(62)
9
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Задача.
Електричний привід з двигуном постійного струму незалежного
M H  k1  
значної величини і працює в режимі, коли падіння напруги U1  i  rд  rя 
збудження (рис. 2), навантажений моментом в’язкого тертя
r  rд  rя , значно більшому оберненій величині
електрорушійної сили e  ce   . Визначити закон управління
на опорі
електродвигуном, за яким сумарна енергія втрат, що витрачається на
переборення моменту в’язкого тертя та на нагрів, буде мінімальною.
Впливом індуктивності у ланці якоря знехтувати. Момент якоря з
об’єктом J  1,96  105 кг  м2 , коефіцієнти пропорційності по е.р.с.
та по моменту:
C  0,096 B  c
e
Cм  2,94 103 Н  м  с, rд  rя  5 Ом
10
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
UВ
0В

U1
rЯ
rД
Розв’язання.
МН
Рис. 2. Схема електричного
приводу з двигуном
постійного струму,
навантаженого моментом
в’язкого тертя
Рівняння моментів двигуна має вигляд
d
J
 k1    Cм  i
dt
(63)
Згідно з умовами задачі індуктивність ланки якоря є малою. Тому
відповідно до закону Кірхгофа
(64)
i  r  Ce    U y .
11
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Uy
Ce
   . Підставимо цей вираз в (63), матимемо:
Звідки i 
r
r
d U y
 C C

J
dt

 Cм  
r

м
e
r
 k1   

Оскільки Ce  Cм / r  k1 , то першою складовою у дужках
нехтуємо. Тоді наближене рівняння динаміки матиме вигляд:
d
Cм
J
 k1   
U y
dt
r
Підставимо числові значення, після спрощення матимемо:
d
 b    m U ya ,
dt
(65)
де b = -50.c-1, m = 30.B-1c-2.
Далі слід визначити Uy як функцію . Згідно з умовами задачі
двигун працює в режимі, коли Ce   i  r.
i
Тому наближено:
Uy
r
.
(66)
Потужність електричних втрат обчислюється за формулою
U 2y
.
(67)
Pe  i  U y 
r
12
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Потужність втрат на в’язке тертя складає:
Pm  M H    k1   2 .
Тобто фунціонал, що мінімізується і визначає сумарну енергію

втрат, має вигляд:
I   ( k1   2  a0  U y2 ) dt ,
(68)
0
де a1 = 0,98110-3 Джс, а0=0,2 ВтВ-2.
Задачу визначення оптимального управління, що забезпечує
міні-мум інтеграла (69), розв’язуємо методом динамічного
програмування. Для цієї системи рівняння динамічного
програмуванняматимуть
вигляд:

2
2
a1    a 0  U y  (b    m  U y ) 
 0;




 2a  U  m    0.
0
y



(69)
де  - допоміжна функція, що визначається рівнянням
d
 V
dt
,
де V – підінтегральна функція функціонала, що мінімізується. 13
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Розв’язавши друге рівняння системи (69), знайдемо:
(69)

2a
  0 U y

m

Після підстановки цього значення

m  a0  U y2  2a0  b    U y  a1  m   2  0
одержимо:
Розв’язання має вигляд:
k де
2
(70)
у перше рівняння
.
U y  k  
b
50
b a
 50  0 ,981  10
    1     
m
30
0 ,2
 m  a0
 30 
2
.
2 ,
(71)
 0,87  101 B  c
Тобто оптимальний з точки зору мінімуму втрат закон управління є
лінійним (рис. 3.).
Ce    i  r
Слід мати на увазі, що внаслідок зробленого раніше припущення
Uy
отриманий закон є справедливим для малих значень
.
 
.
Ce
14
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
U

0
Рис. 3. Функція оптимального
управління
15
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Література:
1. Лисенко В.П., Кузьменко Б.В., Головінський Б.Л. Оптимальні системи
автоматичного управління. – К.: ВЦ НАУ, 2003. -96 с.
Питання?