НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ І
Download
Report
Transcript НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ І
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Кафедра автоматики та робототехнічних систем
ДИСЦИПЛІНА: “ МОДЕЛЮВАННЯ ТА ОПТИМІЗАЦІЯ СИСТЕМ УПРАВЛІННЯ”
Лекція № 3.
ДИНАМІЧНЕ ПРОГРАМУВАННЯ (ДИСКРЕТНА
ТА НЕПЕРЕРВНА ФОРМИ)
Навчальна мета: Час: 2 години.
Література: Лисенко В.П., Кузьменко Б.В., Головінський Б.Л. Оптимальні
системи автоматичного управління. – К.: ВЦ НАУ, 2003. -96 с.
Навчальні питання:
Перше питання.
Друге питання.
1
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Нехай динаміка об’єкта описується деяким диференціальним
рівнянням
dx
f ( x, u ) ,
dt
(41)
I G1 x, u dt 1 [ x(T )] .
(42)
де х – вектор змінних стану об’єкта;
и – вектор змінних управління.
Задамо функціонал
T
0
Дискретна форма. Параметр Т вважається фіксованим, а тому
кінцевий стан об’єкта залежить від Т. Інтервал [0; Т] розбивається на
N рівних ділянок, довжиною кожного з них T n . Диференціальне
рівняння (41) у скінчено різницевій формі запишеться у вигляді:
x k 1 x k
де k – номер ділянки, або
f1 [ x k , u k ]
x k 1 f1 [ x k , u k ] x k f [ x k , u k ] x k .
(43)
2
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Функціонал (42) наближено замінимо сумою:
N 1
N 1
n 0
n 0
I G1 [ x k , u k ] [ x N ] G[ x k ,
u k ] [ x N ]
.
Виберемо останню ділянку розбиття і підрахуємо на ньому
значення функціонала I N 1 :
I N 1 G[ x N 1 , u N 1 ] [ x N ] .
(44)
(45)
Враховуючи співвідношення (43) матимемо
I N 1 G[ x N 1 , u N 1 ] [ x N 1 f ( x N 1 ,
u N 1 ] I N 1 [ x N 1 ]
Таким чином, функціонал залежить від положення системи на кроці
N 1
і від управління на останньому кроці. Виберемо управління так, щоб
функціонал приймав мінімум і позначимо його и*. Тоді матимемо:
I *N 1 [ x N 1 ] I *N 1 G[ x N 1 , u* N 1 ] [ x N 1
f x N 1 , u* N 1 ].
(46)
3
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Значення функціонала та управління фіксуються на
передостанньому кроці.
I N 2 G[ x N 2 , U N 2 ] G[ x( N 1 ),
(47)
U( N 1 ) [ x( N )]] G[ x( N 2 ),U( N 2 )] I *N 1 [ x( N 1 )].
Останній функціонал у виразі (44) є мінімізованим. Мінімізуючи
функціонал IN-2, підберемо управління U*(N-2):
I *N 2 [ x( N 2 )] I *N 2 G[ x( N 2 ), U * ( N 2 )]
I N 2 { x( N 2 ) f [ x( N 2 ), U * ( N 2 )]}.
(48)
Значення I* N-2 та U*(N-2) запам’ятовуються, а величину I* N-1
можна видалити з пам’яті, оскільки вона увійшла до I* N-2.
Переходячи до наступного кроку, маємо:
I N 3 G[ x( N 3 ), U( N 3 )] I *N 2 [ x( N 2 )] G{ x( N 3 ),
U( N 3 )} I N 2 { x( N 3 ) f [ x( N 3 ), U( N 3 )]}.
(49)
4
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Мінімізуючи IN-3 шляхом підбору управління U* (N-3), маємо:
I *N 3 [ x( N 3 )] I *N 3 G{ x( N 3 ), U * ( N 3 )}
I N 2 { x( N 3 ) f [ x( N 3 ), U ( N 3 )]}.
*
(50)
Значення I* N-3 , U*(N-3) запам’ятовуються, а величина I* N-2 з пам’яті
видаляється, оскільки вона увійшла до I* N-3 . Продовжуючи
переходити до інших кроків, матимемо:
I *N i [ x( N i )] I *N i G{ x( N i ), U * ( N i )}
I N i1{ x( N i ) f [ xN i ), U ( N i )]}.
*
(51)
Формула (51) є рекурентним співвідношенням для визначення
функціонала на будь-якому кроці. Довівши розрахунки до початкової точки
х(0), будемо мати оптимальну траєкторію та оптимальне управління U*i .
Метод динамічного програмування дозволяє здійснити найраціональніші
обчислення для визначення оптимальної траєкторії та оптимального
управління.
Слід зауважити, що не всі задачі оптимального управління, що
розв’язуються методом динамічного програмування слід подавати у
дискретній формі. А тому розглянемо неперервну форму рівнянь
динамічного програмування.
5
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Неперервна форма.
Як і раніше вважаємо відомими:
динамічні властивості об’єкта управління:
dx
= f(x,U) ,
(52)
dt Сил України на 2006 - 2011 роки
Державна програма розвитку Збройних
початкові умови: х(0) = х0, U(0) = U0.
Виберемо критерій оптимальності.
I G( x,U )dt ,
(53)
0
де U – функція управління, яка мінімізує функціонал I.
Позначимо S(x0) = min I – мінімальне значення функціонала, яке
залежить від початкових умов та управління U.
Припустимо існування оптимальної траєкторії x*(t), що забезпечує
мінімальне значення інтеграла (53). Розіб’ємо цю траєкторію на дві
ділянки: перша від t = 0 до t = , друга від t = до t = ∞.
6
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Р. Белманом сформульований принцип оптимальності, згідно з
яким майбутня поведінка системи, тобто при t > , не залежить від
“передісторії”, тобто поведінки системи в минулому, і визначається
лише її теперішнім станом, тобто в момент часу t = . Тому якщо
траєкторія від t = 0 до t = оптимальна, то друга ділянка оптимальної
траєкторії також є оптимальна. Крім цього, друга ділянка може
розглядатися як самостійна траєкторія з початковими умовами x*().
Для використання принципу оптимальності, подамо інтеграл (53) у
вигляді:
S( x0 ) min[ G( x,U )dt G( x,U )dt ] .
(54)
0
Згідно з принципом оптимальності Беллмана, якщо U(t) надає
мінімум інтегралу
також інтегралу
G( x,U )dt
, то ця функція надаватиме мінімум
0
G( x,U )dt . Тому, враховуючи (54), маємо:
S( x0 ) min[ G( x,U )dt ] S [ x( )],a
(55)
0
де S[x()] – функція від початкового стану x() у момент t = .
7
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Вважаємо достатньо малою величиною. У цьому випадку:
S[ x( )] S[ x0 x] S[ x0 f ( x,U ) ].
(56)
Застосовуємо до (56) формулу кінцевих приростів:
S[ x0 f ( x,U ) ] S( x0 ) f ( x,U )
S
.
x
(57)
З виразу (52) та з врахуванням (53) можна записати:
S
S( x0 ) min[ G( x0 ,U 0 ) S( x0 ) f ( x0 ,U 0 )
].
x
(58)
Віднімемо з обох частин рівності (55) S(x0), матимемо:
min[ G( x0 ,U 0 ) f ( x0 ,U 0 )
S
].
x
(59)
Для одержання мінімуму за U слід продиференціювати (56) по U0.
У результаті отримаємо:
G( x0 ,U 0 ) f ( x0 ,U 0 ) S
0.
U 0
U 0
x
(60)
8
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Згідно з принципом оптимальності початкові умови x0, U0
можна замінити на поточні координати x, U. Тоді матимемо кінцеві
функціональні рівняння Беллмана:
S
G( x,U ) f ( x,U )
0;
x
G( x,U ) f ( x,U ) S 0.
U
U
x
(61)
Вираз (61) є нелінійним диференціальним рівнянням у частинних
похідних. Тому застосування цього методу в багатьох випадках
потребує складних розрахунків. Виключимо з (61)
співвідношення:
dS
, матимемо
dx
G( x,U )
f ( x,U )
f ( x,U )
G
.
U
U
(62)
9
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Задача.
Електричний привід з двигуном постійного струму незалежного
M H k1
значної величини і працює в режимі, коли падіння напруги U1 i rд rя
збудження (рис. 2), навантажений моментом в’язкого тертя
r rд rя , значно більшому оберненій величині
електрорушійної сили e ce . Визначити закон управління
на опорі
електродвигуном, за яким сумарна енергія втрат, що витрачається на
переборення моменту в’язкого тертя та на нагрів, буде мінімальною.
Впливом індуктивності у ланці якоря знехтувати. Момент якоря з
об’єктом J 1,96 105 кг м2 , коефіцієнти пропорційності по е.р.с.
та по моменту:
C 0,096 B c
e
Cм 2,94 103 Н м с, rд rя 5 Ом
10
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
UВ
0В
U1
rЯ
rД
Розв’язання.
МН
Рис. 2. Схема електричного
приводу з двигуном
постійного струму,
навантаженого моментом
в’язкого тертя
Рівняння моментів двигуна має вигляд
d
J
k1 Cм i
dt
(63)
Згідно з умовами задачі індуктивність ланки якоря є малою. Тому
відповідно до закону Кірхгофа
(64)
i r Ce U y .
11
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Uy
Ce
. Підставимо цей вираз в (63), матимемо:
Звідки i
r
r
d U y
C C
J
dt
Cм
r
м
e
r
k1
Оскільки Ce Cм / r k1 , то першою складовою у дужках
нехтуємо. Тоді наближене рівняння динаміки матиме вигляд:
d
Cм
J
k1
U y
dt
r
Підставимо числові значення, після спрощення матимемо:
d
b m U ya ,
dt
(65)
де b = -50.c-1, m = 30.B-1c-2.
Далі слід визначити Uy як функцію . Згідно з умовами задачі
двигун працює в режимі, коли Ce i r.
i
Тому наближено:
Uy
r
.
(66)
Потужність електричних втрат обчислюється за формулою
U 2y
.
(67)
Pe i U y
r
12
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Потужність втрат на в’язке тертя складає:
Pm M H k1 2 .
Тобто фунціонал, що мінімізується і визначає сумарну енергію
втрат, має вигляд:
I ( k1 2 a0 U y2 ) dt ,
(68)
0
де a1 = 0,98110-3 Джс, а0=0,2 ВтВ-2.
Задачу визначення оптимального управління, що забезпечує
міні-мум інтеграла (69), розв’язуємо методом динамічного
програмування. Для цієї системи рівняння динамічного
програмуванняматимуть
вигляд:
2
2
a1 a 0 U y (b m U y )
0;
2a U m 0.
0
y
(69)
де - допоміжна функція, що визначається рівнянням
d
V
dt
,
де V – підінтегральна функція функціонала, що мінімізується. 13
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Розв’язавши друге рівняння системи (69), знайдемо:
(69)
2a
0 U y
m
Після підстановки цього значення
m a0 U y2 2a0 b U y a1 m 2 0
одержимо:
Розв’язання має вигляд:
k де
2
(70)
у перше рівняння
.
U y k
b
50
b a
50 0 ,981 10
1
m
30
0 ,2
m a0
30
2
.
2 ,
(71)
0,87 101 B c
Тобто оптимальний з точки зору мінімуму втрат закон управління є
лінійним (рис. 3.).
Ce i r
Слід мати на увазі, що внаслідок зробленого раніше припущення
Uy
отриманий закон є справедливим для малих значень
.
.
Ce
14
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
U
0
Рис. 3. Функція оптимального
управління
15
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ БІОРЕСУРСІВ
І ПРИРОДОКОРИСТУВАННЯ УКРАЇНИ
Література:
1. Лисенко В.П., Кузьменко Б.В., Головінський Б.Л. Оптимальні системи
автоматичного управління. – К.: ВЦ НАУ, 2003. -96 с.
Питання?