Transcript Slide 1
1
کنترل پیش بین و پایداری
شکوفه جعفری 89123012
سمینار درس کنترل پیش بین
استاد درس :آقای دکتر توحید خواه
2
فهرست
(1معرفی کلی
(2کنترل پیش بین غیر خطی با افق شبه بی نهایت
(3شماتیک کنترل پیش بین غیر خطی با افق شبه بی نهایت
(4نتایج اولیه
(5پایداری مجانبی
(6مثال حل شده
3
(7بحث های دیگر
- 1معرفی
پایداری حلقه بستهی یک سیستم امری حیاتی برای ادامهی کار آن سیستم میباشد.
حتی در حالتی که الگوریتم بهینهسازی برای مسئله یک پاسخ بهینه پیدا کند ،این امر پایداری حلقه بسته سیستم را
تضمین نخواهد کرد (حتی اگر مدل مورد استفاده بسیار دقیق باشد).
4
مثالهای متعددی نشان میدهند که الگوریتمهای کنترل پیشبین میتوانند ناپایدار شوند.
تکنیکها برای تضمین پایداری سیستم کنترل شده بر اساس پیشبینی مدل :استفاده از
جریمههای نهایی ))Terminal Penalty
قیود ( )Constraints
توابع لیاپانوف ()Lyapunov functions
مجموعههای نامتغیر ()Invariant sets
پیشنهادات اصلی دربرخورد با مشکل پایداری : MPC
افق بینهایت (: )Keerthi and Gilbert
افزایش افقهای پیشبینی و کنترل تا بینهایت
به علت بینهایت بودن متغیرهای تصمیمگیری در هر زمان نمونه برداری :غیر قابل اعمال به صورت مستقیم
قیود نهایی (: )Keerthi and Gilbert
•
•
•
•
با اضافه کردن یک قید روی حالت نهایی به فرم
پایداری تضمین میشود.
در P
شد xو)
نتیجه(kورxودی کنترلی نیز صفر خواهد بود و (اگر
بااین قید در پایان افق محدود حالت صفر خواهد s
اغتشاش وجود نداشته باشد) سیستم در مبدا میماند.
هزینهی محاسباتی اضافه میکند و باعث افزایش محدودیت ناحیهی عملکرد میگردد.
اجرای عملی آن مشکل است.
کنترل دوگانه (: )Michalska and Mayne
• دراینایده یک ناحیه حول حالت نهایی تعریف میشود که سیستم میتواند با استفاده از یک کنترل کنندهی
فیدبک حالت خطی حالت نهایی را داخلاین ناحیه هدایت کند و به مبدا برساند.
5
افق شبه بینهایت ()Chen and Allg¨ower
- 2کنترل پیش بین غیر خطی با افق شبه بی نهایت
هدف :ارائه ی یک کنترل پیش بین غیر خطی با پایداری مجانبی تضمین شده
این روش می تواند هم به سیستم های پایدار و هم ناپایدار اعمال شود.
مسئله ی MPCدر حلت کلی :حل روی خط مسئله ی کنترل بهینه ی حلقه باز با افق محدود و براساس دینامیک
سیستم (خطی یا غیر خطی) و قیودی که شامل حالت ها و ورودی ها هستند.
6
این فرم کلی MPCپایداری حلقه بسته را به خودی خود تضمین نمی کند.
پایداری حلقه بسته می تواند با انتخاب مناسب پارامتر های طراحی ،مانند افق پیش بینی ،افق کنترل و ماتریس های
وزنی حاصل گردد.
آنچه در این جا ارائه می شود :
معرفی یک MPCغیر خطی با افق شبه بی نهایت
تابعی هدف :شامل یک هزینه با افق محدود و یک هزینه ی نهایی
قیود :دینامیک سیستم ،قیود روی ورودی و یک قید ناساوی برای حالت نهایی
امکان پذیری قید حالت نهایی یعنی :حالت ها در پایان افق محدود در یک ناحیه نهایی از پیش مشخص شده ای قرار می
گیرند.
حالت های نهایی چنان جریمه می شوند که هزینه ی نهایی ،هزینه ی افق نامحدود سیستم غیر خطی کنترل شده با
یک فیدبک حالت خطی محلی مفروض را محدود می کند.
کنترل کننده ی پیش بین غیر خطی پیشنهاد شده یک افق پیش بینی شبه بی نهایت دارد! اما دنباله ی ورودی کنترلی
که قرار است محاسبه شود طبیعت محدود دارد.
7
اگر ژاکوبین خطی ساز سیستم غیر خطی ای که قرار است کنترل شود پایدار پذیر باشد ،ان گاه پاسخ یکتا و مثبت معین
متقارن یک معادله ی لیاپانوف مناسب می تواند به عنوان ماتریس جریمه ی نهایی در هزینه ی نهایی استفاده شود.
و یک همسایگی از مبدا می تواند به عنوان ناحیه ی نهایی به صورت خارج از خط محاسبه گردد.
پایداری مجانبی حلقه بسته :با امکان پذیری مسئله ی کنترل بهینه ی حلقه باز در زمان t=0تضمین می شود.
به صورت معمول در ،MPCکنترل حلقه بسته با حل روی خط مسئله ی کنترل بهینه در هر زمان نمونه بردا ری و
بدون توجه به این که حالت ها داخل یا خارج از ناحیه ی نهایی قرار دارند محاسبه می شود.
هیچ سوئیچی بین کنترل کننده ها الزم نیست.
فیدبک حالت خطی محلی تنها برای محاسبه ی خارج از خط ماتریس جریمه ی نهایی و ناحیه ی نهایی استفاده می شود.
به همین علت روش ی که در این جا ارائه می شود در مقایسه با سایر روش ها کلی تر بوده و از لحاظ محاسباتی بسیار
جالب است.
8
- 3شماتیک کنترل پیش بین غیر خطی با افق شبه بی نهایت
معرفی سیستم هایی که قرار با این روش کنترل شوند :
بردار ورودی :
فرض های کلی :
)(1
بردار حالت :
u (t ) R m
قیود روی ورودی :
) f : R n R m R n (A1دو بار مشتق پذیر پیوسته بود و
0 R nیک نقطه ی تعادل سیستم با u 0
است.
) U R m (A2یک مجموعهی محدب و فشرده است و
) (A3سیستم ) (1برای هر شرایط اولیهی x 0 R nو
پیوسته باشد یک پاسخ یکتا دارد.
9
x (t ) f (x (t ),u (t )), x(0)=x 0
x (t ) R n
u (t ) U , t 0
f (0,. 0) 0
یک نقطهی داخلی از Uاست.
0R m
(.) :[0, ) Uکهuقطعهای پیوسته و از راست
x s ,u s ) 0م(یfتوان مبدا سیستم را به
فرض f (0, 0) 0فرض محدود کنندهای نیست .زیرا اگر
) (x s ,u sمنتقل نمود.
فرض دیگر :قابل اندازهگیری بودن همهی حالتهای سیستم (چون در طراحی فیدبک حالت نیاز داریم).
: نماد گذاری
x R n x : 2 norm
weighted norm : x
P
x
2
P
: x T Px
Hermitian, Positive Definite Matrix : P
Induced 2-norm: A
Internal Variable in Controller : (x , u )
largest & smallest real part of the eigenvalues of A : max (A ) & min (A )
10
مسئلهی بهینه سازی کنترل حلقه باز در زمان tو با حالت اولیهی ): x(t
هزینه ی نهایی برای جریمه
حالت ها در پایان افق محدود
)(2
2
P
هزینه ی استاندارد افق محدود
برای عملکرد کنترلی مطلوب
t T p
) ( x ( ; x (t ), t ) Q u ( ) R )d x (t T p ; x (t ), t
2
2
min J (x (t ),u (t ))
t
)x (t ; x (t ), t ) x(t
] [t,t+TP
x f (x ,u ),
)u (.
Subj. to
u ( ) U ,
x (t T P ; x (t ),t )
Q&P :Positive Definite Symmetric Weighted Matrix
Tp : Finite Prediction Horizon
: Terminal RegionΩ
11
t , t T P ] Uبه[(.) :
دست uمیآید.
مسیر سیستم که توسط
) x (.;: x (t ), t
برای سادگی افق کنترل و پیشبینی یکسان در نظر گرفته میشوند.
مقدار اولیه در پیش بینی آینده :حاالت واقعی سیستم در زمان واقعی tیعنی )x(t
قید ناساوی آخر حالتها را در پایان افق پیشبینی ،مجبور میکند که دریک همسایگی از مبدا (ناحیهی نهایی) قرار
گیرند.
Ωبه گونه ای انتخاب می شود که برای سیستم غیرخطی کنترل شده توسط یک فیدبک حالت خطی محلی ،نامتغیر
باشد.
2
P
) ، x (t T P ; x (t ), tهزینهی افق نامحدود سیستم غیرخطی که از Ωآغاز میشود و توسط فیدبک حالت
خطی محلی کنترل میشود را محدود میکند ،یعنی :
( x ( ; x (t ), t ) Q u ( ) R )d
2
2
t T P
2
P
) x (t T P ; x (t ), t
u Kx , x (t T P ; x (t ), t )
و نشان داده می شود که پایداری حلقه بسته به این صورت تضمین می شود.
ماتریس جریمه ی نهایی Pهمراه با ناحیه ی نهایی Ωبه صورت خارج از خط به گونه ای تعیین می شود که ویژگی
نامتغیر بودن Ωحفظ شده و قیود ورودی در Ωبرآورده شوند.
12
هزینه ی افق نامحدود :
با جایگذاری داریم :
بنابراین افق پیشبینی کنترل کنندهی پیشبین پیشنهاد شده به شبه بی نهایت گسترش داده میشود.
پاسخ بهینه برای مسئلهی بهینه سازی (در صورت وجود پاسخ) :
J (x (t ),u (t )) : ( x ( ; x (t ), t ) Q u ( ) R )d
2
2
t
u ( ) Kx ( ; x (t ),t ), t T P
))J (x (t ),u (.)) J (x (t ),u (.
u * (.; x (t ),t ,t T P ) :[t ,t T P ] U
مقدار هدف متناظر :
) * J * (x (t ),t ,t T P ) : J (x (t ),u
13
در چهارچوب MPCکنترل حلقه باز می تواند در دوگام در نظر گرفته شود :
.I
روی یک افق محدود ،یک دنباله ی ورودی بهینه با حل مسئله ی کنترل بهینه ی حلقه باز به دست می آید که
مدل سیستم غیرخطی را به ناحیه ی نهایی می برد.
.IIیک کنترل فیدبک خطی محلی به گونه ای در نظر گرفته می شود که سیستم را به مبدا هدایت می کند.
نکته :فیدبک حالت خطی هیچ گاه مستقیما به سیستم اعمال نمی شود بلکه دنباله ورودی حاصل از کنترل پیش بین
اعمال می گردد.
این فیدبک حالت تنها برای تعیین ماتریس جریمه ی نهایی Pو ناحیه ی نهایی ، Ωبه صورت خارج از خط استفاده می
شود.
با شرط ( Tp<δزمان نمونه برداری) کنترل حلقه بسته عبارت است از :
] [t ,t
14
u * ( ) : u * ( ; x (t ),t ,t T P ),
-4نتایج اولیه
هدف :بیان نتایج اولیه در مورد ناحیه ی جذب و یک کران روی سیستم غیرخطی کنترل شده توسط فیدبک
حالت خطی محلی برای تعیین ناحیه ی نهایی و ماتریس جریمه ی نهایی و اثبات پایداری مجانبی حلقه بسته
ژاکوبین خطی ساز سیستم ) (1در مبدا :
اگر این ژاکوبین خطی ساز پایدار پذیر باشد آنگاه یک فیدبک حالت خطی
x Ax Bu
)B : (f / u )(0,0
نظر گرفته شود که
پایدار مجانبی باشد.
AK : A BK
15
)A : (f / x )(0,0
میتواند به گونهای در
u Kx
لم - 1فرض کنید ژاکوبین خطی ساز سیستم ) (1در مبدا پایدار پذیر باشد .آنگاه :
یک پاسخ مثبت معین متقارن یکتا Pبه دست
(aمعادلهی لیاپانوف * (A،K I )T P P (AK I ) Q
)
مثبت* Q
Q K T RK R n n
[0,یررا برآورده
معین و متقارن است و
میدهد به طوریکه
شرط ز
) max (A
میکند :
(b
یک ثابت ) (0, چنان وجود دارد که یک همسایگی
ازمبدا را به فرم زیر مشخص میکند:
} : {x R n | x T Px
به طوریکه :
.i
برای همهی
داxریم
Kxیعنی کنترل کنندهی فیدبک خطی قیود ورودی را در برآورده
( U
میکند).
.ii
Kx
کنترل uمیشود نامتغیر
برای سیستم غیر خطی ) (1که با فیدبک حالت خطی محلی
است.
.iii
برای هر x 1 هزینهی افق بی نهایت :
J (x 1 ,u ) ( x (t ) Q u (t ) R )dt
2
2
t1
بر اساس سیستم غیر خطی ) (1که از x 1
آغاز میشود و با فیدبک حالت خطی محلی کنترل u Kx
16
میشود از باال به صورت زیر کران دار است :
J (x 1,u ) x 1T Px 1
اثبات :
aبرقرار است.
[0, max (Ak )]: (AK I ) 0
A Kپایدار مجانبی است.
* (AK I )T P P (AK I ) Q
& Q* 0
(AK I ) 0
پاسخ متقارن و P.D.یکتا دارد.
)P 0 : 1 [0,
0 R mنقطه ی داخلی Uاست.
به گونه ای تعیین می کند که
به طوریکه ناحیه ای به فرم } : {x R n | x T Px 1را
1
مقادیر کنترل فیدبک خطی قیود ورودی را در
ناحیه ی
قرار می دهیم ) (0, 1و
iبرقرار است.
x 1 : Kx U
آورده می کند.
بر
1
تعریف می کنیم:
}: {x R n | x T Px را
قیود ورودی در برآورده می شوند.
1
سیستم می تواند در بدون قید در نظر گرفته شود.
با مشتق گیری از x T Pxحول مسیر
17
) f (x , Kxدارxیم :
d
)) x (t )T Px (t ) x (t )T (A KT P PA K )x (t ) 2x (t )T P (x (t
dt
(x ) : f (x , Kx ) A K x
x T P (x ) x T P . (x ) P .L . x
2
P .L
min (P )
x
2
: داریم
P
L : sup{ (x ) / x | x , x 0}
L
: داشته باشیم
.min (P )
را چنان انتخاب می کنیم که در (0, 1 )
P
x T P (x ) x T Px
d
x (t )T Px (t ) x (t )T [(A K I )T P P (A K I )]x (t )
dt
d
x (t )T Px (t ) x (t )T Q *x (t )
dt
( کنترل شده با فیدبک حالت محلی1) ای سیستم
بر
باقی
.مانده و به مبدا همگرا می شود
نامساوی آخر بیان می کند کهP 0,Q * 0 چون
u .است
Kx نامتغیر
آغاز می شود در
که درx f (x , Kx ) و هر مسیر از
d
x (t )T Px (t ) J (x 1 ,u )
dt
t1
x 1 :
J (x 1 ,u ) x Px 1
T
1
18
در واقع نتایج موجود در لم 1همان چیزیست که به دنبالش بودیم!
با قرار دادن ) x 1 x (t T P ; x (t ),tداریم :
( x ( ; x (t ), t ) Q u ( ) R )d
2
2
t T P
2
P
) x (t T P ; x (t ), t
u Kx , x (t T P ; x (t ), t )
پاسخ Pاز معادله ی * K I )T P P (AK I ) Qو(Aناحیه ی
تواند به عنوان ماتریس جریمه ی نهایی و ناحیه نهایی به کار گرفته شوند.
19
J (x 1,u ) x Px 1
T
1
می
}: {x R n | x T Px
(
بزرگترین مقدار ممکن برای
اکنون میتوان یک روند برای تعیین Pو
) به
صورت خارج از خط ارائه داد :
گام )1مسئلهی کنترل را بر اساس ژاکوبین خطی ساز برای به دست آوردن بهرهی فیدبک حالت خطی پایدار ساز
Kحل میکنیم.
گام )2ثابت
برآورده شود و سپس
را به گونهای انتخاب میکنیم که نامعادلهی
[0,
معادلهی )
لیاپانوف
معین Pحل میکنیم.
دن
maxر
را برای به ) (A
ماتریس متقارن و مثبت
دست آو
* (AK I )T P P (AK I ) Q
گام )3برزگترین مقدار ممکن برای
داشته باشیم :
را به گونهای مییابیم که برای همهی
1
گام – )4بزرگترین مقدار
x 1
را به گونهای مییابیم که نامساوی زیر در
] (0, 1
برقرار باشد :
) .min (P
P
20
Kx U
L
نکات :
در گام 4بر آوردن نامعادله
P
سیستم این نامعادله تنها برای ناحیه ی نهایی کوچکی بر آورده گردد .از
علت مقدار کوچک
Pب/ر)ای(Pیکmin
این رو برای دست یافتن به ناحیهی نهایی با محافظه کاری کمتر میتوان از رویکرد دیگری استفاده نمود.
) .min (P
بLرای یک ناحیه ی نهایی به اندازه ی کافی بزرگ ساده نیست .به
در ابتدا روند فوق را تا گام 3ادامه میدهیم .سپس تکراری از مسئلهی بهینه سازی سادهی زیر را برای انتخاب
کاهش
از
اگر مقدار
مناسب
تا زمانی که مقدار بهینهی مسئلهی بهینه سازی زیر نامثبت گردد انجام میدهیم:
روش1
پیدا شود ناحیه ی
از این
به فرم
را مشخص می
گرفتهشود.
max{x T P (x ) .x T Px | x T Px
کند که می تواند به عنوان ناحیه ی نهایی در نظر }
21
} : {x R n | x T Px
x
با
روند فوق ناحیهی نهایی یکتایی برای یک سیستم غیر خطی به دست نمیدهد.
برای کاهش بار محاسبات رو خط میخواهیم بزرگترین مقدار ناحیهی ممکن را بیابیم که کار سادهای نیست .برای این
کار در ابتدا باید بهرهی فیدبک پایدار ساز خطی مناسب Kانتخاب کنیم که از روشهای کنترل خطی بسیاری میتوان
استفاده نمود ،اما به علت «بهینه» بودن MPCتکنیک کنترل بهینهی خطی )(LQRمیتواند انتخاب مناسبی
باشد.
مورد دوم اینکه برای یک بهرهی داده شدهی ،Kانتخاب مناسب برای
است که بعدا بحث خواهد شد.
نیاز
مهمتر از همه اینکه اندازهی ناحیهی نهایی بستگی کلی به میزان غیر خطی بودن سیستم تحت کنترل دا رد .هر چه یک
سیستم غیر خطیتر باشد ناحیهی نهایی کوچکتر خواهد بود .برای یک سیستم خطی و یا غیر خطی ساده اندازهی
ناحیهی نهایی تنها با قیود ورودی محدود میشود.
اگر هیچ کنترل کنندهی فیدبک خطی پیدا نشود که بتواند سیستم را به صورت محلی پایدار مجانبی کند،
به مبدا محدود میشود .آنگاه قید نامساوی نهایی به x (t T P ) 0کاهش مییابد(روش & Mayne
22
).)Michalska(1990) , Rawlings & Muske (1993
اگر سیستم تحت کنترل خطی باشد داریم :
x R n : (x ) 0 & L 0 0 J (x 1 ,u ) x 1T Px 1
( x ( ) Q u ( ) R )d
2
2
t
2
P
) ( x ( ) Q u ( ) R )d x (t T P
2
2
t T P
t
پس کنترل پیشبین دقیقا یک افق پیشبینی بینهایت دارد اما دنبالهی ورودی به صورت روی خط در افق محدود
محاسبه میشود.
23
- 5پایداری مجانبی
در این بخش ویژگی پایداری سیستم حلقه بسته زیر مورد بحث قرار می گیرد :
)(3
)) x (t ) f (x (t ),u * (t
که برای آن داریم :
] [t ,t
: u * ( ) : u * ( ; x (t ),t ,t T P ),کنترل حلقه بسته
: u * (.; x (t ),t ,t T P ) :[t ,t T P ] Uپاسخ مسئله ی بهینه سا زی
تعریف )1نقطهی تعادل x=0از معادلهی ) (3پایدار است اگر
0: ( ) 0 | x (0) ( ) x (t ) for t 0
تعریف )2نقطهی تعادل از معادلهی ) (3پایدار مجانبی است اگر پایدار بوده و ηبه گونهای بتواند
انتخاب شود که x (0) نتیجه بدهد . x (t ) 0 as t
24
نماد :
نشانxدهنده ی مسیر پیش بینی شده از سیستم غیر خطی که از حالت واقعی ) x(tآغاز شده و
) (.; x: (t ), t
توسط کنترل حلقه باز
امکان پذیری مسئلهی بهینه سازی
به علت تکرار مسئلهی بهینه سازی داده شده مسئله باید در زمانهای
همچنین مقدار تابعی هدف
25
ممکن باشد.
امکان پذیری مسئلهی بهینه سازی :حداقل یک پاسخ (نه لزوما بهینه) برای 0
دنبالهی tورودی چنان وجود دارد که
تضمین میکند مسیر معادلهی
شود در زمانی که پیش بینی در زمان واقعی tانجام می شود.
هدایت می
)u (.
قید نامساوی نهایی
یx
) ,uکxر( f
شود.
اندار م
هر ز(t ),
در( u
در ادامه لمی روی امکان پذیری مسئلهی بهینه سازی)) t
مان اxر(ائه Jمیشود.
را بر آورده میکند
x (t T P ; x (t ),t )
لم - 2برای سیستم نامیکه حالتهای آن کامال قابل اندازه گیری باشند و هیچ نامعینی در آن وجود نداشته باشد،
هی بهینه سازی حلقه باز ) (2در
،امکان پذیر0یمسئل
برای یک زمان نمونه برداری به اندازه کافی کوچک
زمان ،t=0امکان پذیری آن برای همهی t>0را نتیجه میدهد.
نکته :لم 2بیان میکند که افق پیشبینی ( Tpپارامتر تنظیم) باید به گونهای انتخاب شود که مسئلهی بهینه
سازی )(2در زمان t=0امکان پذیر باشد.
پایداری مجانبی
در ابتدا نشان میدهیم که مقدار بهینهی تابع هزینه غیر افزایش ی است :
لم - 3فرض کنید که مسئلهی بهینه سازی در زمان t=0ممکن باشد .آنگاه برای سیستم نامی بدون اختالل،
برای هر
مقدار
و(t , t ] t 0
بهینهی تابع هزینه شرط زیر را برآورده میکند :
J (x ( ), , T P ) J (x (t ), t , t T P ) ( x (s ) Q u * (s ) )ds
2
26
2
*
R
t
*
Qلم 3بیان میکند که مقدار بهینهی تابع هزینه غیرافزایش ی است .اکنون میتوان نتایج
چون ، 0, R 0
پایداری مجانبی سیستم حلقه بستهی
بیان( x
)) f (x (t ),u * (tراt )
کرد :
قضیه - 1فرض کنید که :
(aمفروضات ) (A1)-(A3بر آورده میشوند.
(bژاکوبین خطی ساز سیستم غیر خطی ) (1پایدار پذیر است.
(cمسئلهی کنترل بهینهی حلقه باز )(2در زمان t=0امکان پذیر است.
آنگاه برای یک زمان نمونه برداری به اندازه کافی کوچک
کنترل کنندهی پیشبین
0ودرغیاب اغتشاش سیستم حلقه بسته با
نامی پایدار مجانبی است.
صورت * u
) * ( ; x (t ),t ,t T Pبه( ) : u
اگر X R nنشان دهندهی مجموعهی همهی حالتهای اولیهای باشد که فرض ) (cرا بر آورده میکند آنگاه
Xناحیهی جذبی برای سیستم حلقه بسته معرفی مینماید.
27
نکات :
شرط پایداری داده شده تنها یک شرط کافی است و الزم نیست .این واقعیت که سیستم خطی شده پایدار پذیر نیست نیز
بیانگر آن نمیباشد که هیچ کنترل کنندهی فیدبک خطی وجود ندارد که بتواند سیستم غیر خطی را به صورت محلی
پایدار کند.
وقتی این شماتیک کنترلی به سیستمهای عملی اعمال میشود بهینه سازی عددی که اجرا میگردد ممکن است دنبالهی
بهینهی ورودی کلی را در هر گام پیدا نکند.
این میتواند به علت محدودیتهای زمانی محاسبات بالدرنگ و یا گیر افتادن دریک نقطهی بهینه محلی باشد .دراین
صورت اگرچه عملکرد بهینه از دست میرود ولی پایداری باز هم تضمین است .زیرا پایداری به بهینگی پاسخ وابسته نیست
و صرفا به امکان پذیری وابسته میباشد.
28
اگر سیستم غیر خطی به صورت حلقه باز پایدار مجانبی باشد ،قید نامساوی نهایی غیر خطی
حذف شود بدون اینکه پایداری تحت تاثیر قرار گیرد.
تواندx
P ) مTی(t
-6مثال حل شده
سیستم زیر را در نظر بگیرید :
x 1 x 2 u ( (1 )x 1 ),
x 2 x 1 u ( 4(1 )x 2 ).
همانطور که مشخص است سیستم فوق ناپایدار است.
سیستم خطی شده ی آن عبارت است از :
0 1 x 1
x Ax Bu
u
1 0 x 2
0 1
A : (f / x )(0,0)
1 0
B : (f / u )(0,0)
این سیستم برای هر ) (0,1
پایدار پذیر هست اما کنترل پذیر نیست.
قید روی ورودی :
}u U {u R | 2.0 u 2.0
و ماتریس وزن ها :
29
فرض 0.5 :
R 1.0
0.5 0.0
Q
,
0.0
0.5
فرض های ) (A1-A3را چک می کنیم :
) f : R n R m R n (A1دو بار مشتق پذیر پیوسته بود و
0 R nیک نقطه ی تعادل سیستم با u 0
است.
f (0,. 0) 0
) U R m (A2یک مجموعهی محدب و فشرده است و
Uاست.
یک نقطهی داخلی از
0R m
) (A3سیستم ) (1برای هر شرایط اولیهی x 0 R nو
پیوسته و از راست پیوسته باشد یک پاسخ یکتا دارد.
(.) :[0, ) Uکهuقطعهای
برقرار
برقرار
برقرار
برای یافتن ماتریس جریمه ی نهایی Pو ناحیه ی نهایی Ωروند گفته شده را طی می کنیم :
x 1 x 2 u (0.5 0.5x 1 ),
x 2 x 1 u (0.5 2x 2 ).
30
گام )1مسئلهی کنترل را بر اساس ژاکوبین خطی ساز برای به دست آوردن بهرهی فیدبک حالت خطی پایدار ساز K
حل میکنیم.
در ابتدا مقدمه ای در مورد : LQR
برای سیستم خطی پیوسته زمان
Ax Buباxتابع هزینه ی
قانوJن کنترل
، (x T Qx u T Ru )dt
Kxدرانu
است که
فیدبک که مقدار تابع هزینه ی فوق را کمینه می کند به صورت
0
1 T
K R B Pبوده و Pاز حل معادله ی ریکاتی زیر به دست می اید :
AT P PA PBR 1B T P Q 0
حال با حل معادله ی ریکاتی فوق برای مثال ارائه شده خواهیم داشت :
ا به گونهای انتخاب میکنیم که نامعادلهی
گام )2ثابت ) [0, ر
2.2430 1.9930
P
1.9930 2.2430
K 2.118 2.118
) max (Aبرآورده شود و سپس
معادلهی لیاپانوف * K I )T P P (AK I ) QراAب(رای به دست آوردن ماتریس متقارن و مثبت معین
Pحل میکنیم: .
31
1.059 0.059
1.118
A k A BK
(
A
)
k
0.059 1.059
1.0
max (A K ) 1.0 0.95
16.5926 11.5926
(AK I )T P P (A K I ) Q * P
11.5926 16.5926
گام )3برزگترین مقدار ممکن برای
1
1
Kx U
}1 : {x R n | x T Px 1
داریم 1 12.5 :
رابه گونهای مییابیم که برای همهی
داشته xباشیم :
ا به گونهای مییابیم که نامساوی زیر در
گام – )4بزرگترین مقدار ] (0, 1ر
ار باشد :
برقر
) .min (P
چون min (P ) 0.1774مقدار کوچکی است در گام 4خواهیم داشت
P
L
P
0.025کهمقدار کوچکی است.
از این رو برای یافتن ناحیه ی نهایی بزرگتر از روش اصالحی گفته شده استفاده می کنیم .در این صورت خواهیم
داشت :
} : {x R n | x T Px 0.7
32
33
حال با انتخاب زمان نمونه برداری و افق پیش بینی در واحد زمان به صورت
:
خواهیم داشت
0.5,T P 1.5
خطوط پر :مسیر های حلقه بسته
خطوط خط چین :مرز ناحیه ی نهایی محاسبه شده
خط چین – نقطه :مسیر پیش بینی شده با حل مسئله ی بهسنه سازی در t=0
پروفایل ورودی و حالت ها
34
-7بحث های دیگر
بحثی روی بار محاسباتی :
یکی از مزایای این روش با توجه مثالهای پیاده سازی شده آن است که بار محاسباتی آن نسبت به سایر روشهای
طراحی کنترل کنندهی MPCکه در آنها پایداری حلقه بسته نیز تضمین میگردد کمتر است!
بحثی روی ناحیهی نهایی
اگر غیر ممکن نباشد ،بسیار دشوار است که بزرگترین ناحیهی نهایی را برای یک سیستم غیر خطی به دست آوریم.
از روی معادلهی لیاپانوف
افزایش با نزدیک شدن
P ،با
شود(AK .
Pم)Tی I
P
(AK I ) Q
سریع
بسیار
*به
max
حال KتA
ای )
پایان افق محدود درنظر میگیرد اما ناحیهی نهایی بزرگی را به
ها( در
یک Pبزرگ جریمهی سنگینی بر
طور اتوماتیک به دست نمیدهد.
35
افزایش پیدا میکند و این
به نظر میرسد یک
ثابت نزدیک به قدر مطلق بزرگترین مقدار ویژهی
متناظر با بزرگترین ناحیهی نهایی
AK
ممکن است.
اگر چه با این مقدار Pنیز بزرگ میشود .از روی ساختار تابع هزینه میتوان گفت جریمهی بزرگ روی حالت
نهایی میتواند تاثیر مخرب روی عملکرد کنترلی حاصل داشته باشد.
بنابراین یک trade-offبین ناحیهی نهایی بزرگ و عملکرد کنترلی مطلوب وجود دارد.
ضعفهای روش
در روش ارائه شده امکان عدم تطابق مدل و سیستم در نظر گرفته نشده است یعنی هیچ اغتشاش ی روی سیستم
وجود ندارد.
36
فرض شده است که همهی حالتها قابل اندازه گیری هستند.
شرایط داده شده برای پایداری تنها شرایط کافی بودند و نه الزم.
مراجع
Rolf Findeisen, Frank Allgöwer, and L.T. Biegler,
Assessment and Future Directions of Nonlinear
Model Predictive Control. 2007.
Allgower, H.C.a.F., A Quasi-Infinite Horizon
Nonlinear Model Predictive Control Scheme with
Guaranteed Stability. Automatica, 1998. 34(No.
10): p. 1205-1217.
Fontes, F.A.C.C., AGeneral Framework to Design
Stabilizing NonlinearModel Predictive
Controllers. Systems & Control Letters, 2000.
37
THANKS FOR YOUR ATTENTION
38