Cooperative MPC

Download Report

Transcript Cooperative MPC

‫‪88133057‬‬
‫نسیم لحیم‌گرزاده‬
‫دکتر فرزاد توحیدخواه‬
‫استاد درس‪:‬‬
‫روش کنترل پیش‌بین مبتنی بر مدل در صنعت‬
‫در واقع یک روش بهینه‌سازی‌ برخط است که با توجه به شرایط فعلی‪،‬‬
‫‪ ‬این روش ‌‬
‫اغتشاشات وارد ‌بر سامانه‪ ،‬ایمنی ‌و قیدهای مسئله ورودی مناسب برای سامانه را‬
‫تعیین می‌کند‪.‬‬
‫‪ ‬سیستم‌های صنعتی عمدتا ‌از زیرسیستم‌های متعدد ساخته شده‌اند‪ ،‬درنتیجه برای‬
‫دار است‪.‬‬
‫نظر گرفتن رابطه‌ی بین این زیرسیستم‌ها ‌از اهمیت ویژه برخ ‌ور ‌‬
‫کنترل‌ در ‌‬
‫‪ ‬کنترل‌ غیرمتمرکز‬
‫‪ ‬کنتر ‌ل متمرکز‬
‫‪ ‬کنتر ‌ل پیش‌بین غیرهماهنگ‬
‫‪ ‬کنترل‌ پیش‌بین هماهنگ‬
‫بررس ی روش‌های کنترلی متداول‌‬
‫‪ ‬روش کنترل‌ غیرمتمرکز (‪)decentralized‬‬
‫نظر گرفته می‌شوند‬
‫‪ ‬زیرسیستم‌ها به صورت واحدهای مجزا در ‌‬
‫هر زیرسیستم به‌صورت مستقل انجام می‌شود‬
‫‪ ‬کنترل‌ ‌‬
‫‪ ‬ارتباطات بین آن‌ها به‌عنوان اغتشاش بین سیستم‌ها به حساب می‌آید‪.‬‬
‫نظر نگرفتن ارتباطات بین سیستمی است‬
‫ضعف این روش در ‌‬
‫در مواردی که ارتباطات بین زیرسیستم‌ها‬
‫‌و قطعا این روش ‌‬
‫ی است جوابگ ‌و نخواهد بود‬
‫قو ‌‬
‫بررس ی روش‌های کنترلی متداول‌ ‪ -‬ادامه‬
‫‪ ‬روش متمرکز (‪)centralized‬‬
‫‪ ‬تمام زیرسیستم‌ها توسط یک واحد کنترلی هماهنگ و کنترل می‌شوند‪.‬‬
‫‪ ‬این روش از لحاظ محاسباتی بهینه‌تر از روش قبلی است‪.‬‬
‫‪ ‬ارتباطات بین زیرسیستم‌ها را به‌طور کلی درنظر می‌گیرد‪.‬‬
‫این مسئله که تمام زیرسیستم‌ها توسط یک واحد کنتر ‌ل‬
‫می‌شوند کنتر ‌ل کل سامانه ‌و ایجاد ‌و حفظ هماهنگی را‬
‫پیچیده می‌کند‪.‬‬
‫بررس ی روش‌های کنترلی متداول‌ ‪ -‬ادامه‬
‫‪ ‬روش کنترل‌ گسترده (‪)distributed‬‬
‫ساختار روش غیرمتمرک ‌ز را‬
‫‌‬
‫غیرمتمرکز است که‬
‫‌‬
‫متمرکز ‌و‬
‫‌‬
‫‪ ‬یک روش میانی بین د ‌و روش‬
‫نظر می‌گیرد‪.‬‬
‫ی در ‌‬
‫نیز با حفظ پایدار ‌‬
‫فتار هماهنگ سیستم را ‌‬
‫حفظ می‌کند ‌و ر ‌‬
‫یر سیستم‌ها به‌طور‌ خاص مدل می‌شوند‪.‬‬
‫در این روش ارتباط بین ز ‌‬
‫‪‌ ‬‬
‫یر مطرح می‌شود‬
‫‪ ‬این روش به د ‌و صورت ز ‌‬
‫‪ ‬کنترل‌ گسترده غیرهماهنگ‬
‫‪ ‬کنتر ‌ل گسترده هماهنگ‬
‫بررس ی روش‌های کنترلی متداو ‌ل ‪ -‬ادامه‬
‫‪ ‬روش کنترل غیرهماهنگ (‪)noncooperative‬‬
‫‪ ‬در روش کنترل غیرهماهنگ هر زیرسیستم اثر ارتباطات بین سیستمی را به‌طور‌ محلی (اثر‬
‫بر رفتار خود زیرسیستم) پیش‌بینی می‌کند‬
‫‪ ‬رفتار کل سامانه به سمت تعادل ناش میل می‌کند‪.‬‬
‫فتار‬
‫ی هستند ر ‌‬
‫در حالتی که ارتباطات قو ‌‬
‫این روش ‌‬
‫غیرمتمرکز دارد‪.‬‬
‫‌‬
‫ضعیف‌تری‌ نسبت به کنترل‌‬
‫بررس ی روش‌های کنترلی متداول‌ ‪ -‬ادامه‬
‫‪ ‬روش کنترل‌ گسترده هماهنگ‬
‫نظر‬
‫بر کل زیرسیستم‌ها در ‌‬
‫اثر رفتارهای کنترلی محلی را ‌‬
‫‪ ‬روش کنترل‌ گسترده هماهنگ ‌‬
‫می‌گیرد‪.‬‬
‫فتار کل سیستم) را بهینه می‌کند ‌و برای‬
‫هر زیرسیستم یک تابع هزینه کلی (وابسته به ر ‌‬
‫‪‌ ‬‬
‫ی‬
‫فتار کاهش ی طی فرآیند بهینه‌ساز ‌‬
‫ی ‌از روش‌های گسترده استفاده می‌شود تا ر ‌‬
‫بهینه‌ساز ‌‬
‫حفظ شود‪.‬‬
‫در این حالت به تعادل پارت ‌و میل می‌کند‪.‬‬
‫فتار کل سیستم ‌‬
‫‪ ‬ر ‌‬
‫در نتیجه‬
‫در این حالت ممکن است فرآیند بهینه‌سازی‌ قبل ‌از همگرایی به پایان برسد ‌‬
‫‪‌ ‬‬
‫روش کنترل‌ هماهنگ یک روش زیربهینه است‪.‬‬
‫نیاز به هماهنگ‌کننده ندارد ‌و می‌تواند با استفاده ‌از روش‌های زیربهینه‬
‫‪ ‬این روش ‌‬
‫ورودی‌های مناسبی برای پایداری‌ سیستم ارائه دهد‬
‫‪ ‬معرفی مدل‬
‫ی‬
‫‪ ‬مسئله پایدار ‌‬
‫‪ ‬اصالح مدل با درنظر گرفتن تخمین‌زننده‬
‫‪ ‬تعمیم مدل‬
‫‪ ‬بررس ی یک مثال‬
‫معرفی مدل‬
‫‪‬‬
‫‪‬‬
‫در این‌جا فرض می‌کنیم که برای هر زیرسیستم ‪ ،‬مجموعه‌ای از مدل‌های خطی وجود دا ‌رد‬
‫که اثر ورودی‌های زیرسیستم را حاالت زیرسیستم مدل می‌کند‪.‬‬
‫هم‌چنین فرض می‌کنیم سیستم از دو زیرسیستم تشکیل شده است‪.‬‬
‫معرفی تابع هزینه‬
‫‪ ‬برای هر زیرسیستم یک یک تابع هزینه تعریف می‌شود که اثر زیرسیستم دیگر را نیز‬
‫شامل میشود‪.‬‬
‫قیود مسئله‬
‫نظر گرفته شده است این است‬
‫در حالت کلی تنها قیدی که روی ورودی سیستم در ‌‬
‫‪‌ ‬‬
‫مرکز باشند‪.‬‬
‫که که ورودیها متعلق به د ‌و مجموعه مجزای محدب شامل ‌‬
‫شرایط مسئله‬
‫سیستم‌های (‪ )Aij , Bij‬قابل پایدارسازی باشند‪.‬‬
‫تنها اولین نمونه‌ی سیگنال کنترل اعمال می‌شود‪.‬‬
‫تامین پایداری‌‬
‫ناپایدار سیستم تحت بررس ی ابتدا مدل سیستم را توسط‬
‫‌‬
‫‪ ‬برای تعیین مودهای‬
‫ناپایدار تقسیم می‌کنیم‪.‬‬
‫‌‬
‫پایدار ‌و‬
‫‌‬
‫روش تجزیه شو ‌ر به د ‌و بخش‬
‫‪ ‬تابع لیاپانوف را ‌بر اساس ماتریس‌های بدست آمده ‌از تجزیه شور‌ می‌توان‬
‫به‌صورت ز ‌یر نوشت‪.‬‬
‫تامین پایداری‌ ‪ -‬ادامه‬
‫الگوریتم کنترل‌ پیش‌بین هماهنگ‬
‫هر تکر ‌ار معادله‬
‫در ‌‬
‫‪ v0 ‬را به عنوان شرایط اولیه سیستم انتخاب می‌کنیم‪‌ .‬‬
‫ی ز ‌یر حل می‌شود‪.‬‬
‫بهینه‌ساز ‌‬
‫ابر با ‪ v‬قر ‌ار میدهیم ‌و تنها نمونه او ‌ل‬
‫در آخرین تکر ‌ار الگوریتم سیگنال کنترلی را بر ‌‬
‫‪‌ ‬‬
‫آن‌را به سیستم اصلی می‌دهیم‪.‬‬
‫پایداری‌ روش پیشنهادی‬
‫‪ ‬اگر ‪ di‬به اندازه کافی بزرگ انتخاب شود تا رابطه زیر برقرار باشد‪.‬‬
‫تعمیم الگوریتم درصورت وجود تخمین‌زننده‬
‫‪ ‬مدل کلی سیستم به صورت زیر است‪.‬‬
‫‪ ‬تخمین‌زننده مورد استفاده به صورت رابطه زیر است‪.‬‬
‫تعمیم الگوریتم درصورت وجود تخمین‌زننده ‪ -‬ادامه‬
‫نظر گرفتن دینامیک خطا معادالت سیستم به‌صورت ز ‌یر درمی‌آید‬
‫‪ ‬با در ‌‬
‫در این حالت به صورت ز ‌یر درمی‌آید‪.‬‬
‫‪ ‬تابع لیاپانوف ‌‬
‫قیدهای کوپل شده‬
‫در این‬
‫دو ورودی است‪‌ .‬‬
‫لگر جدا بودن فضای ‌‬
‫در طراحی اولیه کنتر ‌‬
‫‪ ‬یک فرض اصلی ‌‬
‫فتار سیستم را بررس ی می‌کنیم‪.‬‬
‫جا این فرض را برداشته ‌و ر ‌‬
‫قیدهای کوپل شده ‪ -‬ادامه‬
‫‪ ‬برای اصالح معادله مربوط به بهینه‌سازی‌ سیگنال ورودی را به صورت ز ‌یر‬
‫بازتعریف می‌کنیم‪.‬‬
‫‪ ‬با توجه به این تعریف تمام معادالت مربوط به بهینه‌سازی‌ اصالح می‌ش ‌وند‪.‬‬
‫تعمیم روش به حالت ‪ M‬زیرسیستم‬
‫در‬
‫تغییراتی ‌‬
‫در این حالت تمام روش‌های قبلی قابل اعمال است ‌و تنها الزم است که ‌‬
‫‪‌ ‬‬
‫تعریف پارامترها ایجاد شود‪.‬‬
‫بررس ی یک مثال‬
‫معادالت سیستم مورد بررس ی‬
‫مدل نهایی سیستم‬
‫قید مسئله‬
‫‪ ‬قیدهای ورودی به گونه‌ای انتخاب شده‌اند که شار منفی در سیستم وجود نداشته‬
‫باشد‪.‬‬
‫سایر روش‌ها‬
‫نتایج مدل ‌و مقایسه آن با ‌‬
‫چهار کنترلگر‬
‫بررس ی عمل‌کرد ‌‬
NASH EQUILIBRIUM

Let (S, f) be a game with n players, where Si is the strategy set for
player i, S=S1 X S2 ... X Sn is the set of strategy profiles and
f=(f1(x), ..., fn(x)) is the payoff function. Let x − i be a strategy
profile of all players except for player i. When each player i {1, ...,
n} chooses strategy xi resulting in strategy profile x = (x1, ..., xn)
then player i obtains payoff fi(x). Note that the payoff depends on
the strategy profile chosen, i.e. on the strategy chosen by player i
as well as the strategies chosen by all the other players. A
strategy profile x* S is a Nash equilibriu (NE) if no unilateral
deviation in strategy by any single player is profitable for that
player, that is