عامل واکنشی ساده
Download
Report
Transcript عامل واکنشی ساده
Saeidirad
مفاهیم
عامل
خواص محیط های وظیفه
برنامه های عامل و انواع عامل ها
ساختار عاملها
برنامه +معماري = عامل
کار هوش مصنوعي طراحي برنامه عامل است که تابع عامل را پياده سازي ميکند
وظیفه معماری
دریافت ها را بگیرد و به برنامه بدهد
برنامه را اجرا کند
عمل خروجی را از برنامه بگیرد و روی محیط اعمال کند
عاملهاي واکنشي ساده
عاملهایي که اثرات دنیا را حفظ ميکنند (مبتنی بر مدل)
عاملهاي مبتنی بر هدف
عاملهاي مبتنی بر سودمندی
عامل های یادگیرنده
این عاملها فعالیت را بر اساس درک فعلي و بدون در نظر گرفتن سابقه ادراک،
انتخاب میکند
به خاطر حذف سابقه ادراک برنامه عامل در مقایسه با جدول آن بسيار کوچک
است(جدول خیلي بزرگ ولي برنامه در مقابل آن کوچک)
انتخاب فعالیت بر اساس یکسري قوانين موقعيت شرطي انجام میشود
مثالي از عامل واکنشي ساده در دنياي جاروبرقي
تصمممممیم گیممممري آن بممممر اسمممماس
مکااان فعلااي و کثيااف بااودن آن
مکان صورت میگیرد
انتخممممماب فعالیمممممت بمممممر اسممممماس
موقعيت شرطي:
If dirty then suck
)]function REFLEX-VACUUM-AGENT ([location, status
return an action
if status == Dirty then return Suck
else if location == A then return Right
else if location == B then return Left
عامل مبتنی بر مدل
استفاده از دانش “چگونگي عملکرد جهان” که مدل نام دارد
عامل بخشي از دنيايي را که فعال میبیند رديابي میکند
عامل باید حالت داخلي را ذخیره کند که به سابقه ادراک بستگي دارد
در هر وضعیت ,عامل میتواند توصيف جديدي از جهان را کسب کند
عامل از تاثیری که با عمل خود روی محیط دارد با خبر است
بهنگامسازي اطالعات وضعيت داخلي همزمان با گذر زمان نیازمند دو نوع دانش
کد شده در برنامه عامل است.
اول :نیازمند آنیم که برخي اطالعات درباره چگونگي تغییر جهان مستقل از عامل
را داشته باشیم.
دوم :نیازمند اطالعات درباره اعمال خود هستیم که بر روي دنیا اثرگذار است.
این عامل عالوه بر توصیف حالت فعلمي ،بمراي انتخماب موقعيات مطلاو
نیازمند اطالعات هدف نیز میباشد
جست و جو و برنامه ريزي ،دنباله اي از فعالیتها را براي رسیدن عاممل
به هدف ،پیدا میکند
این نوع تصممیم گیمري هممواره آيناده را در نظمر دارد و بما اموانین شمرط
عمل تفاوت دارد
این نوع عامل کارایي چنداني ندارد ،اما قابليت انعطاف بیشتري دارد
12
برنامه عامل ميتواند این اطالعات را با اطالعاتي درباره نتایج اعمال ممکن
(همانند اطالعاتي که در عامل واکنش براي بهنگامسازي وضعیت داخلي استفاده
شد) ترکیب نموده تا اعمال مناسب را براي دسترسي به هدف انتخاب نماید.
در مواقعي ساده است :که رضایت از هدف بالفاصله از عمل واحد تولید گردد.
در مواقعي پيچيده است :که عامل باید دنبالههاي طوالني را در نظرگرفته تا راهي
براي دستیابي به هدف پیدا کند.
در موااع پیچیده ،جستجو و برنامهریزي به یافتن دنباله اعمال منجر خواهند شد.
13
این عامل براي اهداف مشخص ،راه هاي مختلفي دارد ،که راه حمل بهتمر بمراي
عامل سودمندتر است.
تااابس سااودمندي ،حالممت یمما دنبالممه اي از حالتهمما را بممه یممک عممدد حقيقااي نگاش مت
میکند که درجه رضايت را توصیف ِمیکند.
واتي اهداف متضاد باشند ،بعضي از آنها برآورده میشوند
اگر هيچيک از اهاداف بمه طمور اطعمي اابمل حصمول نباشمند ،احتممال موفقیمت بما
اهميت هدف مقایسه میشود
سودمندي :تابعي است که یک وضعیت را به عدد حقیقي نگاشت ميدهد ،که
درجه رضایت مربوط را تشریح ميکند.
مشخصات کامل تابع سودمندي امکان تصمیمگیري منطقي را براي دو نوع حالتي
که هدف مشکل دارد ،اجازه ميدهد:
زماني که اهداف متنااص وجود دارند.
زماني که چندین هدف دارند که عامل ميتواند آنها را هدف ارار دهد و
هیچکدام از آنها با اطعیت اابل حصول نیست.
17
عنصريادگيرنده مسئول ایجاد بهبودها
ِ
عنصر کارايي مسئول انتخاب فعالیتهاي خارجي
منتقد مشخص میکند که یادگیرنمده بما توجمه بمه اسمتانداردهاي کمارایي چگونمه عممل
میکند
مولد مسئله مسئول پیشنهاد فعالیتهایي است که منجر بمه تجربیمات آموزنمده جدیمدي
میشود
عامل یادگرینده
20
The End