عامل واکنشی ساده

Download Report

Transcript عامل واکنشی ساده

Saeidirad
‫مفاهیم‬
‫‪ ‬عامل‬
‫‪ ‬خواص محیط های وظیفه‬
‫‪ ‬برنامه های عامل و انواع عامل ها‬
‫ساختار عاملها‬
‫برنامه ‪ +‬معماري = عامل‬
‫کار هوش مصنوعي طراحي برنامه عامل است که تابع عامل را پياده سازي ميکند‬
‫وظیفه معماری‬
‫‪ ‬دریافت ها را بگیرد و به برنامه بدهد‬
‫‪ ‬برنامه را اجرا کند‬
‫‪ ‬عمل خروجی را از برنامه بگیرد و روی محیط اعمال کند‬
‫عاملهاي واکنشي ساده‬
‫عاملهایي که اثرات دنیا را حفظ ميکنند (مبتنی بر مدل)‬
‫عاملهاي مبتنی بر هدف‬
‫عاملهاي مبتنی بر سودمندی‬
‫عامل های یادگیرنده‬
‫این عاملها فعالیت را بر اساس درک فعلي و بدون در نظر گرفتن سابقه ادراک‪،‬‬
‫انتخاب میکند‬
‫به خاطر حذف سابقه ادراک برنامه عامل در مقایسه با جدول آن بسيار کوچک‬
‫است(جدول خیلي بزرگ ولي برنامه در مقابل آن کوچک)‬
‫انتخاب فعالیت بر اساس یکسري قوانين موقعيت شرطي انجام میشود‬
‫مثالي از عامل واکنشي ساده در دنياي جاروبرقي‬
‫تصمممممیم گیممممري آن بممممر اسمممماس‬
‫مکااان فعلااي و کثيااف بااودن آن‬
‫مکان صورت میگیرد‬
‫انتخممممماب فعالیمممممت بمممممر اسممممماس‬
‫موقعيت شرطي‪:‬‬
‫‪If dirty then suck‬‬
‫)]‪function REFLEX-VACUUM-AGENT ([location, status‬‬
‫‪return an action‬‬
‫‪if status == Dirty then return Suck‬‬
‫‪else if location == A then return Right‬‬
‫‪else if location == B then return Left‬‬
‫عامل مبتنی بر مدل‬
‫استفاده از دانش “چگونگي عملکرد جهان” که مدل نام دارد‬
‫عامل بخشي از دنيايي را که فعال میبیند رديابي میکند‬
‫عامل باید حالت داخلي را ذخیره کند که به سابقه ادراک بستگي دارد‬
‫در هر وضعیت‪ ,‬عامل میتواند توصيف جديدي از جهان را کسب کند‬
‫عامل از تاثیری که با عمل خود روی محیط دارد با خبر است‬
‫بهنگامسازي اطالعات وضعيت داخلي همزمان با گذر زمان نیازمند دو نوع دانش‬
‫کد شده در برنامه عامل است‪.‬‬
‫اول‪ :‬نیازمند آنیم که برخي اطالعات درباره چگونگي تغییر جهان مستقل از عامل‬
‫را داشته باشیم‪.‬‬
‫دوم‪ :‬نیازمند اطالعات درباره اعمال خود هستیم که بر روي دنیا اثرگذار است‪.‬‬
‫این عامل عالوه بر توصیف حالت فعلمي‪ ،‬بمراي انتخماب موقعيات مطلاو‬
‫نیازمند اطالعات هدف نیز میباشد‬
‫جست و جو و برنامه ريزي‪ ،‬دنباله اي از فعالیتها را براي رسیدن عاممل‬
‫به هدف‪ ،‬پیدا میکند‬
‫این نوع تصممیم گیمري هممواره آيناده را در نظمر دارد و بما اموانین شمرط‬
‫عمل تفاوت دارد‬
‫این نوع عامل کارایي چنداني ندارد‪ ،‬اما قابليت انعطاف بیشتري دارد‬
‫‪12‬‬
‫برنامه عامل ميتواند این اطالعات را با اطالعاتي درباره نتایج اعمال ممکن‬
‫(همانند اطالعاتي که در عامل واکنش براي بهنگامسازي وضعیت داخلي استفاده‬
‫شد) ترکیب نموده تا اعمال مناسب را براي دسترسي به هدف انتخاب نماید‪.‬‬
‫در مواقعي ساده است‪ :‬که رضایت از هدف بالفاصله از عمل واحد تولید گردد‪.‬‬
‫در مواقعي پيچيده است‪ :‬که عامل باید دنبالههاي طوالني را در نظرگرفته تا راهي‬
‫براي دستیابي به هدف پیدا کند‪.‬‬
‫در موااع پیچیده‪ ،‬جستجو و برنامهریزي به یافتن دنباله اعمال منجر خواهند شد‪.‬‬
‫‪13‬‬
‫این عامل براي اهداف مشخص‪ ،‬راه هاي مختلفي دارد‪ ،‬که راه حمل بهتمر بمراي‬
‫عامل سودمندتر است‪.‬‬
‫تااابس سااودمندي‪ ،‬حالممت یمما دنبالممه اي از حالتهمما را بممه یممک عممدد حقيقااي نگاش مت‬
‫میکند که درجه رضايت را توصیف ِمیکند‪.‬‬
‫واتي اهداف متضاد باشند‪ ،‬بعضي از آنها برآورده میشوند‬
‫اگر هيچيک از اهاداف بمه طمور اطعمي اابمل حصمول نباشمند‪ ،‬احتممال موفقیمت بما‬
‫اهميت هدف مقایسه میشود‬
‫سودمندي‪ :‬تابعي است که یک وضعیت را به عدد حقیقي نگاشت ميدهد‪ ،‬که‬
‫درجه رضایت مربوط را تشریح ميکند‪.‬‬
‫مشخصات کامل تابع سودمندي امکان تصمیمگیري منطقي را براي دو نوع حالتي‬
‫که هدف مشکل دارد‪ ،‬اجازه ميدهد‪:‬‬
‫‪ ‬زماني که اهداف متنااص وجود دارند‪.‬‬
‫‪ ‬زماني که چندین هدف دارند که عامل ميتواند آنها را هدف ارار دهد و‬
‫هیچکدام از آنها با اطعیت اابل حصول نیست‪.‬‬
17
‫عنصريادگيرنده مسئول ایجاد بهبودها‬
‫ِ‬
‫عنصر کارايي مسئول انتخاب فعالیتهاي خارجي‬
‫منتقد مشخص میکند که یادگیرنمده بما توجمه بمه اسمتانداردهاي کمارایي چگونمه عممل‬
‫میکند‬
‫مولد مسئله مسئول پیشنهاد فعالیتهایي است که منجر بمه تجربیمات آموزنمده جدیمدي‬
‫میشود‬
‫عامل یادگرینده‬
20
The End