عامل - ghobaei.ir

Download Report

Transcript عامل - ghobaei.ir

‫هوش مصنوعي‬
‫فصل دوم‬
‫عاملهاي هوشمند‬
‫هوش مصنوعي‬
‫‪Artificial Intelligence‬‬
‫فهرست‬
‫‪‬عامل‬
‫‪‬خواص محيطهای وظيفه‬
‫‪‬برنامه های عامل‬
‫عامل‪:‬‬
‫به هر چيزي اطالق ميشود‪ ،‬که قادر به درک محيط پيرامون خود از طريق حسگرها(‪)sensor‬‬
‫و اثرگذاري بر روي محيط از طريق اثرکنندهها (‪ )effector‬باشد‪.‬‬
‫‪sensors‬‬
‫‪percepts‬‬
‫?‬
‫‪environment‬‬
‫‪agent‬‬
‫‪actions‬‬
‫‪effectors‬‬
‫عاملهای هوشمند‬
‫‪ ‬عامل‬
‫ادراک ها‬
‫محيط‬
‫حسگرها‬
‫?‬
‫فعاليت ها‬
‫محرکها‬
‫عامل‬
‫عوامل انساني‬
‫‪ :sensor .1‬گوش‪ ،‬چشم‪ ،‬ديگر ارگانها‬
‫‪ :effector .2‬دست‪ ،‬پا‪ ،‬بيني‪ ،‬اندامهاي ديگر‬
‫عوامل روباتيک‬
‫‪ :sensor .1‬دوربين‪ ،‬يابندههاي مادون قرمز‬
‫‪ :effector .2‬موتور‪ -‬چرخها‪--‬بازوها‬
‫عامل نرم افزاري‪:‬‬
‫‪:effector.1‬فشرده شدن كليد‪-‬بيت هاي(‪-(01101‬‬
‫‪:effector-2‬نمايش روي صفحه كليد‪-‬رمزگذاري(‪)abc‬‬
‫عاملهای هوشمند‬
‫‪ ‬دنباله ادراکي‬
‫تاريخچه وسابقه کامل هر چيزی است که عامل تاكنون درک کرده است‪.‬‬
‫‪ ‬تابع عامل‬
‫رفتار عامل توسط تابع عامل توصيف ميشود که هر دنباله ادراک را به يک عمل‬
‫نقش ميکند‪.‬‬
‫‪f : P*  A‬‬
‫عمل‬
‫تفاوت ‪ percept‬و‪percept sequence‬‬
‫دنباله ادراک ‪ :‬تابع عامل‬
The vacuum-cleaner world
Environment: square A and B •
Percepts: [location and content] e.g. [A, Dirty] •
Actions: left, right, suck, and no-op •
)‫برنامه عامل(مبتني بر جدول‬
Percept sequence
Action
[A,Clean]
Right
[A, Dirty]
Suck
[B, Clean]
Left
[B, Dirty]
Suck
[A, Clean],[A, Clean]
Right
[A, Clean],[A, Dirty]
Suck
…
…
)‫برنامه عامل(واكنش ي ساده‬
function REFLEX-VACUUM-AGENT ([location, status]) return an action
if status == Dirty then return Suck
else if location == A then return Right
else if location == B then return Left
‫‪12‬‬
‫عاملهای هوشمند‬
‫‪ ‬عامل عالِـم )‪)Omni science‬‬
‫خروجی واقعی فعاليت خود را ميداند و ميتواند بر اساس آن عمل کند‬
‫‪ ‬عامل خردمند (‪)Rational agent‬‬
‫عاملی است که خوب عمل می کند وفعاليتی را انتخاب ميکند که معيار کارايي اش را حداکثر ميکند و این کار با توجه به شواهدی که از طریق دنباله ی‬
‫ادراک بدست می آید و دانش درونی عامل صورت می گيرد‪.‬‬
‫• جمع آوری اطالعات‪ ،‬اکتشاف‪ ،‬يادگيری‬
‫• عامل خردمند باید خودمختار باشد‬
‫‪‬عامل خود مختار‬
‫نقص دانش قبلی خود را ميتواند جبران کند‪.‬‬
‫• اگر عامل بجای ادرکات خود براساس دانش قبلی طراح خود رفتارکند گوییم عامل خودمختار نیست‬
‫‪13‬‬
‫معیارهایی کارآیی برای عاملهای هوشمند‬
‫‪ ‬معيار کارآيي‪ ،‬معياری برای موفقيت رفتار عامل است‬
‫‪ ‬بدیهی است برای تمام عاملها معیار ثابتی وجود ندارد‬
‫‪ ‬این معیار معموال توسط طراح عامل مشخص می شود‬
‫‪ ‬انتخاب معیار کارآیی همواره ساده نیست‬
‫‪ ‬کدام بهتراست؟ اقتصادی که در آن هر کس ی تاحدی فقير است یا‬
‫اقتصادی که در آن بعض ی بسیار ثروتمند و بعض ی دیگر فقيرند؟‬
‫‪14‬‬
‫عاملهای هوشمند‬
‫‪ ‬عقالیی بودن در هر زمان به ‪ 4‬چيز بستگی دارد‬
‫‪‬معيار کارايي که مالکهای موفقيت را تعريف ميکند‬
‫‪ ‬دانش قبلي عامل نسبت به محيط‬
‫‪ ‬فعاليتهايي که عامل ميتواند انجام دهد‬
‫‪ ‬دنباله ادراک عامل در اين زمان‬
‫تفاوت ميان منطقي بودن و دانش کل )‪:(omniscience‬‬
‫عامل داناي کل معني خروجي واقعي اعمال خود را دانسته و بر پايه آن عمل ميکند اما‬
‫دانش کل در واقعيت غيرممکن است‪.‬‬
‫اگر معين کنيم که هر عامل هوشمند همواره بايد همان کاري را انجام دهد که در عمل‬
‫مناسب است‪ ،‬هيچگاه نميتوان عاملي را طراحي نمود که اين مشخصات را مرتفع سازد‪.‬‬
‫‪16‬‬
‫تعیين محیط وظیفه‬
‫‪‬اولين قدم در طراحی عامل ‪ ،‬مشخص کردن محیط وظیفه ی آن است‬
‫‪‬برای هر عامل خردمند باید معیار کارآیی ‪ ،‬محیط ‪ ،‬حسگرها و محرک ها‬
‫را مشخص کنیم تمام این موارد تحت عنوان محیط وظیفه در نظر گرفته‬
‫گرفته می شوند و ‪ PEAS‬خوانده می شود‬
‫‪Performance,Environment,Actuator,Sensor‬‬
‫توصیف ‪( PEAS‬چند مثال)‬
‫نوع عامل‬
‫مقیاس کارآیی‬
‫محیط‬
‫محرک ها‬
‫حس گرها‬
‫راننده تاکس ی‬
‫امن‪،‬سریع‬
‫قانونی‬
‫بیشینه کردن سود‬
‫جاده ها‪،‬‬
‫عابرین پیاده‪،‬‬
‫مشتریان‬
‫فرمان‪،‬گاز‪،‬ترمزچرا‬
‫غها‪،‬بوق‬
‫صفحه نمایش‬
‫دوربینها‪،‬‬
‫سرعت سنج‬
‫کیلومتر شمار‬
‫بیمار سالم‬
‫مسائل حقوقی‬
‫بازده واقعیت‬
‫بیشینه کردن خلوص‬
‫بیشینه کردن نمره‬
‫امتحان دانش اموز‬
‫بیمار‪،‬کارکنان‬
‫بیمارستان‬
‫پاالیشگاه‬
‫کاربران‬
‫مجموعه‬
‫دانش اموزان‬
‫آزمایشها‪،‬تجویز‬
‫نمایش پرسشها‬
‫شيرها ‪ ،‬پمپها‬
‫گرماسازها‬
‫نمایش تمرینها‬
‫پیشنهاد ها‬
‫وارد کردن عالئم بیماری‬
‫سیستم تشخیص‬
‫پزشکی‬
‫کنترلگر پاالیشگاه‬
‫معلم انگلیس ی‬
‫محاوره ای‬
‫‪17‬‬
‫حسگرهای دما‪،‬‬
‫فشار و شیمیایی‬
‫ورودی‬
‫صفحه کلید‬
‫عاملهای هوشمند‬
‫ً‬
‫‪ ‬کامال قابل مشاهده درمقابل قابليت مشاهده جزئی‬
‫‪ ‬قطعي درمقابل غير قطعی‬
‫خواص‬
‫‪ ‬راهبردی‬
‫‪ ‬رويدادی درمقابل ترتيبي‬
‫‪ ‬ايستا درمقابل پويا‬
‫‪ ‬گسسته درمقابل پيوسته‬
‫‪ ‬تک عاملي درمقابل چند عاملي‬
‫محيط های وظيفه‬
‫‪‬چند عاملي رقابتي درمقابل چندعاملي همياری‬
‫‪ ‬قابل دسترس ي در مقابل غيرقابل دسترس ي‬
‫محيط قابل دسترس ي‪ :‬محيطي که عامل آن توسط ابزار حسکنندهاش امکان دسترس ي به‬
‫وضعيت کامل محيط را داشته باشد‪.‬‬
‫محيط قابل دسترس ي راحت است‪ ،‬زيرا عامل نيازمند دستکاري هيچ وضعيت داخلي براي حفظ‬
‫دنيا را نخواهد داشت‪.‬‬
‫‪ ‬قطعي در مقابل غير قطعي‬
‫محيط قطعي‪ :‬محيطي است که اگر وضعيت بعدي محيط بوسيله وضعيت کنوني و اعمالي که‬
‫با عاملها انتخاب گردد‪ ،‬تعيين شود‪.‬‬
‫بهتر است به قطعي يا غير قطعي بودن محيط از ديدگاه عامل نگاه کنيم‪.‬‬
Example: vacuum world
23
‫‪ ‬اپيزوديک در مقابل غير اپيزوديک‬
‫‪ ‬محيط اپيزوديک (‪ ،)episodic‬تجربه عامل به اپيزودهايي تقسيم ميگردد‪.‬‬
‫‪ ‬هر اپيزود شامل درک و عمل عامل است‪.‬‬
‫‪ ‬کيفيت اعمال آن تنها به خود اپيزود وابسته است‪.‬‬
‫‪ ‬محيطهاي اپيزودي بسيار سادهترند زيرا عامل نبايد به جلوتر فکر کند‪.‬‬
‫‪ ‬ايستا در مقابل پويا‬
‫محيط پويا‪ :‬محيطي که در حين سنجيدن عامل تغيير ميکند‪.‬‬
‫محيط نيمهپويا‪ :‬محيطي که با گذر زمان تغيير نميکند اما امتياز کارايي تغيير ميکند‪.‬‬
‫محيطهاي ايستا براي کار ساده هستند زيرا عامل نياز به نگاهکردن به دنيا در حين تصميمگيري‬
‫عملي نداشته و همچنين در مورد گذر زمان نيز نگران نميباشد‪.‬‬
‫‪ ‬گسسته در مقابل پيوسته‬
‫محيط گسسته‪ :‬اگر تعداد محدود و مجزا از ادراک و اعمال بوضوح تعريف شده باشد‪.‬‬
‫‪ -‬بازي شطرنج گسسته است‪.‬‬
‫ رانندگي تاکس ي پيوسته است‪.‬‬‫سختترين حالت در بين حاالت موجود براي محيط‪:‬‬
‫غير قابل دسترس ي‪ ،‬غير اپيزوديک‪ ،‬پويا و پيوسته‬
‫مثالهايي از انواع محيط و ويژگيهاي آنها‬
‫محيط‬
‫قابل دسترس ي‬
‫قطعي‬
‫اپيزوديک‬
‫ايستا‬
‫گسسته‬
‫شطرنج به همراه ساعت‬
‫‪YES‬‬
‫‪YES‬‬
‫‪NO‬‬
‫‪Semi‬‬
‫‪YES‬‬
‫شطرنج بدون ساعت‬
‫‪YES‬‬
‫‪YES‬‬
‫‪NO‬‬
‫‪YES‬‬
‫‪YES‬‬
‫پوکر‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪YES‬‬
‫‪YES‬‬
‫تخته نرد‬
‫‪YES‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪YES‬‬
‫‪YES‬‬
‫راندن تاکس ي‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫سيستم تشخيص پزشکي‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫سيستم تحليل تصوير‬
‫‪YES‬‬
‫‪YES‬‬
‫‪YES‬‬
‫‪Semi‬‬
‫‪NO‬‬
‫ربات جابجا کننده اشياء‬
‫‪NO‬‬
‫‪NO‬‬
‫‪YES‬‬
‫‪NO‬‬
‫‪NO‬‬
‫کنترلکننده پااليشگاه‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫آموزشدهنده انگليس ي با ارتباط متقابل‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪NO‬‬
‫‪YES‬‬
‫عاملهای هوشمند(چند نکته)‬
‫‪‬اگر محیط کامال قابل مشاهده نباشد‪،‬غير قطعی است‬
‫‪ ‬بهتر است قطعی یا غير قطعی بودن را از دیدگاه عامل در نظر بگيریم‬
‫‪ ‬در محیطهای رویدادی ‪ ،‬انتخاب فعالیت در هر رویداد به خود رویداد بستگی دارد و به فعالیتهای‬
‫رویداد قبلی بستگی ندارد‬
‫‪ ‬در محیطهای ترتیبی ‪ ،‬تصمیم فعلی می تواند در تصمیمات بعدی موثر باشد‬
‫‪‬اگر محیط در طول عمر عامل تغیير کند پویاست در غير اینصورت ایستاست‬
‫‪‬اگر محیط با گذر زمان تغیير نکند ولی اختیارات کارآیی تغیير کند گوییم محیط نیمه پویاست‬
‫‪‬محیطهای چند عاملی به دو دسته چند عاملی رقابتی و چند عاملی همیاری تقسیم می شود‬
‫‪‬سخت ترین محیط‪ ،‬قابل مشاهده ی جزئی ‪ ،‬غغير قطعی ‪ ،‬ترتیبی ‪ ،‬پویا ‪ ،‬پیوسته و چند عاملی است‬
‫‪33‬‬
‫محیطهای کاری و ویژگیهای آن(چند مثال)‬
‫محیط کار‬
‫جدول کلمات متقاطع‬
‫شطرنج زمان دار‬
‫پوکر‬
‫تخته نرد‬
‫رانندگی تاکس ی‬
‫تشخیص پزشکی‬
‫تحلیل تصاویر‬
‫روبات قطعه بردار‬
‫کنترلگر پاالیشگاه‬
‫معلم انگلیس ی‬
‫‪34‬‬
‫رویت پذیر قطعی‬
‫کامال‬
‫کامال‬
‫بعضا‬
‫کامال‬
‫بعضا‬
‫بعضا‬
‫کامال‬
‫بعضا‬
‫بعضا‬
‫بعضا‬
‫قطعی‬
‫راهبردی‬
‫اتفاقی‬
‫اتفاقی‬
‫اتفاقی‬
‫اتفاقی‬
‫قطعی‬
‫اتفاقی‬
‫اتفاقی‬
‫اتفاقی‬
‫مرحله ای‬
‫ایستا‬
‫ایستا‬
‫ترتیبی‬
‫نیمه پویا‬
‫ترتیبی‬
‫ایستا‬
‫ترتیبی‬
‫ایستا‬
‫ترتیبی‬
‫پویا‬
‫ترتیبی‬
‫پویا‬
‫ترتیبی‬
‫مرحله ای‬
‫مرحله ای‬
‫ترتیبی‬
‫ترتیبی‬
‫نیمه پویا‬
‫پویا‬
‫پویا‬
‫پویا‬
‫گسسته‬
‫عاملها‬
‫گسسته تک عاملی‬
‫گسسته چند عاملی‬
‫گسسته چند عاملی‬
‫گسسته چند عاملی‬
‫پیوسته چند عاملی‬
‫پیوسته تک عاملی‬
‫پیوسته تک عاملی‬
‫پیوسته تک عاملی‬
‫پیوسته تک عاملی‬
‫گسسته چند عاملی‬
‫ساختار عاملها‬
‫برنامه ‪ +‬معماری = عامل‬
‫کار هوش مصنوعی طراحی برنامه عامل است که تابع عامل را پياده سازی ميکند‪ ،‬این‬
‫برنامه بر روی یک دستگاه محاسباتی با حسگرها و محرک های فيزیکی یعنی معماری اجرا‬
‫می شود‪.‬‬
‫انواع عاملها‬
‫‪35‬‬
‫‪ ‬عاملهای واکنش ی ساده‬
‫‪ ‬عاملهای واکنش ی مدل گرا‬
‫‪‬عاملهای هدف گرا‬
‫‪‬عاملهای سودمند‬
‫‪‬عاملهای یادگيرنده‬
(1) Table - Driven - Agent
1- function TABLE -DRIVEN -AGENT (percept) return action
2 - static:
3percepts, a sequence,initially empty
4table , a table,indexed by percept sequences,
initially
fully specified
5 - append percept to the end of percepts
6 - action lookup (percepts,table)
7 - return action
The vacuum-cleaner world
Percept sequence
Action
[A,Clean]
Right
[A, Dirty]
Suck
[B, Clean]
Left
[B, Dirty]
Suck
[A, Clean],[A, Clean]
Right
[A, Clean],[A, Dirty]
Suck
…
…
‫جنبههاي مختلف يک عمل‪ ،‬انواع مختلف برنامههاي عامل را پيشنهاد خواهد کرد‪.‬‬
‫براي مثال‪ 4 ،‬عامل را مورد بررس ي قرار مي دهيم‪:‬‬
‫‪ ‬عاملهاي واکنش ي ساده‬
‫‪ ‬عاملهايي که اثرات دنيا را حفظ ميکنند‬
‫‪ ‬عاملهاي هدفگرا‬
‫‪ ‬عاملهاي سودمند‬
AGENT- BASE-PROGRAM
1- function SKELETON -AGENT
(percept) returns action
2 - static:
3 - memory, the agent memory of the world
4 - memory  Update -Memory(memory,percept)
5 - action  Choose -Best -Action(memory)
6 - memory  Update -Memory(memory,action)
7 - return action
‫عاملهای هوشمند‬
‫عاملهای واکنش ی ساده‬
‫‪‬اين عاملها فعاليت را بر اساس‬
‫درک فعلی و بدون در نظر گرفتن‬
‫سابقه ادراک‪ ،‬انتخاب ميکند‬
‫‪‬انتخاب فعاليت بر اساس يکسری‬
‫قوانين موقعيت شرطي انجام‬
‫ميشود‬
‫محيط‬
‫‪‬به خاطر حذف سابقه ادراک‬
‫برنامه عامل در مقايسه با جدول آن‬
‫بسيار کوچک است‬
‫حسگرها‬
‫عامل‬
‫در حال حاضر‬
‫جهان چگونه است‬
‫حاالچه عملی بايد‬
‫انجام دهم؟‬
‫محرکها‬
‫قانون‬
‫شرط عمل‬
(2) Simple Reflex Agents
1 - function SIMPLE _REFLEX_AGENT (percept)
returns
action
2 - static :
Rules, a set of condition_action rules
3 - state <-- INTERPRET-INPUT (percept)
4 - rule <-- RULE-MATCH (state,rules)
5 - action <-- RULE-ACTION [rule]
6 - return action
‫عاملهای هوشمند‬
‫مثالي از عامل واکنش ی ساده در دنيای جاروبرقي‬
‫‪‬تصميم گيری آن بر اساس مکان‬
‫فعلـ ـ ـ ــی و کثيـ ـ ـ ــف بـ ـ ـ ــودن آن مکا ا ا ااان‬
‫صورت ميگيرد‬
‫‪‬در برنام ا ااه عام ا اال در مقايس ا ااه ب ا ااا‬
‫جاادول آن‪ ،‬تعااداد حال هااای ممکاان از‬
‫‪ 4‬به ‪ 4‬کاهش مي يابد‬
‫)]‪function REFLEX-VACUUM-AGENT ([location, status‬‬
‫‪return an action‬‬
‫‪‬انتخ ا ا ا اااب فعالي ا ا ا اات ب ا ا ا اار اس ا ا ا اااس‬
‫‪if status == Dirty then return Suck‬‬
‫موقعيت شرطي‪:‬‬
‫‪else if location == A then return Right‬‬
‫‪else if location == B then return Left‬‬
‫‪If dirty then suck‬‬
‫عاملهای هوشمند‬
‫عاملهای واکنش ي مدل گرا‬
‫‪‬اسا ا ا ااتفاده از دان ا ا ا ااش “چگ ـ ـ ـ ــونگی‬
‫عملکرد جهان” که مدل نام دارد‬
‫‪‬عام ا ا اال باي ا ا ااد حالـ ـ ـ ــت داخلـ ـ ـ ــي را‬
‫ذخيا ااره کن ا ااد ک ا ااه با ااه س ـ ــابقه ادراک‬
‫بستگي دارد‬
‫‪‬در ه ا اار وض ا ااعيت‪ ,‬عام ا اال ميتوان ا ااد‬
‫توصيف جديدی از جهاان را کساب‬
‫کند‬
‫محيط‬
‫‪‬عام ا اال بخشـ ـ ـ ي از دني ـ ــايي را ک ا ااه‬
‫فعال ميبيند رديابی ميکند‬
‫حسگرها‬
‫در حال حاضر‬
‫جهان چگونه است‬
‫وضعيت‬
‫جهان چگونه در‬
‫مي آيد؟‬
‫عملكردهاي من‬
‫چه مي كنند؟‬
‫حاال چه عملی بايد‬
‫انجام دهم؟‬
‫محرکها‬
‫قانون‬
‫شرط عمل‬
‫عامل‬
(2) Simple Reflex Agents
1 - function SIMPLE _REFLEX_AGENT (percept)
returns
action
2 - static :
Rules, a set of condition_action rules
3 - state <-- INTERPRET-INPUT (percept)
4 - rule <-- RULE-MATCH (state,rules)
5 - action <-- RULE-ACTION [rule]
6 - return action
‫عاملهای هوشمند‬
‫مثالي از عامل واکنش ی ساده در دنيای جاروبرقي‬
‫‪‬تصميم گيری آن بر اساس مکان‬
‫فعلـ ـ ـ ــی و کثيـ ـ ـ ــف بـ ـ ـ ــودن آن مکا ا ا ااان‬
‫صورت ميگيرد‬
‫‪‬در برنام ا ااه عام ا اال در مقايس ا ااه ب ا ااا‬
‫جاادول آن‪ ،‬تعااداد حال هااای ممکاان از‬
‫‪ 4‬به ‪ 4‬کاهش مي يابد‬
‫)]‪function REFLEX-VACUUM-AGENT ([location, status‬‬
‫‪return an action‬‬
‫‪‬انتخ ا ا ا اااب فعالي ا ا ا اات ب ا ا ا اار اس ا ا ا اااس‬
‫‪if status == Dirty then return Suck‬‬
‫موقعيت شرطي‪:‬‬
‫‪else if location == A then return Right‬‬
‫‪else if location == B then return Left‬‬
‫‪If dirty then suck‬‬
‫عاملهای هوشمند‬
‫عاملهای واکنش ي مدل گرا‬
‫‪‬اسا ا ا ااتفاده از دان ا ا ا ااش “چگ ـ ـ ـ ــونگی‬
‫عملکرد جهان” که مدل نام دارد‬
‫‪‬عام ا ا اال باي ا ا ااد حالـ ـ ـ ــت داخلـ ـ ـ ــي را‬
‫ذخيا ااره کن ا ااد ک ا ااه با ااه س ـ ــابقه ادراک‬
‫بستگي دارد‬
‫‪‬در ه ا اار وض ا ااعيت‪ ,‬عام ا اال ميتوان ا ااد‬
‫توصيف جديدی از جهاان را کساب‬
‫کند‬
‫محيط‬
‫‪‬عام ا اال بخشـ ـ ـ ي از دني ـ ــايي را ک ا ااه‬
‫فعال ميبيند رديابی ميکند‬
‫حسگرها‬
‫در حال حاضر‬
‫جهان چگونه است‬
‫وضعيت‬
‫جهان چگونه در‬
‫مي آيد؟‬
‫عملكردهاي من‬
‫چه مي كنند؟‬
‫حاال چه عملی بايد‬
‫انجام دهم؟‬
‫محرکها‬
‫قانون‬
‫شرط عمل‬
‫عامل‬
(3) Reflex Agents with State
1 - function REFLEX_AGENT_WITH_STATE
(percept) returns action
2 - static :
State,a description of the current world state
Rules,a a set of condition_action rules
3 - state  UPDATE-STATE (state,percept)
4 - rule RULE-MATCH (state,rules)
5 - action  RULE-ACTION [rule]
6 - state UPDATE-STATE (state,action)
7- return action
‫عاملهای هوشمند‬
‫عاملهای هدف گرا‬
‫حسگرها‬
‫جهان حاالچگونه‬
‫است‬
‫‪‬جســت و جــو و برنامــه ريــزی‪ ،‬دنبالااه ای‬
‫از فعالي ها را برای رسيدن عامال باه هادف‪،‬‬
‫پيدا ميکند‬
‫دز صورت انجام عمل‬
‫‪ A‬جهان چگونه‬
‫خواهد بود؟‬
‫محيط‬
‫‪‬اي ا اان عام ا اال ع ا ااالوه ب ا اار توص ا اايف حال ا اات‬
‫فعل ا اای‪ ،‬با ا ارای انتخ ا اااب موقعي ـ ــت مطل ـ ــوب‬
‫نيازمند اطالعات هدف نيز ميباشد‬
‫‪‬اياان نااوع تصااميم گيااری همااواره آينــده را‬
‫در نظر دارد و با قاوانين شارع عمال تفااوت‬
‫دارد‬
‫حاال چه عملی بايد‬
‫انجام دهم؟‬
‫‪‬اين نوع عامل کارايي چندانی ندارد‪ ،‬اماا‬
‫قابليت انعطاف بيشتری دارد‬
‫محرکها‬
‫وضعيت‬
‫جهان چگونه‬
‫در مي آيد؟‬
‫عملكردهاي من‬
‫چه مي كنند؟‬
‫اهداف‬
‫عامل‬
‫عاملهای هوشمند‬
‫عاملهای سودمند‬
‫حسگرها‬
‫‪‬اياان عاماال ب اراي اهــداف مشــخص‪ ،‬راه‬
‫ه ــای مختلف ــی دارد‪ ،‬کااه راه ح اال بهت اار ب اارای‬
‫عامل سودمندتر است‪.‬‬
‫‪‬وقتای اهداف متضـاد باشاند‪ ،‬بعضـ ی از‬
‫آنها برآورده ميشوند‬
‫‪‬اگاار هيچيــک از اهــداف بااه طااور قطعاای‬
‫قابل حصاول نباشاند‪ ،‬احتماال موفقيات باا‬
‫اهميت هدف مقايسه ميشود‬
‫حاالجهان چگونه است‬
‫محيط‬
‫‪‬تــابع ســودمندی‪ ،‬حالاات يااا دنبالااه ای از‬
‫حال ه ا ااا را ب ا ااه ي ا ااک ع ا اادد حقيق ـ ــی نگاش ا اات‬
‫ميکن ا ا ااد ک ا ا ااه درج ـ ـ ــه رض ـ ـ ــايت را توص ا ا اايف‬
‫ِميکند‪.‬‬
‫وضعيت‬
‫دز صورت انجام‬
‫عمل ‪ A‬جهان‬
‫چگونه خواهد‬
‫بود؟‬
‫در چنين حالتی چقدر‬
‫رضايت دارم‬
‫اکنون چه عملی بايد‬
‫انجام دهم‬
‫محرکها‬
‫جهان چگونه‬
‫در مي آيد؟‬
‫عملكردهاي من‬
‫چه مي كنند؟‬
‫سودمند‬
‫عامل‬
‫عاملهای هوشمند‬
‫عاملهای يادگيرنده‬
‫استاندارد کارايي‬
‫‪ ‬عنصا ا ا ا ِار ِ يادگيرنـ ـ ـ ــده مس ا ا ا ا ول ايجا ا ا اااد‬
‫بهبودها‬
‫محيط‬
‫‪‬مول ـ ـ ـ ـ ـ ــد مس ـ ـ ـ ـ ـ ـ له مس ا ا ا ا ا ا ول پيشا ا ا ا ا اانهاد‬
‫فعالي ه ا ااايي اس ا اات ک ا ااه منج ا اار ب ا ااه تجربي ا اات‬
‫آموزنده جديدی ميشود‬
‫عنصر کارايي‬
‫تغييرات‬
‫دانش‬
‫عنصر‬
‫يادگيرنده‬
‫اهداف‬
‫يادگيری‬
‫‪‬منتقد مشخص ميکند که يادگيرناده باا‬
‫توجه به استانداردهای کارايي چگونه عمل‬
‫ميکند‬
‫بازخورد‬
‫‪‬عنص ا ا ا ا ا اار ک ـ ـ ـ ـ ـ ــارايي مس ا ا ا ا ا ا ول انتخ ا ا ا ا ا اااب‬
‫فعالي های خارجی‬
‫حسگرها‬
‫منتقد‬
‫مولد مس له‬
‫محرکها‬
‫عامل‬