عامل - ghobaei.ir
Download
Report
Transcript عامل - ghobaei.ir
هوش مصنوعي
فصل دوم
عاملهاي هوشمند
هوش مصنوعي
Artificial Intelligence
فهرست
عامل
خواص محيطهای وظيفه
برنامه های عامل
عامل:
به هر چيزي اطالق ميشود ،که قادر به درک محيط پيرامون خود از طريق حسگرها()sensor
و اثرگذاري بر روي محيط از طريق اثرکنندهها ( )effectorباشد.
sensors
percepts
?
environment
agent
actions
effectors
عاملهای هوشمند
عامل
ادراک ها
محيط
حسگرها
?
فعاليت ها
محرکها
عامل
عوامل انساني
:sensor .1گوش ،چشم ،ديگر ارگانها
:effector .2دست ،پا ،بيني ،اندامهاي ديگر
عوامل روباتيک
:sensor .1دوربين ،يابندههاي مادون قرمز
:effector .2موتور -چرخها--بازوها
عامل نرم افزاري:
:effector.1فشرده شدن كليد-بيت هاي(-(01101
:effector-2نمايش روي صفحه كليد-رمزگذاري()abc
عاملهای هوشمند
دنباله ادراکي
تاريخچه وسابقه کامل هر چيزی است که عامل تاكنون درک کرده است.
تابع عامل
رفتار عامل توسط تابع عامل توصيف ميشود که هر دنباله ادراک را به يک عمل
نقش ميکند.
f : P* A
عمل
تفاوت perceptوpercept sequence
دنباله ادراک :تابع عامل
The vacuum-cleaner world
Environment: square A and B •
Percepts: [location and content] e.g. [A, Dirty] •
Actions: left, right, suck, and no-op •
)برنامه عامل(مبتني بر جدول
Percept sequence
Action
[A,Clean]
Right
[A, Dirty]
Suck
[B, Clean]
Left
[B, Dirty]
Suck
[A, Clean],[A, Clean]
Right
[A, Clean],[A, Dirty]
Suck
…
…
)برنامه عامل(واكنش ي ساده
function REFLEX-VACUUM-AGENT ([location, status]) return an action
if status == Dirty then return Suck
else if location == A then return Right
else if location == B then return Left
12
عاملهای هوشمند
عامل عالِـم ))Omni science
خروجی واقعی فعاليت خود را ميداند و ميتواند بر اساس آن عمل کند
عامل خردمند ()Rational agent
عاملی است که خوب عمل می کند وفعاليتی را انتخاب ميکند که معيار کارايي اش را حداکثر ميکند و این کار با توجه به شواهدی که از طریق دنباله ی
ادراک بدست می آید و دانش درونی عامل صورت می گيرد.
• جمع آوری اطالعات ،اکتشاف ،يادگيری
• عامل خردمند باید خودمختار باشد
عامل خود مختار
نقص دانش قبلی خود را ميتواند جبران کند.
• اگر عامل بجای ادرکات خود براساس دانش قبلی طراح خود رفتارکند گوییم عامل خودمختار نیست
13
معیارهایی کارآیی برای عاملهای هوشمند
معيار کارآيي ،معياری برای موفقيت رفتار عامل است
بدیهی است برای تمام عاملها معیار ثابتی وجود ندارد
این معیار معموال توسط طراح عامل مشخص می شود
انتخاب معیار کارآیی همواره ساده نیست
کدام بهتراست؟ اقتصادی که در آن هر کس ی تاحدی فقير است یا
اقتصادی که در آن بعض ی بسیار ثروتمند و بعض ی دیگر فقيرند؟
14
عاملهای هوشمند
عقالیی بودن در هر زمان به 4چيز بستگی دارد
معيار کارايي که مالکهای موفقيت را تعريف ميکند
دانش قبلي عامل نسبت به محيط
فعاليتهايي که عامل ميتواند انجام دهد
دنباله ادراک عامل در اين زمان
تفاوت ميان منطقي بودن و دانش کل ):(omniscience
عامل داناي کل معني خروجي واقعي اعمال خود را دانسته و بر پايه آن عمل ميکند اما
دانش کل در واقعيت غيرممکن است.
اگر معين کنيم که هر عامل هوشمند همواره بايد همان کاري را انجام دهد که در عمل
مناسب است ،هيچگاه نميتوان عاملي را طراحي نمود که اين مشخصات را مرتفع سازد.
16
تعیين محیط وظیفه
اولين قدم در طراحی عامل ،مشخص کردن محیط وظیفه ی آن است
برای هر عامل خردمند باید معیار کارآیی ،محیط ،حسگرها و محرک ها
را مشخص کنیم تمام این موارد تحت عنوان محیط وظیفه در نظر گرفته
گرفته می شوند و PEASخوانده می شود
Performance,Environment,Actuator,Sensor
توصیف ( PEASچند مثال)
نوع عامل
مقیاس کارآیی
محیط
محرک ها
حس گرها
راننده تاکس ی
امن،سریع
قانونی
بیشینه کردن سود
جاده ها،
عابرین پیاده،
مشتریان
فرمان،گاز،ترمزچرا
غها،بوق
صفحه نمایش
دوربینها،
سرعت سنج
کیلومتر شمار
بیمار سالم
مسائل حقوقی
بازده واقعیت
بیشینه کردن خلوص
بیشینه کردن نمره
امتحان دانش اموز
بیمار،کارکنان
بیمارستان
پاالیشگاه
کاربران
مجموعه
دانش اموزان
آزمایشها،تجویز
نمایش پرسشها
شيرها ،پمپها
گرماسازها
نمایش تمرینها
پیشنهاد ها
وارد کردن عالئم بیماری
سیستم تشخیص
پزشکی
کنترلگر پاالیشگاه
معلم انگلیس ی
محاوره ای
17
حسگرهای دما،
فشار و شیمیایی
ورودی
صفحه کلید
عاملهای هوشمند
ً
کامال قابل مشاهده درمقابل قابليت مشاهده جزئی
قطعي درمقابل غير قطعی
خواص
راهبردی
رويدادی درمقابل ترتيبي
ايستا درمقابل پويا
گسسته درمقابل پيوسته
تک عاملي درمقابل چند عاملي
محيط های وظيفه
چند عاملي رقابتي درمقابل چندعاملي همياری
قابل دسترس ي در مقابل غيرقابل دسترس ي
محيط قابل دسترس ي :محيطي که عامل آن توسط ابزار حسکنندهاش امکان دسترس ي به
وضعيت کامل محيط را داشته باشد.
محيط قابل دسترس ي راحت است ،زيرا عامل نيازمند دستکاري هيچ وضعيت داخلي براي حفظ
دنيا را نخواهد داشت.
قطعي در مقابل غير قطعي
محيط قطعي :محيطي است که اگر وضعيت بعدي محيط بوسيله وضعيت کنوني و اعمالي که
با عاملها انتخاب گردد ،تعيين شود.
بهتر است به قطعي يا غير قطعي بودن محيط از ديدگاه عامل نگاه کنيم.
Example: vacuum world
23
اپيزوديک در مقابل غير اپيزوديک
محيط اپيزوديک ( ،)episodicتجربه عامل به اپيزودهايي تقسيم ميگردد.
هر اپيزود شامل درک و عمل عامل است.
کيفيت اعمال آن تنها به خود اپيزود وابسته است.
محيطهاي اپيزودي بسيار سادهترند زيرا عامل نبايد به جلوتر فکر کند.
ايستا در مقابل پويا
محيط پويا :محيطي که در حين سنجيدن عامل تغيير ميکند.
محيط نيمهپويا :محيطي که با گذر زمان تغيير نميکند اما امتياز کارايي تغيير ميکند.
محيطهاي ايستا براي کار ساده هستند زيرا عامل نياز به نگاهکردن به دنيا در حين تصميمگيري
عملي نداشته و همچنين در مورد گذر زمان نيز نگران نميباشد.
گسسته در مقابل پيوسته
محيط گسسته :اگر تعداد محدود و مجزا از ادراک و اعمال بوضوح تعريف شده باشد.
-بازي شطرنج گسسته است.
رانندگي تاکس ي پيوسته است.سختترين حالت در بين حاالت موجود براي محيط:
غير قابل دسترس ي ،غير اپيزوديک ،پويا و پيوسته
مثالهايي از انواع محيط و ويژگيهاي آنها
محيط
قابل دسترس ي
قطعي
اپيزوديک
ايستا
گسسته
شطرنج به همراه ساعت
YES
YES
NO
Semi
YES
شطرنج بدون ساعت
YES
YES
NO
YES
YES
پوکر
NO
NO
NO
YES
YES
تخته نرد
YES
NO
NO
YES
YES
راندن تاکس ي
NO
NO
NO
NO
NO
سيستم تشخيص پزشکي
NO
NO
NO
NO
NO
سيستم تحليل تصوير
YES
YES
YES
Semi
NO
ربات جابجا کننده اشياء
NO
NO
YES
NO
NO
کنترلکننده پااليشگاه
NO
NO
NO
NO
NO
آموزشدهنده انگليس ي با ارتباط متقابل
NO
NO
NO
NO
YES
عاملهای هوشمند(چند نکته)
اگر محیط کامال قابل مشاهده نباشد،غير قطعی است
بهتر است قطعی یا غير قطعی بودن را از دیدگاه عامل در نظر بگيریم
در محیطهای رویدادی ،انتخاب فعالیت در هر رویداد به خود رویداد بستگی دارد و به فعالیتهای
رویداد قبلی بستگی ندارد
در محیطهای ترتیبی ،تصمیم فعلی می تواند در تصمیمات بعدی موثر باشد
اگر محیط در طول عمر عامل تغیير کند پویاست در غير اینصورت ایستاست
اگر محیط با گذر زمان تغیير نکند ولی اختیارات کارآیی تغیير کند گوییم محیط نیمه پویاست
محیطهای چند عاملی به دو دسته چند عاملی رقابتی و چند عاملی همیاری تقسیم می شود
سخت ترین محیط ،قابل مشاهده ی جزئی ،غغير قطعی ،ترتیبی ،پویا ،پیوسته و چند عاملی است
33
محیطهای کاری و ویژگیهای آن(چند مثال)
محیط کار
جدول کلمات متقاطع
شطرنج زمان دار
پوکر
تخته نرد
رانندگی تاکس ی
تشخیص پزشکی
تحلیل تصاویر
روبات قطعه بردار
کنترلگر پاالیشگاه
معلم انگلیس ی
34
رویت پذیر قطعی
کامال
کامال
بعضا
کامال
بعضا
بعضا
کامال
بعضا
بعضا
بعضا
قطعی
راهبردی
اتفاقی
اتفاقی
اتفاقی
اتفاقی
قطعی
اتفاقی
اتفاقی
اتفاقی
مرحله ای
ایستا
ایستا
ترتیبی
نیمه پویا
ترتیبی
ایستا
ترتیبی
ایستا
ترتیبی
پویا
ترتیبی
پویا
ترتیبی
مرحله ای
مرحله ای
ترتیبی
ترتیبی
نیمه پویا
پویا
پویا
پویا
گسسته
عاملها
گسسته تک عاملی
گسسته چند عاملی
گسسته چند عاملی
گسسته چند عاملی
پیوسته چند عاملی
پیوسته تک عاملی
پیوسته تک عاملی
پیوسته تک عاملی
پیوسته تک عاملی
گسسته چند عاملی
ساختار عاملها
برنامه +معماری = عامل
کار هوش مصنوعی طراحی برنامه عامل است که تابع عامل را پياده سازی ميکند ،این
برنامه بر روی یک دستگاه محاسباتی با حسگرها و محرک های فيزیکی یعنی معماری اجرا
می شود.
انواع عاملها
35
عاملهای واکنش ی ساده
عاملهای واکنش ی مدل گرا
عاملهای هدف گرا
عاملهای سودمند
عاملهای یادگيرنده
(1) Table - Driven - Agent
1- function TABLE -DRIVEN -AGENT (percept) return action
2 - static:
3percepts, a sequence,initially empty
4table , a table,indexed by percept sequences,
initially
fully specified
5 - append percept to the end of percepts
6 - action lookup (percepts,table)
7 - return action
The vacuum-cleaner world
Percept sequence
Action
[A,Clean]
Right
[A, Dirty]
Suck
[B, Clean]
Left
[B, Dirty]
Suck
[A, Clean],[A, Clean]
Right
[A, Clean],[A, Dirty]
Suck
…
…
جنبههاي مختلف يک عمل ،انواع مختلف برنامههاي عامل را پيشنهاد خواهد کرد.
براي مثال 4 ،عامل را مورد بررس ي قرار مي دهيم:
عاملهاي واکنش ي ساده
عاملهايي که اثرات دنيا را حفظ ميکنند
عاملهاي هدفگرا
عاملهاي سودمند
AGENT- BASE-PROGRAM
1- function SKELETON -AGENT
(percept) returns action
2 - static:
3 - memory, the agent memory of the world
4 - memory Update -Memory(memory,percept)
5 - action Choose -Best -Action(memory)
6 - memory Update -Memory(memory,action)
7 - return action
عاملهای هوشمند
عاملهای واکنش ی ساده
اين عاملها فعاليت را بر اساس
درک فعلی و بدون در نظر گرفتن
سابقه ادراک ،انتخاب ميکند
انتخاب فعاليت بر اساس يکسری
قوانين موقعيت شرطي انجام
ميشود
محيط
به خاطر حذف سابقه ادراک
برنامه عامل در مقايسه با جدول آن
بسيار کوچک است
حسگرها
عامل
در حال حاضر
جهان چگونه است
حاالچه عملی بايد
انجام دهم؟
محرکها
قانون
شرط عمل
(2) Simple Reflex Agents
1 - function SIMPLE _REFLEX_AGENT (percept)
returns
action
2 - static :
Rules, a set of condition_action rules
3 - state <-- INTERPRET-INPUT (percept)
4 - rule <-- RULE-MATCH (state,rules)
5 - action <-- RULE-ACTION [rule]
6 - return action
عاملهای هوشمند
مثالي از عامل واکنش ی ساده در دنيای جاروبرقي
تصميم گيری آن بر اساس مکان
فعلـ ـ ـ ــی و کثيـ ـ ـ ــف بـ ـ ـ ــودن آن مکا ا ا ااان
صورت ميگيرد
در برنام ا ااه عام ا اال در مقايس ا ااه ب ا ااا
جاادول آن ،تعااداد حال هااای ممکاان از
4به 4کاهش مي يابد
)]function REFLEX-VACUUM-AGENT ([location, status
return an action
انتخ ا ا ا اااب فعالي ا ا ا اات ب ا ا ا اار اس ا ا ا اااس
if status == Dirty then return Suck
موقعيت شرطي:
else if location == A then return Right
else if location == B then return Left
If dirty then suck
عاملهای هوشمند
عاملهای واکنش ي مدل گرا
اسا ا ا ااتفاده از دان ا ا ا ااش “چگ ـ ـ ـ ــونگی
عملکرد جهان” که مدل نام دارد
عام ا ا اال باي ا ا ااد حالـ ـ ـ ــت داخلـ ـ ـ ــي را
ذخيا ااره کن ا ااد ک ا ااه با ااه س ـ ــابقه ادراک
بستگي دارد
در ه ا اار وض ا ااعيت ,عام ا اال ميتوان ا ااد
توصيف جديدی از جهاان را کساب
کند
محيط
عام ا اال بخشـ ـ ـ ي از دني ـ ــايي را ک ا ااه
فعال ميبيند رديابی ميکند
حسگرها
در حال حاضر
جهان چگونه است
وضعيت
جهان چگونه در
مي آيد؟
عملكردهاي من
چه مي كنند؟
حاال چه عملی بايد
انجام دهم؟
محرکها
قانون
شرط عمل
عامل
(2) Simple Reflex Agents
1 - function SIMPLE _REFLEX_AGENT (percept)
returns
action
2 - static :
Rules, a set of condition_action rules
3 - state <-- INTERPRET-INPUT (percept)
4 - rule <-- RULE-MATCH (state,rules)
5 - action <-- RULE-ACTION [rule]
6 - return action
عاملهای هوشمند
مثالي از عامل واکنش ی ساده در دنيای جاروبرقي
تصميم گيری آن بر اساس مکان
فعلـ ـ ـ ــی و کثيـ ـ ـ ــف بـ ـ ـ ــودن آن مکا ا ا ااان
صورت ميگيرد
در برنام ا ااه عام ا اال در مقايس ا ااه ب ا ااا
جاادول آن ،تعااداد حال هااای ممکاان از
4به 4کاهش مي يابد
)]function REFLEX-VACUUM-AGENT ([location, status
return an action
انتخ ا ا ا اااب فعالي ا ا ا اات ب ا ا ا اار اس ا ا ا اااس
if status == Dirty then return Suck
موقعيت شرطي:
else if location == A then return Right
else if location == B then return Left
If dirty then suck
عاملهای هوشمند
عاملهای واکنش ي مدل گرا
اسا ا ا ااتفاده از دان ا ا ا ااش “چگ ـ ـ ـ ــونگی
عملکرد جهان” که مدل نام دارد
عام ا ا اال باي ا ا ااد حالـ ـ ـ ــت داخلـ ـ ـ ــي را
ذخيا ااره کن ا ااد ک ا ااه با ااه س ـ ــابقه ادراک
بستگي دارد
در ه ا اار وض ا ااعيت ,عام ا اال ميتوان ا ااد
توصيف جديدی از جهاان را کساب
کند
محيط
عام ا اال بخشـ ـ ـ ي از دني ـ ــايي را ک ا ااه
فعال ميبيند رديابی ميکند
حسگرها
در حال حاضر
جهان چگونه است
وضعيت
جهان چگونه در
مي آيد؟
عملكردهاي من
چه مي كنند؟
حاال چه عملی بايد
انجام دهم؟
محرکها
قانون
شرط عمل
عامل
(3) Reflex Agents with State
1 - function REFLEX_AGENT_WITH_STATE
(percept) returns action
2 - static :
State,a description of the current world state
Rules,a a set of condition_action rules
3 - state UPDATE-STATE (state,percept)
4 - rule RULE-MATCH (state,rules)
5 - action RULE-ACTION [rule]
6 - state UPDATE-STATE (state,action)
7- return action
عاملهای هوشمند
عاملهای هدف گرا
حسگرها
جهان حاالچگونه
است
جســت و جــو و برنامــه ريــزی ،دنبالااه ای
از فعالي ها را برای رسيدن عامال باه هادف،
پيدا ميکند
دز صورت انجام عمل
Aجهان چگونه
خواهد بود؟
محيط
اي ا اان عام ا اال ع ا ااالوه ب ا اار توص ا اايف حال ا اات
فعل ا اای ،با ا ارای انتخ ا اااب موقعي ـ ــت مطل ـ ــوب
نيازمند اطالعات هدف نيز ميباشد
اياان نااوع تصااميم گيااری همااواره آينــده را
در نظر دارد و با قاوانين شارع عمال تفااوت
دارد
حاال چه عملی بايد
انجام دهم؟
اين نوع عامل کارايي چندانی ندارد ،اماا
قابليت انعطاف بيشتری دارد
محرکها
وضعيت
جهان چگونه
در مي آيد؟
عملكردهاي من
چه مي كنند؟
اهداف
عامل
عاملهای هوشمند
عاملهای سودمند
حسگرها
اياان عاماال ب اراي اهــداف مشــخص ،راه
ه ــای مختلف ــی دارد ،کااه راه ح اال بهت اار ب اارای
عامل سودمندتر است.
وقتای اهداف متضـاد باشاند ،بعضـ ی از
آنها برآورده ميشوند
اگاار هيچيــک از اهــداف بااه طااور قطعاای
قابل حصاول نباشاند ،احتماال موفقيات باا
اهميت هدف مقايسه ميشود
حاالجهان چگونه است
محيط
تــابع ســودمندی ،حالاات يااا دنبالااه ای از
حال ه ا ااا را ب ا ااه ي ا ااک ع ا اادد حقيق ـ ــی نگاش ا اات
ميکن ا ا ااد ک ا ا ااه درج ـ ـ ــه رض ـ ـ ــايت را توص ا ا اايف
ِميکند.
وضعيت
دز صورت انجام
عمل Aجهان
چگونه خواهد
بود؟
در چنين حالتی چقدر
رضايت دارم
اکنون چه عملی بايد
انجام دهم
محرکها
جهان چگونه
در مي آيد؟
عملكردهاي من
چه مي كنند؟
سودمند
عامل
عاملهای هوشمند
عاملهای يادگيرنده
استاندارد کارايي
عنصا ا ا ا ِار ِ يادگيرنـ ـ ـ ــده مس ا ا ا ا ول ايجا ا ا اااد
بهبودها
محيط
مول ـ ـ ـ ـ ـ ــد مس ـ ـ ـ ـ ـ ـ له مس ا ا ا ا ا ا ول پيشا ا ا ا ا اانهاد
فعالي ه ا ااايي اس ا اات ک ا ااه منج ا اار ب ا ااه تجربي ا اات
آموزنده جديدی ميشود
عنصر کارايي
تغييرات
دانش
عنصر
يادگيرنده
اهداف
يادگيری
منتقد مشخص ميکند که يادگيرناده باا
توجه به استانداردهای کارايي چگونه عمل
ميکند
بازخورد
عنص ا ا ا ا ا اار ک ـ ـ ـ ـ ـ ــارايي مس ا ا ا ا ا ا ول انتخ ا ا ا ا ا اااب
فعالي های خارجی
حسگرها
منتقد
مولد مس له
محرکها
عامل