Transcript اسلاید دوم
هوش مصنوعي
Artificial Intelligenceَ
حامد صباغ
Http://www.h-sabbagh.ir
Email:[email protected]
پيترنورويگ-استوارت راسل
دانشگاه پیام نور مركزبیرجند
فصل دوم
عاملهاي هوشمند
عامل هوشمند
• عامل
– هر چیزی که محیط خود را از طریق حس گرها ادراک می کند و از طریق
اقدام گرها(محرکها) در آن محیط اقدامی را انجام می دهد.
• عامل انسانی
– حس گرها :چشم ،گوش ،دیگر اعضای حس ی
– اقدامگرها(محرکها) :دست ،پا ،دهان و دیگر اعضای بدن
• عامل روباتیک
– حس گرها :دوربین ،ردیاب مادون قرمز
– اقدام گر :موتورهای گوناگون
عاملهای هوشمند
توالی ادراک
سابقه کامل هرچیزی است که عامل تاکنون درک کرده است.
تابع عامل
رفتارعامل توسط تابع عامل توصيف ميشود که هردنباله ادراک را به يک فعاليت
نقش ميکند.
f : P* A
فعاليت
دنباله ادراک :تابع عامل
عاملهای هوشمند
عامل
ادراک ها
محيط
حسگرها
?
فعاليت ها
محرکها
عامل
• تابع عامل را می توانیم به صورت جدول نشان دهیم ،تا هر عامل را
تشریح کند .برای اغلب عامل ها این جدول بسیار بزرگ خواهد بود،
ولی می توانیم حدی را برای طول دنباله ادراک در نظر بگیریم.
• برای ساخت جدول عامل ،تمام دنباله های ادراک را در نظر گرفته و
فعالیتهایی که عامل در پاسخ به آنها انجام می دهد را ذخیره می کنیم.
دنیای جاروبرقی
•
•
•
•
فقط دو مکان دارد :مربع Aو مربع B
عامل جاروبرقی درک می کند که در کدام مکان قرار دارد و آیا گرد و
خاک در آن مکان وجود دارد یا خیر.
میتواند :به چپ یا راست برود .گرد و خاک را مکش کند .یا هیچ کاری
انجام ندهد.
تابع عامل ساده :اگر مربع فعلی کثیف است ،آن را تمیز کن وگرنه به
مربع دیگر برو.
• شکل 2.3
عامل عقالنی(خردمند)
• عاملی است که رفتار درست انجام می دهد.
• وقتی عامل در محیط قرار گرفت براساس آنچه عامل از محیط
دریافت میکند دنباله ای از فعالیتها را انجام میدهد ،اگر این دنباله
مطلوب باشد آنگاه این عامل به درستی عمل کرده است.
• برای هر رشته ادراکات ممکن ،یک عامل عقالنی بر اساس شواهدی
که توسط رشته ادراکات و دانش درونی خود عامل فراهم شده است،
اقدامی را باید انتخاب کند که انتظار می رود مقیاس کارایی اش را
بیشینه کند.
معيارهای کارايي
معيارکارايي ،معياری برای موفقيت رفتارعامل است.
• براساس خواسته های فرد در محيط انتخاب ميشود
•مثال:
• میزان گرد وخاکی که در مدت 8ساعت تمیز میشود.
•برای هرمربع تمیزیک امتیازو برای برق مصرفی و سروصدا امتیازمنفی درنظر
گرفت.
•معیارکارایی باید براساس خواسته های واقعی فرد در محیط باشد.
رفتارعقاليي(خردمند بودن)
خرد مند بودن درهرزمان به چهارچیزبستگی دارد:
معيارکارايي که مالکهای موفقيت را تعريف ميکند
دانش قبلي عامل نسبت به محيط
فعاليتهايي که عامل ميتواند انجام دهد
دنباله ادراک عامل دراين زمان
عامل خرد مند
• برای هر دنباله از ادراک ممکن ،عامل خردمند باید فعالیتی را انتخاب
کند که انتظار می رود معیار کارایی اش را به حداکثر برساند .این کار
با توجه به شواهدی که از طریق این دنباله ادراک به دست می آید و
دانش درونی عامل ،صورت می گیرد.
• مثال :عامل جاروبرقی...
عامل خردمند
()Rational agent
فعاليتی را انتخاب ميکند که معيارکارايي اش را حداکثرميکند
• جمع آوری اطالعات ،اکتشاف ،يادگیری
عامل عالِـم
))Omni science
خروجی واقعی فعاليت خود را ميداند و ميتواند براساس آن عمل کند
عامل خود مختار
نقص دانش قبلی خود را ميتواند جبران کند
همه چیزدانی
•
•
•
•
•
یک عامل همه چیز دان نتیجه واقعی اقداماتش را می داند و بر این
اساس می تواند عمل کند.
همه چیزدانی در واقعیت غیر ممکن است.
مثال اگر در حال عبور از خیابان هستید ،درب یک هواپیما که در
حال عبور از باالی سر شماست ،کنده می شود و روی سر شما می
افتد؟ آیا در هنگام عبور ،تصمیم عقالنی نگرفته بودید؟
علت بروز این مشکل ،این است که شما همه چیز را نمی دانید.
پس عقالنیت با کمال یکی نیست.
عامل خودمختار
• به اندازه ای که یک عامل به جای ادراکات خودش ،به دانش قبلیش
که طراح در آن تعبیه کرده است تکیه می کند ،این عامل کمبود
خودمختاری دارد.
• یک عامل عقالنی باید برای اصالح دانش غلط یا ناقص قبلی،
خودمختار باشد و باید یاد بگیر که نقص دانش قبلی را چگونه جبران
کند.
ماهیت محیطها
حسگرها
عامل
مقیاس کارایی
محیط
اقدامگرها
راننده تاکس ی
امن ،سریع،
قانونی ،سفر
راحت
جاده ها،
عابرین پیاده،
مشتریان
فرمان ،گاز،
ترمز ،چراغها،
بوق
Performance
دوربین ،حسگر Environment
صوتی ،سرعت
Actuator
سنج،GPS ،
Sensor
کیلومترشمار
معلم انگلیس ی
محاوره ای
بیشینه کردن
نمره دانش آموز
دانش آموزان،
موسسه
امتحان گیرنده
نمایش تمرینها،
پیشنهدادت
ورودی صفحه
کلید
روبات قطعه
بردار
درصد قطعاتی
که درست در
جای خود قرار
گرفته اند
کمربند نقاله،
قطعات
بازو و دست
مفصل دار
دوربین ،حس
گرهای زاویه
مفصل
• PEAS
–
–
–
–
عاملهای هوشمند
ً
کامال قابل مشاهده درمقابل قابليت مشاهده جزئی
قطعي درمقابل غیر قطعی
راهبردی
رويدادی درمقابل ترتيبي
ايستا درمقابل پويا
گسسته درمقابل پيوسته
تک عاملي درمقابل چند عاملي
چند عاملي رقابتي درمقابل چندعاملي مشارکتی
خواص
محيط های
وظيفه
خواص محيط های وظيفه
ً
• کامال قابل مشاهده درمقابل پاره ای قابل مشاهده
– اگر حس گرهای یک عامل ،امکان دسترس ی به وضعیت کامل محیط در هر لحظه از زمان را به عامل
بدهند ،محیط کامال رویت پذیراست.
– پاره ای قابل مشاهده :محیط ممکن است به دلیل وجود حسگرهای شلوغ و غیردقیق ،از دست دادن
بخش ی از حالت توسط حسگر ،کامال قابل مشاهده نباشد .جاروبرقی با یک حسگر نمی تواند تشخیص
دهد مربع دیگر کثیف است یا خیر.
– اگر عامل فاقد سنسور باشد آنگاه محیط غیرقابل مشاهده است.
• قطعي درمقابل غیر قطعی
– اگر بر اساس وضعیت فعلی و اقدامی که توسط عامل اجرا می شود ،وضعیت بعدی محیط به طور کامل
تعیین شود محیط قطعی(دنیای جاروبرقی) و در غیر اینصورت اتفاقی است(راننده تاکس ی ،رفتار ترافیکی را
نمی تواند پیش بینی کند)
– اگر یک محیط کامال قابل مشاهده نباشد یا غیر قطعی باشد میگوییم این محیط غیرقابل اعتماد است.
خواص محيط های وظيفه
• مرحله ای درمقابل ترتيبي
– در یک محیط مرحله ای ،تجربه عامل به بخشهای مجزا تقسیم می شود .در هر مرحله ،عامل چیزی را
درک میکند و یک عمل را براساس آن انجام می دهد .هر مرحله مستقل اجرا می شود و اقداماتش به
اقدامات بخشهای دیگر ربطی ندارد .یعنی انتخاب اقدام در هر مرحله ،تنها به خود همان مرحله بستگی
دارد .مانند کارهای دسته بندی و طبقه بندی ،عامل شناسایی قطعات معیوب در خط مونتاژ
– در محیط ترتیبی تصمیم فعلی ،می تواند بر تمام تصمیمات بعدی تاثیر بگذارد .مانند شطرنج و راننده
تاکس ی
• ايستا در مقابل پويا
– اگر در حالی که عامل تعمق می کند ،محیط تغییر کند محیط برای آن عامل ،پویا است(رانندگی تاکس ی).
وگرنه ایستا است(جدول کلمات متقاطع)
– اگر با گذشت زمان ،محیط تغییر نکند اما بر امتیاز کارایی تاثیر بگذارد ،محیط نیمه پویا است(شطرنج).
خواص محيط های وظيفه
• گسسته درمقابل پیوسته
– تعداد محدودی حالت متمایز(مجزای متناهی) داشته باشد ،مجموعه گسسته ای از ادراکات و اقدامات
داشته باشد محیط گسسته(شطرنج)
– پیوسته :رانندگی تاکس ی ،زمان ،سرعت و مکان تاکس ی
• تک عاملی در مقابل چندعاملی
– تعداد عاملها در محیط ( جدول کلمات متقاطع تک عاملی است .شطرنج دو عاملی است)
– محیط چند عامله رقابتی
• یک عامل سعی می کند امتیاز خود را بیشینه و امتیاز رقیبش را کمینه کند( .شطرنج)
– محیط چند عامله مشارکتی(همیاری)
• هر عامل سعی می کند مقیاس کارایی تمام عاملها را بیشینه کند (راننده تاکس ی ،اجتناب از تصادف ها)
• شناخته شده در مقابل ناشناخته
– این تمایز به خود محیط مربوط نمی شود ،بلکه به حالت دانش عامل در مورد“قوانین فیزیکی“
محیط مربوط می شود.
مثال
محیط کار
رویت پذیر
قطعی
مرحله ای
ایستا
گسسته
چندعاملی
جدول کلمات متقاطع
کامال
قطعی
ترتیبی
ایستا
گسسته
تک عاملی
شطرنج زماندار
کامال
راهبردی
ترتیبی
نیمه پویا
گسسته
چندعاملی
راننده تاکس ی
نیمه
اتفاقی
ترتیبی
پویا
پیوسته
چندعاملی
روبات قطعه بردار
نیمه
اتفاقی
مرحله ای
پویا
پیوسته
تک عاملی
معلم انگلیس ی محاوره ای
نیمه
اتفاقی
ترتیبی
پویا
گسسته
چندعاملی
ساختارعاملها
رفتار ،عملی است که پس از هر دنباله از ادراکات صورت می گیرد.
معماری :یک دستگاه محاسباتی با حسگرها و محرک های فیزیکی
برنامه ای که انتخاب میکنیم باید با معماری متناسب باشد .برنامه :راه رفتن ،معماری باید پا داشته
باشد
برنامه +معماری = عامل
کارهوش مصنوعی طراحی برنامه عامل است که تابع عامل را پياده سازی ميکند
برنامه های عامل :درک فعلی را به عنوان ورودی ازحسگردریافت می کنند و
فعالیت را ازطریق محرک انجام می دهند
عاملهای واکنش ی مدل گرا
عاملهای واکنش ی ساده
عاملهای هدف گرا
عاملهای سودمند
عاملهای واکنش ی ساده
چهارگوش :نشان دادن حالت داخلی فعلی مربوط به فرآیند
تصمیم گیری عامل
بیض ی :برای نمایش اطالعات ضمنی که در پردازش بکار رفته
اين عاملها فعاليت را بر اساس
درک فعلی و بدون در نظر گرفتن
سابقه ادراک ،انتخاب ميکند
حسگرها
به خاطر حذف سابقه ادراک
برنامه عامل در مقايسه با جدول آن
بسيارکوچک است
در صورتی درست کار میکند که تصمیم
درستی بر اساس ادراک فعلی اتخاذ گردد.
اگر اتومبیل جلویی ترمز کرد ،آنگاه اقدام
به ترمز کن
جهان چگونه است
محيط
انتخاب فعاليت بر اساس يکسری
قوانین موقعيت شرطي انجام
ميشود)(if-then-else
عامل
اکنون چه عملی بايد
انجام دهم
محرکها
قانون
شرط عمل
مثالي ازعامل واکنش ی ساده دردنيای جاروبرقي
تصممميم گیممری آن بممر اسمماس مکـان
فعل ـ ـ ـ ــی و کثي ـ ـ ـ ــف ب ـ ـ ـ ــودن آن مک م م م ممان
صورت ميگیرد
در برنام م ممه عام م ممل در مقايس م ممه ب م مما
ج ممدول آن ،تع ممداد حالته ممای ممک ممن از
4به 4کاهش مي يابد
)]function REFLEX-VACUUM-AGENT ([location, status
انتخ م م م مماب فعالي م م م ممت ب م م م ممر اس م م م مماس
موقعيت شرطي:
If dirty then suck
return an action
if status == Dirty then return Suck
else if location == A then return Right
else if location == B then return Left
عاملهای واکنش ي مدل گرا
اس م م م ممتفاده از دان م م م ممش “چگ ـ ـ ـ ــونگی
عملکرد جهان” که مدل نام دارد
حسگرها
عامل بخش ي از دنيايي را که فعمال
ميبينممد رديــابی ميکنممد و بخش م ی را کممه
فعال نمی تواند ببیند نگهداری کند.
در ه م ممر وض م ممعيت ,عامم ممل ميتوانم ممد
توصــيف جديــدی از جهممان را کسممب
کند
محيط
عامل بايمد حالت داخلـي را ذخیمره
کن م ممد ک م ممه ب م ممه س ـ ــابقه ادراک بس م ممتگي
دارد
جهان چگونه است
حالت
جهان چگونه
تکامل می يابد
کار فعاليت
چيست
اکنون چه عملی بايد
انجام دهم
قانون
شرط عمل
محرکها
عامل
عاملهای هدف گرا
حسگرها
اي م ممن عام م ممل ع م ممالوه ب م ممر توص م مميف حالم م ممت
فعلم م ممی ،ب م م مرای انتخم م مماب موقعيـ ـ ــت مطلـ ـ ــوب
نيازمند اطالعات هدف نیز ميباشد
جهان چگونه است
محيط
جست و جو و برنامه ريـزی ،دنبالمه ای از
فعاليتهم مما را ب م مرای رسم مميدن عامم ممل بم ممه هم ممدف،
پيدا ميکند
حالت
اگر فعاليت Aرا
انجام دهم چه خواهد
شد
اين نوع تصميم گیری همواره آينـده را در
نظم ممر دارد و بم مما قم مموانین شم ممرط عمم ممل تفم مماوت
دارد
اکنون چه عملی بايد
انجام دهم
ايممن نمموع عامممل کممارایي چنممدانی نممدارد ،ام ما
قابليت انعطاف بيشتری دارد
محرکها
جهان چگونه
تکامل می يابد
کار فعاليت
چيست
اهداف
عامل
عاملهای سودمند
اي ممن عام ممل بم مرا اهـ ــداف م ـ ـ ص ،راه
هـ ــای مختلفـ ــی دارد ،ک ممه راه ح ممل هت ممر ب ممرای
عامل سودمندتر است.
وقتممی اهــداف متدــاد باشممند ،بعض ـ ی از
آنها برآورده ميشوند
اگ ممر هيچي ــک ازاه ــداف ب ممه ط ممور قطع ممی
قابممل حصممول نباشممند ،احتمممال موفقيممت بمما
اهميت هدف مقايسه ميشود
جهان چگونه است
محيط
ت ــابع س ــودمندی ،حال ممت ي مما دنبال ممه ای از
حالتها را به يمک عمدد حقيقـی نگاشمت ميکنمد
که درجه رضايت را توصيف ِميکند.
حسگرها
حالت
اگر فعاليت Aرا
انجام دهم چه خواهد
شد
درچنین حالتی چقدر
رضايت دارم
اکنون چه عملی بايد
انجام دهم
محرکها
جهان چگونه
تکامل می يابد
کار فعاليت
چيست
سودمند
عامل
عاملهای يادگیرنده
استاندارد کارايي
عنص م م م م ِمر ِ يادگیرن ـ ـ ـ ــده مس م م م م ول ايج م م م مماد
هبودها
محيط
مولد مسئله مسم ول پيشمنهاد فعاليتهمایي
اس م م ممت ک م م ممه منج م م ممر ب م م ممه تجربي م م ممات آموزن م م ممده
جديدی ميشود
عنصرکارايي
تغيیرات
دانش
عنصر
يادگیرنده
اهداف
يادگیری
منتقــد مشممخص ميکنممد کممه يادگیرنممده بمما
توجممه بممه اسممتانداردهای کممارایي چگونممه عمممل
ميکند
بازخورد
عنصر کارايي مس ول انتخماب فعاليتهمای
خارجی
حسگرها
منتقد
مولد مسئله
محرکها
عامل