اسلاید دوم

Download Report

Transcript اسلاید دوم

‫هوش مصنوعي‬
Artificial Intelligenceَ
‫حامد صباغ‬
Http://www.h-sabbagh.ir
Email:[email protected]
‫پيترنورويگ‬-‫استوارت راسل‬
‫دانشگاه پیام نور مركزبیرجند‬
‫فصل دوم‬
‫عاملهاي هوشمند‬
‫عامل هوشمند‬
‫• عامل‬
‫– هر چیزی که محیط خود را از طریق حس گرها ادراک می کند و از طریق‬
‫اقدام گرها(محرکها) در آن محیط اقدامی را انجام می دهد‪.‬‬
‫• عامل انسانی‬
‫– حس گرها‪ :‬چشم‪ ،‬گوش‪ ،‬دیگر اعضای حس ی‬
‫– اقدامگرها(محرکها) ‪ :‬دست‪ ،‬پا‪ ،‬دهان و دیگر اعضای بدن‬
‫• عامل روباتیک‬
‫– حس گرها‪ :‬دوربین‪ ،‬ردیاب مادون قرمز‬
‫– اقدام گر‪ :‬موتورهای گوناگون‬
‫عاملهای هوشمند‬
‫‪ ‬توالی ادراک‬
‫سابقه کامل هرچیزی است که عامل تاکنون درک کرده است‪.‬‬
‫‪ ‬تابع عامل‬
‫رفتارعامل توسط تابع عامل توصيف ميشود که هردنباله ادراک را به يک فعاليت‬
‫نقش ميکند‪.‬‬
‫‪f : P*  A‬‬
‫فعاليت‬
‫دنباله ادراک ‪ :‬تابع عامل‬
‫عاملهای هوشمند‬
‫‪ ‬عامل‬
‫ادراک ها‬
‫محيط‬
‫حسگرها‬
‫?‬
‫فعاليت ها‬
‫محرکها‬
‫عامل‬
‫• تابع عامل را می توانیم به صورت جدول نشان دهیم‪ ،‬تا هر عامل را‬
‫تشریح کند‪ .‬برای اغلب عامل ها این جدول بسیار بزرگ خواهد بود‪،‬‬
‫ولی می توانیم حدی را برای طول دنباله ادراک در نظر بگیریم‪.‬‬
‫• برای ساخت جدول عامل‪ ،‬تمام دنباله های ادراک را در نظر گرفته و‬
‫فعالیتهایی که عامل در پاسخ به آنها انجام می دهد را ذخیره می کنیم‪.‬‬
‫دنیای جاروبرقی‬
‫•‬
‫•‬
‫•‬
‫•‬
‫فقط دو مکان دارد‪ :‬مربع ‪ A‬و مربع ‪B‬‬
‫عامل جاروبرقی درک می کند که در کدام مکان قرار دارد و آیا گرد و‬
‫خاک در آن مکان وجود دارد یا خیر‪.‬‬
‫میتواند‪ :‬به چپ یا راست برود‪ .‬گرد و خاک را مکش کند‪ .‬یا هیچ کاری‬
‫انجام ندهد‪.‬‬
‫تابع عامل ساده‪ :‬اگر مربع فعلی کثیف است‪ ،‬آن را تمیز کن وگرنه به‬
‫مربع دیگر برو‪.‬‬
‫• شکل ‪2.3‬‬
‫عامل عقالنی(خردمند)‬
‫• عاملی است که رفتار درست انجام می دهد‪.‬‬
‫• وقتی عامل در محیط قرار گرفت براساس آنچه عامل از محیط‬
‫دریافت میکند دنباله ای از فعالیتها را انجام میدهد‪ ،‬اگر این دنباله‬
‫مطلوب باشد آنگاه این عامل به درستی عمل کرده است‪.‬‬
‫• برای هر رشته ادراکات ممکن‪ ،‬یک عامل عقالنی بر اساس شواهدی‬
‫که توسط رشته ادراکات و دانش درونی خود عامل فراهم شده است‪،‬‬
‫اقدامی را باید انتخاب کند که انتظار می رود مقیاس کارایی اش را‬
‫بیشینه کند‪.‬‬
‫‪ ‬معيارهای کارايي‬
‫‪ ‬معيارکارايي‪ ،‬معياری برای موفقيت رفتارعامل است‪.‬‬
‫• براساس خواسته های فرد در محيط انتخاب ميشود‬
‫•مثال‪:‬‬
‫• میزان گرد وخاکی که در مدت ‪ 8‬ساعت تمیز میشود‪.‬‬
‫•برای هرمربع تمیزیک امتیازو برای برق مصرفی و سروصدا امتیازمنفی درنظر‬
‫گرفت‪.‬‬
‫•معیارکارایی باید براساس خواسته های واقعی فرد در محیط باشد‪.‬‬
‫‪ ‬رفتارعقاليي(خردمند بودن)‬
‫‪ ‬خرد مند بودن درهرزمان به چهارچیزبستگی دارد‪:‬‬
‫‪‬معيارکارايي که مالکهای موفقيت را تعريف ميکند‬
‫‪ ‬دانش قبلي عامل نسبت به محيط‬
‫‪ ‬فعاليتهايي که عامل ميتواند انجام دهد‬
‫‪ ‬دنباله ادراک عامل دراين زمان‬
‫عامل خرد مند‬
‫• برای هر دنباله از ادراک ممکن‪ ،‬عامل خردمند باید فعالیتی را انتخاب‬
‫کند که انتظار می رود معیار کارایی اش را به حداکثر برساند‪ .‬این کار‬
‫با توجه به شواهدی که از طریق این دنباله ادراک به دست می آید و‬
‫دانش درونی عامل‪ ،‬صورت می گیرد‪.‬‬
‫• مثال‪ :‬عامل جاروبرقی‪...‬‬
‫عامل خردمند‬
‫(‪)Rational agent‬‬
‫فعاليتی را انتخاب ميکند که معيارکارايي اش را حداکثرميکند‬
‫• جمع آوری اطالعات‪ ،‬اکتشاف‪ ،‬يادگیری‬
‫‪ ‬عامل عالِـم‬
‫)‪)Omni science‬‬
‫‪‬خروجی واقعی فعاليت خود را ميداند و ميتواند براساس آن عمل کند‬
‫‪‬عامل خود مختار‬
‫‪‬نقص دانش قبلی خود را ميتواند جبران کند‬
‫همه چیزدانی‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫یک عامل همه چیز دان نتیجه واقعی اقداماتش را می داند و بر این‬
‫اساس می تواند عمل کند‪.‬‬
‫همه چیزدانی در واقعیت غیر ممکن است‪.‬‬
‫مثال اگر در حال عبور از خیابان هستید‪ ،‬درب یک هواپیما که در‬
‫حال عبور از باالی سر شماست‪ ،‬کنده می شود و روی سر شما می‬
‫افتد؟ آیا در هنگام عبور‪ ،‬تصمیم عقالنی نگرفته بودید؟‬
‫علت بروز این مشکل‪ ،‬این است که شما همه چیز را نمی دانید‪.‬‬
‫پس عقالنیت با کمال یکی نیست‪.‬‬
‫عامل خودمختار‬
‫• به اندازه ای که یک عامل به جای ادراکات خودش‪ ،‬به دانش قبلیش‬
‫که طراح در آن تعبیه کرده است تکیه می کند‪ ،‬این عامل کمبود‬
‫خودمختاری دارد‪.‬‬
‫• یک عامل عقالنی باید برای اصالح دانش غلط یا ناقص قبلی‪،‬‬
‫خودمختار باشد و باید یاد بگیر که نقص دانش قبلی را چگونه جبران‬
‫کند‪.‬‬
‫ماهیت محیطها‬
‫حسگرها‬
‫عامل‬
‫مقیاس کارایی‬
‫محیط‬
‫اقدامگرها‬
‫راننده تاکس ی‬
‫امن‪ ،‬سریع‪،‬‬
‫قانونی‪ ،‬سفر‬
‫راحت‬
‫جاده ها‪،‬‬
‫عابرین پیاده‪،‬‬
‫مشتریان‬
‫فرمان‪ ،‬گاز‪،‬‬
‫ترمز‪ ،‬چراغها‪،‬‬
‫بوق‬
‫‪Performance‬‬
‫دوربین‪ ،‬حسگر ‪Environment‬‬
‫صوتی‪ ،‬سرعت‬
‫‪Actuator‬‬
‫سنج‪،GPS ،‬‬
‫‪Sensor‬‬
‫کیلومترشمار‬
‫معلم انگلیس ی‬
‫محاوره ای‬
‫بیشینه کردن‬
‫نمره دانش آموز‬
‫دانش آموزان‪،‬‬
‫موسسه‬
‫امتحان گیرنده‬
‫نمایش تمرینها‪،‬‬
‫پیشنهدادت‬
‫ورودی صفحه‬
‫کلید‬
‫روبات قطعه‬
‫بردار‬
‫درصد قطعاتی‬
‫که درست در‬
‫جای خود قرار‬
‫گرفته اند‬
‫کمربند نقاله‪،‬‬
‫قطعات‬
‫بازو و دست‬
‫مفصل دار‬
‫دوربین‪ ،‬حس‬
‫گرهای زاویه‬
‫مفصل‬
‫‪• PEAS‬‬
‫–‬
‫–‬
‫–‬
‫–‬
‫عاملهای هوشمند‬
‫ً‬
‫‪ ‬کامال قابل مشاهده درمقابل قابليت مشاهده جزئی‬
‫‪ ‬قطعي درمقابل غیر قطعی‬
‫‪ ‬راهبردی‬
‫‪ ‬رويدادی درمقابل ترتيبي‬
‫‪ ‬ايستا درمقابل پويا‬
‫‪ ‬گسسته درمقابل پيوسته‬
‫‪ ‬تک عاملي درمقابل چند عاملي‬
‫‪‬چند عاملي رقابتي درمقابل چندعاملي مشارکتی‬
‫خواص‬
‫محيط های‬
‫وظيفه‬
‫خواص محيط های وظيفه‬
‫ً‬
‫• کامال قابل مشاهده درمقابل پاره ای قابل مشاهده‬
‫– اگر حس گرهای یک عامل‪ ،‬امکان دسترس ی به وضعیت کامل محیط در هر لحظه از زمان را به عامل‬
‫بدهند‪ ،‬محیط کامال رویت پذیراست‪.‬‬
‫– پاره ای قابل مشاهده‪ :‬محیط ممکن است به دلیل وجود حسگرهای شلوغ و غیردقیق‪ ،‬از دست دادن‬
‫بخش ی از حالت توسط حسگر‪ ،‬کامال قابل مشاهده نباشد‪ .‬جاروبرقی با یک حسگر نمی تواند تشخیص‬
‫دهد مربع دیگر کثیف است یا خیر‪.‬‬
‫– اگر عامل فاقد سنسور باشد آنگاه محیط غیرقابل مشاهده است‪.‬‬
‫• قطعي درمقابل غیر قطعی‬
‫– اگر بر اساس وضعیت فعلی و اقدامی که توسط عامل اجرا می شود‪ ،‬وضعیت بعدی محیط به طور کامل‬
‫تعیین شود محیط قطعی(دنیای جاروبرقی) و در غیر اینصورت اتفاقی است(راننده تاکس ی‪ ،‬رفتار ترافیکی را‬
‫نمی تواند پیش بینی کند)‬
‫– اگر یک محیط کامال قابل مشاهده نباشد یا غیر قطعی باشد میگوییم این محیط غیرقابل اعتماد است‪.‬‬
‫خواص محيط های وظيفه‬
‫• مرحله ای درمقابل ترتيبي‬
‫– در یک محیط مرحله ای‪ ،‬تجربه عامل به بخشهای مجزا تقسیم می شود‪ .‬در هر مرحله‪ ،‬عامل چیزی را‬
‫درک میکند و یک عمل را براساس آن انجام می دهد‪ .‬هر مرحله مستقل اجرا می شود و اقداماتش به‬
‫اقدامات بخشهای دیگر ربطی ندارد‪ .‬یعنی انتخاب اقدام در هر مرحله‪ ،‬تنها به خود همان مرحله بستگی‬
‫دارد‪ .‬مانند کارهای دسته بندی و طبقه بندی‪ ،‬عامل شناسایی قطعات معیوب در خط مونتاژ‬
‫– در محیط ترتیبی تصمیم فعلی‪ ،‬می تواند بر تمام تصمیمات بعدی تاثیر بگذارد‪ .‬مانند شطرنج و راننده‬
‫تاکس ی‬
‫• ايستا در مقابل پويا‬
‫– اگر در حالی که عامل تعمق می کند‪ ،‬محیط تغییر کند محیط برای آن عامل‪ ،‬پویا است(رانندگی تاکس ی)‪.‬‬
‫وگرنه ایستا است(جدول کلمات متقاطع)‬
‫– اگر با گذشت زمان‪ ،‬محیط تغییر نکند اما بر امتیاز کارایی تاثیر بگذارد‪ ،‬محیط نیمه پویا است(شطرنج)‪.‬‬
‫خواص محيط های وظيفه‬
‫• گسسته درمقابل پیوسته‬
‫– تعداد محدودی حالت متمایز(مجزای متناهی) داشته باشد‪ ،‬مجموعه گسسته ای از ادراکات و اقدامات‬
‫داشته باشد ‪ ‬محیط گسسته(شطرنج)‬
‫– پیوسته‪ :‬رانندگی تاکس ی‪ ،‬زمان‪ ،‬سرعت و مکان تاکس ی‬
‫• تک عاملی در مقابل چندعاملی‬
‫– تعداد عاملها در محیط ( جدول کلمات متقاطع تک عاملی است‪ .‬شطرنج دو عاملی است)‬
‫– محیط چند عامله رقابتی‬
‫• یک عامل سعی می کند امتیاز خود را بیشینه و امتیاز رقیبش را کمینه کند‪( .‬شطرنج)‬
‫– محیط چند عامله مشارکتی(همیاری)‬
‫• هر عامل سعی می کند مقیاس کارایی تمام عاملها را بیشینه کند (راننده تاکس ی‪ ،‬اجتناب از تصادف ها)‬
‫• شناخته شده در مقابل ناشناخته‬
‫– این تمایز به خود محیط مربوط نمی شود‪ ،‬بلکه به حالت دانش عامل در مورد“قوانین فیزیکی“‬
‫محیط مربوط می شود‪.‬‬
‫مثال‬
‫محیط کار‬
‫رویت پذیر‬
‫قطعی‬
‫مرحله ای‬
‫ایستا‬
‫گسسته‬
‫چندعاملی‬
‫جدول کلمات متقاطع‬
‫کامال‬
‫قطعی‬
‫ترتیبی‬
‫ایستا‬
‫گسسته‬
‫تک عاملی‬
‫شطرنج زماندار‬
‫کامال‬
‫راهبردی‬
‫ترتیبی‬
‫نیمه پویا‬
‫گسسته‬
‫چندعاملی‬
‫راننده تاکس ی‬
‫نیمه‬
‫اتفاقی‬
‫ترتیبی‬
‫پویا‬
‫پیوسته‬
‫چندعاملی‬
‫روبات قطعه بردار‬
‫نیمه‬
‫اتفاقی‬
‫مرحله ای‬
‫پویا‬
‫پیوسته‬
‫تک عاملی‬
‫معلم انگلیس ی محاوره ای‬
‫نیمه‬
‫اتفاقی‬
‫ترتیبی‬
‫پویا‬
‫گسسته‬
‫چندعاملی‬
‫ساختارعاملها‬
‫رفتار‪ ،‬عملی است که پس از هر دنباله از ادراکات صورت می گیرد‪.‬‬
‫معماری‪ :‬یک دستگاه محاسباتی با حسگرها و محرک های فیزیکی‬
‫برنامه ای که انتخاب میکنیم باید با معماری متناسب باشد‪ .‬برنامه‪ :‬راه رفتن ‪ ،‬معماری باید پا داشته‬
‫باشد‬
‫برنامه ‪ +‬معماری = عامل‬
‫کارهوش مصنوعی طراحی برنامه عامل است که تابع عامل را پياده سازی ميکند‬
‫برنامه های عامل‪ :‬درک فعلی را به عنوان ورودی ازحسگردریافت می کنند و‬
‫فعالیت را ازطریق محرک انجام می دهند‬
‫‪ ‬عاملهای واکنش ی مدل گرا‬
‫‪ ‬عاملهای واکنش ی ساده‬
‫‪‬عاملهای هدف گرا‬
‫‪‬عاملهای سودمند‬
‫عاملهای واکنش ی ساده‬
‫چهارگوش‪ :‬نشان دادن حالت داخلی فعلی مربوط به فرآیند‬
‫تصمیم گیری عامل‬
‫بیض ی‪ :‬برای نمایش اطالعات ضمنی که در پردازش بکار رفته‬
‫‪‬اين عاملها فعاليت را بر اساس‬
‫درک فعلی و بدون در نظر گرفتن‬
‫سابقه ادراک‪ ،‬انتخاب ميکند‬
‫حسگرها‬
‫‪‬به خاطر حذف سابقه ادراک‬
‫برنامه عامل در مقايسه با جدول آن‬
‫بسيارکوچک است‬
‫‪‬در صورتی درست کار میکند که تصمیم‬
‫درستی بر اساس ادراک فعلی اتخاذ گردد‪.‬‬
‫‪‬اگر اتومبیل جلویی ترمز کرد‪ ،‬آنگاه اقدام‬
‫به ترمز کن‬
‫جهان چگونه است‬
‫محيط‬
‫‪‬انتخاب فعاليت بر اساس يکسری‬
‫قوانین موقعيت شرطي انجام‬
‫ميشود)‪(if-then-else‬‬
‫عامل‬
‫اکنون چه عملی بايد‬
‫انجام دهم‬
‫محرکها‬
‫قانون‬
‫شرط عمل‬
‫مثالي ازعامل واکنش ی ساده دردنيای جاروبرقي‬
‫‪‬تصممميم گیممری آن بممر اسمماس مکـان‬
‫فعل ـ ـ ـ ــی و کثي ـ ـ ـ ــف ب ـ ـ ـ ــودن آن مک م م م ممان‬
‫صورت ميگیرد‬
‫‪‬در برنام م ممه عام م ممل در مقايس م ممه ب م مما‬
‫ج ممدول آن‪ ،‬تع ممداد حالته ممای ممک ممن از‬
‫‪ 4‬به ‪ 4‬کاهش مي يابد‬
‫)]‪function REFLEX-VACUUM-AGENT ([location, status‬‬
‫‪‬انتخ م م م مماب فعالي م م م ممت ب م م م ممر اس م م م مماس‬
‫موقعيت شرطي‪:‬‬
‫‪If dirty then suck‬‬
‫‪return an action‬‬
‫‪if status == Dirty then return Suck‬‬
‫‪else if location == A then return Right‬‬
‫‪else if location == B then return Left‬‬
‫عاملهای واکنش ي مدل گرا‬
‫‪‬اس م م م ممتفاده از دان م م م ممش “چگ ـ ـ ـ ــونگی‬
‫عملکرد جهان” که مدل نام دارد‬
‫حسگرها‬
‫‪‬عامل بخش ي از دنيايي را که فعمال‬
‫ميبينممد رديــابی ميکنممد و بخش م ی را کممه‬
‫فعال نمی تواند ببیند نگهداری کند‪.‬‬
‫‪‬در ه م ممر وض م ممعيت‪ ,‬عامم ممل ميتوانم ممد‬
‫توصــيف جديــدی از جهممان را کسممب‬
‫کند‬
‫محيط‬
‫‪‬عامل بايمد حالت داخلـي را ذخیمره‬
‫کن م ممد ک م ممه ب م ممه س ـ ــابقه ادراک بس م ممتگي‬
‫دارد‬
‫جهان چگونه است‬
‫حالت‬
‫جهان چگونه‬
‫تکامل می يابد‬
‫کار فعاليت‬
‫چيست‬
‫اکنون چه عملی بايد‬
‫انجام دهم‬
‫قانون‬
‫شرط عمل‬
‫محرکها‬
‫عامل‬
‫عاملهای هدف گرا‬
‫حسگرها‬
‫‪‬اي م ممن عام م ممل ع م ممالوه ب م ممر توص م مميف حالم م ممت‬
‫فعلم م ممی‪ ،‬ب م م مرای انتخم م مماب موقعيـ ـ ــت مطلـ ـ ــوب‬
‫نيازمند اطالعات هدف نیز ميباشد‬
‫جهان چگونه است‬
‫محيط‬
‫‪‬جست و جو و برنامه ريـزی‪ ،‬دنبالمه ای از‬
‫فعاليتهم مما را ب م مرای رسم مميدن عامم ممل بم ممه هم ممدف‪،‬‬
‫پيدا ميکند‬
‫حالت‬
‫اگر فعاليت ‪ A‬را‬
‫انجام دهم چه خواهد‬
‫شد‬
‫‪‬اين نوع تصميم گیری همواره آينـده را در‬
‫نظم ممر دارد و بم مما قم مموانین شم ممرط عمم ممل تفم مماوت‬
‫دارد‬
‫اکنون چه عملی بايد‬
‫انجام دهم‬
‫‪‬ايممن نمموع عامممل کممارایي چنممدانی نممدارد‪ ،‬ام ما‬
‫قابليت انعطاف بيشتری دارد‬
‫محرکها‬
‫جهان چگونه‬
‫تکامل می يابد‬
‫کار فعاليت‬
‫چيست‬
‫اهداف‬
‫عامل‬
‫عاملهای سودمند‬
‫‪‬اي ممن عام ممل بم مرا اهـ ــداف م ـ ـ ص‪ ،‬راه‬
‫هـ ــای مختلفـ ــی دارد‪ ،‬ک ممه راه ح ممل هت ممر ب ممرای‬
‫عامل سودمندتر است‪.‬‬
‫‪‬وقتممی اهــداف متدــاد باشممند‪ ،‬بعض ـ ی از‬
‫آنها برآورده ميشوند‬
‫‪‬اگ ممر هيچي ــک ازاه ــداف ب ممه ط ممور قطع ممی‬
‫قابممل حصممول نباشممند‪ ،‬احتمممال موفقيممت بمما‬
‫اهميت هدف مقايسه ميشود‬
‫جهان چگونه است‬
‫محيط‬
‫‪‬ت ــابع س ــودمندی‪ ،‬حال ممت ي مما دنبال ممه ای از‬
‫حالتها را به يمک عمدد حقيقـی نگاشمت ميکنمد‬
‫که درجه رضايت را توصيف ِميکند‪.‬‬
‫حسگرها‬
‫حالت‬
‫اگر فعاليت ‪ A‬را‬
‫انجام دهم چه خواهد‬
‫شد‬
‫درچنین حالتی چقدر‬
‫رضايت دارم‬
‫اکنون چه عملی بايد‬
‫انجام دهم‬
‫محرکها‬
‫جهان چگونه‬
‫تکامل می يابد‬
‫کار فعاليت‬
‫چيست‬
‫سودمند‬
‫عامل‬
‫عاملهای يادگیرنده‬
‫استاندارد کارايي‬
‫‪ ‬عنص م م م م ِمر ِ يادگیرن ـ ـ ـ ــده مس م م م م ول ايج م م م مماد‬
‫هبودها‬
‫محيط‬
‫‪‬مولد مسئله مسم ول پيشمنهاد فعاليتهمایي‬
‫اس م م ممت ک م م ممه منج م م ممر ب م م ممه تجربي م م ممات آموزن م م ممده‬
‫جديدی ميشود‬
‫عنصرکارايي‬
‫تغيیرات‬
‫دانش‬
‫عنصر‬
‫يادگیرنده‬
‫اهداف‬
‫يادگیری‬
‫‪‬منتقــد مشممخص ميکنممد کممه يادگیرنممده بمما‬
‫توجممه بممه اسممتانداردهای کممارایي چگونممه عمممل‬
‫ميکند‬
‫بازخورد‬
‫‪‬عنصر کارايي مس ول انتخماب فعاليتهمای‬
‫خارجی‬
‫حسگرها‬
‫منتقد‬
‫مولد مسئله‬
‫محرکها‬
‫عامل‬