نسخه ارايه كتاب هوش مصنوعي پيام نور
Download
Report
Transcript نسخه ارايه كتاب هوش مصنوعي پيام نور
هوش مصنوعي
نام كتاب :هوش مصنوعي رهياتي نوين
مولف :راسل و نورويگ
مترجم :رامين رهنمون آناهيتا هماوندي
Artificial
Intelligence
ارايه كننده :حسن عسكرزاده
.
.
:AIبه طور رسمي در سال 1956مطرح شده است.
علل مطالعه :Al
• AIسعي دارد تا موجوديتهاي هوشمند را درک کند .از اين رو يکي از علل
مطالعه آن يادگيري بيشتر در مورد خودمان است.
• جالب و مفيد بودن موجوديتهاي هوشمند .
AIچيست؟
تعاريفي از AIکه به چهار قسمت تقسيم شدهاند:
•پردازش فکري و استداللي
ي
• پردازش رفتار
• ايدهآل هوشمندي (منطقي بودن)
• ارائه انساني
پردازشهاي فکري و استداللي
ايدهآل
هوشمندي
سيستمهايي که
به طور منطقي
فکر ميکنند
سيستمهايي که
مانند انسان فکر
ميکنند
سيستمهايي که
به طور منطقي
عمل ميکنند
سيستمهايي که
مانند انسان عمل
ميکنند
تمرکز بر روي پردازشهاي رفتاري
ارائه انساني
.1انسان گونه عمل کردن :رهيافت آزمون تورينگ
آزموني از کامپيوتر به عمل آيد ،و آزمون گيرنده نتواند دريابد که در آن طرف انسان قرار دارد يا کامپيوتر.
براي اين کار کامپيوتر بايد قابليتهاي زير را داشته باشد:
پردازش زبان طبيعي = محاوره
با زنمايي دانش= ذخيره اطالعات
استدالل خودکار= استدالل و استخراج
يادگيري ماشيني= کشف الگو و برون ريزي
تست تورينگ :اين آزمون از ارتباط فيزيکي مستقيم بين کامپيوتر و محقق اجتناب
ميکند.
به منظور قبول شدن در تست تورينگ کلي ،کامپيوتر به موارد زير احتياج دارد:
بينايي ماشين براي درک اشياء
روباتيک به منظور حرکت آنها
.2انساني فکر کردن :-رهيافت مدلسازي شناختي:
چگونگي شناسايي عملکرد افکار انسان:
-1درون گرايي
-2تجارب روانشناس ي
علوم شناختي :مدلهاي کامپيوتر از AIو همچنين تکنيکهاي روانشناختي را
گرد هم ميآورد تا بتواند تئوريهاي دقيقي از کارکرد ذهن انسان به دست
آورند.
.3منطقي فکر کردن :قوانين رهيافت تفکر
رمز «تفکر درست» :ارسطو سعي در کشف آن داشت.
قياس :از موضوعات مطرح شده توسط ارسط و ميباشد ،که الگوهايي براي ساختار
توافقي ايجاد کرد که همواره نتايج صحيحي به اندازه مقدمات صحيح به دست
ميآورد.
مثال« :سقراط انسان است ،تمام انسانها ميميرند ،پس سقراط خواهد مرد».
دو مشکل عمده در اين رسم منطقگرايي وجود دارد:
تبديل دانش غير رسمي به شکل رسمي توسط اعالم ،منطقي ساده نيست.
تفاوت عمدهاي بين قادر به حل مسئله بودن در اصول و انجام آن در عمل
وجود دارد.
.4منطقي عمل کردن :رهيافت عامل منطقي
عامل :در اصل چيزي است که ابتدا درک ميکند و سپس عمل ميکند.
در نگرش «قوانين تفکر» تأکيد عمده بر روي استنتاجهاي صحيح بوده است.
«مهارتهاي شناخت» که براي آزمون تورينگ موردنياز است ،براي انجام
فعاليتهاي منطقي وجود دارند.
مزاياي مطالعه AIبهعنوان طراحي عامل منطقي:
عموميتر از رهيافت «قوانين تفکر»
پيشرفت علمي ،بسيار قانونپذيرتر از رهيافتهايي است که بر تفکر
يا رفتار انساني متکي هستند.
زيربناي هوش مصنوعي:
،AIاز علوم مختلفي بهره ميبرد که از ميان آنها علوم زير مهمتر شناخته شدهاند:
علم فلسفه
علم رياض ي
علم روانشناس ي
علم زبانشناس ي
علم کامپيوتر
ن)
فلسفه 428( :قبل از ميالد مسيح – تاکنو
پايههاي تفکر و فرهنگ غرب تشکيل شده است از :افالطون ،استادش سقراط ،و
شاگردش ارسطو.
قياس :ارسطو ،سيستمي غيررسمي از قياس براي استدالل مناسب توسعه داد،
امکان توليد نتايج ،بر پايه فرضيات اوليه به طور مکانيکي وجود داشت.
در نظر گرفتن ذهن بهعنوان سيستمي فيزيکي
رنه دکارت مدافع سرسخت قدرت استدالل بود؛ و همچنين طرفدار مکتب دواليسم.
ماترياليسم :در مقابل دواليسم قرار دارد و معتقد است تمامي جهان مطابق قوانين فيزيکي عمل
ميکنند.
ويلهم اليبنيز:
تبديل موقعيت ماترياليستي به نتايج منطقي
ساخت ابزاري مکانيکي براي انجام عمليات منطقي
ايجاد منبع دانش:
فرانسيس بيکن ،جنبش آزمونگرايان را آغاز کرد .و با شعار جان الک مفهوم يافت:
«هيچ چيز قابل فهم نيست اگر ابتدا در حس نباشد».
اصل استقراي امروزي ،در حقيقت از کتاب ديويد هيوم نشأت ميگيرد" :رسانهاي از طبيعت
انسان"
برتراندراسل ،پايهگذار پوزيوتيزم منطقي ،ارائهدهندة اين تئوري بود که:
«قوانين عمومي توسط تکرار ارتباطات بين عناصر آنها به وجود ميآيند».
ارتباط بين دانش و عمل
اشياء را با تحليل ،دستهبندي ميکنيم و در اطراف آنها ،کارکرد مورد نيازشان نوسان مينمايد.
در اين ميان پايه سيستممکاشفهاي GPSبنيان گذارده ميشود.
رياضيات (- C.800تاکنون)
براي ارتباط فلسفه با دانش نظري ،نياز به فرمولسازي رياض ي در سه زمينه اصلي است:
محاسبات
منطق
احتماالت
محاسبات:
نظريه اظهار محاسبات به عنوان الگوريتمي رسمي به خوارزمي برميگردد ،رياضيدان
عربي قرن نهم که نوشتههاي وي ،جبر و تئوري اعداد عربي را به اروپا معرفي کرد.
منطق:
در اين زمينه ،دانشمندان زيادي بر چگونگي شکلگيري و هدايت آن ،نقش داشتهاند که به
چند نفر از آنها اشاره ميکنيم:
ارسطو :دانشمندي که بيشترين شکلگيري نگرش فلسفي منطق را به او نسبت ميدهند.
جورج بول :يک زبان رسمي براي ساخت استنتاج منطقي ارائه داد.
:FREGEمنطق مرتبه اول را به شکلي مطرح نمود که در بيشتر سيستمهاي نمايش
دانش پايه استفاده ميشود.
آلفرد تارسکي :تئوري چگونگي ارتباط بين اشياء موجود در محيط منطقي ،و اشياء موجود
در دنياي واقعي را ارائه نمود.
ديويد هيلبرت :رياضيدان بزرگي بود که شهرت وي به دليل مسائلي است که نتوانست
حل کند.
راسل :قضيه کامل نبودن ) (incompletenessرا مطرح نمود.
تورينگ :ماشين تورينگ قادر به محاسبه هر تابع محاسبهپذيري است.
تئوري پيچيدگي:
ي
.1انجامناپذير
.2استحاله
استيون کوک و ريچارد کارپ :تئوري NP-completenessرا مطرح کردند.
احتماالت:
گاردنيوي :اولين کس ي بود که ايده احتمال را مطرح کرد.
پير فرمت ،پاسکال ،برنولي ،الپالس و ديگر دانشمندان بر رشد و توسعه اين ايده تأثير
داشتند.
برنولي :ديدگاه «درجه باور» ذهني را در مقايسه با نرخ نتايج عيني مطرح کرد.
بيس :قانوني براي بهنگامسازي احتماالت ذهني را به وجود آورد.
نيومن و مورگنستر ن :تئوري تصميمگيري را آغاز کردند .و از ترکيب تئوري احتمال ،و
تئوري سودمندي حاصل ميشود.
ن):
روانشناس ي ( -1879تاکنو
هلمولتز :روش ي علمي براي مطالعه بينايي انسان به کار برد؛ که اين کتاب به عنوان مرجع
بينايي فيزيولوژيک و حتي بهعنوان «مهمترين رساله فيزيکي و روانشناختي بينايي انسان تا به
امروز» شناخته ميشود.
وندت :اولين آزمايشگاه روانشناس ي تجربي را در دانشگاه اليپزيک راهاندازي کرد.
داتسون و تورن دايک :حرکت رفتارگرايي ) (behaviorismرا مطرح کردند.
اساس مشخصه روانشناس ي شناختي) ،(congnitive psychologyاين نگرش
است که مغز دارنده و پردازشکننده اطالعات است.
کريک ،کتاب ماهيت بيان را منتشر کرد .و سه مرحله کليدي را براي عامل مبتني بر داشن
معين کرد:
محرکها بايد به شکل دروني تبديل شوند.
بازنمايي توسط پردازشهاي شناختي بازنماييهاي داخلي جديدي را مشتق کند.
اينها دوباره به صورت عمل برگردند.
ن)
مهندس ي کامپيوتر ( -1940تاکنو
براي پيشرفت هوش مصنوعي ،به دو چيز احتياج داريم:
هوش
محصول مصنوعي
در اين تقسيمبندي ،کامپيوتر ميتواند به عنوان محصول مصنوعي محسوب گردد.
:Heath Robinsonاولين کامپيوتر مدرن عملياتي بود که در سال 1940توسط تيم
آلن تورينگ به منظور کدگشايي پيامهاي آملانها ساخته شد.
:Colossusنام ماشين بعدي بود که تيوپهاي مکنده در آن به کار برده شد.
:Z-3اولين کامپيوتر قابل برنامهريزي که توسط کنراد زوس در 1941اختراع شد.
اعداد با مميز شناور و زبان Plankalkulنيز توسط زوس اختراع شدند.
:ABCاولين کامپيوتر الکترونيک در امريکا توسط جان آتاناسف و کليفورد در دانشگاه
ايالتي ايوا ساخته شد.
:MARK I , II , IIIتوسط تيمي به رهبري هوراد ايکن در هاروارد توسعه داده شد.
:ENIACاولين کامپيوترديجيتال الکترونيک چند منظوره ،توسط تيمي به سرپرستي
ماچلي و اکرت در دانشگاه پنسيلوانيا ساخته شد.
:IBM 701اولين کامپيوتر سودآور ،توسط ناتانيل روچتر در 1952ساخته شد.
چارلز بابيج :طراحي ماشيني که جداول لگاريتمي را محاسبه کند.
طراحي موتور آناليتيکي
طرح حافظه قابلآدرسدهي ،برنامه ذخيره شده و پرشهاي شرطي
کار در زمينه AIمنجر به ايدههاي بسيار متعددي شد که به علوم کامپيوتر برگشت؛ مانند:
اشتراک زماني – مفسرهاي دوسويه – نوع داده ليست پيوندي – مديريت حافظه خودکار
و برخي نکات کليدي برنامهنويس ي ش يءگرا و محيطهاي توسعه برنامه مجتمع با واسط
کاربر گرافيکي.
ن)
زبانشناس ي ( -1975تاکنو
اسکينر در سال 1975کتابي در زمينه رفتارگرايان براي يادگيري زبان ،با نام «رفتار زباني» منتشر
کرد.
نوآم چامسکي بر اساس تئ وري خودش يعني ساختارهاي ترکيبي ،اين کتاب را تجديد نظر و
چاپ کرد .که به اندازه اصل کتاب شهرت پيدا کرد.
تئوري چامسکي بر اساس مدلهاي نحوي قرار دارد.
زبانشناس ي مدرن و AIدر يک زمان متولد شدند ،بنابراين زبانشناس ي نقش مهمي در رشد AI
بازي نميکند.
اين دو دريک زمينه مشترک به نام
زبانشناس ي محاسباتي) (Computatioal linguisticsيا
پردازش زبان طبيعي )(natural language processing
بهم تنيده شدهاند که در آن بر روي مسئله استفاده زبان تمرکز شده است.
تاريخچه هوش مصنوعي
پيدايش هوش مصنوعي ()1956 -1943
اشتياق زودهنگام ،آرزوهاي بزرگ ()1969-1952
مقداري واقعيت ()1966-1974
سيستمهاي مبتني بر دانش :کليد قدرت؟ ()1979-1969
بازگشت شبکههاي عصبي ( -1986تاکنو ن)
حوادث اخير ( -1987تاکنو ن)
پيدايش هوش مصنوعي
اولين کار جدي در حيطه ،AIتوسط وارن مککلود و والتر پيتز انجام شد.
سه منبع استفاده شده توسط آنها:
دانش فيزيولوژي پايه و عملکرد نرون در مغز
تحليل رسمي منطق گزارهها متعلق به راسل و رايت هد
تئوري محاسبات تورينگ
در 1949دونالد هب ،قانون ساده بهنگامسازي براي تغيير تقويت اتصاالت بين ن رونها را
تعريف کرد که از طريق آن يادگيري ميسر ميگردد.
در زماني که کلود شانون و آلن تورينگ ،برنامه بازي شطرنج را نوشتند ،SNARC ،
اولين کامپيوتر شبکه عصبي در دانشگاه پرينستون توسط مينسکي و ادموندز ساخته شد.
اين کامپيوتر ،از 3هزار تيوپ مکش ي و مکانيزم خلباني خودکار اضافي که مربوط به
بمبافکنهاي B24ميباشد براي شبيهسازي شبکه 40نروني استفاده کرد.
محققين عالقمند به تئوري آتوماتا ،شبکههاي عصبي و مطالعه هوش ،گرد يکديگر جمع
شدند و در کارگاهي در دورت موند مشغول فعاليت شدند .که در اين ميان نام هوش
مصنوعي براي حيطه فعاليت آنها انتخاب شد.
اشتياق زودهنگام ،آرزوهاي بزرگ ()1969-1952
فعاالن در عرصه :AI
روچستو و تيمش در IBM
هربرت جلونتر :با ساخت Geometry Theorem Prover
آرتور ساموئل :ساخت برنامه براي بازي چکر
جان مک کارتي در :MIT
تعريف زبان ليسپ ) (Lispمهمترين زبان هوش مصنوعي
مفهوم اشتراک زماني )(time sharing
نشر مقالهاي با عنوان "برنامهها با حواس مشترک"
تشريح يک سيستم فرض ي به نام ، Advice Takerکه به اصول پايه
بازنمايي معرفت و استدالل تجسم بخشيد؛
کار بر روي سيستم برنامهريزي سؤال-جواب
کار بر روي پروژه روباتهاي shakey
مينسکي :کار بر روي ميکرو ورلدها و همکاري با مککارتي ،ولي بر سر اختالف بر نگرش
منطقي و ضدمنطقي کار تحقيقاتي خود را از هم جدا کردند.
مينسکي با گروهي از دانشجويان بر روي ميکروورلدها کار کرد که برخي از آنها عبارتند از:
جيمز اسالگل ،SAINT ،قادر به حل مسائل انتگرالگيري فرم بسته
اوانز ،ANALOGY :حل مسائل مشابهت هندس ي در تستهاي هوش
رافائل :SIR :پاسخ به قضاياي پرسش ي جمالت ورودي
بابرو :STUDENT :حل مسائل داستاني جبر
مقداري واقعيت ()1974-1966
ً
مشکالت تقريبا تمام پروژهها تحقيقي AIوقتي پديدار ميشدند که مسائل
گستردهتري براي حل توسط آنها مطرح ميشد:
برنامههاي اوليه اغلب داراي دانش محدود يا فاقد دانش در مورد موضوع کار
بودند.
انجام ناپذيري بسياري از مسائل
به دليل اعمال برخي محدوديتهاي پايهاي بر روي ساختار پايه مورد استفاده براي
توليد رفتار هوشمند
سيستمهاي مبتني بر دانش :کليد قدرت؟ ()1979-1969
روشهاي ضعيف :مبتني بر يک جستجوي همهمنظوره ميباشند که قدمهاي اوليه
يادگيري را برميدارند اما تالش ي در جهت يافتن راهحلهاي کامل ندارند.
به اين دليل که اطالعات ضعيفي را در مورد دامنه فعاليت خود به کار ميبرند.
ً
پس براي حل مسائل دشوار ،تقريبا جواب را از قبل بايد بدانيم.
برنامه DENDRALاز برنامههايي است که از اين رهيافت استفاده ميکند.
اهميت برنامه DENDRALدر اين بود که اولين سيستم موفق با
دانش غني بود ،يعني تبحر سيستم بر پايه تعداد بسيار زيادي قانون
ايجاد شده بود .سيستمهاي بعدي ايده اصلي رهيافت Advice
takerمک کارتي را دنبال ميکردند يعني جداسازي دانش (در شکل
قوانين) و مؤلفه استدالل.
MYCINنسبت به DENDRALدو تفاوت عمده دارد:
برخالف قوانين ،DENDRALهيچ مدل تئوريوار عمومي براي
آنکه قوانين MYCINاستنتاج شود ،وجود نداشت.
قوانين ميبايست عدم قطعيت مربوط به دانش پزشکي را منعکس
ميکرد.
AIبه يک صنعت تبديل ميشود ()1988-1980
:RIاولين سيستم خبره تجاري موفق از شرکت DECکه سودآوري زيادي را براي شرکت
بهمراه داشت.
پروژه «نسل پنجم» :اين پروژه ژاپني به منظور ساخت کامپيوترهاي هوشمندي که پرولوگ
را به جاي کد ماشين اجرا ميکردند ،انجام شد.
شرکتهاي ديگر جهان از جمله ميکروالکترونيک ،MCC ،ليسپ ماشين ،تگزاس
اينسترومنت ،سمبوليکس ،زيراکس و غيره در ساخت ايستگاههاي کاري بهينه شده در اين
عرصه فعاليت داشتند.
بازگشت شبکههاي عصبي:
دانشمندان فعال در اين عرصه:
هاپ فيلد :که به آناليز خواص ذخيرهسازي و بهينهسازي شبکهها پرداخت.
راسل هارت و هينتو ن :مطالعه مدلهاي شبکه عصبي را ادامه دادند.
ً
بريسون و هو :الگوريتم يادگيري انتشار به عقب را مجددا مطرح کردند.
حوادث اخير:
رهيافت :HMMرهيافت غالب در سالهاي اخير ميباشد که توسط مايکف به وجود آمده
است.
اين رهيافت از دو جنبه زير حائز اهميت است:
مبتني بر نظريه رياض ي محض است.
طي فرايندي با يادگيري گروه عظيمي از داده گفتار واقعي خود را بهبود ميبخشد.
برنامهريزي :در دهه 70فقط براي ميکرووردها مناسب بودند ،اکنون براي
زمانبندي کار در کارخانهها و مأموريتهاي فضايي استفاده ميشوند.
بيان شبکه باو ر :استدالل کارا را در مورد ترکيب رويدادهاي غيرمنطقي ممکن
ساخت.
ايده سيستمهاي خبره فرماتيو توسط کار جوداپير و ارديک هوروتيز و
ديويد هکرمن مطرح شد:
"سيستمهايي که مطابق قوانين تئوري تصميمگيري به طور منطقي
عمل ميکنند و سعي ندارند که تبحر انساني را تقليد کنند".
شرايط کنوني:
برخي از سيستمهايي موجود در جهان که از هوش مصنوعي استفاده ميکنند:
:HITECHاولين برنامه کامپيوتري که موفق به شکست استاد بزرگ شطرنج جهان،
آرنولد دنکر شده است.
:PEGASUSيک برنامه درک گفتار که سؤاالت کاربر را جواب ميدهد و تمامي برنامههاي
مسافرتي شخص را با يک برنامهريزي درست ،مقرون به صرفه ميکند.
:MARVELسيستم خبرهاي که دادههاي ارسالي از سفينه فضايي را تحليل نموده و در
صورت بروز مشکالت جدي ،پيغام هشدار به تحليلگران ميدهد.
فصل دوم:
عاملهاي هوشمند
عامل:
قادر به درک محيط پيرامون خود از طريق حسگرها()sensor
هر چيزي اطالق ميشود ،که
به
و اثرگذاري بر روي محيط از طريق اثرکنندهها ( )effectorباشد.
ي:
عامل نرمافزار
عامل نرمافزاري رشتههاي بيتي را به عنوان درک محيط و عمل ،کدگذاري ميکند.
عوامل انساني
.1
حس کردن :گوش ،چشم ،ديگر ارگانها
.2
اثرگذاري :دست ،پا ،بيني ،اندامهاي ديگر
عوامل روباتيک
.1
حس کردن :دوربين ،يابندههاي مادون قرمز
.2
اثرگذاري :موتور
sensors
percepts
?
environment
agent
actions
effectors
عاملها چگونه بايد عمل کنند؟
عامل منطقي :چيزي است که کار درست انجام ميدهد.
عمل درست :آن است که باعث موفقترين عامل گردد.
کارايي :چگونگي موفقيت يک عامل را تعيين ميکند.
تفاوت ميان منطقي بودن و دانش کل ):(omniscience
عامل داناي کل معني خروجي واقعي اعمال خود را دانسته و بر پايه آن عمل ميکند اما
در واقعيت غيرممکن است.
دانش کل
در عمل
هر عامل هوشمند همواره بايد همان کاري را انجام دهد که
اگر معين کنيم که
مناسب است ،هيچگاه نميتوان عاملي را طراحي نمود که اين مشخصات را مرتفع سازد.
آن چه در هر زماني منطقي است به چهار چيز وابسته است:
معيار کارايي که درجه موفقيت را تعيين ميکند.
هر چيزي که تا کنون عامل ،ادراک نموده است .ما اين تاريخچه کامل ادراکي را دنباله
ادراکي ميناميم.
آنچه که عامل درباره محيط خود ميداند.
اعمالي که عامل ميتواند صورت دهد.
رفتار عامل وابسته به دنباله ادراکي تا حال است.
عامل را بايد بهعنوان ابزاري براي تحليل سيستمها قلمداد کرد؛
نه شخصيتي مطلق که جهان را به دو بخش عامل و غيرعاملها تقسيم ميکند.
نگاشت ايدهآل از دنبالههاي ادراکي به عمليات
هر عامل خاص ي را به وسيله جدولي توصيف ميکنيم ،که در آن عمل آن در پاسخ به هر
دنباله ادراکي قرار ميگيرد.
اين بدان معني نيست که ما جدول خاص ي با يک ورودي براي هر دنباله ادراک ممکني
توليد کنيم .ميتوان مشخصات نگاشت را بدون شمارش خستهکننده آنها انجام داد.
مثال:
تابع ريشه دوم
دنباله ادراکي:
دنبالهاي از کليدهاي زده شده
نگاشت ايدهآل:
براي مقادير مثبت xنشان داده شده توسط
ادراک z ،نيز مثبت باشد و عمل مناسب نمايش نشان داده شود.
خودمختاري:
در اينجا تعريف عامل بايد کاملتر شود و بخش دانش دروني به آن اضافه ميگردد.
رفتار عامل ميتواند متکي بر دو پايه تجربه خود و دانش دروني بنا نهاده شود.
اين رفتار ،در ساخت عامل براي شرايط محيطي خاص که در آن عمل خواهد کرد،
استفاده ميشود.
سيستم به وسعتي خود مختار است که رفتار آن بر اساس تجربه خودش تعيين ميکند.
ً
زماني که عامل فاقد تجربه و يا کم تجربه است ،مسلما تصادفي عمل خواهد کرد ،مگر
آنکه طرح کمکهايي به آن داده باشد.
ً
عامل هوشمند واقعا خود مختار بايد قادر به عمل موفقيتآميز در دامنه وسيعي از
محيطها باشد و البته بايد زمان کافي براي تطبيق نيز به آن داده شود.
ساختار عاملهاي هوشمند
وظيفه هوش مصنوعي طراحي برنامه عامل است؛
اين طراحي شامل تابعي است که نگاشت عامل از ادراک به عمليات را پياده سازي ميکند.
معماري :فرض ميکنيم برنامه عامل بر روي نوعي ابزار محاسبهگر اجرا ميگردد که آن را
معماري ميناميم.
برنامه عامل ،بايد توسط معماري قابل پذيرش و اجرا باشد.
ً
عموما ،معماري ادراک از طريق حسگرها را براي برنامه آماده ساخته ،برنامه را اجرا نموده و
اعمال انتخابي برنامه را به عملکنندههاي سيستم منتقل ميکند.
ارتباط بين عاملها ،معماريها و برنامهها را ميتوان به صورت ذيل جمع بندي نمود:
برنامه +معماري= عامل
در اينجا مسئله تمايز بين محيط واقعي و مصنوعي مطرح ميشود؛ اما
مسأله اصلي ،پيچيدگي مابين:
ارتباط رفتار عامل،
دنباله ادراکي توليد شده بوسيله محيط ،و
اهدافي که عامل قصد حصول آن را دارد ،است.
مشهورترين محيط مصنوعي ،محيط تست تورينگ ( )turingاست.
برنامههاي عامل:
تشابهات عاملهاي هوشمند:
دريافت ادراک محيطي
توليد اعمال الزم
دو نکته در مورد شالوده برنامه قابل ذکر هستند:
.1برنامه عامل تنها يک درک از شرايط محيطي واحد را به عنوان ورودي دريافت ميکند.
.2هدف يا معيار کارايي بخش ي از برنامه شالوده نخواهد بود.
چرا تنها به پاسخها نگاه نميکنيم؟
جدول مراجعه بايد بر پايه حفظ کامل دنباله ادراکي در حافظه عمل نموده و از آن براي ايندکسسازي
داخل جدول استفاده کند.
جدول عامل نوع راننده تاکس ي
ادراکات
عمليات
اهداف
محيط
دوربينها ،سرعت سنج،
راهنمايي کردن،
ايمني ،سرعت،
جاده ،پيادهرو،
ي قانونمندي ،راحتي ،شتابدهنده ،ترمز،
Sonar ،GPS
ترافيک ،مشت ر
ميکروفو ن
افزايش سودمندي صحبت با مسافر
نوع عامل
راننده تاکس ي
جنبههاي مختلف يک عمل ،انواع مختلف برنامههاي عامل را پيشنهاد خواهد کرد.
براي مثال 4 ،عامل را مورد بررس ي قرار مي دهيم:
عاملهاي واکنش ي ساده
عاملهايي که اثرات دنيا را حفظ ميکنند
عاملهاي هدفگرا
عاملهاي سودمند
عاملهاي واکنش ي ساده
در اينجا جدول رجوع بايد مورد توجه قرار گرفته و فيلدهاي مختلف آن توسط اطالعات و رودي
پر شود.
اتصاالتي (واکنشهايي) وجود دارند که انسانها بسياري از آنها را دارا بوده:
برخي از آنها قابل يادگيري و برخي ديگر غريزي است.
دياگرام شماتيک از عامل ساده واکنش ي
Sensors
Environment
Agent
What the world
is like now
What action I
should do now
Condition-action rules
Effectors
مربع مستطيل :نشاندهنده وضعيت داخلي جاري فرايند تصميمگيري عامل
بيض ي :نشاندهنده وضعيت اطالعات پسزمينه
عاملهايي که اثرات دنيا را حفظ ميکنند
از آنجايي ناش ي ميشود که حسگرها نميتوانند دسترس ي کامل به وضعيت دنيا را به وجود
آورند.
در چنين شرايطي ،عامل ممکن است نيازمند دستکاري برخي اطالعات وضعيت داخلي باشد
در
ظاهر ورودي ادراکي يکساني ميکنند ولي
در
تمايز بين وضعيتهاي دنيا که
تا از طريق آن
ً
ميسر سازد.
کامال متفاوتي دارند را
واقع معني
بهنگامسازي اطالعات وضعيت داخلي همزمان با گذر زمان نيازمند دو نوع دانش کد شده در
برنامه عامل است.
اول :نيازمند آنيم که برخي اطالعات درباره چگونگي تغيير جهان مستقل از عامل را داشته
باشيم.
دوم :نيازمند اطالعات درباره اعمال خود هستيم که بر روي دنيا اثرگذار است.
عامل واکنش ي با حالت داخلي
sensors
State
What my action do
Condition-action rules
Agent
What action I
should do now
Effectors
Environment
How the world evolves
What the world is
like now
عاملهاي هدف گرا:
دانستن درباره وضعيت کنوني محيط همواره براي تصميمگيري عمل نميتواند کافي باشد.
به همان گونه که عامل نيازمند شرح وضعيت جاري است ،به نوعي نيازمند اطالعات
هدف( )goalميباشد که توضيح موقعيت مطلوب است.
برنامه عامل ميتواند اين اطالعات را با اطالعاتي درباره نتايج اعمال ممکن (همانند اط العاتي
که در عامل واکنش براي بهنگامسازي وضعيت داخلي استفاده شد) ترکيب نموده تا اعمال
مناسب را براي دسترس ي به هدف انتخاب نمايد.
در مواقعي ساده است :که رضايت از هدف بالفاصله از عمل واحد توليد گردد.
در مواقعي پيچيده است :که عامل بايد دنبالههاي طوالني را در نظرگرفته تا راهي براي
دستيابي به هدف پيدا کند.
در مواقع پيچيده ،جستجو و برنامهريزي به يافتن دنباله اعمال منجر خواهند شد.
تفاوت عاملهاي واکنش ي و هدفگرا:
در طراحي عاملهاي واکنش ي طراح براي حاالت متفاوت عملي درست را پيش محاسبه ميکند .در
عاملهاي هدفگرا ،عامل ميتواند دانش خود را در مورد چگونگي واکنش بهنگام سازد.
.1براي عامل واکنش ي ما مجبور به دوباره نويس ي تعداد زيادي قوانين شرط –عمل خ واهيم
بود.
.2عامل هدفگرا نسبت به رسيدن به مقاصد متفاوت انعطاف پذير است.
.3بسادگي با تعيين يک هدف تازه ،ميتوانيم عامل هدفگرا را به رفتار تازه برسانيم.
عاملي با اهداف دقيق
sensors
State
What my action do
What it will be like
if I do action A
Goals
What action I
should do now
Agent
Effectors
Environment
How the world evolves
What the world is
like now
عاملهاي سودمند:
اهداف به تنهايي براي توليد رفتار با کيفيت باال کافي نيستند.
مالک کارايي عومي بايد مقايسهاي بين وضعيتهاي دنياي متفاوت (يا دنباله حاالت) را بر
پايه چگونگي رضايت عامل در صورت حصول هدف بدهد.
ديگري ترجيح داده ميشود ،آنگاه آن براي عامل سودمندتر
بنابراين اگر يک وضعيت دنيا به
خواهد بود
سودمندي :تابعي است که يک وضعيت را به عدد حقيقي نگاشت ميدهد ،که درجه رضايت
مربوط را تشريح ميکند.
مشخصات کامل تابع سودمندي امکان تصميمگيري منطقي را براي دو نوع حالتي که هدف
مشکل دارد ،اجازه ميدهد.
.1زماني که اهداف متناقص وجود دارند.
.2زماني که چندين هدف دارند که عامل ميتواند آنها را هدف قرار دهد و هيچکدام از آنها با
قطعيت قابل حصول نيست.
ارتباط بين عامل و محيط :اعمال بوسيله عامل بر محيط انجام ميشود ،که خود ادراک عامل را مهيا
ميسازد.
خواص محيط:
قابل دسترس ي در مقابل غير دسترس ي
قطعي در برابر غير قطعي
اپيزوديک در مقابل غيراپيزوديک
ايستا در مقابل پويا
گسسته در مقابل پيوسته
قابل دسترس ي در مقابل غيرقابل دسترس ي
محيط قابل دسترس ي :محيطي که عامل آن توسط ابزار حسکنندهاش امکان دسترس ي به
وضعيت کامل محيط را داشته باشد.
محيط قابل دسترس ي راحت است ،زيرا عامل نيازمند دستکاري هيچ وضعيت داخلي براي حفظ
دنيا را نخواهد داشت.
قطعي در مقابل غير قطعي
محيط قطعي :محيطي است که اگر وضعيت بعدي محيط بوسيله وضعيت کنوني و اعمالي که
با عاملها انتخاب گردد ،تعيين شود.
بهتر است به قطعي يا غير قطعي بودن محيط از ديدگاه عامل نگاه کنيم.
اپيزوديک در مقابل غير اپيزوديک
محيط اپيزوديک ( ،)episodicتجربه عامل به اپيزودهايي تقسيم ميگردد.
هر اپيزود شامل درک و عمل عامل است.
کيفيت اعمال آن تنها به خود اپيزود وابسته است.
محيطهاي اپيزودي بسيار سادهترند زيرا عامل نبايد به جلوتر فکر کند.
ايستا در مقابل پويا
محيط پويا :محيطي که در حين سنجيدن عامل تغيير ميکند.
محيط نيمهپويا :محيطي که با گذر زمان تغيير نميکند اما امتياز کارايي تغيير ميکند.
محيطهاي ايستا براي کار ساده هستند زيرا عامل نياز به نگاهکردن به دنيا در حين تصميمگي ري
عملي نداشته و همچنين در مورد گذر زمان نيز نگران نميباشد.
گسسته در مقابل پيوسته
محيط گسسته :اگر تعداد محدود و مجزا از ادراک و اعمال بوضوح تعريف شده باشد.
-بازي شطرنج گسسته است.
رانندگي تاکس ي پيوسته است.سختترين حالت در بين حاالت موجود براي محيط:
غير قابل دسترس ي ،غير اپيزوديک ،پويا و پيوسته
مثالهايي از انواع محيط و ويژگيهاي آنها
محيط
قابل دسترس ي
قطعي
اپيزوديک
ايستا
گسسته
شطرنج به همراه ساعت
YES
YES
NO
Semi
YES
شطرنج بدون ساعت
YES
YES
NO
YES
YES
پوکر
NO
NO
NO
YES
YES
تخته نرد
YES
NO
NO
YES
YES
راندن تاکس ي
NO
NO
NO
NO
NO
سيستم تشخيص پزشکي
NO
NO
NO
NO
NO
سيستم تحليل تصوير
YES
YES
YES
Semi
NO
ربات جابجا کننده اشياء
NO
NO
YES
NO
NO
کنترلکننده پااليشگاه
NO
NO
NO
NO
NO
آموزشدهنده انگليس ي با ارتباط متقابل
NO
NO
NO
NO
YES
برنامههاي محيط
شبيهساز يک يا چند عامل را به عنوان ورودي گرفته و بگونهاي عمل ميکند که هر عامل
ادراک درست و نتيجه بازگشتي عمل خود را بدست آورد.
شبيهساز محيط را بر اساس اعمال و ديگر فرآيندهاي پوياي محيط بهنگام ميسازد.
محيط با وضعيت آغازين و تابع بهنگامسازي تعريف ميگردد.
فصل سوم:
حل مسائل توسط جستجو
يک نوع عامل هدفگرا ،عامل حل مسئله ناميده ميشود.
عاملهاي حل مسئله توسط يافتن ترتيب عمليات تصميم ميگيرند که چه انجام دهند تا
ق دهد.
آنها را به حالتهاي مطلوب سو
عاملهاي حل مسئله
ً
عاملهاي هوشمند به طريقي عمل ميکنند که محيط مستقيما به داخل دنباله حالتهايي
وارد شود که معيار کارآرايي را افزايش ميدهند.
عمليات به گونهاي سادهسازي ميشوند که عامل قادر باشد تا هدفي را قبول کرده و به آن
برسد.
الگوريتم جستجو مسئلهاي را به عنوان ورودي دريافت نموده و راهحلي را به صورت دنباله
عمليات بر ميگرداند.
فاز اجرايي :مرحلهاي است که در آن زمان ،راهحلي پيدا ميشود و عمليات پيشنهادي ميتوانند انجام
شوند.
به طور ساده براي طرح يک عامل مراحل «فرمولهسازي ،جستجو ،اجرا» را در نظر ميگيريم.
پس از فرمولهسازي يک هدف و يک مسئله براي حل عامل،
.1رويه جستجويي را براي حل آن مسئله فراخواني ميکند.
.2از راه حل براي راهنمايي عملياتش استفاده ميکند و هرآنچه که راه حل پيشنهاد ميکند را انجام
ميدهد.
.3آن مرحله را از دنباله حذف ميکند.
.4زماني که راهحل اجرا شد ،عامل هدف جديدي را پيدا ميکند.
چهار نوع اساس ي از مسائل وجود دارند:
مسائل تک حالته )(Single-state
مسائل چند حالته )(Multiple-state
مسائل احتمالي )(Contingency
مسائل اکتشافي )(Exploration
دانش و انواع مسئله
دنياي مکش (جاروبرقي):
اگر دنيا حاوي دو محل باشد:
هر محل ممکن است که شامل خاک باشد و يا نباشد و عامل ممکن است که در يک محل يا
ديگر محلها باشد؛ که داراي هشت حالت متفاوت خواهد بود.
هدف تميز کردن تمام خاکهاست که در اينجا معادل با مجموعه حالت {8و }7است.
مدلهاي مختلف براي مسئله جاروبرقي:
مدل تک حالته:حسگرهاي عامل به آن اطالعات کافي ميدهند تا وضعيت دقيق مشخص شود( .دنيا قابل
دسترس ي است) .عامل ميتواند محاسبه کند که کدام وضعيت پس از هر دنباله از
عمليات قرار خواهد گرفت.
مدل چند حالته:عامل تمام اثرهاي عملياتش را ميداند اما دسترس ي به حالت دنيا را محدود کرده است.
ً
زماني که دنيا تماما قابل دسترس ي نيست عامل بايد در مورد مجموعه حالتهايي که
ممکن است به آن برسد استدالل کند.
مدل احتمالي:نياز داريم .عامل اکنون بايد تمام
فاز اجرايي
در طول
با اين مدل حل مسئله ،حسگرهايي را
هر شاخه
درخت عملياتي را بر خالف دنباله عملياتي منفرد ،محاسبه کند .که به طور کلي
درخت ،با يک امکان احتمالي که از آن ناش ي ميشود ،بررس ي ميشود.
مدل اکتشافي:در مورد اثرات عملياتش ندارد.
عاملي که هيچ اطالعاتي
در اين حالت ،عامل بايد تجربه کند و به تدريج کشف کند که چه عملياتي بايد انجام شود و
چه وضعيتهايي وجود دارند .اين روش يک نوع جستج و است.
اگر عامل نجات يابد« ،نقشهاي» از محيط را ياد ميگيرد که ميتواند مسائل بعدي را حل کند.
مسائل و راهحلهاي خوب تعريف شده
مسئله :در واقع مجموعهاي از اطالعات است که عامل از آنها براي تصميمگيري در مورد اينکه چه
کاري انجام دهد ،استفاده ميکند.
عناصر اوليه تعريف يک مسئله ،وضعيتها عمليات هستند.
براي تعريف يک مسئله موارد زير نياز داريم:
در آن آگاه است.
وضعيت آغازين ( )initial stateکه عامل خودش از بودن
مجموعهاي از عمليات ممکن ،که براي عامل قابل دسترس ي باشد.
در يک تعريف وضعيت منفرد آن را تقاضا
آزمون هدف ( ،)goal testکه عامل ميتواند
کند تا تعيين گردد که آن حالت ،وضعيت هدف است يا خير.
نظر ميگيرد؛ و با حرف g
در
هر مسير ،هزينهاي را
تابع هزينه مسير ،تابعي است که براي
مشخص ميشود.
هزينه يک سفر= مجموع هزينههاي عمليات اختصاص ي در طول مسير
براي حل مسئله چند حالته ،فقط به يک اصالح جزئي نياز داريم:
يک مسئله شامل:
يک مجموعه حالت اوليه
مجموعهاي از عملگرهاي ويژه براي هر عمل به گونهاي که از هر وضعيت داده شده
مجموعهاي حاالت رسيده شده و يک آزمون هدف و تابع هزينه مسير را معين کند.
يک عملگر:
توسط اجتماع نتايج اعمال عملگر در هر وضعيت مجموعه ،به کار برده ميشود.
يک مسير:
مجموعه حاالت را مرتبط ميکند.
يک راه حل:
مسيري است که به مجموعهاي از حاالت که تمام آنها ،وضعيت هدف هستند ،س وق
ميدهند.
اندازهگيري کارايي حل مسئله:
کارايي يک جستجو ،حداقل از سه طريق ميتواند اندازهگيري شود:
.1آيا اين جستجو راه حلي پيدا ميکند؟
.2آيا راه حلي مناسبي است؟
.3هزينه جستجو از نظر زماني و حافظه مورد نياز براي يافتن راه حل چيست؟
مجموع هزينه جستجو= هزينه مسير +هزينه جستجو
عامل بايد تصميم بگيرد که چه منابعي را فداي جستجو و چه منابعي را صرف اجرا کند.
انتخاب حاالت و عمليات
در تعريف حاالت و عملگرها
در مورد اين است که چه چيزهايي
هنر واقعي حل مسئله ،تصميمگيري
کنار گذاشته شوند.
بايد به حساب آورده شوند و چه چيزهايي بايد
انتزاع:
فرآيند حذف جزئيات از يک بارنمايي انتزاع ( )abstractionناميده ميشود.
همانگونه که تعريف را خالصه ميکنيم ميبايست عمليات را نيز خالصه نمائيم.
انتزاع به اين دليل مفيد است ،که انجام هر کدام از عمليات آسانتر از مسئله اصلي است.
انتخاب يک انتزاع خوب از اين رو شامل حذف تا حد ممکن ميشود تا زماني که عمليات
خالصه شده براي انجام آسان باشند.
مسائل نمونه:
ي
مسائل اسبابباز
ي
مسائل نمونه:مسائل اسبابباز
معماي :8
در يک صفحه خالي.
دار
معماي 8نمونهاي است شامل يک صفحة 3*3با 8مربع شماره
هر مربع که مجاور خانه خالي است .ميتواند به درون آن خانه برود .هدف رسيدن به ساختاري است که
در سمت راست شکل نشان داده شده است .نکته مهم اين است که بجاي اينکه بگوييم «مربع شماره 4را
بهتر است بگوييم «فضاي خالي جايش را با مربع سمت چپش عوض
به داخل فضاي خالي حرکت بده»
کند».
Goal State
3
2
4
5
6
Start State
4
5
1
8
8
1
6
7
2
3
7
حالتها :توصيف وضعيت مکان هر 8مربع را در يکي از 6خانة صفحه مشخص ميکند .براي
کارايي بيشتر ،بهتر است که فضاهاي خالي نيز ذکر شود.
عملگرها :فضاي خالي به چپ ،راست ،باال و پائين حرکت کند.
آزمون هدف :وضعيت با ساختار هدف مطابقت ميکند.
هزينه مسير :هر قدم ارزش 1دارد ،بنابراين هزينه مسير همان طول مسير است.
مسئله 8وزير:
هدف از مسئله 8وزير ،قر ار دادن 8وز ير بر روي صفحه شطرنج به صورتي است که هيچ
ي حمله کند.
ي نتواند به ديگر
وزير
د و نوع بيان رياض ي اصلي وجود دارد بيان افزايش ي که با جايگزيني وزيرها ،به ص ورت يکي
کار ميکند و ديگري بيان وضعيت کامل که با تمام 8وز ير روي صفحه شروع ميکند و
يکي
آنها را حرکت ميدهد.
در اين فرمول ما 64امکان داريم.
مسير را به صورت ز ير خواهيم داشت:
بنابراين ما تست هدف و هزينه
ن هدف 8 :وز ير روي صفحه ،که با هم برخورد ندارند.
آزمو
هزينه مسير :صفر.
صفر تا 8وز ير بدون هيچ برخورد.
حاالت :ترتيب از
در خاليترين ستون سمت چپ جايگزين کنيد که هيچ برخوردي با بقيه
عملگرها :يک وز ير را
نداشته باشد.
:Cryptarithmetic
در مسائل کريپتاريتمتيک ،حروف به جاي ارقام مينشينند و هدف يافتن جايگزيني از اعداد براي حروف
ً
است که مجموع نتيجه از نظر رياض ي درست باشد .معموال هر حرف بايد به جاي يک رقم مختلف
بنشينند.
مثال:
F=2, O=9, R=7, etc.
29786
FORTY
+ 850
+ TEN
+ 850
+ TEN
----------
----------
31486
SIXTY
يک فرمول ساده:
حاالت :يک معماي Cryptarithmeticبا چند حروف جايگزين شده توسط ارقام.
ً
جايگزين کنيد که قبال در معما ظاهر نشده باشد.
عملگرها :وقوع يک حروف را با يک رقم
آزمون هدف :معما فقط شامل ارقام است و يک مجموع صحيح را بر ميگرداند.
هزينه مسير :صفر -تمام راه حلهاي صحيح است.
ميخواهيم که از تبديل جايگزينيهاي مشابه اجتناب کنيم:
قبول يک ترتيب ثابت مانند ترتيب الفبايي.
هر کدام که بيشترين محدوديت جايگزيني را دارد ،انتخاب کنيم؛ يعني حرفي که کمترين
امکان مجاز را دارند ،محدوديتهاي معما را ميدهد.
دنياي مکش:
مسئله تک حالته :عامل از جاي خودش اطالع دارد و تمام مکانهاي آلوده را ميشناسد و
دستگاه مکنده ما درست کار ميکند.
حاالت :يکي از 8حالت نشان داده شده.
عملگرها :حرکت به چپ ،حرکت به راست ،عمل مکش.
آزمون هدف :هيچ خاکي در چهار گوشها نباشد.
هزينه مسير :هر عمل ارزش 1دارد.
حسگر نميباشد.
مسئله چند حالته :عامل داراي
مجموعه وضعيتها :ز ير مجموعهاي از حاالت.
عملگرها :حرکت به چپ ،حرکت به راست ،عمل مکش.
در مجموعه حالتها فاقد خاک باشند.
آزمون هدف :تمام حاالت
هر عمل هزينه 1دارد.
هزينه مسير :
مسئله کشيشها و آدمخوارها:
قادر
در يک طرف رودخانه قر ار دارند و هم چنين قايقي که
خوار
سه کشيش و سه آدم
ديگر رودخانه برود،
نفر به سمت
هر
نفر را حمل کند .راهي را بيابيد که
است يک يا د و
کمتر از آدم خوارها شود.
در يکجا
بدو ن آنکه تعداد کشيشها
حاالت :يک حالت شامل يک دنبالة مرتب شده از عدد است که تعداد کشيشها ،تعداد
آدمخوارها و محل قايق در ساحلي از رودخانه که از آنجا مسئله شروع شده را نمايش ميدهد.
عملگرها :از هر حالت ،عملگرهاي ممکن يک کشيش ،يک آدمخوار ،دو کشيش ،دو آدمخوار،
يا يکي از هر کدام را در قايق جا ميدهند.
آزمون هدف :رسيدن به حالت(0و 0و .)0
هزينه مسير :تعداد دفعات عبور از رودخانه.
مسائل دنياي واقعي
مسيريابي:
الگوريتمهاي مسير يابي کاربردهاي زيادي دراند ،مانند مسيريابي در شبکههاي کامپيوتري،
سيستمهاي خودکار مسافرتي و سيستمهاي برنامهنويس ي مسافرتي هوايي.
مسائل فروشنده دوره گرد و تور :
يکبار بايد مالقات
شهر حداقل
هر
در آن
مسئله فروشنده دوره گرد مسئله مشهوري است که
مسير است.
شود هدف يافتن کوتاهترين
هر حالت بايد مجموعه شهرهايي را که عامل مالقات کرده ،نگه دارد.
عالوه بر مکان عامل ،
صفر براي ف روشنده دورهگرد ،اين الگوريتمها براي اعمالي نظ ير برنامهريزي
عالوه بر برنامهريزي
مدار استفاده ميشود.
دکار سوراخکننده برد
حرکات مته خور
طرح : VISI
بسيار مشکل
ابزار طراحي کمکي کامپيوتري در هر فازي از پردازش استفاده ميشود دو وظيفه
عبارتند از:
Channel routing
Cell layout
که بعد از اينکه ارتباطات و اتصاالت مدار کامل شد ،اين دو قسمت انجام ميشوند.
ي روي تراشه است که کمترين مساحت و طو ل اتصاالت و بيشترين سرعت
هدف طراحي مدار
را داشته باشد.
هدف قر ار دادن سلولها روي تراشه به گونهاي است که آنها روي هم قر ار نگيرند و بنابراين
نيز براي سيمهاي ارتباطي وجود دارد که بايد بين سلولها قر ار گيرند.
فضايي
هر سيم که از فواصل بين سلولها استفاده ميکند ،پيدا
مسير ويژهاي را براي
کاناليابي،
ميکند.
هدايت ربات:
در يک فضاي پيوسته با يک مجموعه نامحدودي از حاالت و عمليات
يک ربات ميتواند
ممکن حرکت کند.
در خواندن حسگرها و کنترل م وتور
رباتهاي واقعي بايد قابليت تصحيح اشتباهات را
داشته باشند.
خط توليد خودکار:
در مسائل سرهمبندي ،مشکل يافتن قانوني است که تکههاي چند شيئي را جمع کند .اگ ر ترتيب
نو انجام دادن
نادرست انتخاب شود ،راهي نيست که بتوان قسمتهاي بعدي را بدون از
قسمتهاي قبلي ،اضافه کرد.
نزديکي با
در دنباله ،يک مسئله جستجوي پيچيدة هندس ي است که ارتباط
کنترل يک مرحله
مجاز گرانترين قسمت دنباله سرهمبندي است و
هدايت ربات دارد .از اين رو توليد مابعدهاي
ي است.
استفاده از الگوريتمهاي آگاهانه براي کاهش جستجو ،ضرور
جستجو براي راهحل:
نگهداري و گسترش يک مجموعه از دنبالههاي راه حل ناتمام.
جستجوي حالتهاي موجود و يافتن راهحل بنا بر اصل جستجو.
توليد دنبالههاي عمل:
در
فرايند گسترش حالت :فرايندي که از طريق توليد مجموعه جديدي از حاالت ،عملگرها
ً
در مجموعه وارد ميکند.
نتيجتا حالت هدف را
کار گرفته ،و
حالت جاري را به
کنار گذاشتن بقيه براي بعد ،زماني که اولين انتخاب به
اصل جستجو :انتخاب يک حالت و
منجر نشود.
حل مسئله
ريشه درخت جستجو :يک گره جستج و است که با حالت اوليه مطابقت دارد.
در درخت نيستند.
گرههاي برگي درخت :حاالتي هستند که داراي فرزندي
ساختارهاي داده براي درختهاي جستجو:
گره به عنوان يک ساختار داده با پنج قسمت به شرح زير است:
وضعيتي که گره در فضاي حاالت دارا ميباشند.
گرهاي که در جستجوي درخت ،گره جديدي را توليد کرده است (گره والد).
عملگري که براي توليد گره به کار رفته است.
تعداد گرههاي مسير ،از ريشه تا گره موردنظر (عمق گره).
هزينه مسير ،از حالت اوليه تا گره.
تفاوت بين گرهها و حالتها:
گرهها عمق و والد دارند؛ در صورتي که حالتها شامل چنين چيزهايي نيستند.
ي جستجو:
استراتژ
معيار ز ير باشند:
استراتژيها بايد داراي 4
کامل بودن
پيچيدگي زماني
پيچيدگي فضا
بهينگي
ما 6استراتژي را بررس ي خواهيم کرد:
جستجوي سطحي
جستجوي با هزينه يکسان
جستجوي عمقي
جستجوي عمقي محدود شده
جستجوي عميقکننده تکراري
جستجوي دوطرفه
جستجوي سطحي:
ديگر
بسيار سيستماتيک است ،ابتدا گره ريشه ،و سپس تمام گرههاي
ي که
در اين استراتژ
گسترش داده ميشوند.
به عبارت کليتر ،تمام گرههاي عميق ،dقبل از گرههاي عميق d+1گسترش داده ميشوند.
مزايا:
ي سطحي ،کامل و بهينه ميباشد زيرا هزينه مسير ،يک تابع کاهشنيابنده از عمق گره
جستجو
است.
معايب:
مرتبه زماني ) O(bdمي باشد که نمايي است.
نياز به حافظه زياد.
جستجوي با هزينه يکسان:
در اين استراتژي ،در شرايط عمومي ،اولين راه حل ،ارزانترين راه نيز هست.
اگر هزينه مسير توسط تابع ) g(nاندازهگيري شود ،در اين صورت جستجوي سطحي همان
جستجوي با هزينه يکسان است با:
)g(n)=DEPTH(n
جستجوي عمقي:
اگر به نتيجه نرسيد،
در پائينترين سطح درخت بسط ميدهد؛ اما
اين استراتژي ،يکي از گرهها را
تر ميرود.
در سطوح کم عميق
به سراغ گرههايي
مزايا:
ً
مسير واحدي از ريشه به يک گره برگي،
نسبتا کمي فقط براي ذخيره
نياز به حافظه
اين جستجو ،
و گرههاي باقيمانده بسط داده نشده دارد.
حداکثر
پيچيدگي زماني ) O(bmميباشد .به طوريکه bفاکتور انشعاب فضاي حالت ،و m
عمق درخت باشد.
معايب:
اگر مسيري را اشتباه طي کند ،هنگام پائين رفتن گير ميکند.
جستجوي عمقي نه کامل و نه بهينه است.
در درختهاي با عمق نامحدود و بزرگ اين استراتژي کار نميکند.
جستجوي عمقي محدود شده:
گرفتار ميشد ،از يک برش
در آن
اين استراتژي ،براي رهايي از دامي که جستجوي عمقي
استفاده ميکند.
جستجوي عمقي محدود شده کامل است اما بهينه نيست.
زمان و پيچيدگي فضاي جستجوي عمقي محدودشده ،مشابه جستجوي عمقي است .اين
جستج و پيچيدگي زماني ) O(bLو فضاي ) O(bLرا خواهد داشت ،که Lمحدودة عمق
است.
ً
در سطح پائين هستند ،بنابراين موردي
تقريبا تمام گرهها
ي نمايي،
در يک درخت جستجو
ي
در يک جستج و
ندارد که سطوح بااليي چندين مرتبه بسط داده شوند .تعداد بسطها
عمقي محدود شده با عمق dو فاکتور انشعاب bبه قر ار ز ير است:
1+b+b2+…+bd-2+bd-1+bd
ي:
جستجوي عميقکننده تکرار
ي عمقي محدود شده ،انتخاب يک محدودة خوب است.
دشوار جستجو
قسمت
اگر محدودة عمق بهتري را پيدا کنيم ،اين محدوده ،ما را به سوي جستجوي کاراتري س وق
بيشتر مسائل ،محدودة عمقي مناسب را تا زماني که مسئله حل نشده است،
ميدهد .اما براي
نميشناسيم.
ي است که نظريه انتخاب بهترين محدودة عمقي،
ي استراتژ
ي عميقکنندة تکرار
جستجو
توسط امتحان تمام محدودة مسيرهاي ممکن را يادآوري ميکند.
مزايا:
ي سطحي و عمقي را دارد.
ترکيبي از مزاياي جستجو
اين جستج و مانند جستجوي سطحي کامل و بهينه است ،اما فقط مزيت درخواست حافظه
اندک را از جستجوي عمقي دارد.
بار بسط
جز اينکه بعض ي حاالت چند
ي سطحي است ،به
مرتبه بسط حاالت مشابه جستجو
داده ميشوند.
بار بسط داده ميشوند ،آنهايي
در جستجوي عميقکننده تکراري ،گرههاي سطوح پائيني يک
تجو
آخر تا به ريشه درخت جس
دوبار بسط داده ميشوند و الي
باالتر قر ار دارند
که يک سطح
بار بسط داده ميشوند.
برسد ،که d+1
در اين جستج و عبارتست از:
بنابراين مجموع دفعات بسط
(d+1)1+(d)b+(d-1)b2+…+3bd-2+2bd-1+1bd
پيچيدگي زماني اين جستج و هنوز ) O(bdاست ،و پيچيدگي فضا ) O(bdاست.
ي
ي است؛ زماني که فضاي جستجو
ي برتر
در حالت کلي ،عميقکننده تکراري ،روش جستجو
نيز مجهول است.
بزرگي وجود دارد و عمق راه حل
جستجوي دوطرفه:
ايده جستجوي دوطرفه در واقع شبيهسازي جستجويي به سمت جلو از حالت اوليه و به سمت
عقب از هدف است و زماني که اين دو جستجو به هم برسند ،متوقف ميشود.
براي پيادهسازي الگوريتم سؤاالت زير بايد پاسخ داده شوند:
.1سؤال اصلي اين است که ،جستجو از سمت هدف به چه معني است؟ ماقبلهاي )(predeccessors
يک گره nرا گرههايي درنظر ميگيريم که nمابعد ) (successorآنها باشد .جستجو به سمت عقب
بدين معناست که توليد ماقبلها از گرة هدف آغاز شود.
.2زماني که تمام عملگرها ،قابل وارونهشدن باشند ،مجموعه ماقبلها و مابعدها يکسان هستند.
اگر ليست صريحي از حالتهاي هدف
.3چه کار ميتوان کرد زماني که هدفهاي متفاوتي وجود داشته باشد؟
در حاليکه تابع مابعد يا
وجود داشته باشد ،ميتوانيم يک تابع ماقبل براي مجموعه حالت تقاضا کنيم
کار ميرود.
ي مسائل چندوضعيته به
در جستجو
(جانشين)
ً
در درخت
قبال
هر گره جديد وجود داشته باشد تا متوجه شويم که آيا اين گره
موثر براي کنتر ل
.4بايد يک راه
ظاهر شده است يا خير.
جستج و توسط جستجوي طرف ديگر ،
هر نيمه قصد انجام دارد.
نياز داريم که تصميم بگيريم که چه نوع جستجويي در
.5
:مقايسه استراتژيهاي جستجو
. محدوديت عمق استl ، ماکزيمم عمق درخت جستجوm ، عمل پاسخd ، فاکتور انشعابb .ارزيابي استراتژيهاي جستجو
Criterion
BreadthFirst
UniformCost
DepthFirst
DepthLimited
Iterative
Deepening
Bidirectional
(if applicable)
Time
bd
bd
bm
bl
bd
bd/2
Space
bd
bd
bm
bl
bd
bd/2
Optimal?
Yes
Yes
No
No
Yes
Yes
Complete
Yes
Yes
No
Yes, if
Yes
Yes
ld
ي:
اجتناب از حاالت تکرار
برراي مسررائل زيررادي ،حرراالت تکرراري غيرقابررل اجتنرراب هسررتند .ايررن شررامل تمررام مسررائلي ميشررود
که عملگرها قابل وارونه شدن باشند ،مانند مسائل مسيريابي و کشيشها و آدمخوا رها.
ي
کامپيوتر وجود دارد:
کار
فشار
ي براي مقابله با افزايش مرتبه و سرريز
سه راه براي حل مشکل حاالت تکرار
به حالتي که هم اکنون از آن آمدهايد ،برنگرديد .داشتن تابع بسط (يا مجموعه عملگرها) از توليد مابعدهايي که
نيز والدين اين گرهها وجود دارند ،جلوگيري ميکند.
در آنجا
مشابه حالتي هستند که
دوار بپرهيزيد .داشتن تابع بسط (يا مجموعه عملگرها) از توليد مابعدهاي يک گره که
.1از ايجاد مسيرهاي
ي ميکند.
مشابه اجداد آن گره است ،جلوگير
ً
ً
هر حالت د ر حافظه
مجددا توليد نکنيد .اين مسئله باعث ميشود که
قبال توليد شده است،
.2حالتي را که
بهتر است که به ) O(sتوجه کنيد که sتعداد کل
ي شود ،پيچيدگي فضايي ) O(bdداشته باشد .
نگهدار
حاالت در فضاي حالت ورودي است.
جستجوي ارضاء محدوديت ):(Constraint Satisfaction Problem
مقادير مجموعهاي از متغيرها
نوع خاص ي از مسئله است که ،CSPحاالت توسط
تعريف ميشوند و آزمون هدف مجموعهاي از محدوديتها را به آنها اختصاص ميدهد که
متغير ملزم به پيروي از آنها هستند.
CSPها ميتوانند توسط الگوريتمهاي جستجوي geneal-purposeحل شوند،
ً
صرفا براي CSPهايي طرح ميشوند که از
ساختار خاص آنها ،الگوريتمهايي
اما به علت
الگوريتمهاي عمومي کارآيي بهتري دارند.
محدوديتها به گونههاي مختلفي ظاهر ميشوند.
محدوديتهاي يکتا
محدوديتهاي دودويي
محدوديتهاي مطلق
محدوديتهاي اول ويتدار
در CSPهاي گسسته که دامنههاي آن محدود هستند ،محدوديتها ميتوانند به سادگي
مقادير نمايش داده شوند.
مجاز
توسط شمردن ترکيبات
با استفاده از يک شمارهگذاري ،هر CSPگسسته ميتواند به يک CSPدودويي تبديل
شود.
کار ببريم:.
در يک CSPبه
چطور يک الگوريتم جستجوي همه منظوره را
در حالتي که تمام متغيرها ،تعيين نشدهاند:
مقادير ممکن ،نسبت ميدهند.
متغير از مجموعه
عملگرها مقداري را به يک
مقدار گرفتهاند و تمام محدوديتها
آزمو ن هدف تمام متغيرها کنتر ل ميکند که آيا
از بين رفتهاند يا خير.
در عمق nهستند.
حداکثر عمق درخت جستج و در nو تعداد متغيرها و تمام راهحلها
توجه کنيد که
ً
قبال مختلف شده
ي عمقي روي يک CSPزمان جستج و را تلف ميکند زماني که محدوديتها
جستجو
باشند.
فصل چهارم:
روشهاي جستجو آگاهانه
جستجوي بهترين:
در يک درخت ،زماني که گرهها مرتب ميشوند،
اين استراتژي به اين صورت بيان ميشود که
ديگر گرهها بسط داده ميشود.
گرهاي که بهترين ارزيابي را داشته باشد ،قبل از
ً
معيار تخمين براي
عموما از تعدادي
هدف :يافتن راهحلهاي کمهزينه است ،اين الگوريتمها
هزينه راهحلها استفاده ميکنند و سعي بر حداقل کردن آنها دارند.
حداقل هزينه تخمين زده شده براي رسيدن به هدف :جستجوي حريصانه
يکي از سادهترين استراتژيهاي جستجوي بهترين ،به حداقل رساندن هزينه تخمين زده شده
تر است،
براي رسيدن به هدف است .بدين صورت که حالت گرهاي که به حالت هدف نزديک
ابتدا بسط داده ميشود.
ً
تابع کشفکننده :هزينه رسيدن به هدف از يک حالت ويژه ميتواند تخمين زده شود اما دقيقا
تعيين نميشود .تابعي که چنين هزينههايي را محاسبه ميکند تابع کشفکننده hناميده
ميشود.
جستجوي حريصانه :جستجوي بهترين که hرا به منظور انتخاب گره بعدي براي بسط
ي حريصانه ) (greedy searchناميده ميشود.
استفاده ميکند ،جستجو
ويژگيهاي جستجوي حريصانه:
در تمام طول راه به طرف هدف ،مانند جستجوي
مسير ويژه
جستجوي حريصانه از لحاظ دنبال کردن يک
عمقي است ،اما زماني که به بنبست ميرسد ،برميگردد.
اين جستج و بهينه نيست و ناکامل است.
حداکثر عمق فضاي جستج و
در بدترين حالت براي جستجوي حريصانه ) ،O(bmکه m
پيچيدگي زماني
است.
در حافظه نگه ميدارد ،بنابراين پيچيدگي فضاي آن مشابه پيچيدگي زماني
جستجوي حريصانه تمام گرهها را
آن است.
ميزان کاهش پيچيدگي به مسئله و کيفيت تابع hبستگي دارد.
ي *A
حداقلسازي مجموع هزينه مسير :جستجو
نيز حداقل ميکند.
جستج و با هزينه يکسان ،هزينه مسير g(n) ،را
با ترکيب د و تابع ارزيابي داريم:
)f(n) = g(n) + h(n
مسير از گره آغازين به گره nرا به ما ميدهد.
) :g(nهزينه
مسير از nبه هدف است
) :h(nهزينه تخمين زده شده از ارزانترين
و ما داريم:
هزينه تخمين زده شده ارزانترين راه حل از طريق f(n) = n
کشفکنندگي قابل قبو ل:
تابع hاي را که هزينهاي بيش از تخمين براي رسيدن به هدف نداشته باشد ،يک کشفکنندگي
قابل قبول ) (admissible heuristicگويند.
جستجوي *:A
جستجوي بهترين که fبه عنوان تابع ارزياب و يک تابع hقابل قبول استفاده ميکند ،به عنوان
جستجوي * Aشناخته ميشود.
فتار جستجوي *A
ر
نگاهي گذرا به اثبات کامل و بهينه بودن *:A
مشاهده مقدماتي:
ً
هر مسيري از ريشه،
در طول
مجاز داراي اين ويژگي هستند که
تقريبا تمام کشفکنندگيهاي
هرگز کاهش پيدا نميکند.
هزينه f
اين خاصيت براي کشفکنندگي ،خاصيت يکنوايي ) (monotonicityگفته ميشود.
اگر يکنوا نباشد ،با ايجاد يک اصالح جزئي آن را يکنوا ميکنيم.
هر گره جديدي که توليد ميشود ،بايد کنترل کنيم که آيا هزينة fاين گره از هزينه f
بنابراين
پدر به جاي فرزند مينشيند:
کمتر باشد ،هزينة f
اگر
کمتر است يا خير .
پدرش
بنابراين:
fهميشه در طول هر مسيري از ريشه غيرکاهش ي خواهد بود ،مشروط بر اينکه hامکانپذير
باشد.
) :h*(nهزينه واقعي رسيدن از nبه هدف است.
کامپيوتر
هر
مسير متناسب هستند ،و سرانجام رشد نمايي
در استفاده عملي ،خطاها با هزينه
تسخير ميکند .البته ،استفاده از يک کشفکنندگي خوب هنوز باعث صرفهجويي زيادي
را
ي ناآگاهانه ميشود.
نسبت به جستجو
ً
تجو
دچار کمبود فضا ميشود .زيرا اين جس
دچار کمبود زمان شود ،
معموال قبل از اينکه
*A
در حافظه ذخيره ميکند.
تمام گرههاي توليد شده را
توابع کشفکننده:
مسئله 8را بررس ي ميکنيم:
معماي 8يکي از مسائل اوليه کشفکنندگي بود.
هدف :لغزاندن چهارخانهها به طور افقي يا عمودي به طرف فضاي خالي است تا زماني که
ساختار کلي مطابق با هدف ) (goalباشد.
5
4
6
1
8
8
7
3
2
7
Start State
1
2
3
4
6
Goal State
5
در
رگز
نياز داريم که ه
خواستار يافتن راهحلهاي کوتاه باشيم ،به يک تابع کشفکننده
اگر
در اينجا ما د و کانديد داريم:
تعداد مراحل به هدف اغراق نکند .
مجاز
در مکانهاي نادرست هستند h1 .يک کشفکننده
= h1 تعداد چهارخانههايي که
يکبار بايد
هر چهارخانهاي که خارج از مکان درست باشد حداقل
است ،زيرا واضح است که
جابجا شود.
= h2 مجموع فواصل چهارخانهها از مکانهاي هدف صحيحشان است .فاصلهاي که ما
حساب ميکنيم ،مجموع فواصل عمودي و افقي است که بعض ي وقتها city block
distanceو يا Manhattan distanceناميده ميشود.
بر کارايي:
اثر صحت کشفکنندگي
اگر مجموع تعداد
يک راه براي تشخيص کيفيت کشفکنندگي فاکتور انشعاب مؤثر * bاست .
گرههاي بسط داده شده توسط *Aبراي يک مسئله ويژه Nباشد و عمق راه حل ،d
سپس * bفاکتور انشعابي است که يک درخت يکنواخت با عمق dخواهد داشت تا گرههاي
Nرا نگهدارد .بنابراين:
N=1+ b*+( b*)2…+( b*)d
ً
ر
مقدار ثابتي دارد.
مؤثر که توسط کشفکنندگي نمايش داده ميشود،
معموال فاکتو انشعاب
در حدود 1دارد.
يک کشفکنندگي خوب طراحي شده b* ،
کشفکنندهها براي مسائل ارضا محدوديت:
مسئله ارضاء محدوديت شامل يک سري از متغيرهايي است که ,ويژگيهاي ز ير را دارا هستند:
ميتوانند مقاديري را از دامنة داده شده دريافت کنند.
با يک سري از محدوديتها ،ويژگيهاي راه حل را مشخص کنند.
ي نقشه نمونهاي از اين کشفکنندههاست:
رنگآميز
هدف رنگآميزي نقشه ،اجتناب از رنگآميزي مشابه د و کشور همسايه است.
B
A
GREEN
RED
C
E
F
D
حداکثر از سه رنگ (قرمز ،آبي ،سبز) ميتوانيم استفاده کنيم:
ما
در
قرمز را براي ،Bانتخاب کنيم ،کشور Eبايد آبي باشد .
سبز را براي کشور ،A
اگر رنگ
ي Dبا رنگ
سبز باشد .رنگآميز
قرمز درآوريم و F
اين صورت ما ناچاريم که Cرا به رنگ
در اين حالت مسئله بدو ن هيچگونه جستجويي حل
آبي يا قرمز ،بستگي به راهحل دارد .
ميشود.
جستجوي *:SMA
الگوريتم * ،SMAحافظه محدود * Aساده شده (Simplified-Memory-
)* BoundedAميباشد.
جستجو استفاده کند .استفاده از
قادر است تا از تمام حافظه موجود براي اجراي
اين الگوريتم ،
نظر کرد.
جستجو را وسعت ميبخشد .ميتوان هميشه از فضاي اضافي صرف
بيشتر کارايي
حافظه
* SMAداراي خواص زير است:
ميتواند از تمام حافظه قابل دسترس استفاده کند.
ي ميکند.
ي تا جايي که حافظه اجازه ميدهد ،جلوگير
از حاالت تکرار
مسير راه حل کافي
اين الگوريتم کامل است به شرط آنکه حافظه براي ذخيره کم عمقترين
باشد.
مسير راهحل کافي باشد.
اگر حافظه کافي براي ذخيره کمعمقترين
اين الگوريتم بهينه است ،
بعالوه بهترين راهحلي را برميگرداند که بتواند با حافظه موجود مطابقت داشته باشد.
زماني که حافظه موجود براي درخت جستجوي کامل کافي باشد ،جستجو Optimally
efficientاست.
طراحي *SMAساده است.
نياز به ساختن فضا
نياز به توليد فرزند داشته باشد ولي حافظهاي نداشته باشد ،
زماني که
بر روي صف دارد .براي انجام اين امر ،يک گره را حذف ميکند .گرههايي که به اين طريق ا ز
صف حذف ميشوند ،گرههاي فراموششده يا ) (forgotten nodesناميده ميشوند.
در گرههاي
براي اجتناب از جستجوي مجدد زيردرختهايي که از حافظه حذف شدهاند ،
در ز ير درخت فراموش شده ،نگهداري ميشود.
مسير
در مورد کيفيت بهترين
اجدادي ،اطالعاتي
ي
الگوريتمهاي اصالح تکرار
نظر داشتن تمام حاالتي است که روي
بهترين راه براي فهم الگوريتمهاي اصالح تکراري در
در دورنما مطابق با
هر نقطه
سطح يک دورنمايي در معرض ديد قر ار داده شده است .ارتفاع
در اطراف دورنما و سعي
تابع ارزياب حالت آن نقطه است .ايده اصالح تکراري ،حرکت کردن
بر يافتن قلههاي مرتفع است ،که همانا راهحلهاي بهينه هستند.
ً
ي
اتر از
ي را فقط حفظ ميکنند ،و توجهي فر
اثر حالت جار
معموال
الگوريتمهاي اصالح تکرار
همسايگي آن حالت ندارند.
evaluation
Current
state
بر يافتن قلههايي بروي سطح حاالت دارند،
الگوريتمهاي اصالح تکراري سعي
جائي که ارتفاع توسط تابع ارزيابي تعريف ميشود.
اين الگوريتمها به د و گره اصلي تقسيم ميشوند.
الگوريتمهاي تپهنوردي )(Hill-climbing
Simulated annealing
-1الگوريتمهاي جستجوي تپهنوردي )(Hill-climbing
يک اصالح خوب اين است زماني که بيش از يک فرزند خوب براي انتخاب وجود دارد،
الگوريتم بتواند به طو ر تصادفي از ميان آنها يکي را انتخاب کند.
اين سياست ساده ،سه زيان عمده دارد:
تر از
:Local Maxima يک ماکزيمم محلي ،برخالف ماکزيمم عمومي ،قلهاي است که پائين
بلندترين قله درفضاي حالت است .زماني که روي ماکزيمم محلي هستيم ،الگوريتم توقف خواهد نمود.
انتظار باشد.
نيز ممکن است دور از
اگرچه راه حل
:Plateaux يک فالت محوطهاي از فضاي حالت است که تابع ارزياب يکنواخت باشد .جستج و
يک قدم تصادفي را برخواهد داشت.
:Ridges نوک کوه ،داراي لبههاي سراشيب است .بنابراين جستج و به باالي نوک کوه به آساني
ً
يما به
مگر اينکه عملگرهايي موجود باشند که مستق
ميرسد ،اما بعد با ماليمت به سمت قله ميرود .
ديگر نوسان داشته باشد و
سمت باالي نوک کوه حرکت کنند .جستج و ممکن است از لبهاي به لبه
پيشرفت کمي را حاصل شود.
کار
اگر اين اتفاق بيفتد ،تنها
هر مورد ،الگوريتم به نقطهاي ميرسد که هيچ پيشرفتي نيست .
در
آغاز ميشود.
آغاز مجدد از نقطه شروع ديگري دوباره
ممکن براي انجام دادن
اگر فقط
ظاهر فضاي حالت «سطح» بستگي دارد :
موفقيت hill-climbingخيلي به
ماکزيممهاي محلي کمي وجود داشته باشد ،تپهنوردي با شروع تصادفي خيلي سريع راهحل
خوبي را پيدا خواهد کرد.
Simulated annealing -2
در يک ماکزيمم محلي
در اين گروه از الگوريتمها به جاي شروع دوباره به طور تصادفي زماني که
گير افتاديم ،ميتوانيم اجازه دهيم که جستج و چند قدم به طرف پائين بردارد تا از ماکزيمم
محلي فر ار کند.
3
2
3
2
1
2
2
3
2
3
1
3
2
0
هر مرحله يک وز ير به منظور تعيين
در
دو مرحلهاي براي مسئله 8وز ير با استفاده از حداقل برخوردها را نشان ميدهد .
راهحل
هر چهارخانه نشان داده شده
در
در اين مورد ،تعداد وزيرهاي حملهکننده)
مجدد ستون انتخاب ميشود .تعداد برخوردها (
است .الگوريتم وز ير را به چهارخانهاي که حداقل برخورد را داشته باشد ،براي از بين بردن تصادفي برخوردها ،حرکت ميدهد.
ً
اگر حرکت واقعا شرايط را بهبود بخشد ،آن حرکت هميشه اجرا ميشود.
پارامترهاي مؤثر به شرح زير ميباشند:
: E -1چگونگي ارزيابي.
:T -2تعيين احتمال.
الگوريتم شباهت صريحي با ( annealingپردازش ي که به طو ر آهسته مايعي را تا زماني که
مقدار تابع مطابق با انرژي ورودي اتمهاي ماده
يخ ببندد سرد ميکند) ،گسترش يافته است.
در جايي که پائين آمده است ،تعيين
است ،و Tبا دما مطابقت دارد .جدول ميزان دما را
ميکند.
در مسائل ارضا محدوديت
کاربردها
مسائل ارضاء محدوديت ) ،(CSPميتوانند توسط روشهاي اصالح تکراري با استفاده از
موارد ز ير حل شوند.
مقدار دادن به تمام متغيرها.
ساختار به طرف يک راهحل.
تغيير به منظور حرکت دادن
به کاربردن عملگرهاي
الگوريتمهايي که CSPها را حل ميکنند ،روشهاي تصحيح کشفکنندگي ،ناميده ميشوند،
ساختار جاري مسئله اصالح ميکنند.
در
زيرا آنها تناقضات را
ي است که
مقدار جديد براي يک متغير ،واضحترين کشفکنندگي انتخاب مقدار
در انتخاب
ديگر متغيرها نتيجه دهد ،که همان کشفکنندگي مينيمم
مقدار تناقضات را با
کمترين
تناقضات است.
فصل پنجم :
تئوري بازي
در نقش مسائل جستجو
بازيها
در بازيهاي صفحهاي ديده ميشود ،موجب شده تا تئوري بازي جزء
رقابت انتزاعي ،که
تحقيقات AIقر ار بگيرد.
ً
معموال به تعداد کمي از عمليات محدود
وضعيت بازي براي بازنمايي آسان است و عاملها
ميشوند.
داليلي که محققين قديم ،شطرنج را بهعنوان موضوعي در AIبرگزيدند:
ي اثباتي بر وجود ماشيني است که اعمال هوشمندانهاي را انجام
ي شطرنج کامپيوتر
باز
ميدهند.
سادگي قوانين
ً
کامال براي برنامه شناخته شده است( .بازنمايي بازي به عنوان يک جستج و از
وضعيت دنيا
طريق فضاي موقعيتهاي ممکن بازي ،ساده است).
پيچيدگي بازيها ،به طور کامل نوعي از عدم قطعيت را معرفي ميکنند.
عدم قطعيت به علت وجود اطالعات گم شده رخ نميدهد ،اما به علت اينکه فرد زماني براي
محاسبه دقيق نتايج حرکت ندارد عدم قطعيت بوجود ميآيد.
در اين مورد ،فرد بر اساس تجربيات گذشته ميتواند بهترين حدس را بزند.
در بازيهاي دونفره:
تصميمات کامل
نظر ميگيريم که آن را MIN,MAXميناميم.
در
مورد کلي از يک بازي با د و بازيکن را
يک بازي به طور رسمي ميتواند به عنوان نوعي از مسئله جستج و به همراه قسمتهاي ز ير تعريف شود:
حالت اوليه شامل مکان صفحه وتعيين نوبت حرکت هر بازيکن است.
مجموعهاي از عملگرها که حرکات صحيح را که بازيکن ميتواند انجام دهد ،تعيين
ميکند.
آزمون پاياني زمان بازي را تعيين ميکند .حاالتي را که بازي درآنها به پايان رسيده است
حاالت پاياني ناميده ميشوند.
مقدار عددي براي نتيجه بازي را تعيين ميکند.
تابع سودمندي (تابع امتياز )payoffکه
اگر به آن به عنوان يک مسئله جستج و نگاه شود ،جستج و براي دنبالهاي از حرکات که
منتهي به حالت پاياني ميشد (مطابق با تابع سودمندي) ،و سپس پيشروي و ساخت اولين
در دنباله بود.
حرکت
اما حرکات MINغير قابل پيشبيني است؛
بنابراين:
MAXبايد استراتژياي را بيابد که به يک حالت پاياني برنده بدون توجه به عملکرد MIN
هر حرکت ممکن از
منجر شود ،که اين استراتژي شامل حرکات درست براي MAXبراي
MINميباشد.
ي بهينه براي MAXطراحي شده است و از
الگوريتم MINMAXبه منظور تعيين استراتژ
ي کرد .الگوريتم شامل 5مرحله است:
اين رو ميتوان بهترين حرکت را تصميمگير
.1توليد درخت کامل بازي ،تمام راه تا مراحل پاياني
هر حالت پاياني به منظور بدست آوردن مقدارش.
.2درخواست تابع سودمندي براي
باالتر دردرخت جستج و استفاده
.3از سودمندي حاالت پاياني به منظور تعيين سودمندي گرهها يک مرحله
کنيد.
هر لحظه ،ادامه دهيد.
در
مقادير را از گرههاي برگي تا ريشه ،يک اليه
.4بررس ي
ً
مقدار منتهي
مقادير به باالي درخت ميرسند MAX ،حرکتي را انتخاب ميکند که به باالترين
.5
احتماال
ميشود.
اگر:
حداکثر عمق درخت،
:m
هر نقطه،
در
:bتعداد حرکات قانوني
آنگاه:
زمان پيچيدگي الگوريتم O(bm) ،minimaxاست.
الگوريتم يک جستجو عمقي است.
تصميمات ناقص:
ي تمامي راههاي
الگوريتم minimaxفرض ميکند که برنامه زمان الزم براي جستجو
ً
معموال عملي نيست.
ممکن وضعيتهاي پاياني را دارد که اين فرض
تغيير يابد:
الگوريتم مينيماکس ،به د و راه
تابع سودمندي با تابع ارزيابي EVALجايگزين شود.
آزمون پاياني با آزمون قطع CUTOFF-TESTجايگزين گردد.
تابع ارزيابي:
ي را ازموقعيت داده شده برميگرداند.
انتظار باز
تابع ارزيابي تخميني از سودمندي مورد
ي بي نهايت به کيفيت تابع ارزيابي بستگي دارد.
واضح است که ارائه يک برنامه باز
چگونه به طو ر دقيق کيفيت را ميتوان اندازه گرفت؟
در مورد حالت پاياني بايد به توافق برسند.
.1تابع ارزيابي با تابع سودمندي
.2نبايد زياد طو ل بکشد! (اگر پيچيدگي را محدود نکنيم minimaxبه عنوان يک
مقدار دقيق وضعيت محاسبه ميشود ).از اين رو ،معاملهاي
زيربرنامه فراخواني ميشود و
بين صحت تابع ارزيابي و هزينه زمان آن وجود دارد.
.3تابع ارزيابي بايد به درستي شانسهاي واقعي براي برد را منعکس کند.
ديگر مهرهها روي
هر مهره ميتواند به طور مستقل از
مقدار
تابع ارزيابي فرض ميگيرد که
دار ناميده ميشود.
صفحه قضاوت شود .اين نوع از تابع ارزيابي ،تابع خطي وزن
هر نوع مهره روي
ذکر شود که Wها وزن ها هستند و fها اعداد
اين تابع ميتواند به صورتي
صفحه خواهند بود.
قطع جستجو:
صريحترين رهيافت براي کنترل ميزان جستج و قراردادن محدوديتي براي داشتن يک عمق ثابت
است ،بنابراين تست قطع براي تمام گرهها در زير عمق dموفق ميشود .عمق طوري انتخاب
ميشود که ميزان زمان استفاده شده از آنچه که قوانين بازي اجازه ميدهد تجاوز نکند.
زماني که ،وقت تمام ميشود ،برنامه حرکت انتخابي توسط عميقترين جستجوي کامل شده را
برميگرداند.
به دليل تخميني بودن توابع ارزيابي اين رهيافتها ميتوانند نتايج ناخوشايندي را به همراه داشته
باشند.
تابع ارزيابي فقط بايد براي مواقعي به کاربرده شود که خاموش هستند ،يعني اينکه تفاوتهاي
نظر ميرسد.
در آينده نزديک بعيد به
در مقدار ،
گير
چشم
اين جستجوي فوق العاده جستجوي خاموش ناميده ميشود.
مسئله افقي
):(horizonproblem
رخ سياه مانع از حرکت وز ير سفيد به
حالت افقي شده است و اين موقعيت
در حالي که برگ
به نفع سياه است .
در دست سفيد است.
برنده
هرس آلفا-بتا:
هرس درخت جستجو:
نظر داشتن و بدو ن آزمايش ،هرس درخت
در
پردازش حذف شاخهاي از درخت جستجو ،با
جستج و ناميده ميشود.
کار برده ميشود ،حرکت
زماني که اين تکنيک براي يک درخت minimaxاستاندارد ،به
مشابهي همانطور که minimaxانجام ميداد ،برميگرداند؛ اما شاخههايي که در تصميم
نهايي دخالتي ندارند را هرس ميکند.
نظر گرفته
در
هر لحظه ،بايد گرههايي
در
جستجوي minimaxعمقي است ،بنابراين ،
در درخت هستند.
مسير مجزا
در طول يک
شوند که
مسير براي MAXپيدا شده است .و β
در طول
مقدار بهترين انتخابي باشد که تا کنون
α
مسير تا اين لحظه
در طول
مقدار بهترين (به طور مثال ،پايينترين مقدار) انتخابي باشد که
براي MINپيدا شده است.
درخت جستجوي آلفا-بتا:
اين درخت ،مقدار αو βرا همچنانکه جل و ميرود ،به رو ز درميآورد ،و ز ير درخت را هرس
ميکند (فراخواني بازگشتي را قطع ميکند) به محض اينکه معلوم ميشود که اين ز ير درخت
ي است.
بدتر از مقدار αيا βجار
مزاياي هرس آلفا-بتا
در آن گرههاي فرزندي آزمايش شدهاند ،برميگردد.
مزاياي آلفا-بتا به مرتبهاي که
پيچيدگي O(b/log b)dميباشد.
در عمل ،يک تابع ساده مرتبکننده شما را به نتيجه بهترين حالت بر خالف نتيجه تصادفي
(1
سوق ميدهد.
ي و استفاده از مقادير backed-
ي عميقکننده تکرار
ديگر انجام جستجو
(2رهيافت مشهور
در تکر ار بعدي است.
upاز يک تکر ار براي تعيين ترتيب جانشينها
در حالت کلي) و بايد به
جستجو
در حقيقت ،مسائل
نيز قابل مالحظه هستند ( و
نتايج بازيها
صورت يک مدل درخت مطلوب فرض شوند تا نتايجشان را به دست آورند.
عنصر شانس هستند:
بازيهايي که شامل
تخته نرد يک بازي عمومي است که شانس و مهارت را با هم ترکيب ميکند.
تاسهاي سفيد ،6-5چهار حرکت زير
را ميتواند انجام دهد:
( 10-16و )5-10و ( 19-24و )5-11و
( 5-11و )5-10و ( 11-16و )5-11
5
6
در تخته نرد بايد شامل گرههاي شانس براي گرههاي MINو MAXباشد.
ي
درخت باز
مرحله بعدي فهم چگونگي ساخت تصميمات صحيح است.
مقادير انتظاري گرهها ،صريح است .براي گرههاي پاياني ،از تابع سودمندي مانند
محاسبه
بازيهاي قطعي استفاده ميکنيم.
در درخت جستج و به اندازه يک مرحله ،به يک گره شانس برخورد ميکنيم.
با پيشروي
اگر ما فرض کنيم که ) S(C,diمجموعه موقعيتهاي توليد شده توسط اعمال حرکات قانوني
در موقعيت Cباشد ،ميتواند مقدار expectimaxاز Cرا با استفاده از
براي پرتاب ) P(di
فرمول ز ير محاسبه نمود:
))Expectimax (c)=∑I P(di) maxsε S(c,di) (utility(s
در موقعيت cرا با فرض بهترين بازي ارائه ميدهد.
انتظار
اين فرمول ،سودمندي مورد
در بازيها با گرههاي شانس:
ارزيابي موقعيت
مقادير ارزيابي
در مورد آنچه که به معناي
حضور گرههاي شانس بدين معناست که بايد
است ،دقيق بود.
فتار
در مجموع به طور متفا وت ر
مقادير ارزيابي ايجاد کنيم ،برنامه
در مقياس
اگر ما تغييري را
ميکند.
پيچيدگي:
نظر ميگيرد ،زماني معادل )O(bmnm
در
بدليل اينکه expectiminimaxتمام دنبالههاي پرتاب تاس را
ميبرد ،که nتعداد پرتابهاي محدود است.
در آينده است که احتمال وقوعشان کم است.
مزيت آلفا -بتا ،با داشتن بهترين بازي ناديده گرفتن پيشرفتها
در بازيهاي به همراه تاس ،دنبالههاي محتملي از حرکات وجود ندارد ،چون براي آن حرکاتي که بايد انجام
بگيرند ،ابتدا تاس بايد به روش درستي پرتاب شود تا آن حرکات منطقي شوند.
در
مقدار گرههاي برگي محدود ميشوند و
مقادير سودمندي بين +1و -1هستند ،سپس
اگر بگوئيم که تمام
مقدار گره شانس ي بدون توجه به فرزندانش قر ار دهيم.
عوض ما ميتوانيم حد بااليي روي
فصل ششم :
عاملهاييکه به طور منطقي استدالل ميکنند
.
.
معرفي طراحي پايهاي براي يک عامل مبتني بر دانش:
سازي
رهيافت مبتني بر دانش روش قدرتمندي از ساخت برنامه عامل است .هدف آن پياده
در مورد
در مورد دنياي آنها و استدالل
نمايي از عامل است که بتواند به عنوان دانش
کار ميرود.
فتار آنها به
گونههايي ممکن از ر
عاملهاي مبتني بر دانش قادرند که:
.1وظايف جديد را به صورت اهداف تعريف شده صريح قبول کنند.
ي دانش جديد درمورد حيطه ،به رقابت
.2آنها ميتوانند به سرعت توسط گفتن يا يادگير
برسند.
در آوردن دانش مربوطه،
.3آنها ميتوانند خود شانس را با تغييرات محيط ،توسط به رو ز
تطبيق دهند.
عامل مبتني بر دانش به موارد ز ير نياز دارد:
(1چه چيزهايي را بداند؟
(2وضعيت جاري دنيا؟
(3چطور توسط ادراک به خواص ناديده دنيا رجوع کند؟
(4چطور دنيا زمان را ميگشايد؟
(5عامل به چيزي ميخواهد برسد؟
(6فعاليتهايي که در شرايط مختلف انجام ميدهد چيست؟
بخش مرکزي عامل مبتني بر دانش پايگاه دانش ( )knowledge baseآن ،يا KBاست.
پايگاه دانش :مجموعهاي از نمايش حقايق در مورد نياز است.
جمله :هر نمايش اختصاص ي يک جمله ( )sentenceناميده ميشود.
جمال ال ال الالالت :جمر ر ر ررالت در ير ر ر ررک زبر ر ر رراني کر ر ر رره زبر ر ر رران بازنمر ر ر ررايي دانر ر ر ررش (
)representationناميده ميشود ،بيان ميشوند.
knowledge
:ASKبه منظور افزودن جمالت جديد به پايگاه دانش به کار برده ميشود.
:TELLبه منظور پرسش اينکه چه چيزهايي شناخته شده است.
مکانيزمي به
ي بايد پس از TELLedبه KBدنبال شود ،مسئوليت
تشخيص اينکه چه چيز
ديگر عامل مبتني بر دانش را تشکيل
نام استنتاج ( )inferenceاست ،که قسمت مهم
ميدهد.
هر زمان که برنامه دانش صدا زده ميشود ،دو عمل انجام ميشود:
.1به پايگاه دانش گفته ميشود ( )TELLکه چه دريافت کرده است.
.2از پايگاه دانش سؤال ميشود ( )ASKکه چه عملي بايد انجام شود.
بهتر از بقيه
در فرآيند پاسخ به اين پرسش ،استدالل منطقي براي اثبات اينکه کدام عمل
است استفاده ميشود و دانستههاي عامل و اهداف آن مشخص ميشوند.
در سه سطح تعريف کنيم:
ميت وانيم يک عامل مبتني بر دانش را
.1سطح دانش knowledge levelيا سطح epistemologicalکه خالصهترين سطح است؛
ميتوانيم عامل را توسط گفتن اينکه عامل چه ميداند ،تعريف نماييم.
.2سطح منطقي logical levelسطحي است که دانش به صورت جمالت رمزگذاري ميش ود.
در معماري عامل اجرا ميشود و
.3سطح پياده سازي Implementation Levelسطحي است که
در اين سطح وجود دارد.
بازنماييهاي فيزيکي از جمالت سطح منطقي ،
انتخاب پيادهسازي در کارآيي بهتر عامل بسيار اهميت دارد ،اما به سطح منطقي و سطح دانش
مربوط نميشود.
دنياي :WUMPUS
مشابه دنياي مکش ،دنياي Wumpusشبکهاي از مربع است که توسط ديوارهايي احاطه
هر مربع ميتواند شامل عاملها و اشياء باشد.
شدهاند ،که
وظيفه عامل يافتن طال و بازگشتن به نقطه شروع و باال رفتن از غار است.
در
براي مشخص نمودن وظيفه عامل ،ادراکات ،عمليات و اهداف آن را بايد مشخص کنيم .
دنياي ،Wumpusاينها به صورت ز ير هستند:
از مربعي که شامل Wumpusاست و مربعهاي مجاور (نه قطري) عامل بوي بدي را
دريافت ميکند .
ً
مستقيما مجاور با چالهها هستند ،عامل نسيمي را دريافت ميکند.
در مربعهايي که
در مربعي که ط ال وجود دارد ،عامل يک درخشش ي را درک ميکند.
زماني که يک عامل به داخل ديواره قدم بر ميدارد ،ضربهاي را دريافت ميکند.
غار شنيده
هر جايي از
سر ميدهد که
زماني که Wumpusکشته ميشود ،فريادي
ميشود.
ادراکات به عامل به صورت ليستي از پنج سيمبول داده ميشود.
مانند دنياي مکش ،عماليتي براي جل و رفتن ،چرخيدن 90به سمت چپ ،چرخيدن 90به
سمت راست وجود دارد.
عامل نابود خواهد شد زماني که وارد يک مربع شامل سياده چاله و يا کي Wumpusزنده
ميشود.
هدف عامل يافتن ط ال و برگرداندن آن به خانه شروع با سرعت تمام است ،بدون آنکه
کشته شود.
بازنمايي ،استدالل و منطق:
بازنمايي و استدالل با همديگر ،عملکرد يک عامل مبتني بر دانش را حمايت خواهند کرد.
بازنمايي دانش ) (knowledge representationدانش را در فرم حل شدني کامپيوتر
مطرح ميسازد ،که به عاملها کمک ميکند تا ارائه بهتري داشته باشند.
زبان بازنمايي دانش متوسط دو خاصيت تعريف ميشود:
نحو ( :)Syntaxيک زبان ساختاري ممکن براي تشکيل جمالت را ايجاد ميکند.
ساختار فيزيکي يا خاصيت فيزيکي
هر جمله توسط يک
در داخل کامپيوتر :
بازنمايي واقعي
ي ميشود.
قسمتي از عامل پيادهساز
در دنيا به چه جمالتي نسبت داده
معني ( :)Semanticتعيين ميکند که حقايق موجود
شوند.
ساختار ويژه با يک
با Semanticها ،ميتوانيم بگوييم زماني که
عامل وجود دارد ،عامل به جمالت مربوطه ،اعتقاد دارد.
معنيهاي زبان تعيين ميکند که حقايق به کدام جمالت مربوط ميشوند.
تفاوت بين حقايق و بازنماييهاي آنها:
حقايق قسمتي از دنياي واقعي را تشکيل ميدهند ،اما بازنماييهاي آنها بايد به صورتي کد
در يک عامل ذخيره شود.
شوند که بتواند به طور فيزيکي
تار جديد
ساختار فيزيکي عامل هستند و استدالل بايد پردازش ي از ايجاد ساخ
جمالت قسمتي از
تر باشد.
فيزيکي از نمونههاي قديمي
ساختار جديد حقايقي را بازنمايي ميکند
استدالل مطلوب بايد اين اطمينان را حاصل کند که
ساختار قديمي ايجاد کرده بود ،پيروي کنند.
که از حقايقي که
SENTENCES
SENTENCES
Semantics
World
Semantics
Representation
Entails
FACTS
FOLLOWS
FACTS
.ارتباط بين جمالت و حقايق توسط معناي زبان توليد ميشوند
استلزام:
ارتباط بين حقايقي که دنباله رو يکديگر هستند را نشان ميدهد.
در عالئم رياض ي ،ارتباط استلزام بين يک پايگاه دانش KBو يک جمله aبه صورت «KB
مستلزم aاست» تلفظ ميشود و به صورت KB|= aنوشته ميشود.
رويه استنتاج ميتواند يکي از د و عامل ذيل را انجام دهد:
.1با داشتن پايگاه دانش KBميتواند جمالت تازهاي از aتوليد کند که مفهوم آن
استلزام توسط KBباشد.
.2يا با داشتن يک پايگاه دانش KBو جمله aديگري ،اين رويه ميتواند گزارش دهد که a
توسط KBمستلزم شده است يا خير.
رويه استنتاج iميتواند توسط جمالتي که آنها را مشتق ميکند ،تعريف شود .اگر iبتواند a
را از KBمشتق کند ،منطقدان ميتواند بنويسيد KB |_ I a :که خوانده ميشود «آلفا از
KBتوسط iمشتق شده است يا « iمشتق ميکند آلفا از .»KB
ثبت عمليات رويه استنتاج صحيح ،اثبات ) (Proofناميده ميشود.
کليد استنتاج صحيح:
داشتن مراحل استنتاج است که به جمالت مورد عمل قرار گرفته ،توجه داشته باشد.
بازنمايي:
زبانهاي برنامهنويس ي (مانند Cيا پاسکال يا )Lipsبراي تعريف الگوريتمها مناسب
هستند و بين ساختارهاي داده پيوستگي ايجاد ميکنند.
زبانهاي طبيعي بيشتر محتاج محاوره بر خالف بازنمايي هستند.
مزايا و معايب زبان طبيعي:
زبان طبيعي راهي خوب براي سخنگ و است تا مخاطب را متوجه منظور خود سازد؛ اما اغلب
اين تقسيم دانش بدون بازنمايي صريح خود دانش انجام ميشود .زبانهاي طبيعي هم چنين
از ابهامات رنج ميبرند ،مانند عبارت «سگها و گربههاي کوچک» ،روشن نيست که آيا
نيز کوچک هستند يا خير.
سگها
يک زبان بازنمايي خوب ميبايست:
مزاياي زبانهاي طبيعي و رسمي را با هم داشته باشد.
پرمعني و رسا باشد.
غير مبهم
دقيق و
مستقل از متن
قابل استنتاج
معاني:
يک جمله خودش به تنهاي معنايي ندارد.
در عمل
تفسير اختياري داشته باشد .اما
هر جمله يک
در آن
ميتوان زباني را تعريف نمود که
تمام زبانهاي بازنمايي ارتباط سيستماتيکي بين جمالت اعمال ميکنند.
صدقپذيري:
ً
در
اگر تحت تمام تفسيرهاي ممکن
اگر و فقط
ما صحيح است
يک جمله معتبر ( )Validيا لزو
تمام دنياي ممکن ،بدو ن توجه از آنچه که تصو ر ميشد که معنا دهد و بدو ن توجه به حالت
در کل ،تعريف شده باشد.
آن مطلب
در دنيايي براي صحت
اگر تفسيري
اگر و فقط
يک جمله صدقپذير ( )satisfiableاست
در خانه [1,2] Wumpusوجود دارد " Satisfiable
آن وج ود داشته باشد .جمله
اگر چنين اتفاقي نيفتاده
در آن خانه باشد ،حتي
است زيرا امکان دارد که Wumpus
پذير نباشد صدق ناپذير ( )unsatisfiableاست.
باشد ،جملهاي که صدق
جمررالت خررود تناقض ر ي صرردقناپذير هسررتند ،اگررر تنرراقض برره معنرراي سرريمبولهررا بسررتگي نداشررته
باشد.
استنتاج در کامپيوترها:
ي به قابليت کامپيوتري که استدالل ميکند ،بستگي دارد.
ناپذير
معتبر بودن و صدق
کامپيوترها از دور نقطه ضعف رنج ميبرند:
ً
کامپيوتر لزوما تفسيري را که شما براي جمالت در پايگاه دانش به کار ميبرديد ،نميداند.
چيزي در مورد دنيا نميداند به جز آنچه که در پايگاه دانش ظاهر ميشود.
چيزي که استنتاج رسمي را قدرت ميبخشد ،نبودن محدوديت بر روي پيچيدگي جمالتي
کاميپوتر بايد آنها را مورد عمل قر ار دهد.
است که
در مورد استنتاج رسمي ،قابليت آن براي بدست آوردن نتايج صحيح است
چيز
بزرگترين
تفسير استفاده شده توسط شما نداشته باشد.
کامپيوتر اطالعي از
حتي زماني که
کامپيوتر فقط نتايج معتبر را گزارش ميکند ،که بايست بدون توجه به تفسير شما ،صحيح
باشد.
ير ميشود:
منطق شامل موارد ز
-1يک سيستم رسمي براي تعريف حالتهاي مطلب که شامل:
الف -نحو ( )syntaxزبان ،که روش درست کردن جمالت را شرح ميدهد.
ب -معاني ( )semanticزبان ،که محدوديتهاي سيستماتيکي را روي چگونگي ارتباط
جمالت با حاالت موضوع قر ار ميدهند.
-2تئ وري اثبات -مجموعهاي از قوانين براي استنباط استلزامي يک سري از جمالت.
ما روي دو نوع منطق تمرکز خواهيم کرد:
منطق بولين يا گزارهاي،
ي).
منطق مرتبه اول (دقيق تر بگوييم ،حساب گزاره مرتبه اول با تساو
در منطق گزارهاي سيمبولها تمام گزارهها را بازنمايي ميکنند.
سيمبولهاي گزارهاي ميتوانند با استفاه از ربطدهندههاي بولين ( Boolin
)connevtivesجمالت را با معناهاي پيچيدهترين توليد کنند.
منطق مرتبه او ل با بازنمايي دنياهايي به نام اشياء ( )objectsو گزاره ها روي اشياء (به
عنوان مثال ،خواص اشياء يا ارتباط بين اشياء) ،به خوبي استفاده از ربط دهنده ها و سورها
در دنيا به سرعت نوشته شوند.
در مورد چيزي
( ،)quantifiersبه جمالت اجازه ميدهند تا
در منطق مرتبه اول گزارهاي يک جمله يک حقيقت را بيان ميکند و عامل باور دارد که جمله
صحيح است ،يا جمله نادرست است يا قادر نيست تا از راه ديگري تنيجهگيري کند.
در
سيستمهايي که مبتني بر منطق شوال ( )Fuzzyهستند ،ميتوانند در جايي از اعتقاد را
نيز اجاره دهند :يک حقيقت نيازي به
يک جمله داشته باشند و همچنين به درجات حقيقت
در دنيا ندارد ،اما مي تواند تا يک ميزاني صحت داشته باشد.
درست يا نادرست بودن
منطق گزارهاي :يک منطق بسيار ساده:
عالئم منطق گزارهاي:
ثابتهاي منطقي ()true, False
عالئم گزارهايQ, P :
هاي , , , ,
رابط
پرانتز ()
تمام جم الت توسط قر ار دادن اين عالئم با هم و با استفاده از قوانين زير،
ساخته ميشوند:
ثابتهاي منطقي ( )true, Falseخودشان جمله محسوب ميشوند.
هر کدام به تنهايي يک جمله هستند.
عالمات گزارهاي نظير Q, P
پرانتزهاي اطراف يک عبارت ،آن عبارت را تبديل به يک جمله واحد ميسازند مثل (P
).^ Q
تر با يکي از پنج رابط منطقي ايجاد
يک جمله ميتواند توسط ترکيب جمالت ساده
ميشود.
روش رفع ابهام منطق گزارهاي بسيار شبيه عبارت رياض ي است.
معاني:
يک سيمبول گزارهاي ميتواند آنچه که خواست شما است ،معني بدهد .يعني اينکه،
هر حقيقت اختياري ميتواند باشد.
تفسير آن
هر رابط ميت واند
هر قسمت از جمله را دارد ،
يک جمله پيچيده ،معنايي مرکب از معناهاي
به عنوان يک تابع تصور شود.
اعتبار و استنتاج:
کار ميرود.
معتبر به
جدول درستي براي تعريف رابطها و براي کنترل جمالت
ماشين هيچ ايدهاي از معناي نتايج ندارد ،کار بر ميتواند نتايج را بخواند و از تفس ير خود
براي سيمبولهاي گزارهاي به معناي نتيجه پي ببرد.
WORLD
قادر باشد ،نتايجي را استخراج کند که از
وجود يک يک سيستم استدالل ضروري است تا
مقدمها ،بدو ن توجه به دنيا که اولويت رجوع جمالت را مشخص ميکند ،پيروي کنند.
Input sentences
conclusions
?
User
effectors
جمالت اغلب به دنيايي رجوع ميکنند که عامل دسترس ي مستقلي به آن نداشته باشد.
مدلها :Models
در آن جملهاي تحت تفسيري ويژه ،درست باشد .يک مدل ( )Modelاز آن جمله
دنيايي که
ناميده ميشود.
حائز اهميت هستند زيرا ،دوباره استلزام را مطرح ميکنند ،جمله a
بسيار
در منطق
مدلها
اگر مدلهاي KBتمام مدلهاي aباشند.
توسط يک پايگاه دانش KBمستلزم ميشود ،
نيز درست خواهد بود.
سپس زماني که KBدرست باشد a ،
مقادير درستي مشابهي براي آن سيمبو لها
ي وجود دارند که
«دنياهاي واقعي» متفاوت بسيار
دارند .تنها تقاضايي که براي کامل شدن تصفيه الزم است ،درستي يا نادرستي ه ر سيمبول
هر دنيا است
در
گزارهاي
قوانين استنتاج براي منطق گزارهاي:
هر کدام از آنها ،صحت يک استنباط از طريق جداول درستي بدست
پردازش ي که توسط
آمده است ،ميتوند به کالسهاي استنتاجها گسترش داده شود.
تر بوجود ميآيند ،و صحت
بيشتر و بيش
نمونههاي مطمئني از استنتاجها وجود دارند .که
يکبار براي هميشه نشان داده شوند.
آنها ميتواند
زماني که يک قانون پياده شد ،ميتوان به منظور ساخت استنتاجها بدون ساخت جداول
درستي ،استفاده شود.
اين جمله نيست ،اما يک قانون استنتاج است.
در تمام موارد درست باشد و مقدمها
اگر نتيجه آن
يک قانون استنتاج زماني درست است
نيز درست باشند.
يک اثبات منطقي شامل دنبالهاي از کاربردهاي قوانين استنتاج است که ابتدا با جملههاي
منجر به توليد جملهاي ميشود که اثبات را پايان ميدهد.
آغاز ميشود ،و
موجود در KB
يکنوايي:
استفاده قوانين استنتاج به منظور يافتن نتيجه از يک پايگاه دانش ،به طور صريح مبتني بر
خواص عمومي منطقهاي قطعي (شامل گزارهاي و منطق مرتبه او ل) است که يکنوايي
) (monotonicityناميده ميشود.
ميتوانيم خواص يکنوايي منطق را به طور ز ير شرح دهيم:
then ( KB1 KB2 ) |
if KB1 |
منطق مرتبه اول وگزارهاي دراين حالت ،يکنوا هستند.
تئوري احتمال ،يکنوا نيست.
کالس مفيدي از جمالت براي زماني که رويه استنتاجي با زمان چند جملهاي وجود دارد که
اين کالس جمالت هورن ) (Horn sentencesناميده ميشود .يک جمله هورن فرمي به
صورت ز ير دارد:
P1 P2 ... Pn Q
که Piو Qاتمهاي خنثي هستند .د و مورد مهم وجود دارد :اول ،زماني که Qثابت False
است.
ابر است با:
ما به جملهاي ميرسيم که بر
P1 ... Pn
ابر است با جمله
دوم اينکه ،زماني که n=1و P1=Trueما به True=>Qميرسيم که بر
اتمي .Q
منطق گزارهاي به ما اجازه ميدهد که به تمام نکات مهم درمورد منطق و چگونگي استفاده از
ً
نهايتا به عمليات تبديل ميشود ،برسيم .اما منطق گزارهاي
آن به منظور ارائه استنتاج که
بسيار ضعيف است.
مشکل کند شدن رويه استنتاج:
)1مشکل فقط نوشتن اين قوانين نيست بلکه تعداد زياد آنها ،باعث مشکل ميش ود.
در
)2مشکل ديگر ،روبرو شدن با تغييرات محيط است .ما جزيي از عامل استدالل کننده را
در پايگاه دانش در آن زمان خاص ،درست
يک مکان و زمان ويژه نشان داديم ،و تمام گزارهها
بودند .اما در حالت کلي ،دنيا هر لحظه در حال تغيير است.
در پايگاه دانش است.
اندازه يک جدول درستي 2nاست .که nتعداد سيمبولهاي گزارهاي
براي اجتناب از سردرگمي ،ما به سيمبولهاي گزارهاي متفاوتي ،براي تشخيص مکان عامل
در هر مرحله نيازداريم.
-1ما نميدانيم که بازي چه مدت طول خواهد کشيد ،بنابراين نميدانيم که چه تعداد از
نياز داريم.
اين گزارههاي وابسته به زمان ،
-2اکنو ن بايد برگرديم و حالتهاي وابسته به زمان از هر قانو ن را بنويسيم.
فصل هفتم :
منطق مرتبه او ل
.
.
منطق گزارهاي هستي شناس ي بسيارمحدودي دارد و فقط براي دنيايي که شامل حقايق
نيز مشکل ساخته است.
باشد ،تعهد قبول ميکند و اين امر بازنمايي مسائل ساده را
منطق مرتبه اول ) )First-Order_logicتعهدات هستي شناسانه قويتري را
نسبت به منطق گزارهاي ايجاد ميکند.
در اين منطق وجود دارند:
اجزايي که
اشياء) :(Objectsمردم ،خانهها ،اعداد ،تئوريها ،رنگها ،بازيهاي بيسبال ،جنگلها،
کشورها...
بدهکار است،
گتر از ،داخل ،قسمتي از ،رنگ ...دارد،
روابط) :(Relationsبرادر ،بزر
اتفاق افتاد بعد از...
خواص) :(Propertiesقرمز ،گرد :غيرواقعي ،رسمي...
توابع) :(Functionsپدر ،بهترين دوست ،يکي بيشتراز ،نوبت سوم...
ً
واقعا از اشياء و روابط بين آنها ساخته شده است ،بلکه اين
ما ادعا نميکنيم که دنيا
در مورد دنيا قضاوت کنيم.
بهتر
جداسازي به ما کمک ميکند با
قادر است تا حقايقي را در مورد تمام اشياء جهان بيان دارد.
منطق مرتبه اول
اگرچه منطق مرتبه اول ،موجوديت اشياء و روابط آنها را ممکن ميسازد ،اما هيچ تعهد
هستيشناس ي را براي چيزهايي مثل طبقات ،زمان و حوادث قبول نميکند.
ي را که قابل
قادر است تا هر چيز
نظر جهاني است که
منطق مرتبه او ل از اين
برنامهريزي باشد ،بيان کند.
نح و و معاني:
نيز دارد که اشياء را بازنمايي
منطق مرتبه اول جمالتي دارد ،اما همچنين واژههايي term
ميکنند.
سيمبو لهاي ثابت ،متغيرها و سيمبو لهاي تابع براي ساخت واژهها استفاده ميشوند ،و
کار برده ميشوند.
کميتسنجها و سيمبولهاي گزارهاي براي ساخت جمالت به
عنصر به صورت ز ير است:
هر
تعريف دقيق
سيمبولهاي ثابت ):(Constant Symbols
در اشياء ارجاع
تفسير ميبايست معين کند که کدام ش يء توسط کدام سيمبو ل ثابت
يک
داده ميشود.
ً
هر سيمبول ثابت ،دقيقا به اسم يک ش يء نامگذاري ميشود ،اما تمام اشياء نيازي به
داشتن نام ندارند و بعض ي از آنها ميتوانند چند اسم داشته باشند.
سيمبولهاي گزاره ):(Predicate Symbols
تفسير معين ميکند که يک سيمبو ل گزاره به يک رابطه ويژه درمدل رجوع ميکند.
يک
سيمبولهاي تابع ):(Function Symbols
ً
دقيقا به شيئ ديگري توسط رابطه
بعض ي از روابط تابع هستند ،بدين معنا که هر شيئ
رجوع ميکند.
انتخاب ثابت ،گزاره ،و سيمبولهاي تابع به کلي به کاربرد بستگي دارد.
ترمها ):(Terms
يک ترم ،يک عبارت منطقي است که به يک شيئ رجوع ميکند.
بسيار صريح است .تفسير ،يک رابطه تابعي ارجاع داده شده ت وسط
معاني رسمي ترمها
سيمبول تابع ،و اشياء ارجاع داده شده توسط واژهها را اختصاص ميدهد که آرگومانهايش
هستند .از اين رو ،تمام ترم به شيئ رجوع ميکند که به عنوان ) (n+1امين مدخل در آن
ظاهر
عنصر آن اشياء ارجاع شده توسط آرگومانها هستند ،
در رابطهاي که اولين n
tuple
ميشود.
جمالت اتمي ):(Atomic sentences
ميتوانيم با استفاده از ترمهايي براي ارجاع به اشياء و گزارههايي براي ارجاع به روابط،
جمالت اتمي به وجود آوريم ،که حقايق را پايهگذاري ميکنند.
پرانتز ا ز واژهها
يک جمله اتمي از يک سيمبو ل گزارهاي تشکيل يافته و توسط يک ليست
دنبال ميشود.
يک جمله اتمي درست است اگر رابطه ارجاع شده توسط سيمبول گزاره با اشياء ارجاع شده
توسط آرگومانها مطابقت داشته باشد.
رابطه در صورتي صحت دارد که tupleاشياء در رابطه باشد.
تفسير و هم به دنيا بستگي دارد.
حقيقت يک جمله بنابراين هم به
جمالت پيچيده:
تر فقط در محاسبات گزارهاي
ما ميتوانيم از رابطهاي منطقي براي تشکيل جمالت پيچيده
استفاده کنيم.
معاني جمالت که با استفاده از رابطهاي منطقي فرم گرفتهاند ،ازلحاظ گزارهاي با آن يکسان
هستند.
سورها ):(Quantifires
ذکر خواص کلي
اختيار داريم که شامل اشياء است ،طبيعي است که
زماني که ما منطقي در
اشياء را بر شمارش اشياء توسط نام ترجيح ميدهيم .سورها به ما اجازه اين کار را ميدهند.
منطق مرتبه او ل د و سور استاندارد دارد:
عمومي )(universal
وجودي )(existential
سور عمومي(Universal Quantification) :
ً
معموال به معني «براي تمام» است.
معادل با )
(عطفي
ترکيب
A
A
شما يک جمله را ميتوانيد به صورت
xP
که Pيک عبارت منطقي است تصور کنيد .و P
تمام جمالت حاصل شده توسط جانشيني نام يک شيئ براي
ظاهر شود ،است.
متغير xهرجا که در P
به صورت «وجود دارد »...تلفظ ميشود .درحالت کلي
E
سور وجودي ):(Existential
xP
زماني درست است که P
E
براي بعض ي از اشياء در دنيا درست باشد .بنابراين ميتواند به عنوان معادلي براي ترکيب
فصلي جمالت بدست آمده توسط جانشيني اسم يک اشياء براي متغير ،xتصور شود.
بنابراين ،يک جمله شرطي با سو ر وجودي در دنيايي شامل هر شيئ که مقدم آن ترکيب
ً
اصال چيزي براي گفتن
شرطي نادرست باشد ،درست است .از اين رو همچنين جمالتي
ندارند.
سورهاي النهاي ):(Nested Quantifiers
A
A
A
x,y
معادل با x
و yاست
تر ميشود.
انتز قر ار دهيم روشن
در پر
اگر ما آنها را
بسيار مهم است .
ترتيب سورها
A
E
در حالت کليy P(x,y)) ،
(x
جمله دلخواهي است که شامل x,yميباشد.
در دنيا يک خاصيت ويژهاي دارد ،و آن خاصيت به چند شيئي توسط
هر شيئي
ميگويد که
E
A
رابطه pمربوط ميشود.
از طرف ديگرy P(x,y)) ،
(x
در دنيا شيئي وجود دارد که خاصيت
ميگويد که
در دنيا مربوط ميشود
هر شيئي
ويژهاي دارد و خاصيت توسط pبه
مشکل اساس ي زماني بوجود ميآيد ،که دو سور با يک متغير استفاده ميشوند.
قانون اين است که متغير به داخليترين سور که آن را بيان ميکند ،پس اين متغير ارتباطي با ديگر سورها
نخواهد داشت.
ارتباط بين
A
و
E
در ارتباط هستند.
دو سور وجودي و عمومي از طريق تناقض با هم
در واقع
E
A
بدليل اينکه
در دنياي اشياء است و
در واقع رابط عاطفي
رابط فصلي است ،تعجب آو ر
در ارتباط با جمالت سوري
نخواهد بود که آنها از قوانين دمورگان پيروي کنند .قوانين دمورگان
به شرح ز ير است:
)P Q ( P Q
( P Q) P Q
)P Q (P Q
)P Q (P Q
xP xP
xP xP
xP xP
xP xP
براي اهداف ،AIمحتوا و از اين رو قابليت خواندن جمالت مهم هستند.
بنابراين:
ما هر دو سور را نگه ميداريم.
تساوي (:)Equality
ً
قبال به آنها اشاره ميتوانيم از سيمبول تساوي ( equality
غير از گزارهها و ترمهايي که
به
)symbolبراي ساختن عباراتي که د و ترم به شيئي مشابه رجوع کنند ،استفاده ميکنيم.
سيمبول تساوي :ميتواند به منظور شرح خواص يک تابع داده شده ،استفاده شود .اين
دو شيئي استفاده
سمبول هم چنين ميتواند با عالمت نقيض براي نشان دادن عدم تشابه
شود.
توسعهها و تمايزات نگارش ي:
سه نوع از روشهاي که روي منطق مرتبه او ل اعمال ميشود:
-1منطق مرتبه باالتر
1-2عبارات تابعي و گزارهاي با استفاده از عملگر λ
2-2سو ر يکتايي
عملگر يکتايي
3-2
-3انواع عالئم
منطق مرتبه باالتر:
قادر ميسازد تا بتوانيم کيفيت روابط و توابع اشياء را به خوبي تعيين کنيم.
ما را
ي نسبت به منطق او ل دارد.
قدرت معنا دا رتر
عبارات تابعي و گزارهاي با استفاده از عملگر : λ
اغلب مفيد است که توابع و گزارههاي پيچيده را از قسمت هاي سادهتري تشکيل دهيم.
عملگر λمرسوم است که براي اين منظور استفاده شود.
کار برده شود تا به يک ترم
نيز به
اين λ –expressionميتواند براي آرگومانها
منطقي منتهي شود.
براي مثال گزارة « از جنيست متفاوت و از آدرس مشابه هستند ».را ميتواند به صورت ز ير
نوشت:
x, y Gender( x) gender( y) Address( x) Address y
سور يکتايي:
منحصر به فرد يک گزاره را قانع ميکند ،وجود ندارد.
راه دقيقي براي گفتن اينکه يک شيئي
E
بعض ي از مؤلفان عالمت )! x King(x
را استفاده ميکنند.
منحصر به فرد xوجود دارد که ) King(xرا قانع
جمله با ال بدين معناست که «يک شيئي
ً
دقيقا يک Kingوجود دارد.
غير رسمي تر بگوييم»
ميکند «يا
عملگر يکتايي:
براي مفهوم يکتايي استفاده ميکنيم.
ً
نظر استفاده ميشود.
عموما براي بازنمايي مستقيم شيئي مورد
عالمت) xp(xﺎ
iE
:انواع عالئم
:در منطق مرتبه اول
تعدادي از عالئم رايج
Syntax item
Negation (not)
Conjunction (and)
Disjunction (or)
Implication (if)
Equivalence (iff)
Universal (all)
Existential (exists)
Relation
This book
Others
P
PQ
~ PP
P & Q P.Q PQ P, Q
PQ
PQ
PQ
P | Q P; Q P Q
x P ( x )
x P ( x )
(x) P( x) xP( x) P( x)
(x) P( x) xP( x) P ( Skolemi )
R ( x, y )
( Rxy) Rxy xRy
PQ P Q
PQ PQ
استفاده از منطق مرتبه او ل:
دامنه Kinship
اصل موضوعات ،تعاريف و قضايا
دامنه مجموعهها
عالئم خاص براي مجموعهها ،ليستها و محاسبات
طرح پرسش و گرفتن پاسخ
عاملهاي منطق براي دنياي :Wumpus
نظر ميگيريم:
در
ما معماري سه عامل را
(1عاملهاي ( )reflexکه فقط ادراکات و عملياتشان رامطابق هم طبقهبندي ميکنند.
(2عاملهاي مبتني بر مدل ( )model-basedکه بازنمايي داخلي از دنيا را تشکيل
ميدهند و از آن براي عملکردشان استفاده ميکنند.
(3عاملهاي مبتني بر هدف goal-basedکه اهداف را صورت ميدهند و سعي دارند تا
ً
نيز هستند).
معموال عاملهاي مبتني بر مدل
به آنها برسند( .عاملهاي مبتني بر هدف
عامل واکنش ي ساده:
ً
مستقيما ادراکات را به عمليات مرتبط ميسازد.
سادهترين نوع ممکن عامل ،قوانيني دارد که
ايز هستند.
اين قوانين مشابه واکنش يا غر
محدوديتهاي عاملهاي واکنش ي ساده:
وجود مسائلي که بايد به عامل از طريق بازنمايي دنيا فهمانده شود.
عاملهاي واکنش ي نميتوانند از حلقههاي نامحدود اجتناب ورزند.
در دنيا:
تغيير
بازنمايي
در اصل تاريخچه ادراک
در طراحي عامل ،تمام ادراکات به پايگاه دانش اضافه ميشود ،و
اگر ما قوانيني داشته باشيم که
در مورد دنيا بايد دانسته شود .
تمام آن چيزهايي است که
ي رجوع کنند ،ميتوانيم قابليتهاي يک عامل را براي
به گذشته به همان خوبي زمان جار
يافتن جايي که عملکرد بهينه دارد ،افزايش دهيم.
هر سيستمي که تصميماتي را بر پايه ادراکات گذشته ميگيرد ،ميتواند براي استفاده مجدد از
در مورد حالت جاري ،دوباره نوشته شود ،به شرط اينکه اين جمالت به محض
جمالتي
در عمل تازهاي که انجام ميشود ،به رو ز درآورده شود.
هر درک تازهاي و
رسيدن
تغيير نکند) را تعريف ميکنند ،قوانين
تغيير کند (
در آن دنيا ميتواند
قوانيني که روشهايي
سرتاسر زمان» برگرفته شده
diachronicناميده ميشوند که از زبان يوناني به معناي «
در بازنمايي دانش است.
است .بازنمايي تغييرات يکي از مهمترين حيطهها
تغيير پايگاه دانش است.
کنار آمدن با تغييرات ،
سادهترين راه براي
هر حالت
جستجو بپردازد ،و
در فضاي گذشته و حاالت ممکن آينده ،به
يک عامل ميتواند
توسط پايگاه دانش متفاوتي بازنمايي ميشود.
در اصل ،بازنمايي موقعيت و عمليات تفاوتي با بازنمايي اشياء واقعي يا روابط واقعي ندارد.
در
در مورد اشياء و روابط مناسب ،تصميمگيري کنيم و سپس قضايايي
نياز داريم که
ما
رابطه با آنها بنويسيم.
محاسبه موقعيت:
در منطق
محاسبه موقعيت ) (Situation Calculusروش خاص ي براي تعريف تغييرات
مرتبه او ل است.
هر
نظر ميگيرد ،که
در
تصوري که از دنيا ميشود ،آن را به صورت دنبالهاي از موقعيتها
کدام از آنها يک " "snapshotاز حالت دنيا است.
استنتاج خواص پنهاني دنيا:
زماني که عامل بتواند تشخيص دهد که کجا قر ار دارد ،ميتواند کيفيتها را با محل ،به
جاي موقعيت تطبيق دهد.
قوانين همزمان:
ي براي اين استنباطها خواهيم داشت ،قوانين
تسخير اطالعات ضرور
قضايايي را که ما براي
ديگر
همزمان ) (Synchronicناميده ميشوند ،زيرا آنها خواص حالت يک دنيا را به
خواص حالت دنياي مشابه ،مربوط ميکنند.
د و نوع اصلي از قوانين همزمان وجود دارند:
قوانين :Causal
در دنيا منعکس ميکنند :بعض ي از خواص پنهاني
قوانين سببي جهت مفروض شده علت را
دنيا ،ادراکات مطمئني را براي توليد شدن باعث ميشوند.
)2قوانين تشخيص ي ):(Diagnostic rules
ً
ر
قوانين تشخيص ي مستقيما داللت بر حضو خواص پنهان شده از اطالعات مبتني ب ر ادراک
دارند.
ً
نظر ميآيد که اطالعات مطلوبي را مستقيما توليد کنند ،خيلي
اگرچه قوانين تشخيص ي به
حيلهگيرانه است ،اطمينان داشته باشيم که آنها قويترين نتايج ممکن را از اطالعات
موجود به دست ميآورند.
اگر قضايا به درستي و کمال ،روش
خاطر سپردن اين است که
مهمترين مسئله براي به
عملکرد دنيا و روش ي که ادراکات توليد ميشوند را تعريف کنند ،رويه استنتاج به درستي
قويترين شرح ممکن از حالت دنيا با ادراکات داده شده را استخراج خواهد کرد.
اولويت بين عمليات:
ديگر
در قوانيني که با
نياز به تغييرات
در مورد بعض ي از چهرههاي دنيا
تغييرات عقايد عامل
کار دارند ،دارد.
چهرهها سرو
عامل ما به سادگي توسط پرسش براي رسيدن به چيزي متفاوت ،ميتواند د و مرتبه برنامهريزي شود.
اهداف ،مطلوب بودن حاالت حاصل را بدون توجه به روش به دست آمدن آنها توضيح ميدهند.
اولين قدم ،شرح مطلوبيت خود عمليات ) ،(actionو ترک ماشين براي انتخاب بهترين
عمل است.
از يک مقياس ساده استفاده ميکنيم:
عمليات ميتوانند عالي ،خوب ،متوسط ،ريسکي و يا مهلک باشند.
غير اينصو رت،
در
در صورت يافتن انجام دهد؛
عامل هميشه بايد يک عمل فوقالعادهاي را
اگر تمام قبليها
دار
غير اينصورت ،يک عمل متوسط ،و يک عمل ريسک
در
يک عمل خوب
شکست بخورند.
مقدار عملياتي:
سيستم
مقدار عملياتي (action-
ي قوانيني از اين نوع است يک سيستم
سيستمي که حاو
) valueناميده ميشود.
ً
واقعا عمليات انجام ميدهند ،رجوع نميکنند ،فقط
توجه کنيد که قوانين به آنچه که
به مطلوب بودن آنها توجه دارند.
به سوي يک عامل هدفدار:
منجر رسيدن به
حضور يک هدف دقيق به عامل اجازه ميدهد تا دنبالهاي از عملياتي که
هدف ميشوند را پيدا کند.
حداقل سه روش براي يافتن چنين دنبالهاي وجود دارد:
(1استنتاج
(2جستجو
(3برنامهريزي
استنتاج:
نوشتن قضايايي که به ما اجازه ASKاز KBرا براي دنبالهاي از عمليات بدهد که ضمانت
رسيدن به هدف را به طو ر امن بکند ،چندان مشکل نيست.
مشکالت اين روش:
بسيار زياد است.
براي دنياهاي بزرگ ،تقاضاهاي محاسباتي -مشکل تشخيص راهحلهاي خوب از راهحلهاي بيهوده وجود دارد.
جستجو:
ما ميتوانيم از رويه جستجوي سطحي براي يافتن مسيري به هدف استفاده کنيم .اين از عامل
حاالت
درخواست ميکند تا دانش خود را به صورت مجموعهاي از عملگرها درآورد ،و بازنمايي
کار برده شود.
را دنبال کند ،بنابراين الگوريتم جستج و ميتواند به
ي:
برنامه ريز
در مورد عمليات
شامل استفاده از سيستمهاي استدالل خاص ي ميشود که براي استدالل
طراحي شدهاند.
فصل هشتم :
استنتاج در منطق مرتبه او ل
.
.
:قوانين استنتاج مربوط به سورها
:قوانين استنتاج براي منطق گزارهاي
1. Modus Ponens
2. And – Elimination
3. And – Introduction
4. Or – Introduction
5. Resolution
سه قانون استنتاجي جديد:
-1حذف سو ر عمومي ):(Universal Elimination
هر جمله αمتغير ،vو ترم زميني gداريم:
براي
, a
)SUBST({ / g}, a
-2حذف سور وجودي:
براي هر جمله ،αمتغير ، vو سيمبول ثابت kکه جاي ديگري از پايگاه دانش ظاهر نشده
است ،داريم:
, a
)SUBST({ / K }, a
:(Existential Introduction) -3
هر جمله ،αمتغير vکه در αواقع نباشد ،و ترم زميني gکه در αواقع نشود داريم:
براي
a
) SUBST({g / }, a
ميتوان اين قوانين را با استفاده از:
يک جمله با سور عمومي به عنوان ترکيب عطفي تمام مقداردهيهاي ممکن آن ،و تعريف
يک جمله با سور وجودي به عنوان ترکيب فصلي تمام مقداردهيهاي ممکن آن ،کنترل کرد.
در واقع پرسش ي از مطابقت نمونههاي پيشفرضيات آنها با جمالت
کاربرد قوانين استنتاج ،
موجود در KBو سپس افزودن نمونههاي جديد آنهاست.
ي کنيم ،پس واضح
اگر ما فرايند يافتن اثبات را به عنوان يک پردازش جستج و فرمولهساز
است که اثبات همان راه حل مسئله جستج و است و روشن است که بايد برنامهاي
مسير نادرست موجود باشد.
هر گونه
هوشمند براي يافتن اثبات بدو ن دنبال کردن
: تعميم يافتهModus Ponens
Canonical فرم
(Unificaiton) يکسانسازي
فرم :Canonical
در پايگاه دانش بايد به صورتي باشند که با يکي از پيشفرضيات
تمام جمالت موجود
قانون Modus Ponensمطابقت داشته بشاند ،فرم Canonicalبراي
در پايگاه دانش از چه نوع
هر جمله
Modus Ponensمتضمن اين نکته است که
در طرف
در طرف چپ و يک اتم منفرد
اتمي يا شرطي با يک ترکيب عطفي از جمالت اتمي
راست بايد باشد.
ما جمالت را به جمالت Hornزماني تبديل ميکنيم که ابتدا وارد پايگاه دانش ،با استفاده
از حذف سور وجودي و حذف Andشده باشند.
ي ):(Unificaiton
يکسانساز
وظيفه روتين يکسانساز ،Unifyگرفتن د و جمله اتمي q ،pو برگرداندن يک جانشين که
اگر چنين جانشيني موجود نباشدfail ،Unify ،
q ،pرا مشابه هم خواهد ساخت ،است ( .
برميگرداند).
)UNIFY(p,q) , SUBST ( , p) SUBST ( , q
،UNIFYعموميترين يکسانساز ) (Most General Unifierيا ) (MGUرا
در قبل محدودسازي متغيرها دا رد.
برميگرداند ،که جانشيني است که کمترين تعهد را
زنجيرهسازي به جل و و عقب ):(Forward AND Backward Chaining
زنجيرهسازي به جلو ):(forward chaining
قانون Modus Ponensتعميم يافته به د و صورت استفاده ميشود .ميتوانيم با
در پايگاه دانش شروع کنيم و نتايج جديدي را که ميتوانند
جمالت موجود
جلو ناميده
ي به
ي را بسازند ،توليد کنيم .اين روش زنجيرهساز
استنباطهاي بيشتر
ميشود.
اين روش زماني استفاده ميشود که حقيقت جديدي به پايگاه داده ما اضافه شده باشد و
خواسته باشيم نتايج آن را توليد کنيم.
ي به عقب ):(Backward Chaining
زنجيرهساز
آغاز کنيم و جمالت شرطي را پيدا کنيم که به ما
ميتوانيم با چيزي که قصد اثباتش را داريم
در ايجاد پيشفرضيات آنها داشته
اجازه بدهند نتيجه را از آنها استنتاج کنيم ،و سپس سعي
باشيم.
اين روش زماني استفاده ميشود که هدفي براي اثبات وجود داشته باشد.
الگوريتم زنجيرهسازي به جلو:
ي به جل و توسط افزودن يک حقيقت جديد pبه پايگاه دانش ،فعال ميشود و
زنجيرهساز
در اينجا
ميتواند به عنوان قسمتي از پردازش TELLبراي مثال ،همکاري داشته باشد .
ايده ،يافتن تمام ترکيبات شرطي است که Pرا بهعنوان پيشفرض داشته باشد ،سپس
اگر بقيه پيشفرضيات برقر ار باشند ،ميتوانيم نتيجه ترکيب شرطي را به پايگاه دانش
توسط راهاندازي استنتاجهاي بعدي اضافه کنيم.
نياز داريم.
نيز
ما به ايدة ترکيب ) (Compositionجانشيني
ابر
هر جانشيني به نوبت ،بر
اثر اعمال
اثر آن با
) COMPOSE(1 , 2جانشيني است که
است .زيرا:
)SUBST(COMPOSE(1 ,2 ), P) SUBST(1 , P
در حالي که دادههاي جديد وارد ميشوند ،ميسازد.
زنجيرهسازي به جلو ،تصويري تدريجي از شرايط
ً
در ارتباط نيستند،
مستقيما با حل مسئله ويژه
پردازشهاي استنتاجي آن
به همين دليل روية data-drivenيا data-directedناميده ميشود.
الگوريتم زنجيرهسازي به عقب:
زنجيرهسازي به عقب به منظور يافتن تمام پاسخها براي سؤال طرح شده ،به وجود آمده است.
ي به عقب ،وظيفهاي که از رويه ASKخواسته شده را انجام ميدهد .الگوريتم
بنابراين زنجيرهساز
ً
مستقيما از
ي به عقب BACK-CHAINابتدا توسط کنتر ل درمييابد که آيا پاسخها
زنجيرهساز
جمالت پايگاه دانش ،توليد ميشوند يا خير .سپس تمام ترکيبات شرطي که نتايجشان با پرسش
) (queryمطابقت دارد را پيدا ميکند و سعي دارد تا پيشفرضهاي آن ترکيبات شرطي را توسط
ي به عقب ايجادکند.
زنجيرهساز
اگر پيشفرض ،يک ترکيب عطفي باشد ،سپس BACK-CHAINترکيبات عطفي را عطف به
ساز را براي تمام پيشفرض بسازد.
عطف پردازش ميکند ،تا يکسان
کامل بودن :Completeness
اختيار داريم:
در
تصور کنيد که ما پايگاه دانش ز ير را
) P ( x ) Q( x
)P( x) R( x
x
x
) Q( x ) S ( x
)R( x) S ( x
سپس ما ميخواهيم که ) S(Aرا نتيجه بگيريم S(A) ،درست است،
x
x
اگر )Q(Aيا ) R(Aدرست باشد ،و يکي از آنها بايد درست باشد زيرا:
يا ) P(Aيا ) ¬ P(Aدرست است.
متأسفانه ،زنجيرهسازي با Modus Ponensنميتواند ) S(Aرا نتيجه بگيرد.
مشکل اين است که ) xP( x) R( xنميتواند به صورت Hornدربيايد ،و از اين ر و
توسط Modus Ponensنميتواند استفاده شود.
اين بدان معني است که رويه اثباتي که از Modus Ponensاستفاده ميکند ناکامل
) (incompleteاست:
در پايگاه دانش مستلزم شدهاند ولي رويه نميتواند آنها را استنتاج کند.
جمالتي که
در مورد وجود رويههاي اثبات کامل بحثي است که ارتباط مستقيم با رياضيات
پرسش
چيز دنبال ميشود:
دو
اگر يک رويه اثبات کامل بتواند براي عبارات رياض ي پيدا شود ،
دارد .
تمام مفروضات ميتوانند به طور مکانيکي ايجاد شوند.
تمام رياضيات ميتوانند به عنوان نتيجة منطقي مجموعهاي از اصل موضوعهاي
پايهاي ايجاد شوند.
يک رويه اثبات کامل براي منطق مرتبه اول ارزش بسياري در AIدارد:
در رابطه با پيچيدگي کامپيوتري.
نظريههاي عملي
در زبان ميتواند قر ار داده شود.
هر گونه مسئله که
فعال ساختن يک ماشين براي حل
هر جملهاي که توسط مجموعه جمالت
قضيه کامل بودن گودل نشان داد که ،براي منطق مرتبه اول ،
ديگري مستلزم شود ميتواند از آن مجموعه اثبات شود .بنابراين ميتوانيم قوانين استنتاجي را که به يک
رويه اثبات کامل Rاجازه ميدهد ،پيدا کنيم:
if KB | then KB | R
در يک پشته کاه وجود دارد و
اين قضيه کامل بودن مشابه اين است که بگوييم رويهاي براي يافتن سوزني
در پشتههاي کاه با
اين ادعاي بيهوده نيست زيرا جمالت با سود عمومي و سيمبولهاي تابع النهاي دلخواهي
اندازه نامحدود ،استفاده ميشوند.
ذکر نکرد.
گودل نشان داد که رويه اثباتي وجود دارد اما هيچ رويهاي را
در منطق مرتبه اول ،نيمه تصميمپذير ) (Semidecidableبنابراين ميتوانيم
استلزام
نشان دهيم که جمالت از پيشفرضيات تبعيت ميکنند ،اما هميشه نميتوانيم نشان دهيم که
آنها از پيشفرضيات تبعيت نميکنند.
در مورد وجود
بهعنوان يک فرضيه ،سازگا ري ) (consistencyمجموعه جمالت (سؤالي
پذير است.
نيز نيمه تصميم
راهحلي براي تبديل تمام جمالت به جمالت درست)
:Resolutionيک رويه استنتاج کامل
دو ترکيب شرطي ميتوانيم ترکيب سومي را مشتق کنيم که پيشفرض اولي را به نتيجه دومي
از
متصل ميکند.
Modus Ponensبه ما اجازه استخراج ترکيب شرطي جديد را نميدهد و فقط نتايج
تمندتر از Modus
اتمي را استخراج ميکند .از اين رو قانو ن resolutionقدر
Ponensاست.
قانون استنتاج :resolution
ً
دو ترکيب فصلي هستند .ما
دقيقا
در فرم ساده قانو ن ،resolutionپيشفرضيات داراي
اگر يکي از
هر طولي وسعت بخشيم ،که
ميتوانيم اين قانو ن را براي د و ترکيب فصلي به
ديگر ترکيب فصلي )(qk
در يک ) clause(Pjبا نقيض قسمت
قسمتهاي ترکيب فصلي
بغير از آن دو:
يکسان باشند ،سپس ترکيب فصلي از تمام قسمتها استنتاج ميشود
Resolution تعميم يافته (ترکيبات فصلي)
Resolution تعميمي يافته (ترکيبات شرطي)
Resolutionتعميم يافته (ترکيبات فصلي):
براي Piو qiفرض ي که UNIFY (Pj ¬ qk)=θ
Pm
...
Pj
...
P1
qn
...
... qk
q1
)) SUBST( , (P1 ...Pj 1 Pj 1 ...pm q1 ...qk 1 qk 1 ...qn
ً
معادال ،ميتوانيم اين عبارت را به صورت ترکيب شرطي بنويسيم.
:) تعميم يافته (ترکيبات شرطيResolution
کهsi وri وqi وPi براي اتمهاي
UNIFY (Pj , qk)=θ
P1
...
Pj
...
s1
...
sn 3
q1
Pn1 r1 ... rn 2
... qk ...
qn 4
SUBST( , (P1 ...Pj 1 Pj 1 pn1 s1 ...sn3 r1 ...rn2 q1 ...qk 1 qk 1 ... qn4 ))
فرمهاي Canonicalبراي :resolution
هر جمله يک ترکيب فصلي از حروف فرض ي است.
در نسخه اوليه قانون ،resolution
در يک ترکيب عطفي صريح (مانند يک
تمام ترکيبات فصلي در KBفرض شدهاند که
KBمعمولي) به هم متصل شدهاند ،بنابراين اين فرم ،فرم نرمال عطفي Conjunctive
) normal form (CNFناميده ميشود.
هر جمله به تنهايي يک ترکيب فصلي است.
اگرچه
هر جمله يک ترکيب شرطي با يک ترکيب عطفي از اتمها
در صورت ثانويه قانون ،resolution
در طرف راست است.
در سمت چپ و يک ترکيب فصلي از اتمها
اين حالت ،فرم نرمال شرطي) (implicative normal form (INFناميده ميشود.
تر است ،اما فرم نرمال
هر مجموعه از جمالت ميتوانند به د و فرم ترجمه شوند .فرم نرمال عطفي رايج
نظر ميآيد.
تر به
شرطي طبيعي
Resolutionتعميمي از Modus Ponensاست.
تر از فرم Hornاست ،به دليل اينکه طرف سمت راست ميتواند يک
فرم نرمال شرطي رايج
ترکيب شرطي باشد و نه فقط يک اتم تنها.
Modus Ponensقابليت ترکيب اتمها با يک ترکيب شرطي را به منظ ور استخراج
قادر به انجام آن نيست.
نتيجه به صورتي دارد که resolution
تمندتر از زنجيرهسازي با Modus Ponensاست ،اما
زنجيرهسازي با resolutionقدر
هنوز کامل نيست.
برهان خلف:
رويه استنتاج کاملي که از resolutionاستفاده ميکند برهان خلف )(refutation
ناميده ميشود و همچنين به عنوان اثبات توسط تناقض
(proof by
) contradictionو (reduction and absurdumشناخته شده است.
تبديل به فرم نرمال:
هر جمله مرتبه اولي ميتواند به صورت فرم نرمال شرطي (يا عطفي) دربيايد.
از يک مجموعه از جمالت به فرم نرمال ميتوانيم اثبات کنيم که يک جمله نرمال از
مجموعه پيروي خواهد کرد.
رويهاي براي تبديل به فرم نرمال:
)1حذف ترکيب شرطي:
ميتوان تمام ترکيبات شرطي را با معادل فصلي جايگزين نمود.
)2حذف ¬:
مجاز است ،و براي تمام فرمهاي نرمال شرطي قدغن
نقيض فقط براي فرم نرمال عطفي
است.
)3استاندارد کردن متغيرها:
ً
بعدا از ايجاد ابهام زمان حذف سورها جلوگيري ميکند.
اين عمل
)4انتقال سورها به سمت چپ:
:Skolemize )5
در آن تمام سورهاي وجودي حذف ميشوند.
Skolemizationپردازش ي است که
)6توزيع Λبر : ν
)7ترکيبات فصلي و عطفي النهاي مسطح شده:
در اين مورد ،جمله به فرم نرمال عطفي )(CNFاست.
)8تبديل ترکيبات فصلي به ترکيب شرطي:
ي:
برخورد با مسئله تساو
ظاهر ترمهاي آرگوماني است و تست صحيح معنايي
يکسانسازي يک تست نحوي مبتني بر
مبتني بر اشيايي که نمايش ميدهند ،نيست.
د و روش براي انجام اين امر:
ذکر خواص آن:
)1بديهي نمودن تساوي به وسيله
ذکر شود که تساوي ،انعطافپذير ،متقار ن و (متعدي) است.
بايد
)2استفاده از يک قانون استنتاج از يک قانون استنتاج:
ميتوانيم قانون استنتاج را به صورت ز ير تعريف کنيم:
:Demodulationبراي تمام ترمهاي z,y,xکه UNIFY (x,y) = θ
)x y, (...z ...
)(... SUBST( , y)...
استراتژيهاي :Resolution
4استراتژي که براي راهنمايي جستج و به سمت يک اثبات استفاده ميشوند ،را بررس ي
خواهيم کرد:
:Unit preference (1
در اينجا ما سعي بر توليد جمله کوتاهي به صورت True => Falseداريم.
ديگر استراتژيها ترکيب شود.
اين استراتژي يک کشفکننده مفيد است که ميتواند با
)2مجموعه Support
ي ترکيب ميکند و
هر resolutionجملهاي را از مجموعه Supportبا جمله ديگر
اگر مجموعه Supportبه نسبت تمام
نتيجه را به مجموعه Supportاضافه ميکند .
پايگاه دانش کوچک باشد ،فضاي جستج و را قطع خواهد کرد.
يک انتخاب بد براي مجموعه Supportالگوريتم را ناکامل خواهد ساخت.
استراتژي مجموعه Supportداراي اين مزيت است که درختهاي اثباتي توليد ميکند
که اغلب براي درک افراد آسان هستند ،زيرا آنها هدفگرا هستند.
Resolution )3ورودي:
در استراتژي resolutionورودي هر resolutionيکي از جمالت ورودي را (از KBيا
ديگر ترکيب ميکند.
)queryبا جمله
در پايگاههاي دانش Modus Ponens ،Hornنوعي از استراتژي resolution
ديگر جمالت ترکيب ميکند .از اين رو
ورودي است ،زيرا يک ترکيب شرطي از KBاصلي را با
شگفتيآور نخواهد بود که resolutionورودي براي پايگاههاي دانش ي که به صورت
در حالت کلي ناکامل است.
Hornهستند ،کامل باشد اما
:Subsumption )4
متد Subsumptionتمام جمالتي که توسط يک جمله موجود در Subsume ،KB
ميشوند ،را حذف ميکند.
در نتيجه فضاي
Subsumptionبه نگهداري KBبه صورت کوچک کمک ميکند ،و
جستج و را کوچک ميسازد.
فصل نهم :
ي
برنامهريز
.
.
چيز است:
در سه
تفاوت عامل برنامهريزي با عامل حل مسئله
بازنمايي اهداف ،حاالت و عمليات
قادر ميسازد تا سنجش عامل را معقوالنه
استفاده از بازنماييهاي منطقي و صريح برنامهر يز را
هدايت کند.
نيز تفاوت دارد.
در روش بازنمايي و جستج و براي راهحلها
عامل برنامهريزي همچنين
يک عامل ساده برنامهريزي:
زماني که حالت دنيا قابل دسترس ي است ،عامل ميتواند از ادراکات توليد شده توسط محيط
استفاده کرده و مدل کامل و صحيحي از حالت دنياي جاري بسازد .سپس ،با داشتن هدف،
ي مناسبي را براي توليد برنامه عمل فراخواني کند .عامل سپس
ميتواند الگوريتم برنامهريز
هر لحظه يک عمل را اجرا کند.
در طي مراحل برنامه ،
ميتواند
در عمل است و از ادراکاتش براي شرح حالت
عامل با محيط از طريق يک روش حداقل
اوليه استفاده ميکند و از اين رو هدف اوليه را دنبال ميکند؛ اما به سادگي توانسته
مراحل برنامه را تشکيل بدهد.
ي:
از حل مسئله به برنامهريز
در بازنمايي اهداف و حاالت و عمليات
برنامهريزي و حل مسئله موضعات متفاوتي هستند زيرا
ساختار دنبالههاي عملياتي متفاوت عمل ميکنند.
و هم چنين بازنمايي
بر جستجو:
عناصر اوليه يک حل مسئله مبتني
بازنمايي عمليات.
بازنمايي حاالت.
بازنمايي اهداف.
بازنمايي برنامهها.
بازنمايي عمليات:
عمليات توسط برنامههايي که شرح حالت مابعد را توليد ميکنند ،تعريف ميشود.
بازنمايي حاالت:
در حل مسئله ،شرح کامل حالت اوليه داده شده است و عمليات توسط برنامهاي که شرح
کامل حالت را توليد ميکنند ،بازنمايي ميشوند.
بنابراين:
تمام بازنماييهاي حالت ،کامل هستند.
بازنمايي اهداف:
اختيار دارد ،تست هدف و تابع کشفکننده است.
در
در مورد هدف
تنها دانش ي که عامل
هر د و اينها بر روي حالتها اعمال ميشوند تا مطلوبيت آنها مورد ارزيابي قر ار گيرد.
بازنمايي برنامهها:
در طول تشکيل راهحلها ،الگوريتمهاي
در حل مسئله يک راهحل دنبالهاي از عمليات است .
در مورد
آغاز ميشوند (يا
جستج و فقط دنبالههاي پيوسته عمليات را که از حالت اوليه
نظر ميگيرند.
در
ي دوطرفه ،خاتمه دادن به حالت هدف)
جستجو
تأثير ميگذارند ،تا مسئله ساده ز ير را
حال ببينيم چطور اين تصميمات بر روي قابليت عامل
حل کنند:
شير و يک خوشه موز و يک مته چندسرعته را بخر».
ليتر
«يک
در خانه است اما بدو ن هيچ يک از اشياء موردنظر.
حالت اوليه :عامل
قادر به انجام آن است.
عملگر :تمام کارهايي که عامل
تابع کشفکننده :تعداد چيزهايي که هنوز به دست آورده نشدهاند.
در وراي برنامهريزي:
اولين ايده کليدي
«بسط دادن» بازنمايي حاالت ،اهداف و عمليات است .الگوريتمهاي برنامهريزي از تعا ريفي به
ً
معموال منطق مرتبه او ل و يا زيرمجموعهاي از آن است.
زبانهاي رسمي استفاده ميکنند که
حاالت و اهداف توسط مجموعههايي از جمالت بازنمايي ميشوند و عمليات توسط شرح
قادر ميسازد تا ارتباطات بين
پيششرطها و تأثيرات منطقي بازنمايي ميشوند که برنامهريزي را
حاالت و عمليات را هدايت کند.
در وراي برنامهريزي:
دومين ايده کليدي
هر زمان که الزم باشد ،اضافه
اين است که برنامهر يز آزاد است تا عمليات را به برنامه
در حالت اوليه وجود داشته باشد.
کند .هرچند که دنباله افزايش ي
ي و مرتبه اجرا نيست .با ساختن
هيچ الزامي بر وجود ارتباط بين مرتبه برنامه ريز
در ابتدا ،برنامهريزي ميتواند فاکتور انشعاب را براي
تصميمات «مشخص» و «مهم»
ي کاهش دهد.
نياز به پيجويي به عقب را براي تصميمات اختيار
انتخابهاي بعدي و
در وراي برنامهريزي:
سومين ايده کليدي
امر داشتن يک
ديگر بخشها هستند .و اين
بيشتر بخشهاي دنيا مستقل از
اين است که
هدف عطفي را ممکن ميسازد و ميتوان آن را با يک استراتژي تقسيم و غلبه حل نمود.
ً
تقريبا هميشه حل چندين زيرمسئله کوچک
مؤثر هستند؛ زيرا
الگوريتمهاي تقسيم و غلبه
در مواردي که هزينه ترکيب
بهر حال تقسيم و غلبه
تر از يک مسئله بزرگ است .
آسان
راهحلهاي زيرمسائل زياد باشد ،با شکست مواجه ميشود .بسياري از معماها داراي اين
خاصيت هستند.
کار
کنار هم
دليل اينکه معماها «گولزننده» هستند ،اين است که قر ار دادن زيربرنامهها
ي است.
دشوار
فصل دهم :
عدم قطعيت
.
.
مسئلهاي که با منطق مرتبه اول و بنابراين با رهيافت عامل منطقگرا وجود دارد اين است که:
عاملها اغلب هيچگاه دسترس ي کامل به تمام حقيقت درباره محيط خود را ندارند.
بسيار مهمي وجود دارند که عامل نميتواند پاسخ طبقهبندي شده به آن را
سؤاالت
بيابد .بنابراين بايد تحت عدم قطعيت ) (uncertainityعمل کند.
عدم قطعيت به علت کامل نبودن ،و
عدم صحت درک عامل از خواص محيط ناش ي ميشود.
مسئله کيفيت:
در دامنه کامل نيستند؛ زيرا:
قوانين بسياري
ً
دقيقا شمارش شوند،
بسيار زيادي بايد
)1شرايط
يا
)2برخي از شرايط ناشناخته هستند.
برخورد با دانش غيرقطعي:
کنار آمدن با درجات باور ،تئوري احتماالت خواهد بود که درجه عددي
ابز ار اصلي ما براي
از باور را بين 0و 1به جمالت اختصاص ميدهد.
ي عدم قطعيت را به وجود ميآورد که از تنبلي و جهل ما
احتماالت روش ي از خالصهساز
ناش ي ميشوند.
احتمال 0براي باور مبهمي که داراي جمالت نادرست است ،و
احتمال 1براي باو ر مبهمي که داراي جمله درست است ،تخصيص داده ميشود.
در حقيقت خودش هم درست و هم نادرست است.
جمله
مهم است توجه داشته باشيم که درجه باور با درجه درستي متفاوت است.
در دنيا هم
تئوري احتماالت تعهد ontologicalرا همانند منطق ايجاد ميکند ،که حقايق
وجود دارند و هم ندارند.
در تضاد است ،موضوع منطق فازي است.
درجه درستي که با درجه باور
تعبير و دنيا ،درست يا نادرست خواهد بود و
در منطق مرتبه او ل و گزارهاي ،جمله بسته به
زماني درست است که حقيقتي را که به آن رجوع ميکند ،موضوع اصلي باشد.
ً
کامال مشابه اين نوع معناها نيستند .به آن علت است که احتماالتي که
عبارات احتمالي
عامل به يک گزاره تخصيص ميدهد به ادراکاتي که تا آن لحظه دريافت کرده است بستگي
دارد.
در بحث استدالل غيرقطعي ،ما آن را شاهد ) (evidenceمي ناميم.
تغيير
ي به پايگاه دانش اضافه ميشوند
همانطور که وضعيت استلزام زماني که جمالت بيشتر
تغيير خواهند کرد.
در صورت وجود شواهد بيشتر ،
نيز
ميکند ،احتماالت
تمام عبارات احتمالي بايد شواهدي را با توجه به اينکه کدام احتمال تشخيص داده شده
است ،تعيين کنند .همانگونه که عامل ادراکات جديدي را دريافت ميکند ،ارزيابيهاي
احتمالي به منظو ر انعکاس شاهد جديدي ،به رو ز درآورده ميشوند.
عدم قطعيت و تصميمات عقالني:
ً
تغيير داده است .عامل منطقي عموما
حضور عدم قطعيت روشهاي تصميمگيري عامل را
هر برنامهاي که امکان رسيدن به آن قطعي است را اجرا ميکند .يک
هدف واحدي دارد و
عمل ميتواند انتخاب و يا رد شود ،چه به هدف برسد و چه نرسد و بدو ن توجه به آنچه
ديگر عمليات انجام ميدهند.
که
تئوري سودمندي:
اين تئوري اين گونه بيان ميشود:
هر وضعيت درجهاي از فايده يا سودمندي را براي يک عامل دارد وعامل به حاالتي با
باالتر رجوع خواهد کرد.
سودمندي
سودمندي يک حالت به عاملي وابسته است که مفروضاتش توسط تابع سودمندي بازنمايي
شده است.
ً
کامال منطقي است که
نيز ميکند .براي يک عامل
تئوري سودمندي رعايت حال ديگران را
باالتر را به وضعيتي اختصاص دهد که عامل خودش از آن رنج ولي ديگران منفعت
سودمندي
ميبرند.
در تئوري عمومي تصميمات
مفروضات که به عنوان سودمنديها ،مطرح شدند با احتماالت
عقالني که تئوري تصميمگيري ناميده ميشود ،ترکيب ميشوند:
Dicision theory=probalility+utility theory
ايده اساس ي در مورد تئوري تصميمگيري اين است که يک عامل منطقي است
اگر و فقط اگر
عملي را که منتهي به باالترين سودمندي ميشود ،انتخاب کند.
انتظار ماکزيمم) (MEUناميده ميشود.
اين اصل سودمندي مورد
در ارزيابي يک عمل توسط توزين سودمندي يک نتيجه ويژه و با
احتماالت و سودمنديها
احتمالي که پديد آورده است ،ترکيب ميشوند.
ي:
طراحي براي يک عامل تصميمگيري نظر
در سطح
ي براي انتخاب عمليات استفاده ميکند ،
ساختار عاملي که از تئوري تصميمگير
انتزاعي با عامل منطقي يکسان است.