نسخه ارايه كتاب هوش مصنوعي پيام نور
Download
Report
Transcript نسخه ارايه كتاب هوش مصنوعي پيام نور
هوش مصنوعي
نام كتاب :هوش مصنوعي رهياتي نوين
مولف :راسل و نورويگ
مترجم :رامين رهنمون آناهيتا هماوندي
Artificial
Intelligence
ارايه شده توسط دانشجویان
پیام نور
.
.
:AIبه طور رسمي در سال 1956مطرح شده است.
علل مطالعه :Al
• AIسعي دارد تا موجوديتهاي هوشمند را درک کند .از اين رو يکي از علل
مطالعه آن يادگيري بيشتر در مورد خودمان است.
• جالب و مفيد بودن موجوديتهاي هوشمند .
AIچيست؟
تعاريفي از AIکه به چهار قسمت تقسيم شدهاند:
•پردازش فکري و استداللي
• پردازش رفتاري
• ايدهآل هوشمندي (منطقي بودن)
• ارائه انساني
پردازشهاي فکري و استداللي
ايدهآل
هوشمندي
سيستمهايي که
به طور منطقي
فکر ميکنند
سيستمهايي که
مانند انسان فکر
ميکنند
سيستمهايي که
به طور منطقي
عمل ميکنند
سيستمهايي که
مانند انسان عمل
ميکنند
تمرکز بر روي پردازشهاي رفتاري
ارائه انساني
.1انسان گونه عمل کردن :رهيافت آزمون تورينگ
آزموني از کامپيوتر به عمل آيد ،و آزمون گيرنده نتواند دريابد که در آن طرف انسان قرار دارد يا کامپيوتر.
براي اين کار کامپيوتر بايد قابليتهاي زير را داشته باشد:
پردازش زبان طبيعي = محاوره
بازنمايي دانش= ذخيره اطالعات
استدالل خودکار= استدالل و استخراج
يادگيري ماشيني= کشف الگو و برون ريزي
تست تورينگ :اين آزمون از ارتباط فيزيکي مستقيم بين کامپيوتر و محقق اجتناب
ميکند.
به منظور قبول شدن در تست تورينگ کلي ،کامپيوتر به موارد زير احتياج دارد:
بينايي ماشين براي درک اشياء
روباتيک به منظور حرکت آنها
.2انساني فکر کردن :-رهيافت مدلسازي شناختي:
چگونگي شناسايي عملکرد افکار انسان:
-1درون گرايي
-2تجارب روانشناس ي
علوم شناختي :مدلهاي کامپيوتر از AIو همچنين تکنيکهاي روانشناختي را
گرد هم ميآورد تا بتواند تئوريهاي دقيقي از کارکرد ذهن انسان به دست
آورند.
.3منطقي فکر کردن :قوانين رهيافت تفکر
رمز «تفکر درست» :ارسطو سعي در کشف آن داشت.
قياس :از موضوعات مطرح شده توسط ارسطو ميباشد ،که الگوهايي براي ساختار
توافقي ايجاد کرد که همواره نتايج صحيحي به اندازه مقدمات صحيح به دست
ميآورد.
مثال« :سقراط انسان است ،تمام انسانها ميميرند ،پس سقراط خواهد مرد».
دو مشکل عمده در اين رسم منطقگرايي وجود دارد:
تبديل دانش غير رسمي به شکل رسمي توسط اعالم ،منطقي ساده نيست.
تفاوت عمدهاي بين قادر به حل مسئله بودن در اصول و انجام آن در عمل
وجود دارد.
.4منطقي عمل کردن :رهيافت عامل منطقي
عامل :در اصل چيزي است که ابتدا درک ميکند و سپس عمل ميکند.
در نگرش «قوانين تفکر» تأکيد عمده بر روي استنتاجهاي صحيح بوده است.
«مهارتهاي شناخت» که براي آزمون تورينگ موردنياز است ،براي انجام
فعاليتهاي منطقي وجود دارند.
مزاياي مطالعه AIبهعنوان طراحي عامل منطقي:
عموميتر از رهيافت «قوانين تفکر»
پيشرفت علمي ،بسيار قانونپذيرتر از رهيافتهايي است که بر تفکر
يا رفتار انساني متکي هستند.
زيربناي هوش مصنوعي:
،AIاز علوم مختلفي بهره ميبرد که از ميان آنها علوم زير مهمتر شناخته شدهاند:
علم فلسفه
علم رياض ي
علم روانشناس ي
علم زبانشناس ي
علم کامپيوتر
ن)
فلسفه 428( :قبل از ميالد مسيح – تاکنو
پايههاي تفکر و فرهنگ غرب تشکيل شده است از :افالطون ،استادش سقراط ،و
شاگردش ارسطو.
قياس :ارسطو ،سيستمي غيررسمي از قياس براي استدالل مناسب توسعه داد،
امکان توليد نتايج ،بر پايه فرضيات اوليه به طور مکانيکي وجود داشت.
در نظر گرفتن ذهن بهعنوان سيستمي فيزيکي
رنه دکارت مدافع سرسخت قدرت استدالل بود؛ و همچنين طرفدار مکتب دواليسم.
ماترياليسم :در مقابل دواليسم قرار دارد و معتقد است تمامي جهان مطابق قوانين فيزيکي عمل
ميکنند.
ويلهم اليبنيز:
تبديل موقعيت ماترياليستي به نتايج منطقي
ساخت ابزاري مکانيکي براي انجام عمليات منطقي
ايجاد منبع دانش:
فرانسيس بيکن ،جنبش آزمونگرايان را آغاز کرد .و با شعار جان الک مفهوم يافت:
«هيچ چيز قابل فهم نيست اگر ابتدا در حس نباشد».
اصل استقراي امروزي ،در حقيقت از کتاب ديويد هيوم نشأت ميگيرد" :رسانهاي از طبيعت
انسان"
برتراندراسل ،پايهگذار پوزيوتيزم منطقي ،ارائهدهندة اين تئوري بود که:
«قوانين عمومي توسط تکرار ارتباطات بين عناصر آنها به وجود ميآيند».
ارتباط بين دانش و عمل
اشياء را با تحليل ،دستهبندي ميکنيم و در اطراف آنها ،کارکرد مورد نيازشان نوسان مينمايد.
در اين ميان پايه سيستممکاشفهاي GPSبنيان گذارده ميشود.
رياضيات (- C.800تاکنون)
براي ارتباط فلسفه با دانش نظري ،نياز به فرمولسازي رياض ي در سه زمينه اصلي است:
محاسبات
منطق
احتماالت
محاسبات:
نظريه اظهار محاسبات به عنوان الگوريتمي رسمي به خوارزمي برميگردد ،رياضيدان
عربي قرن نهم که نوشتههاي وي ،جبر و تئوري اعداد عربي را به اروپا معرفي کرد.
منطق:
در اين زمينه ،دانشمندان زيادي بر چگونگي شکلگيري و هدايت آن ،نقش داشتهاند که به
چند نفر از آنها اشاره ميکنيم:
ارسطو :دانشمندي که بيشترين شکلگيري نگرش فلسفي منطق را به او نسبت ميدهند.
جورج بول :يک زبان رسمي براي ساخت استنتاج منطقي ارائه داد.
:FREGEمنطق مرتبه اول را به شکلي مطرح نمود که در بيشتر سيستمهاي نمايش
دانش پايه استفاده ميشود.
آلفرد تارسکي :تئوري چگونگي ارتباط بين اشياء موجود در محيط منطقي ،و اشياء موجود
در دنياي واقعي را ارائه نمود.
ديويد هيلبرت :رياضيدان بزرگي بود که شهرت وي به دليل مسائلي است که نتوانست
حل کند.
راسل :قضيه کامل نبودن ) (incompletenessرا مطرح نمود.
تورينگ :ماشين تورينگ قادر به محاسبه هر تابع محاسبهپذيري است.
تئوري پيچيدگي:
.1انجامناپذيري
.2استحاله
استيون کوک و ريچارد کارپ :تئوري NP-completenessرا مطرح کردند.
احتماالت:
گاردنيوي :اولين کس ي بود که ايده احتمال را مطرح کرد.
پير فرمت ،پاسکال ،برنولي ،الپالس و ديگر دانشمندان بر رشد و توسعه اين ايده تأثير
داشتند.
برنولي :ديدگاه «درجه باور» ذهني را در مقايسه با نرخ نتايج عيني مطرح کرد.
بيس :قانوني براي بهنگامسازي احتماالت ذهني را به وجود آورد.
نيومن و مورگنسترن :تئوري تصميمگيري را آغاز کردند .و از ترکيب تئوري احتمال ،و
تئوري سودمندي حاصل ميشود.
ن):
روانشناس ي ( -1879تاکنو
هلمولتز :روش ي علمي براي مطالعه بينايي انسان به کار برد؛ که اين کتاب به عنوان مرجع
بينايي فيزيولوژيک و حتي بهعنوان «مهمترين رساله فيزيکي و روانشناختي بينايي انسان تا به
امروز» شناخته ميشود.
وندت :اولين آزمايشگاه روانشناس ي تجربي را در دانشگاه اليپزيک راهاندازي کرد.
داتسون و تورن دايک :حرکت رفتارگرايي ) (behaviorismرا مطرح کردند.
اساس مشخصه روانشناس ي شناختي) ،(congnitive psychologyاين نگرش
است که مغز دارنده و پردازشکننده اطالعات است.
کريک ،کتاب ماهيت بيان را منتشر کرد .و سه مرحله کليدي را براي عامل مبتني بر داشن
معين کرد:
محرکها بايد به شکل دروني تبديل شوند.
بازنمايي توسط پردازشهاي شناختي بازنماييهاي داخلي جديدي را مشتق کند.
اينها دوباره به صورت عمل برگردند.
ن)
مهندس ي کامپيوتر ( -1940تاکنو
براي پيشرفت هوش مصنوعي ،به دو چيز احتياج داريم:
هوش
محصول مصنوعي
در اين تقسيمبندي ،کامپيوتر ميتواند به عنوان محصول مصنوعي محسوب گردد.
:Heath Robinsonاولين کامپيوتر مدرن عملياتي بود که در سال 1940توسط تيم
آلن تورينگ به منظور کدگشايي پيامهاي آملانها ساخته شد.
:Colossusنام ماشين بعدي بود که تيوپهاي مکنده در آن به کار برده شد.
:Z-3اولين کامپيوتر قابل برنامهريزي که توسط کنراد زوس در 1941اختراع شد.
اعداد با مميز شناور و زبان Plankalkulنيز توسط زوس اختراع شدند.
:ABCاولين کامپيوتر الکترونيک در امريکا توسط جان آتاناسف و کليفورد در دانشگاه
ايالتي ايوا ساخته شد.
:MARK I , II , IIIتوسط تيمي به رهبري هوراد ايکن در هاروارد توسعه داده شد.
:ENIACاولين کامپيوترديجيتال الکترونيک چند منظوره ،توسط تيمي به سرپرستي
ماچلي و اکرت در دانشگاه پنسيلوانيا ساخته شد.
:IBM 701اولين کامپيوتر سودآور ،توسط ناتانيل روچتر در 1952ساخته شد.
چارلز بابيج :طراحي ماشيني که جداول لگاريتمي را محاسبه کند.
طراحي موتور آناليتيکي
طرح حافظه قابلآدرسدهي ،برنامه ذخيره شده و پرشهاي شرطي
کار در زمينه AIمنجر به ايدههاي بسيار متعددي شد که به علوم کامپيوتر برگشت؛ مانند:
اشتراک زماني – مفسرهاي دوسويه – نوع داده ليست پيوندي – مديريت حافظه خودکار
و برخي نکات کليدي برنامهنويس ي ش يءگرا و محيطهاي توسعه برنامه مجتمع با واسط
کاربر گرافيکي.
ن)
زبانشناس ي ( -1975تاکنو
اسکينر در سال 1975کتابي در زمينه رفتارگرايان براي يادگيري زبان ،با نام «رفتار زباني» منتشر
کرد.
نوآم چامسکي بر اساس تئوري خودش يعني ساختارهاي ترکيبي ،اين کتاب را تجديد نظر و
چاپ کرد .که به اندازه اصل کتاب شهرت پيدا کرد.
تئوري چامسکي بر اساس مدلهاي نحوي قرار دارد.
زبانشناس ي مدرن و AIدر يک زمان متولد شدند ،بنابراين زبانشناس ي نقش مهمي در رشد AI
بازي نميکند.
اين دو دريک زمينه مشترک به نام
زبانشناس ي محاسباتي) (Computatioal linguisticsيا
پردازش زبان طبيعي )(natural language processing
بهم تنيده شدهاند که در آن بر روي مسئله استفاده زبان تمرکز شده است.
تاريخچه هوش مصنوعي
پيدايش هوش مصنوعي ()1956 -1943
اشتياق زودهنگام ،آرزوهاي بزرگ ()1969-1952
مقداري واقعيت ()1966-1974
سيستمهاي مبتني بر دانش :کليد قدرت؟ ()1979-1969
بازگشت شبکههاي عصبي ( -1986تاکنون)
حوادث اخير ( -1987تاکنون)
پيدايش هوش مصنوعي
اولين کار جدي در حيطه ،AIتوسط وارن مککلود و والتر پيتز انجام شد.
سه منبع استفاده شده توسط آنها:
دانش فيزيولوژي پايه و عملکرد نرون در مغز
تحليل رسمي منطق گزارهها متعلق به راسل و رايت هد
تئوري محاسبات تورينگ
در 1949دونالد هب ،قانون ساده بهنگامسازي براي تغيير تقويت اتصاالت بين نرونها را
تعريف کرد که از طريق آن يادگيري ميسر ميگردد.
در زماني که کلود شانون و آلن تورينگ ،برنامه بازي شطرنج را نوشتند ،SNARC ،
اولين کامپيوتر شبکه عصبي در دانشگاه پرينستون توسط مينسکي و ادموندز ساخته شد.
اين کامپيوتر ،از 3هزار تيوپ مکش ي و مکانيزم خلباني خودکار اضافي که مربوط به
بمبافکنهاي B24ميباشد براي شبيهسازي شبکه 40نروني استفاده کرد.
محققين عالقمند به تئوري آتوماتا ،شبکههاي عصبي و مطالعه هوش ،گرد يکديگر جمع
شدند و در کارگاهي در دورت موند مشغول فعاليت شدند .که در اين ميان نام هوش
مصنوعي براي حيطه فعاليت آنها انتخاب شد.
اشتياق زودهنگام ،آرزوهاي بزرگ ()1969-1952
فعاالن در عرصه :AI
روچستو و تيمش در IBM
هربرت جلونتر :با ساخت Geometry Theorem Prover
آرتور ساموئل :ساخت برنامه براي بازي چکر
جان مک کارتي در :MIT
تعريف زبان ليسپ ) (Lispمهمترين زبان هوش مصنوعي
مفهوم اشتراک زماني )(time sharing
نشر مقالهاي با عنوان "برنامهها با حواس مشترک"
تشريح يک سيستم فرض ي به نام ، Advice Takerکه به اصول پايه
بازنمايي معرفت و استدالل تجسم بخشيد؛
کار بر روي سيستم برنامهريزي سؤال-جواب
کار بر روي پروژه روباتهاي shakey
مينسکي :کار بر روي ميکرو ورلدها و همکاري با مککارتي ،ولي بر سر اختالف بر نگرش
منطقي و ضدمنطقي کار تحقيقاتي خود را از هم جدا کردند.
مينسکي با گروهي از دانشجويان بر روي ميکروورلدها کار کرد که برخي از آنها عبارتند از:
جيمز اسالگل ،SAINT ،قادر به حل مسائل انتگرالگيري فرم بسته
اوانز ،ANALOGY :حل مسائل مشابهت هندس ي در تستهاي هوش
رافائل :SIR :پاسخ به قضاياي پرسش ي جمالت ورودي
بابرو :STUDENT :حل مسائل داستاني جبر
مقداري واقعيت ()1974-1966
ً
مشکالت تقريبا تمام پروژهها تحقيقي AIوقتي پديدار ميشدند که مسائل
گستردهتري براي حل توسط آنها مطرح ميشد:
برنامههاي اوليه اغلب داراي دانش محدود يا فاقد دانش در مورد موضوع کار
بودند.
انجام ناپذيري بسياري از مسائل
به دليل اعمال برخي محدوديتهاي پايهاي بر روي ساختار پايه مورد استفاده براي
توليد رفتار هوشمند
سيستمهاي مبتني بر دانش :کليد قدرت؟ ()1979-1969
روشهاي ضعيف :مبتني بر يک جستجوي همهمنظوره ميباشند که قدمهاي اوليه
يادگيري را برميدارند اما تالش ي در جهت يافتن راهحلهاي کامل ندارند.
به اين دليل که اطالعات ضعيفي را در مورد دامنه فعاليت خود به کار ميبرند.
ً
پس براي حل مسائل دشوار ،تقريبا جواب را از قبل بايد بدانيم.
برنامه DENDRALاز برنامههايي است که از اين رهيافت استفاده ميکند.
اهميت برنامه DENDRALدر اين بود که اولين سيستم موفق با
دانش غني بود ،يعني تبحر سيستم بر پايه تعداد بسيار زيادي قانون
ايجاد شده بود .سيستمهاي بعدي ايده اصلي رهيافت Advice
takerمک کارتي را دنبال ميکردند يعني جداسازي دانش (در شکل
قوانين) و مؤلفه استدالل.
MYCINنسبت به DENDRALدو تفاوت عمده دارد:
برخالف قوانين ،DENDRALهيچ مدل تئوريوار عمومي براي
آنکه قوانين MYCINاستنتاج شود ،وجود نداشت.
قوانين ميبايست عدم قطعيت مربوط به دانش پزشکي را منعکس
ميکرد.
AIبه يک صنعت تبديل ميشود ()1988-1980
:RIاولين سيستم خبره تجاري موفق از شرکت DECکه سودآوري زيادي را براي شرکت
بهمراه داشت.
پروژه «نسل پنجم» :اين پروژه ژاپني به منظور ساخت کامپيوترهاي هوشمندي که پرولوگ
را به جاي کد ماشين اجرا ميکردند ،انجام شد.
شرکتهاي ديگر جهان از جمله ميکروالکترونيک ،MCC ،ليسپ ماشين ،تگزاس
اينسترومنت ،سمبوليکس ،زيراکس و غيره در ساخت ايستگاههاي کاري بهينه شده در اين
عرصه فعاليت داشتند.
بازگشت شبکههاي عصبي:
دانشمندان فعال در اين عرصه:
هاپ فيلد :که به آناليز خواص ذخيرهسازي و بهينهسازي شبکهها پرداخت.
راسل هارت و هينتون :مطالعه مدلهاي شبکه عصبي را ادامه دادند.
ً
بريسون و هو :الگوريتم يادگيري انتشار به عقب را مجددا مطرح کردند.
حوادث اخير:
رهيافت :HMMرهيافت غالب در سالهاي اخير ميباشد که توسط مايکف به وجود آمده
است.
اين رهيافت از دو جنبه زير حائز اهميت است:
مبتني بر نظريه رياض ي محض است.
طي فرايندي با يادگيري گروه عظيمي از داده گفتار واقعي خود را بهبود ميبخشد.
برنامهريزي :در دهه 70فقط براي ميکرووردها مناسب بودند ،اکنون براي
زمانبندي کار در کارخانهها و مأموريتهاي فضايي استفاده ميشوند.
بيان شبکه باور :استدالل کارا را در مورد ترکيب رويدادهاي غيرمنطقي ممکن
ساخت.
ايده سيستمهاي خبره فرماتيو توسط کار جوداپير و ارديک هوروتيز و
ديويد هکرمن مطرح شد:
"سيستمهايي که مطابق قوانين تئوري تصميمگيري به طور منطقي
عمل ميکنند و سعي ندارند که تبحر انساني را تقليد کنند".
شرايط کنوني:
برخي از سيستمهايي موجود در جهان که از هوش مصنوعي استفاده ميکنند:
:HITECHاولين برنامه کامپيوتري که موفق به شکست استاد بزرگ شطرنج جهان،
آرنولد دنکر شده است.
:PEGASUSيک برنامه درک گفتار که سؤاالت کاربر را جواب ميدهد و تمامي برنامههاي
مسافرتي شخص را با يک برنامهريزي درست ،مقرون به صرفه ميکند.
:MARVELسيستم خبرهاي که دادههاي ارسالي از سفينه فضايي را تحليل نموده و در
صورت بروز مشکالت جدي ،پيغام هشدار به تحليلگران ميدهد.
فصل دوم:
عاملهاي هوشمند
عامل:
به هر چيزي اطالق ميشود ،که قادر به درک محيط پيرامون خود از طريق حسگرها()sensor
و اثرگذاري بر روي محيط از طريق اثرکنندهها ( )effectorباشد.
ي:
عامل نرمافزار
عامل نرمافزاري رشتههاي بيتي را به عنوان درک محيط و عمل ،کدگذاري ميکند.
عوامل انساني
.1
حس کردن :گوش ،چشم ،ديگر ارگانها
.2
اثرگذاري :دست ،پا ،بيني ،اندامهاي ديگر
عوامل روباتيک
.1
حس کردن :دوربين ،يابندههاي مادون قرمز
.2
اثرگذاري :موتور
sensors
percepts
?
environment
agent
actions
effectors
عاملها چگونه بايد عمل کنند؟
عامل منطقي :چيزي است که کار درست انجام ميدهد.
عمل درست :آن است که باعث موفقترين عامل گردد.
کارايي :چگونگي موفقيت يک عامل را تعيين ميکند.
تفاوت ميان منطقي بودن و دانش کل ):(omniscience
عامل داناي کل معني خروجي واقعي اعمال خود را دانسته و بر پايه آن عمل ميکند اما
دانش کل در واقعيت غيرممکن است.
اگر معين کنيم که هر عامل هوشمند همواره بايد همان کاري را انجام دهد که در عمل
مناسب است ،هيچگاه نميتوان عاملي را طراحي نمود که اين مشخصات را مرتفع سازد.
آن چه در هر زماني منطقي است به چهار چيز وابسته است:
معيار کارايي که درجه موفقيت را تعيين ميکند.
هر چيزي که تا کنون عامل ،ادراک نموده است .ما اين تاريخچه کامل ادراکي را دنباله
ادراکي ميناميم.
آنچه که عامل درباره محيط خود ميداند.
اعمالي که عامل ميتواند صورت دهد.
رفتار عامل وابسته به دنباله ادراکي تا حال است.
عامل را بايد بهعنوان ابزاري براي تحليل سيستمها قلمداد کرد؛
نه شخصيتي مطلق که جهان را به دو بخش عامل و غيرعاملها تقسيم ميکند.
نگاشت ايدهآل از دنبالههاي ادراکي به عمليات
هر عامل خاص ي را به وسيله جدولي توصيف ميکنيم ،که در آن عمل آن در پاسخ به هر
دنباله ادراکي قرار ميگيرد.
اين بدان معني نيست که ما جدول خاص ي با يک ورودي براي هر دنباله ادراک ممکني
توليد کنيم .ميتوان مشخصات نگاشت را بدون شمارش خستهکننده آنها انجام داد.
مثال:
تابع ريشه دوم
دنباله ادراکي:
دنبالهاي از کليدهاي زده شده
نگاشت ايدهآل:
براي مقادير مثبت xنشان داده شده توسط
ادراک z ،نيز مثبت باشد و عمل مناسب نمايش نشان داده شود.
خودمختاري:
در اينجا تعريف عامل بايد کاملتر شود و بخش دانش دروني به آن اضافه ميگردد.
رفتار عامل ميتواند متکي بر دو پايه تجربه خود و دانش دروني بنا نهاده شود.
اين رفتار ،در ساخت عامل براي شرايط محيطي خاص که در آن عمل خواهد کرد،
استفاده ميشود.
سيستم به وسعتي خود مختار است که رفتار آن بر اساس تجربه خودش تعيين ميکند.
ً
زماني که عامل فاقد تجربه و يا کم تجربه است ،مسلما تصادفي عمل خواهد کرد ،مگر
آنکه طرح کمکهايي به آن داده باشد.
ً
عامل هوشمند واقعا خود مختار بايد قادر به عمل موفقيتآميز در دامنه وسيعي از
محيطها باشد و البته بايد زمان کافي براي تطبيق نيز به آن داده شود.
ساختار عاملهاي هوشمند
وظيفه هوش مصنوعي طراحي برنامه عامل است؛
اين طراحي شامل تابعي است که نگاشت عامل از ادراک به عمليات را پياده سازي ميکند.
معماري :فرض ميکنيم برنامه عامل بر روي نوعي ابزار محاسبهگر اجرا ميگردد که آن را
معماري ميناميم.
برنامه عامل ،بايد توسط معماري قابل پذيرش و اجرا باشد.
ً
عموما ،معماري ادراک از طريق حسگرها را براي برنامه آماده ساخته ،برنامه را اجرا نموده و
اعمال انتخابي برنامه را به عملکنندههاي سيستم منتقل ميکند.
ارتباط بين عاملها ،معماريها و برنامهها را ميتوان به صورت ذيل جمع بندي نمود:
برنامه +معماري= عامل
در اينجا مسئله تمايز بين محيط واقعي و مصنوعي مطرح ميشود؛ اما
مسأله اصلي ،پيچيدگي مابين:
ارتباط رفتار عامل،
دنباله ادراکي توليد شده بوسيله محيط ،و
اهدافي که عامل قصد حصول آن را دارد ،است.
مشهورترين محيط مصنوعي ،محيط تست تورينگ ( )turingاست.
برنامههاي عامل:
تشابهات عاملهاي هوشمند:
دريافت ادراک محيطي
توليد اعمال الزم
دو نکته در مورد شالوده برنامه قابل ذکر هستند:
.1برنامه عامل تنها يک درک از شرايط محيطي واحد را به عنوان ورودي دريافت ميکند.
.2هدف يا معيار کارايي بخش ي از برنامه شالوده نخواهد بود.
چرا تنها به پاسخها نگاه نميکنيم؟
جدول مراجعه بايد بر پايه حفظ کامل دنباله ادراکي در حافظه عمل نموده و از آن براي ايندکسسازي
داخل جدول استفاده کند.
جدول عامل نوع راننده تاکس ي
ادراکات
عمليات
اهداف
محيط
دوربينها ،سرعت سنج،
راهنمايي کردن،
ايمني ،سرعت،
جاده ،پيادهرو،
ترافيک ،مشتري قانونمندي ،راحتي ،شتابدهنده ،ترمز،
Sonar ،GPS
ميکروفون
افزايش سودمندي صحبت با مسافر
نوع عامل
راننده تاکس ي
جنبههاي مختلف يک عمل ،انواع مختلف برنامههاي عامل را پيشنهاد خواهد کرد.
براي مثال 4 ،عامل را مورد بررس ي قرار مي دهيم:
عاملهاي واکنش ي ساده
عاملهايي که اثرات دنيا را حفظ ميکنند
عاملهاي هدفگرا
عاملهاي سودمند
عاملهاي واکنش ي ساده
در اينجا جدول رجوع بايد مورد توجه قرار گرفته و فيلدهاي مختلف آن توسط اطالعات ورودي
پر شود.
اتصاالتي (واکنشهايي) وجود دارند که انسانها بسياري از آنها را دارا بوده:
برخي از آنها قابل يادگيري و برخي ديگر غريزي است.
دياگرام شماتيک از عامل ساده واکنش ي
Sensors
Environment
Agent
What the world
is like now
What action I
should do now
Condition-action rules
Effectors
مربع مستطيل :نشاندهنده وضعيت داخلي جاري فرايند تصميمگيري عامل
بيض ي :نشاندهنده وضعيت اطالعات پسزمينه
عاملهايي که اثرات دنيا را حفظ ميکنند
از آنجايي ناش ي ميشود که حسگرها نميتوانند دسترس ي کامل به وضعيت دنيا را به وجود
آورند.
در چنين شرايطي ،عامل ممکن است نيازمند دستکاري برخي اطالعات وضعيت داخلي باشد
تا از طريق آن تمايز بين وضعيتهاي دنيا که در ظاهر ورودي ادراکي يکساني ميکنند ولي در
ً
واقع معني کامال متفاوتي دارند را ميسر سازد.
بهنگامسازي اطالعات وضعيت داخلي همزمان با گذر زمان نيازمند دو نوع دانش کد شده در
برنامه عامل است.
اول :نيازمند آنيم که برخي اطالعات درباره چگونگي تغيير جهان مستقل از عامل را داشته
باشيم.
دوم :نيازمند اطالعات درباره اعمال خود هستيم که بر روي دنيا اثرگذار است.
عامل واکنش ي با حالت داخلي
sensors
State
What my action do
Condition-action rules
Agent
What action I
should do now
Effectors
Environment
How the world evolves
What the world is
like now
عاملهاي هدف گرا:
دانستن درباره وضعيت کنوني محيط همواره براي تصميمگيري عمل نميتواند کافي باشد.
به همان گونه که عامل نيازمند شرح وضعيت جاري است ،به نوعي نيازمند اطالعات
هدف( )goalميباشد که توضيح موقعيت مطلوب است.
برنامه عامل ميتواند اين اطالعات را با اطالعاتي درباره نتايج اعمال ممکن (همانند اطالعاتي
که در عامل واکنش براي بهنگامسازي وضعيت داخلي استفاده شد) ترکيب نموده تا اعمال
مناسب را براي دسترس ي به هدف انتخاب نمايد.
در مواقعي ساده است :که رضايت از هدف بالفاصله از عمل واحد توليد گردد.
در مواقعي پيچيده است :که عامل بايد دنبالههاي طوالني را در نظرگرفته تا راهي براي
دستيابي به هدف پيدا کند.
در مواقع پيچيده ،جستجو و برنامهريزي به يافتن دنباله اعمال منجر خواهند شد.
تفاوت عاملهاي واکنش ي و هدفگرا:
در طراحي عاملهاي واکنش ي طراح براي حاالت متفاوت عملي درست را پيش محاسبه ميکند .در
عاملهاي هدفگرا ،عامل ميتواند دانش خود را در مورد چگونگي واکنش بهنگام سازد.
.1براي عامل واکنش ي ما مجبور به دوباره نويس ي تعداد زيادي قوانين شرط –عمل خواهيم
بود.
.2عامل هدفگرا نسبت به رسيدن به مقاصد متفاوت انعطاف پذير است.
.3بسادگي با تعيين يک هدف تازه ،ميتوانيم عامل هدفگرا را به رفتار تازه برسانيم.
عاملي با اهداف دقيق
sensors
State
What my action do
What it will be like
if I do action A
Goals
What action I
should do now
Agent
Effectors
Environment
How the world evolves
What the world is
like now
عاملهاي سودمند:
اهداف به تنهايي براي توليد رفتار با کيفيت باال کافي نيستند.
مالک کارايي عومي بايد مقايسهاي بين وضعيتهاي دنياي متفاوت (يا دنباله حاالت) را بر
پايه چگونگي رضايت عامل در صورت حصول هدف بدهد.
بنابراين اگر يک وضعيت دنيا به ديگري ترجيح داده ميشود ،آنگاه آن براي عامل سودمندتر
خواهد بود
سودمندي :تابعي است که يک وضعيت را به عدد حقيقي نگاشت ميدهد ،که درجه رضايت
مربوط را تشريح ميکند.
مشخصات کامل تابع سودمندي امکان تصميمگيري منطقي را براي دو نوع حالتي که هدف
مشکل دارد ،اجازه ميدهد.
.1زماني که اهداف متناقص وجود دارند.
.2زماني که چندين هدف دارند که عامل ميتواند آنها را هدف قرار دهد و هيچکدام از آنها با
قطعيت قابل حصول نيست.
ارتباط بين عامل و محيط :اعمال بوسيله عامل بر محيط انجام ميشود ،که خود ادراک عامل را مهيا
ميسازد.
خواص محيط:
قابل دسترس ي در مقابل غير دسترس ي
قطعي در برابر غير قطعي
اپيزوديک در مقابل غيراپيزوديک
ايستا در مقابل پويا
گسسته در مقابل پيوسته
قابل دسترس ي در مقابل غيرقابل دسترس ي
محيط قابل دسترس ي :محيطي که عامل آن توسط ابزار حسکنندهاش امکان دسترس ي به
وضعيت کامل محيط را داشته باشد.
محيط قابل دسترس ي راحت است ،زيرا عامل نيازمند دستکاري هيچ وضعيت داخلي براي حفظ
دنيا را نخواهد داشت.
قطعي در مقابل غير قطعي
محيط قطعي :محيطي است که اگر وضعيت بعدي محيط بوسيله وضعيت کنوني و اعمالي که
با عاملها انتخاب گردد ،تعيين شود.
بهتر است به قطعي يا غير قطعي بودن محيط از ديدگاه عامل نگاه کنيم.
اپيزوديک در مقابل غير اپيزوديک
محيط اپيزوديک ( ،)episodicتجربه عامل به اپيزودهايي تقسيم ميگردد.
هر اپيزود شامل درک و عمل عامل است.
کيفيت اعمال آن تنها به خود اپيزود وابسته است.
محيطهاي اپيزودي بسيار سادهترند زيرا عامل نبايد به جلوتر فکر کند.
ايستا در مقابل پويا
محيط پويا :محيطي که در حين سنجيدن عامل تغيير ميکند.
محيط نيمهپويا :محيطي که با گذر زمان تغيير نميکند اما امتياز کارايي تغيير ميکند.
محيطهاي ايستا براي کار ساده هستند زيرا عامل نياز به نگاهکردن به دنيا در حين تصميمگيري
عملي نداشته و همچنين در مورد گذر زمان نيز نگران نميباشد.
گسسته در مقابل پيوسته
محيط گسسته :اگر تعداد محدود و مجزا از ادراک و اعمال بوضوح تعريف شده باشد.
-بازي شطرنج گسسته است.
رانندگي تاکس ي پيوسته است.سختترين حالت در بين حاالت موجود براي محيط:
غير قابل دسترس ي ،غير اپيزوديک ،پويا و پيوسته
مثالهايي از انواع محيط و ويژگيهاي آنها
محيط
قابل دسترس ي
قطعي
اپيزوديک
ايستا
گسسته
شطرنج به همراه ساعت
YES
YES
NO
Semi
YES
شطرنج بدون ساعت
YES
YES
NO
YES
YES
پوکر
NO
NO
NO
YES
YES
تخته نرد
YES
NO
NO
YES
YES
راندن تاکس ي
NO
NO
NO
NO
NO
سيستم تشخيص پزشکي
NO
NO
NO
NO
NO
سيستم تحليل تصوير
YES
YES
YES
Semi
NO
ربات جابجا کننده اشياء
NO
NO
YES
NO
NO
کنترلکننده پااليشگاه
NO
NO
NO
NO
NO
آموزشدهنده انگليس ي با ارتباط متقابل
NO
NO
NO
NO
YES
برنامههاي محيط
شبيهساز يک يا چند عامل را به عنوان ورودي گرفته و بگونهاي عمل ميکند که هر عامل
ادراک درست و نتيجه بازگشتي عمل خود را بدست آورد.
شبيهساز محيط را بر اساس اعمال و ديگر فرآيندهاي پوياي محيط بهنگام ميسازد.
محيط با وضعيت آغازين و تابع بهنگامسازي تعريف ميگردد.
فصل سوم:
حل مسائل توسط جستجو
يک نوع عامل هدفگرا ،عامل حل مسئله ناميده ميشود.
عاملهاي حل مسئله توسط يافتن ترتيب عمليات تصميم ميگيرند که چه انجام دهند تا
آنها را به حالتهاي مطلوب سوق دهد.
عاملهاي حل مسئله
ً
عاملهاي هوشمند به طريقي عمل ميکنند که محيط مستقيما به داخل دنباله حالتهايي
وارد شود که معيار کارآرايي را افزايش ميدهند.
عمليات به گونهاي سادهسازي ميشوند که عامل قادر باشد تا هدفي را قبول کرده و به آن
برسد.
الگوريتم جستجو مسئلهاي را به عنوان ورودي دريافت نموده و راهحلي را به صورت دنباله
عمليات بر ميگرداند.
فاز اجرايي :مرحلهاي است که در آن زمان ،راهحلي پيدا ميشود و عمليات پيشنهادي ميتوانند انجام
شوند.
به طور ساده براي طرح يک عامل مراحل «فرمولهسازي ،جستجو ،اجرا» را در نظر ميگيريم.
پس از فرمولهسازي يک هدف و يک مسئله براي حل عامل،
.1رويه جستجويي را براي حل آن مسئله فراخواني ميکند.
.2از راه حل براي راهنمايي عملياتش استفاده ميکند و هرآنچه که راه حل پيشنهاد ميکند را انجام
ميدهد.
.3آن مرحله را از دنباله حذف ميکند.
.4زماني که راهحل اجرا شد ،عامل هدف جديدي را پيدا ميکند.
چهار نوع اساس ي از مسائل وجود دارند:
مسائل تک حالته )(Single-state
مسائل چند حالته )(Multiple-state
مسائل احتمالي )(Contingency
مسائل اکتشافي )(Exploration
دانش و انواع مسئله
دنياي مکش (جاروبرقي):
اگر دنيا حاوي دو محل باشد:
هر محل ممکن است که شامل خاک باشد و يا نباشد و عامل ممکن است که در يک محل يا
ديگر محلها باشد؛ که داراي هشت حالت متفاوت خواهد بود.
هدف تميز کردن تمام خاکهاست که در اينجا معادل با مجموعه حالت {8و }7است.
مدلهاي مختلف براي مسئله جاروبرقي:
مدل تک حالته:حسگرهاي عامل به آن اطالعات کافي ميدهند تا وضعيت دقيق مشخص شود( .دنيا قابل
دسترس ي است) .عامل ميتواند محاسبه کند که کدام وضعيت پس از هر دنباله از
عمليات قرار خواهد گرفت.
مدل چند حالته:عامل تمام اثرهاي عملياتش را ميداند اما دسترس ي به حالت دنيا را محدود کرده است.
ً
زماني که دنيا تماما قابل دسترس ي نيست عامل بايد در مورد مجموعه حالتهايي که
ممکن است به آن برسد استدالل کند.
مدل احتمالي:با اين مدل حل مسئله ،حسگرهايي را در طول فاز اجرايي نياز داريم .عامل اکنون بايد تمام
درخت عملياتي را بر خالف دنباله عملياتي منفرد ،محاسبه کند .که به طور کلي هر شاخه
درخت ،با يک امکان احتمالي که از آن ناش ي ميشود ،بررس ي ميشود.
مدل اکتشافي:عاملي که هيچ اطالعاتي در مورد اثرات عملياتش ندارد.
در اين حالت ،عامل بايد تجربه کند و به تدريج کشف کند که چه عملياتي بايد انجام شود و
چه وضعيتهايي وجود دارند .اين روش يک نوع جستجو است.
اگر عامل نجات يابد« ،نقشهاي» از محيط را ياد ميگيرد که ميتواند مسائل بعدي را حل کند.
مسائل و راهحلهاي خوب تعريف شده
مسئله :در واقع مجموعهاي از اطالعات است که عامل از آنها براي تصميمگيري در مورد اينکه چه
کاري انجام دهد ،استفاده ميکند.
عناصر اوليه تعريف يک مسئله ،وضعيتها عمليات هستند.
براي تعريف يک مسئله موارد زير نياز داريم:
وضعيت آغازين ( )initial stateکه عامل خودش از بودن در آن آگاه است.
مجموعهاي از عمليات ممکن ،که براي عامل قابل دسترس ي باشد.
آزمون هدف ( ،)goal testکه عامل ميتواند در يک تعريف وضعيت منفرد آن را تقاضا
کند تا تعيين گردد که آن حالت ،وضعيت هدف است يا خير.
تابع هزينه مسير ،تابعي است که براي هر مسير ،هزينهاي را در نظر ميگيرد؛ و با حرف g
مشخص ميشود.
هزينه يک سفر= مجموع هزينههاي عمليات اختصاص ي در طول مسير
براي حل مسئله چند حالته ،فقط به يک اصالح جزئي نياز داريم:
يک مسئله شامل:
يک مجموعه حالت اوليه
مجموعهاي از عملگرهاي ويژه براي هر عمل به گونهاي که از هر وضعيت داده شده
مجموعهاي حاالت رسيده شده و يک آزمون هدف و تابع هزينه مسير را معين کند.
يک عملگر:
توسط اجتماع نتايج اعمال عملگر در هر وضعيت مجموعه ،به کار برده ميشود.
يک مسير:
مجموعه حاالت را مرتبط ميکند.
يک راه حل:
مسيري است که به مجموعهاي از حاالت که تمام آنها ،وضعيت هدف هستند ،سوق
ميدهند.
اندازهگيري کارايي حل مسئله:
کارايي يک جستجو ،حداقل از سه طريق ميتواند اندازهگيري شود:
.1آيا اين جستجو راه حلي پيدا ميکند؟
.2آيا راه حلي مناسبي است؟
.3هزينه جستجو از نظر زماني و حافظه مورد نياز براي يافتن راه حل چيست؟
مجموع هزينه جستجو= هزينه مسير +هزينه جستجو
عامل بايد تصميم بگيرد که چه منابعي را فداي جستجو و چه منابعي را صرف اجرا کند.
انتخاب حاالت و عمليات
هنر واقعي حل مسئله ،تصميمگيري در مورد اين است که چه چيزهايي در تعريف حاالت و عملگرها
بايد به حساب آورده شوند و چه چيزهايي بايد کنار گذاشته شوند.
انتزاع:
فرآيند حذف جزئيات از يک بارنمايي انتزاع ( )abstractionناميده ميشود.
همانگونه که تعريف را خالصه ميکنيم ميبايست عمليات را نيز خالصه نمائيم.
انتزاع به اين دليل مفيد است ،که انجام هر کدام از عمليات آسانتر از مسئله اصلي است.
انتخاب يک انتزاع خوب از اين رو شامل حذف تا حد ممکن ميشود تا زماني که عمليات
خالصه شده براي انجام آسان باشند.
مسائل نمونه:
ي
مسائل اسبابباز
ي
مسائل نمونه:مسائل اسبابباز
معماي :8
معماي 8نمونهاي است شامل يک صفحة 3*3با 8مربع شماره دار در يک صفحه خالي.
هر مربع که مجاور خانه خالي است .ميتواند به درون آن خانه برود .هدف رسيدن به ساختاري است که
در سمت راست شکل نشان داده شده است .نکته مهم اين است که بجاي اينکه بگوييم «مربع شماره 4را
به داخل فضاي خالي حرکت بده» بهتر است بگوييم «فضاي خالي جايش را با مربع سمت چپش عوض
کند».
Goal State
3
2
4
5
6
Start State
4
5
1
8
8
1
6
7
2
3
7
حالتها :توصيف وضعيت مکان هر 8مربع را در يکي از 6خانة صفحه مشخص ميکند .براي
کارايي بيشتر ،بهتر است که فضاهاي خالي نيز ذکر شود.
عملگرها :فضاي خالي به چپ ،راست ،باال و پائين حرکت کند.
آزمون هدف :وضعيت با ساختار هدف مطابقت ميکند.
هزينه مسير :هر قدم ارزش 1دارد ،بنابراين هزينه مسير همان طول مسير است.
مسئله 8وزير:
هدف از مسئله 8وزير ،قرار دادن 8وزير بر روي صفحه شطرنج به صورتي است که هيچ
وزيري نتواند به ديگري حمله کند.
دو نوع بيان رياض ي اصلي وجود دارد بيان افزايش ي که با جايگزيني وزيرها ،به صورت يکي
يکي کار ميکند و ديگري بيان وضعيت کامل که با تمام 8وزير روي صفحه شروع ميکند و
آنها را حرکت ميدهد.
در اين فرمول ما 64امکان داريم.
بنابراين ما تست هدف و هزينه مسير را به صورت زير خواهيم داشت:
ن هدف 8 :وزير روي صفحه ،که با هم برخورد ندارند.
آزمو
هزينه مسير :صفر.
حاالت :ترتيب از صفر تا 8وزير بدون هيچ برخورد.
عملگرها :يک وزير را در خاليترين ستون سمت چپ جايگزين کنيد که هيچ برخوردي با بقيه
نداشته باشد.
:Cryptarithmetic
در مسائل کريپتاريتمتيک ،حروف به جاي ارقام مينشينند و هدف يافتن جايگزيني از اعداد براي حروف
ً
است که مجموع نتيجه از نظر رياض ي درست باشد .معموال هر حرف بايد به جاي يک رقم مختلف
بنشينند.
مثال:
F=2, O=9, R=7, etc.
29786
FORTY
+ 850
+ TEN
+ 850
+ TEN
----------
----------
31486
SIXTY
يک فرمول ساده:
حاالت :يک معماي Cryptarithmeticبا چند حروف جايگزين شده توسط ارقام.
ً
عملگرها :وقوع يک حروف را با يک رقم جايگزين کنيد که قبال در معما ظاهر نشده باشد.
آزمون هدف :معما فقط شامل ارقام است و يک مجموع صحيح را بر ميگرداند.
هزينه مسير :صفر -تمام راه حلهاي صحيح است.
ميخواهيم که از تبديل جايگزينيهاي مشابه اجتناب کنيم:
قبول يک ترتيب ثابت مانند ترتيب الفبايي.
هر کدام که بيشترين محدوديت جايگزيني را دارد ،انتخاب کنيم؛ يعني حرفي که کمترين
امکان مجاز را دارند ،محدوديتهاي معما را ميدهد.
دنياي مکش:
مسئله تک حالته :عامل از جاي خودش اطالع دارد و تمام مکانهاي آلوده را ميشناسد و
دستگاه مکنده ما درست کار ميکند.
حاالت :يکي از 8حالت نشان داده شده.
عملگرها :حرکت به چپ ،حرکت به راست ،عمل مکش.
آزمون هدف :هيچ خاکي در چهار گوشها نباشد.
هزينه مسير :هر عمل ارزش 1دارد.
مسئله چند حالته :عامل داراي حسگر نميباشد.
مجموعه وضعيتها :زير مجموعهاي از حاالت.
عملگرها :حرکت به چپ ،حرکت به راست ،عمل مکش.
آزمون هدف :تمام حاالت در مجموعه حالتها فاقد خاک باشند.
هزينه مسير :هر عمل هزينه 1دارد.
مسئله کشيشها و آدمخوارها:
سه کشيش و سه آدم خوار در يک طرف رودخانه قرار دارند و هم چنين قايقي که قادر
است يک يا دو نفر را حمل کند .راهي را بيابيد که هر نفر به سمت ديگر رودخانه برود،
بدون آنکه تعداد کشيشها در يکجا کمتر از آدم خوارها شود.
حاالت :يک حالت شامل يک دنبالة مرتب شده از عدد است که تعداد کشيشها ،تعداد
آدمخوارها و محل قايق در ساحلي از رودخانه که از آنجا مسئله شروع شده را نمايش ميدهد.
عملگرها :از هر حالت ،عملگرهاي ممکن يک کشيش ،يک آدمخوار ،دو کشيش ،دو آدمخوار،
يا يکي از هر کدام را در قايق جا ميدهند.
آزمون هدف :رسيدن به حالت(0و 0و .)0
هزينه مسير :تعداد دفعات عبور از رودخانه.
مسائل دنياي واقعي
مسيريابي:
الگوريتمهاي مسير يابي کاربردهاي زيادي دراند ،مانند مسيريابي در شبکههاي کامپيوتري،
سيستمهاي خودکار مسافرتي و سيستمهاي برنامهنويس ي مسافرتي هوايي.
مسائل فروشنده دوره گرد و تور :
مسئله فروشنده دوره گرد مسئله مشهوري است که در آن هر شهر حداقل يکبار بايد مالقات
شود هدف يافتن کوتاهترين مسير است.
عالوه بر مکان عامل ،هر حالت بايد مجموعه شهرهايي را که عامل مالقات کرده ،نگه دارد.
عالوه بر برنامهريزي صفر براي فروشنده دورهگرد ،اين الگوريتمها براي اعمالي نظير برنامهريزي
حرکات مته خوردکار سوراخکننده برد مدار استفاده ميشود.
طرح : VISI
ابزار طراحي کمکي کامپيوتري در هر فازي از پردازش استفاده ميشود دو وظيفه بسيار مشکل
عبارتند از:
Channel routing
Cell layout
که بعد از اينکه ارتباطات و اتصاالت مدار کامل شد ،اين دو قسمت انجام ميشوند.
هدف طراحي مداري روي تراشه است که کمترين مساحت و طول اتصاالت و بيشترين سرعت
را داشته باشد.
هدف قرار دادن سلولها روي تراشه به گونهاي است که آنها روي هم قرار نگيرند و بنابراين
فضايي نيز براي سيمهاي ارتباطي وجود دارد که بايد بين سلولها قرار گيرند.
کاناليابي ،مسير ويژهاي را براي هر سيم که از فواصل بين سلولها استفاده ميکند ،پيدا
ميکند.
هدايت ربات:
يک ربات ميتواند در يک فضاي پيوسته با يک مجموعه نامحدودي از حاالت و عمليات
ممکن حرکت کند.
رباتهاي واقعي بايد قابليت تصحيح اشتباهات را در خواندن حسگرها و کنترل موتور
داشته باشند.
خط توليد خودکار:
در مسائل سرهمبندي ،مشکل يافتن قانوني است که تکههاي چند شيئي را جمع کند .اگر ترتيب
نادرست انتخاب شود ،راهي نيست که بتوان قسمتهاي بعدي را بدون از نو انجام دادن
قسمتهاي قبلي ،اضافه کرد.
کنترل يک مرحله در دنباله ،يک مسئله جستجوي پيچيدة هندس ي است که ارتباط نزديکي با
هدايت ربات دارد .از اين رو توليد مابعدهاي مجاز گرانترين قسمت دنباله سرهمبندي است و
استفاده از الگوريتمهاي آگاهانه براي کاهش جستجو ،ضروري است.
جستجو براي راهحل:
نگهداري و گسترش يک مجموعه از دنبالههاي راه حل ناتمام.
جستجوي حالتهاي موجود و يافتن راهحل بنا بر اصل جستجو.
توليد دنبالههاي عمل:
فرايند گسترش حالت :فرايندي که از طريق توليد مجموعه جديدي از حاالت ،عملگرها در
ً
حالت جاري را به کار گرفته ،و نتيجتا حالت هدف را در مجموعه وارد ميکند.
اصل جستجو :انتخاب يک حالت و کنار گذاشتن بقيه براي بعد ،زماني که اولين انتخاب به
حل مسئله منجر نشود.
ريشه درخت جستجو :يک گره جستجو است که با حالت اوليه مطابقت دارد.
گرههاي برگي درخت :حاالتي هستند که داراي فرزندي در درخت نيستند.
ساختارهاي داده براي درختهاي جستجو:
گره به عنوان يک ساختار داده با پنج قسمت به شرح زير است:
وضعيتي که گره در فضاي حاالت دارا ميباشند.
گرهاي که در جستجوي درخت ،گره جديدي را توليد کرده است (گره والد).
عملگري که براي توليد گره به کار رفته است.
تعداد گرههاي مسير ،از ريشه تا گره موردنظر (عمق گره).
هزينه مسير ،از حالت اوليه تا گره.
تفاوت بين گرهها و حالتها:
گرهها عمق و والد دارند؛ در صورتي که حالتها شامل چنين چيزهايي نيستند.
ي جستجو:
استراتژ
استراتژيها بايد داراي 4معيار زير باشند:
کامل بودن
پيچيدگي زماني
پيچيدگي فضا
بهينگي
ما 6استراتژي را بررس ي خواهيم کرد:
جستجوي سطحي
جستجوي با هزينه يکسان
جستجوي عمقي
جستجوي عمقي محدود شده
جستجوي عميقکننده تکراري
جستجوي دوطرفه
جستجوي سطحي:
در اين استراتژي که بسيار سيستماتيک است ،ابتدا گره ريشه ،و سپس تمام گرههاي ديگر
گسترش داده ميشوند.
به عبارت کليتر ،تمام گرههاي عميق ،dقبل از گرههاي عميق d+1گسترش داده ميشوند.
مزايا:
جستجوي سطحي ،کامل و بهينه ميباشد زيرا هزينه مسير ،يک تابع کاهشنيابنده از عمق گره
است.
معايب:
مرتبه زماني ) O(bdمي باشد که نمايي است.
نياز به حافظه زياد.
جستجوي با هزينه يکسان:
در اين استراتژي ،در شرايط عمومي ،اولين راه حل ،ارزانترين راه نيز هست.
اگر هزينه مسير توسط تابع ) g(nاندازهگيري شود ،در اين صورت جستجوي سطحي همان
جستجوي با هزينه يکسان است با:
)g(n)=DEPTH(n
جستجوي عمقي:
اين استراتژي ،يکي از گرهها را در پائينترين سطح درخت بسط ميدهد؛ اما اگر به نتيجه نرسيد،
به سراغ گرههايي در سطوح کم عميقتر ميرود.
مزايا:
ً
اين جستجو ،نياز به حافظه نسبتا کمي فقط براي ذخيره مسير واحدي از ريشه به يک گره برگي،
و گرههاي باقيمانده بسط داده نشده دارد.
پيچيدگي زماني ) O(bmميباشد .به طوريکه bفاکتور انشعاب فضاي حالت ،و mحداکثر
عمق درخت باشد.
معايب:
اگر مسيري را اشتباه طي کند ،هنگام پائين رفتن گير ميکند.
جستجوي عمقي نه کامل و نه بهينه است.
در درختهاي با عمق نامحدود و بزرگ اين استراتژي کار نميکند.
جستجوي عمقي محدود شده:
اين استراتژي ،براي رهايي از دامي که جستجوي عمقي در آن گرفتار ميشد ،از يک برش
استفاده ميکند.
جستجوي عمقي محدود شده کامل است اما بهينه نيست.
زمان و پيچيدگي فضاي جستجوي عمقي محدودشده ،مشابه جستجوي عمقي است .اين
جستجو پيچيدگي زماني ) O(bLو فضاي ) O(bLرا خواهد داشت ،که Lمحدودة عمق
است.
ً
در يک درخت جستجوي نمايي ،تقريبا تمام گرهها در سطح پائين هستند ،بنابراين موردي
ندارد که سطوح بااليي چندين مرتبه بسط داده شوند .تعداد بسطها در يک جستجوي
عمقي محدود شده با عمق dو فاکتور انشعاب bبه قرار زير است:
1+b+b2+…+bd-2+bd-1+bd
ي:
جستجوي عميقکننده تکرار
قسمت دشوار جستجوي عمقي محدود شده ،انتخاب يک محدودة خوب است.
اگر محدودة عمق بهتري را پيدا کنيم ،اين محدوده ،ما را به سوي جستجوي کاراتري سوق
ميدهد .اما براي بيشتر مسائل ،محدودة عمقي مناسب را تا زماني که مسئله حل نشده است،
نميشناسيم.
جستجوي عميقکنندة تکراري استراتژي است که نظريه انتخاب بهترين محدودة عمقي،
توسط امتحان تمام محدودة مسيرهاي ممکن را يادآوري ميکند.
مزايا:
ترکيبي از مزاياي جستجوي سطحي و عمقي را دارد.
اين جستجو مانند جستجوي سطحي کامل و بهينه است ،اما فقط مزيت درخواست حافظه
اندک را از جستجوي عمقي دارد.
مرتبه بسط حاالت مشابه جستجوي سطحي است ،به جز اينکه بعض ي حاالت چند بار بسط
داده ميشوند.
در جستجوي عميقکننده تکراري ،گرههاي سطوح پائيني يک بار بسط داده ميشوند ،آنهايي
که يک سطح باالتر قرار دارند دوبار بسط داده ميشوند و اليآخر تا به ريشه درخت جستجو
برسد ،که d+1بار بسط داده ميشوند.
بنابراين مجموع دفعات بسط در اين جستجو عبارتست از:
(d+1)1+(d)b+(d-1)b2+…+3bd-2+2bd-1+1bd
پيچيدگي زماني اين جستجو هنوز ) O(bdاست ،و پيچيدگي فضا ) O(bdاست.
در حالت کلي ،عميقکننده تکراري ،روش جستجوي برتري است؛ زماني که فضاي جستجوي
بزرگي وجود دارد و عمق راه حل نيز مجهول است.
جستجوي دوطرفه:
ايده جستجوي دوطرفه در واقع شبيهسازي جستجويي به سمت جلو از حالت اوليه و به سمت
عقب از هدف است و زماني که اين دو جستجو به هم برسند ،متوقف ميشود.
براي پيادهسازي الگوريتم سؤاالت زير بايد پاسخ داده شوند:
.1سؤال اصلي اين است که ،جستجو از سمت هدف به چه معني است؟ ماقبلهاي )(predeccessors
يک گره nرا گرههايي درنظر ميگيريم که nمابعد ) (successorآنها باشد .جستجو به سمت عقب
بدين معناست که توليد ماقبلها از گرة هدف آغاز شود.
.2زماني که تمام عملگرها ،قابل وارونهشدن باشند ،مجموعه ماقبلها و مابعدها يکسان هستند.
.3چه کار ميتوان کرد زماني که هدفهاي متفاوتي وجود داشته باشد؟ اگر ليست صريحي از حالتهاي هدف
وجود داشته باشد ،ميتوانيم يک تابع ماقبل براي مجموعه حالت تقاضا کنيم در حاليکه تابع مابعد يا
(جانشين) در جستجوي مسائل چندوضعيته به کار ميرود.
ً
.4بايد يک راه موثر براي کنترل هر گره جديد وجود داشته باشد تا متوجه شويم که آيا اين گره قبال در درخت
جستجو توسط جستجوي طرف ديگر ،ظاهر شده است يا خير.
.5نياز داريم که تصميم بگيريم که چه نوع جستجويي در هر نيمه قصد انجام دارد.
:مقايسه استراتژيهاي جستجو
. محدوديت عمق استl ، ماکزيمم عمق درخت جستجوm ، عمل پاسخd ، فاکتور انشعابb .ارزيابي استراتژيهاي جستجو
Criterion
BreadthFirst
UniformCost
DepthFirst
DepthLimited
Iterative
Deepening
Bidirectional
(if applicable)
Time
bd
bd
bm
bl
bd
bd/2
Space
bd
bd
bm
bl
bd
bd/2
Optimal?
Yes
Yes
No
No
Yes
Yes
Complete
Yes
Yes
No
Yes, if
Yes
Yes
ld
ي:
اجتناب از حاالت تکرار
برراي مسررائل زيررادي ،حرراالت تکرراري غيرقابررل اجتنرراب هسررتند .ايررن شررامل تمررام مسررائلي ميشررود
که عملگرها قابل وارونه شدن باشند ،مانند مسائل مسيريابي و کشيشها و آدمخوارها.
ي
کامپيوتر وجود دارد:
کار
فشار
ي براي مقابله با افزايش مرتبه و سرريز
سه راه براي حل مشکل حاالت تکرار
به حالتي که هم اکنون از آن آمدهايد ،برنگرديد .داشتن تابع بسط (يا مجموعه عملگرها) از توليد مابعدهايي که
مشابه حالتي هستند که در آنجا نيز والدين اين گرهها وجود دارند ،جلوگيري ميکند.
.1از ايجاد مسيرهاي دوار بپرهيزيد .داشتن تابع بسط (يا مجموعه عملگرها) از توليد مابعدهاي يک گره که
مشابه اجداد آن گره است ،جلوگيري ميکند.
ً
ً
.2حالتي را که قبال توليد شده است ،مجددا توليد نکنيد .اين مسئله باعث ميشود که هر حالت در حافظه
نگهداري شود ،پيچيدگي فضايي ) O(bdداشته باشد .بهتر است که به ) O(sتوجه کنيد که sتعداد کل
حاالت در فضاي حالت ورودي است.
جستجوي ارضاء محدوديت ):(Constraint Satisfaction Problem
نوع خاص ي از مسئله است که ،CSPحاالت توسط مقادير مجموعهاي از متغيرها
تعريف ميشوند و آزمون هدف مجموعهاي از محدوديتها را به آنها اختصاص ميدهد که
متغير ملزم به پيروي از آنها هستند.
CSPها ميتوانند توسط الگوريتمهاي جستجوي geneal-purposeحل شوند،
ً
اما به علت ساختار خاص آنها ،الگوريتمهايي صرفا براي CSPهايي طرح ميشوند که از
الگوريتمهاي عمومي کارآيي بهتري دارند.
محدوديتها به گونههاي مختلفي ظاهر ميشوند.
محدوديتهاي يکتا
محدوديتهاي دودويي
محدوديتهاي مطلق
محدوديتهاي اولويتدار
در CSPهاي گسسته که دامنههاي آن محدود هستند ،محدوديتها ميتوانند به سادگي
توسط شمردن ترکيبات مجاز مقادير نمايش داده شوند.
با استفاده از يک شمارهگذاري ،هر CSPگسسته ميتواند به يک CSPدودويي تبديل
شود.
چطور يک الگوريتم جستجوي همه منظوره را در يک CSPبه کار ببريم:.
در حالتي که تمام متغيرها ،تعيين نشدهاند:
عملگرها مقداري را به يک متغير از مجموعه مقادير ممکن ،نسبت ميدهند.
آزمون هدف تمام متغيرها کنترل ميکند که آيا مقدار گرفتهاند و تمام محدوديتها
از بين رفتهاند يا خير.
توجه کنيد که حداکثر عمق درخت جستجو در nو تعداد متغيرها و تمام راهحلها در عمق nهستند.
ً
جستجوي عمقي روي يک CSPزمان جستجو را تلف ميکند زماني که محدوديتها قبال مختلف شده
باشند.
فصل چهارم:
روشهاي جستجو آگاهانه
جستجوي بهترين:
اين استراتژي به اين صورت بيان ميشود که در يک درخت ،زماني که گرهها مرتب ميشوند،
گرهاي که بهترين ارزيابي را داشته باشد ،قبل از ديگر گرهها بسط داده ميشود.
ً
هدف :يافتن راهحلهاي کمهزينه است ،اين الگوريتمها عموما از تعدادي معيار تخمين براي
هزينه راهحلها استفاده ميکنند و سعي بر حداقل کردن آنها دارند.
حداقل هزينه تخمين زده شده براي رسيدن به هدف :جستجوي حريصانه
يکي از سادهترين استراتژيهاي جستجوي بهترين ،به حداقل رساندن هزينه تخمين زده شده
براي رسيدن به هدف است .بدين صورت که حالت گرهاي که به حالت هدف نزديکتر است،
ابتدا بسط داده ميشود.
ً
تابع کشفکننده :هزينه رسيدن به هدف از يک حالت ويژه ميتواند تخمين زده شود اما دقيقا
تعيين نميشود .تابعي که چنين هزينههايي را محاسبه ميکند تابع کشفکننده hناميده
ميشود.
جستجوي حريصانه :جستجوي بهترين که hرا به منظور انتخاب گره بعدي براي بسط
استفاده ميکند ،جستجوي حريصانه ) (greedy searchناميده ميشود.
ويژگيهاي جستجوي حريصانه:
جستجوي حريصانه از لحاظ دنبال کردن يک مسير ويژه در تمام طول راه به طرف هدف ،مانند جستجوي
عمقي است ،اما زماني که به بنبست ميرسد ،برميگردد.
اين جستجو بهينه نيست و ناکامل است.
پيچيدگي زماني در بدترين حالت براي جستجوي حريصانه ) ،O(bmکه mحداکثر عمق فضاي جستجو
است.
جستجوي حريصانه تمام گرهها را در حافظه نگه ميدارد ،بنابراين پيچيدگي فضاي آن مشابه پيچيدگي زماني
آن است.
ميزان کاهش پيچيدگي به مسئله و کيفيت تابع hبستگي دارد.
ي *A
حداقلسازي مجموع هزينه مسير :جستجو
جستجو با هزينه يکسان ،هزينه مسير g(n) ،را نيز حداقل ميکند.
با ترکيب دو تابع ارزيابي داريم:
)f(n) = g(n) + h(n
) :g(nهزينه مسير از گره آغازين به گره nرا به ما ميدهد.
) :h(nهزينه تخمين زده شده از ارزانترين مسير از nبه هدف است
و ما داريم:
هزينه تخمين زده شده ارزانترين راه حل از طريق f(n) = n
کشفکنندگي قابل قبو ل:
تابع hاي را که هزينهاي بيش از تخمين براي رسيدن به هدف نداشته باشد ،يک کشفکنندگي
قابل قبول ) (admissible heuristicگويند.
جستجوي *:A
جستجوي بهترين که fبه عنوان تابع ارزياب و يک تابع hقابل قبول استفاده ميکند ،به عنوان
جستجوي * Aشناخته ميشود.
فتار جستجوي *A
ر
نگاهي گذرا به اثبات کامل و بهينه بودن *:A
مشاهده مقدماتي:
ً
تقريبا تمام کشفکنندگيهاي مجاز داراي اين ويژگي هستند که در طول هر مسيري از ريشه،
هزينه fهرگز کاهش پيدا نميکند.
اين خاصيت براي کشفکنندگي ،خاصيت يکنوايي ) (monotonicityگفته ميشود.
اگر يکنوا نباشد ،با ايجاد يک اصالح جزئي آن را يکنوا ميکنيم.
بنابراين هر گره جديدي که توليد ميشود ،بايد کنترل کنيم که آيا هزينة fاين گره از هزينه f
پدرش کمتر است يا خير .اگر کمتر باشد ،هزينة fپدر به جاي فرزند مينشيند:
بنابراين:
fهميشه در طول هر مسيري از ريشه غيرکاهش ي خواهد بود ،مشروط بر اينکه hامکانپذير
باشد.
) :h*(nهزينه واقعي رسيدن از nبه هدف است.
در استفاده عملي ،خطاها با هزينه مسير متناسب هستند ،و سرانجام رشد نمايي هر کامپيوتر
را تسخير ميکند .البته ،استفاده از يک کشفکنندگي خوب هنوز باعث صرفهجويي زيادي
نسبت به جستجوي ناآگاهانه ميشود.
ً
* Aمعموال قبل از اينکه دچار کمبود زمان شود ،دچار کمبود فضا ميشود .زيرا اين جستجو
تمام گرههاي توليد شده را در حافظه ذخيره ميکند.
توابع کشفکننده:
مسئله 8را بررس ي ميکنيم:
معماي 8يکي از مسائل اوليه کشفکنندگي بود.
هدف :لغزاندن چهارخانهها به طور افقي يا عمودي به طرف فضاي خالي است تا زماني که
ساختار کلي مطابق با هدف ) (goalباشد.
5
4
6
1
8
8
7
3
2
7
Start State
1
2
3
4
6
Goal State
5
اگر خواستار يافتن راهحلهاي کوتاه باشيم ،به يک تابع کشفکننده نياز داريم که هرگز در
تعداد مراحل به هدف اغراق نکند .در اينجا ما دو کانديد داريم:
= h1 تعداد چهارخانههايي که در مکانهاي نادرست هستند h1 .يک کشفکننده مجاز
است ،زيرا واضح است که هر چهارخانهاي که خارج از مکان درست باشد حداقل يکبار بايد
جابجا شود.
= h2 مجموع فواصل چهارخانهها از مکانهاي هدف صحيحشان است .فاصلهاي که ما
حساب ميکنيم ،مجموع فواصل عمودي و افقي است که بعض ي وقتها city block
distanceو يا Manhattan distanceناميده ميشود.
بر کارايي:
اثر صحت کشفکنندگي
يک راه براي تشخيص کيفيت کشفکنندگي فاکتور انشعاب مؤثر * bاست .اگر مجموع تعداد
گرههاي بسط داده شده توسط *Aبراي يک مسئله ويژه Nباشد و عمق راه حل ،d
سپس * bفاکتور انشعابي است که يک درخت يکنواخت با عمق dخواهد داشت تا گرههاي
Nرا نگهدارد .بنابراين:
N=1+ b*+( b*)2…+( b*)d
ً
ر
معموال فاکتو انشعاب مؤثر که توسط کشفکنندگي نمايش داده ميشود ،مقدار ثابتي دارد.
يک کشفکنندگي خوب طراحي شده b* ،در حدود 1دارد.
کشفکنندهها براي مسائل ارضا محدوديت:
مسئله ارضاء محدوديت شامل يک سري از متغيرهايي است که ,ويژگيهاي زير را دارا هستند:
ميتوانند مقاديري را از دامنة داده شده دريافت کنند.
با يک سري از محدوديتها ،ويژگيهاي راه حل را مشخص کنند.
رنگآميزي نقشه نمونهاي از اين کشفکنندههاست:
هدف رنگآميزي نقشه ،اجتناب از رنگآميزي مشابه دو کشور همسايه است.
B
A
GREEN
RED
C
E
F
D
ما حداکثر از سه رنگ (قرمز ،آبي ،سبز) ميتوانيم استفاده کنيم:
اگر رنگ سبز را براي کشور ،Aقرمز را براي ،Bانتخاب کنيم ،کشور Eبايد آبي باشد .در
اين صورت ما ناچاريم که Cرا به رنگ قرمز درآوريم و Fسبز باشد .رنگآميزي Dبا رنگ
آبي يا قرمز ،بستگي به راهحل دارد .در اين حالت مسئله بدون هيچگونه جستجويي حل
ميشود.
جستجوي *:SMA
الگوريتم * ،SMAحافظه محدود * Aساده شده (Simplified-Memory-
)* BoundedAميباشد.
اين الگوريتم ،قادر است تا از تمام حافظه موجود براي اجراي جستجو استفاده کند .استفاده از
حافظه بيشتر کارايي جستجو را وسعت ميبخشد .ميتوان هميشه از فضاي اضافي صرفنظر کرد.
* SMAداراي خواص زير است:
ميتواند از تمام حافظه قابل دسترس استفاده کند.
از حاالت تکراري تا جايي که حافظه اجازه ميدهد ،جلوگيري ميکند.
اين الگوريتم کامل است به شرط آنکه حافظه براي ذخيره کم عمقترين مسير راه حل کافي
باشد.
اين الگوريتم بهينه است ،اگر حافظه کافي براي ذخيره کمعمقترين مسير راهحل کافي باشد.
بعالوه بهترين راهحلي را برميگرداند که بتواند با حافظه موجود مطابقت داشته باشد.
زماني که حافظه موجود براي درخت جستجوي کامل کافي باشد ،جستجو Optimally
efficientاست.
طراحي *SMAساده است.
زماني که نياز به توليد فرزند داشته باشد ولي حافظهاي نداشته باشد ،نياز به ساختن فضا
بر روي صف دارد .براي انجام اين امر ،يک گره را حذف ميکند .گرههايي که به اين طريق از
صف حذف ميشوند ،گرههاي فراموششده يا ) (forgotten nodesناميده ميشوند.
براي اجتناب از جستجوي مجدد زيردرختهايي که از حافظه حذف شدهاند ،در گرههاي
اجدادي ،اطالعاتي در مورد کيفيت بهترين مسير در زير درخت فراموش شده ،نگهداري ميشود.
ي
الگوريتمهاي اصالح تکرار
بهترين راه براي فهم الگوريتمهاي اصالح تکراري درنظر داشتن تمام حاالتي است که روي
سطح يک دورنمايي در معرض ديد قرار داده شده است .ارتفاع هر نقطه در دورنما مطابق با
تابع ارزياب حالت آن نقطه است .ايده اصالح تکراري ،حرکت کردن در اطراف دورنما و سعي
بر يافتن قلههاي مرتفع است ،که همانا راهحلهاي بهينه هستند.
ً
الگوريتمهاي اصالح تکراري معموال اثر حالت جاري را فقط حفظ ميکنند ،و توجهي فراتر از
همسايگي آن حالت ندارند.
evaluation
Current
state
بر يافتن قلههايي بروي سطح حاالت دارند،
الگوريتمهاي اصالح تکراري سعي
جائي که ارتفاع توسط تابع ارزيابي تعريف ميشود.
اين الگوريتمها به د و گره اصلي تقسيم ميشوند.
الگوريتمهاي تپهنوردي )(Hill-climbing
Simulated annealing
-1الگوريتمهاي جستجوي تپهنوردي )(Hill-climbing
يک اصالح خوب اين است زماني که بيش از يک فرزند خوب براي انتخاب وجود دارد،
الگوريتم بتواند به طور تصادفي از ميان آنها يکي را انتخاب کند.
اين سياست ساده ،سه زيان عمده دارد:
:Local Maxima يک ماکزيمم محلي ،برخالف ماکزيمم عمومي ،قلهاي است که پائينتر از
بلندترين قله درفضاي حالت است .زماني که روي ماکزيمم محلي هستيم ،الگوريتم توقف خواهد نمود.
اگرچه راه حل نيز ممکن است دور از انتظار باشد.
:Plateaux يک فالت محوطهاي از فضاي حالت است که تابع ارزياب يکنواخت باشد .جستجو
يک قدم تصادفي را برخواهد داشت.
:Ridges نوک کوه ،داراي لبههاي سراشيب است .بنابراين جستجو به باالي نوک کوه به آساني
ً
ميرسد ،اما بعد با ماليمت به سمت قله ميرود .مگر اينکه عملگرهايي موجود باشند که مستقيما به
سمت باالي نوک کوه حرکت کنند .جستجو ممکن است از لبهاي به لبه ديگر نوسان داشته باشد و
پيشرفت کمي را حاصل شود.
در هر مورد ،الگوريتم به نقطهاي ميرسد که هيچ پيشرفتي نيست .اگر اين اتفاق بيفتد ،تنها کار
ممکن براي انجام دادن آغاز مجدد از نقطه شروع ديگري دوباره آغاز ميشود.
موفقيت hill-climbingخيلي به ظاهر فضاي حالت «سطح» بستگي دارد :اگر فقط
ماکزيممهاي محلي کمي وجود داشته باشد ،تپهنوردي با شروع تصادفي خيلي سريع راهحل
خوبي را پيدا خواهد کرد.
Simulated annealing -2
در اين گروه از الگوريتمها به جاي شروع دوباره به طور تصادفي زماني که در يک ماکزيمم محلي
گير افتاديم ،ميتوانيم اجازه دهيم که جستجو چند قدم به طرف پائين بردارد تا از ماکزيمم
محلي فرار کند.
3
2
3
2
1
2
2
3
2
3
1
3
2
0
راهحل دو مرحلهاي براي مسئله 8وزير با استفاده از حداقل برخوردها را نشان ميدهد .در هر مرحله يک وزير به منظور تعيين
مجدد ستون انتخاب ميشود .تعداد برخوردها (در اين مورد ،تعداد وزيرهاي حملهکننده) در هر چهارخانه نشان داده شده
است .الگوريتم وزير را به چهارخانهاي که حداقل برخورد را داشته باشد ،براي از بين بردن تصادفي برخوردها ،حرکت ميدهد.
ً
اگر حرکت واقعا شرايط را بهبود بخشد ،آن حرکت هميشه اجرا ميشود.
پارامترهاي مؤثر به شرح زير ميباشند:
: E -1چگونگي ارزيابي.
:T -2تعيين احتمال.
الگوريتم شباهت صريحي با ( annealingپردازش ي که به طور آهسته مايعي را تا زماني که
يخ ببندد سرد ميکند) ،گسترش يافته است .مقدار تابع مطابق با انرژي ورودي اتمهاي ماده
است ،و Tبا دما مطابقت دارد .جدول ميزان دما را در جايي که پائين آمده است ،تعيين
ميکند.
در مسائل ارضا محدوديت
کاربردها
مسائل ارضاء محدوديت ) ،(CSPميتوانند توسط روشهاي اصالح تکراري با استفاده از
موارد زير حل شوند.
مقدار دادن به تمام متغيرها.
به کاربردن عملگرهاي تغيير به منظور حرکت دادن ساختار به طرف يک راهحل.
الگوريتمهايي که CSPها را حل ميکنند ،روشهاي تصحيح کشفکنندگي ،ناميده ميشوند،
زيرا آنها تناقضات را در ساختار جاري مسئله اصالح ميکنند.
در انتخاب مقدار جديد براي يک متغير ،واضحترين کشفکنندگي انتخاب مقداري است که
کمترين مقدار تناقضات را با ديگر متغيرها نتيجه دهد ،که همان کشفکنندگي مينيمم
تناقضات است.
فصل پنجم :
تئوري بازي
در نقش مسائل جستجو
بازيها
رقابت انتزاعي ،که در بازيهاي صفحهاي ديده ميشود ،موجب شده تا تئوري بازي جزء
تحقيقات AIقرار بگيرد.
ً
وضعيت بازي براي بازنمايي آسان است و عاملها معموال به تعداد کمي از عمليات محدود
ميشوند.
داليلي که محققين قديم ،شطرنج را بهعنوان موضوعي در AIبرگزيدند:
بازي شطرنج کامپيوتري اثباتي بر وجود ماشيني است که اعمال هوشمندانهاي را انجام
ميدهند.
سادگي قوانين
ً
وضعيت دنيا کامال براي برنامه شناخته شده است( .بازنمايي بازي به عنوان يک جستجو از
طريق فضاي موقعيتهاي ممکن بازي ،ساده است).
پيچيدگي بازيها ،به طور کامل نوعي از عدم قطعيت را معرفي ميکنند.
عدم قطعيت به علت وجود اطالعات گم شده رخ نميدهد ،اما به علت اينکه فرد زماني براي
محاسبه دقيق نتايج حرکت ندارد عدم قطعيت بوجود ميآيد.
در اين مورد ،فرد بر اساس تجربيات گذشته ميتواند بهترين حدس را بزند.
در بازيهاي دونفره:
تصميمات کامل
مورد کلي از يک بازي با دو بازيکن را در نظر ميگيريم که آن را MIN,MAXميناميم.
يک بازي به طور رسمي ميتواند به عنوان نوعي از مسئله جستجو به همراه قسمتهاي زير تعريف شود:
حالت اوليه شامل مکان صفحه وتعيين نوبت حرکت هر بازيکن است.
مجموعهاي از عملگرها که حرکات صحيح را که بازيکن ميتواند انجام دهد ،تعيين
ميکند.
آزمون پاياني زمان بازي را تعيين ميکند .حاالتي را که بازي درآنها به پايان رسيده است
حاالت پاياني ناميده ميشوند.
تابع سودمندي (تابع امتياز )payoffکه مقدار عددي براي نتيجه بازي را تعيين ميکند.
اگر به آن به عنوان يک مسئله جستجو نگاه شود ،جستجو براي دنبالهاي از حرکات که
منتهي به حالت پاياني ميشد (مطابق با تابع سودمندي) ،و سپس پيشروي و ساخت اولين
حرکت در دنباله بود.
اما حرکات MINغير قابل پيشبيني است؛
بنابراين:
MAXبايد استراتژياي را بيابد که به يک حالت پاياني برنده بدون توجه به عملکرد MIN
منجر شود ،که اين استراتژي شامل حرکات درست براي MAXبراي هر حرکت ممکن از
MINميباشد.
الگوريتم MINMAXبه منظور تعيين استراتژي بهينه براي MAXطراحي شده است و از
اين رو ميتوان بهترين حرکت را تصميمگيري کرد .الگوريتم شامل 5مرحله است:
.1توليد درخت کامل بازي ،تمام راه تا مراحل پاياني
.2درخواست تابع سودمندي براي هر حالت پاياني به منظور بدست آوردن مقدارش.
.3از سودمندي حاالت پاياني به منظور تعيين سودمندي گرهها يک مرحله باالتر دردرخت جستجو استفاده
کنيد.
.4بررس ي مقادير را از گرههاي برگي تا ريشه ،يک اليه در هر لحظه ،ادامه دهيد.
ً
.5احتماال مقادير به باالي درخت ميرسند MAX ،حرکتي را انتخاب ميکند که به باالترين مقدار منتهي
ميشود.
اگر:
:mحداکثر عمق درخت،
:bتعداد حرکات قانوني در هر نقطه،
آنگاه:
زمان پيچيدگي الگوريتم O(bm) ،minimaxاست.
الگوريتم يک جستجو عمقي است.
تصميمات ناقص:
الگوريتم minimaxفرض ميکند که برنامه زمان الزم براي جستجوي تمامي راههاي
ً
ممکن وضعيتهاي پاياني را دارد که اين فرض معموال عملي نيست.
الگوريتم مينيماکس ،به دو راه تغيير يابد:
تابع سودمندي با تابع ارزيابي EVALجايگزين شود.
آزمون پاياني با آزمون قطع CUTOFF-TESTجايگزين گردد.
تابع ارزيابي:
تابع ارزيابي تخميني از سودمندي مورد انتظار بازي را ازموقعيت داده شده برميگرداند.
واضح است که ارائه يک برنامه بازي بي نهايت به کيفيت تابع ارزيابي بستگي دارد.
چگونه به طور دقيق کيفيت را ميتوان اندازه گرفت؟
.1تابع ارزيابي با تابع سودمندي در مورد حالت پاياني بايد به توافق برسند.
.2نبايد زياد طول بکشد! (اگر پيچيدگي را محدود نکنيم minimaxبه عنوان يک
زيربرنامه فراخواني ميشود و مقدار دقيق وضعيت محاسبه ميشود ).از اين رو ،معاملهاي
بين صحت تابع ارزيابي و هزينه زمان آن وجود دارد.
.3تابع ارزيابي بايد به درستي شانسهاي واقعي براي برد را منعکس کند.
تابع ارزيابي فرض ميگيرد که مقدار هر مهره ميتواند به طور مستقل از ديگر مهرهها روي
صفحه قضاوت شود .اين نوع از تابع ارزيابي ،تابع خطي وزن دار ناميده ميشود.
اين تابع ميتواند به صورتي ذکر شود که Wها وزن ها هستند و fها اعداد هر نوع مهره روي
صفحه خواهند بود.
قطع جستجو:
صريحترين رهيافت براي کنترل ميزان جستجو قراردادن محدوديتي براي داشتن يک عمق ثابت
است ،بنابراين تست قطع براي تمام گرهها در زير عمق dموفق ميشود .عمق طوري انتخاب
ميشود که ميزان زمان استفاده شده از آنچه که قوانين بازي اجازه ميدهد تجاوز نکند.
زماني که ،وقت تمام ميشود ،برنامه حرکت انتخابي توسط عميقترين جستجوي کامل شده را
برميگرداند.
به دليل تخميني بودن توابع ارزيابي اين رهيافتها ميتوانند نتايج ناخوشايندي را به همراه داشته
باشند.
تابع ارزيابي فقط بايد براي مواقعي به کاربرده شود که خاموش هستند ،يعني اينکه تفاوتهاي
چشمگير در مقدار ،در آينده نزديک بعيد به نظر ميرسد.
اين جستجوي فوق العاده جستجوي خاموش ناميده ميشود.
مسئله افقي
):(horizonproblem
رخ سياه مانع از حرکت وزير سفيد به
حالت افقي شده است و اين موقعيت
به نفع سياه است .در حالي که برگ
برنده در دست سفيد است.
هرس آلفا-بتا:
هرس درخت جستجو:
پردازش حذف شاخهاي از درخت جستجو ،با در نظر داشتن و بدون آزمايش ،هرس درخت
جستجو ناميده ميشود.
زماني که اين تکنيک براي يک درخت minimaxاستاندارد ،به کار برده ميشود ،حرکت
مشابهي همانطور که minimaxانجام ميداد ،برميگرداند؛ اما شاخههايي که در تصميم
نهايي دخالتي ندارند را هرس ميکند.
جستجوي minimaxعمقي است ،بنابراين ،در هر لحظه ،بايد گرههايي در نظر گرفته
شوند که در طول يک مسير مجزا در درخت هستند.
αمقدار بهترين انتخابي باشد که تا کنون در طول مسير براي MAXپيدا شده است .و β
مقدار بهترين (به طور مثال ،پايينترين مقدار) انتخابي باشد که در طول مسير تا اين لحظه
براي MINپيدا شده است.
درخت جستجوي آلفا-بتا:
اين درخت ،مقدار αو βرا همچنانکه جلو ميرود ،به روز درميآورد ،و زير درخت را هرس
ميکند (فراخواني بازگشتي را قطع ميکند) به محض اينکه معلوم ميشود که اين زير درخت
بدتر از مقدار αيا βجاري است.
مزاياي هرس آلفا-بتا
مزاياي آلفا-بتا به مرتبهاي که در آن گرههاي فرزندي آزمايش شدهاند ،برميگردد.
پيچيدگي O(b/log b)dميباشد.
(1در عمل ،يک تابع ساده مرتبکننده شما را به نتيجه بهترين حالت بر خالف نتيجه تصادفي
سوق ميدهد.
(2رهيافت مشهور ديگر انجام جستجوي عميقکننده تکراري و استفاده از مقادير backed-
upاز يک تکرار براي تعيين ترتيب جانشينها در تکرار بعدي است.
نتايج بازيها نيز قابل مالحظه هستند (و در حقيقت ،مسائل جستجو در حالت کلي) و بايد به
صورت يک مدل درخت مطلوب فرض شوند تا نتايجشان را به دست آورند.
عنصر شانس هستند:
بازيهايي که شامل
تخته نرد يک بازي عمومي است که شانس و مهارت را با هم ترکيب ميکند.
تاسهاي سفيد ،6-5چهار حرکت زير
را ميتواند انجام دهد:
( 10-16و )5-10و ( 19-24و )5-11و
( 5-11و )5-10و ( 11-16و )5-11
5
6
درخت بازي در تخته نرد بايد شامل گرههاي شانس براي گرههاي MINو MAXباشد.
مرحله بعدي فهم چگونگي ساخت تصميمات صحيح است.
محاسبه مقادير انتظاري گرهها ،صريح است .براي گرههاي پاياني ،از تابع سودمندي مانند
بازيهاي قطعي استفاده ميکنيم.
با پيشروي در درخت جستجو به اندازه يک مرحله ،به يک گره شانس برخورد ميکنيم.
اگر ما فرض کنيم که ) S(C,diمجموعه موقعيتهاي توليد شده توسط اعمال حرکات قانوني
براي پرتاب ) P(diدر موقعيت Cباشد ،ميتواند مقدار expectimaxاز Cرا با استفاده از
فرمول زير محاسبه نمود:
))Expectimax (c)=∑I P(di) maxsε S(c,di) (utility(s
اين فرمول ،سودمندي مورد انتظار در موقعيت cرا با فرض بهترين بازي ارائه ميدهد.
در بازيها با گرههاي شانس:
ارزيابي موقعيت
حضور گرههاي شانس بدين معناست که بايد در مورد آنچه که به معناي مقادير ارزيابي
است ،دقيق بود.
اگر ما تغييري را در مقياس مقادير ارزيابي ايجاد کنيم ،برنامه در مجموع به طور متفاوت رفتار
ميکند.
پيچيدگي:
بدليل اينکه expectiminimaxتمام دنبالههاي پرتاب تاس را در نظر ميگيرد ،زماني معادل )O(bmnm
ميبرد ،که nتعداد پرتابهاي محدود است.
مزيت آلفا -بتا ،با داشتن بهترين بازي ناديده گرفتن پيشرفتها در آينده است که احتمال وقوعشان کم است.
در بازيهاي به همراه تاس ،دنبالههاي محتملي از حرکات وجود ندارد ،چون براي آن حرکاتي که بايد انجام
بگيرند ،ابتدا تاس بايد به روش درستي پرتاب شود تا آن حرکات منطقي شوند.
اگر بگوئيم که تمام مقادير سودمندي بين +1و -1هستند ،سپس مقدار گرههاي برگي محدود ميشوند و در
عوض ما ميتوانيم حد بااليي روي مقدار گره شانس ي بدون توجه به فرزندانش قرار دهيم.
فصل ششم :
عاملهاييکه به طور منطقي استدالل ميکنند
.
.
معرفي طراحي پايهاي براي يک عامل مبتني بر دانش:
رهيافت مبتني بر دانش روش قدرتمندي از ساخت برنامه عامل است .هدف آن پيادهسازي
نمايي از عامل است که بتواند به عنوان دانش در مورد دنياي آنها و استدالل در مورد
گونههايي ممکن از رفتار آنها به کار ميرود.
عاملهاي مبتني بر دانش قادرند که:
.1وظايف جديد را به صورت اهداف تعريف شده صريح قبول کنند.
.2آنها ميتوانند به سرعت توسط گفتن يا يادگيري دانش جديد درمورد حيطه ،به رقابت
برسند.
.3آنها ميتوانند خود شانس را با تغييرات محيط ،توسط به روز در آوردن دانش مربوطه،
تطبيق دهند.
عامل مبتني بر دانش به موارد زير نياز دارد:
(1چه چيزهايي را بداند؟
(2وضعيت جاري دنيا؟
(3چطور توسط ادراک به خواص ناديده دنيا رجوع کند؟
(4چطور دنيا زمان را ميگشايد؟
(5عامل به چيزي ميخواهد برسد؟
(6فعاليتهايي که در شرايط مختلف انجام ميدهد چيست؟
بخش مرکزي عامل مبتني بر دانش پايگاه دانش ( )knowledge baseآن ،يا KBاست.
پايگاه دانش :مجموعهاي از نمايش حقايق در مورد نياز است.
جمله :هر نمايش اختصاص ي يک جمله ( )sentenceناميده ميشود.
جمال ال ال الالالت :جمر ر ر ررالت در ير ر ر ررک زبر ر ر رراني کر ر ر رره زبر ر ر رران بازنمر ر ر ررايي دانر ر ر ررش (
)representationناميده ميشود ،بيان ميشوند.
knowledge
:ASKبه منظور افزودن جمالت جديد به پايگاه دانش به کار برده ميشود.
:TELLبه منظور پرسش اينکه چه چيزهايي شناخته شده است.
تشخيص اينکه چه چيزي بايد پس از TELLedبه KBدنبال شود ،مسئوليت مکانيزمي به
نام استنتاج ( )inferenceاست ،که قسمت مهم ديگر عامل مبتني بر دانش را تشکيل
ميدهد.
هر زمان که برنامه دانش صدا زده ميشود ،دو عمل انجام ميشود:
.1به پايگاه دانش گفته ميشود ( )TELLکه چه دريافت کرده است.
.2از پايگاه دانش سؤال ميشود ( )ASKکه چه عملي بايد انجام شود.
در فرآيند پاسخ به اين پرسش ،استدالل منطقي براي اثبات اينکه کدام عمل بهتر از بقيه
است استفاده ميشود و دانستههاي عامل و اهداف آن مشخص ميشوند.
ميتوانيم يک عامل مبتني بر دانش را در سه سطح تعريف کنيم:
.1سطح دانش knowledge levelيا سطح epistemologicalکه خالصهترين سطح است؛
ميتوانيم عامل را توسط گفتن اينکه عامل چه ميداند ،تعريف نماييم.
.2سطح منطقي logical levelسطحي است که دانش به صورت جمالت رمزگذاري ميشود.
.3سطح پياده سازي Implementation Levelسطحي است که در معماري عامل اجرا ميشود و
بازنماييهاي فيزيکي از جمالت سطح منطقي ،در اين سطح وجود دارد.
انتخاب پيادهسازي در کارآيي بهتر عامل بسيار اهميت دارد ،اما به سطح منطقي و سطح دانش
مربوط نميشود.
دنياي :WUMPUS
مشابه دنياي مکش ،دنياي Wumpusشبکهاي از مربع است که توسط ديوارهايي احاطه
شدهاند ،که هر مربع ميتواند شامل عاملها و اشياء باشد.
وظيفه عامل يافتن طال و بازگشتن به نقطه شروع و باال رفتن از غار است.
براي مشخص نمودن وظيفه عامل ،ادراکات ،عمليات و اهداف آن را بايد مشخص کنيم .در
دنياي ،Wumpusاينها به صورت زير هستند:
از مربعي که شامل Wumpusاست و مربعهاي مجاور (نه قطري) عامل بوي بدي را
دريافت ميکند .
ً
در مربعهايي که مستقيما مجاور با چالهها هستند ،عامل نسيمي را دريافت ميکند.
در مربعي که طال وجود دارد ،عامل يک درخشش ي را درک ميکند.
زماني که يک عامل به داخل ديواره قدم بر ميدارد ،ضربهاي را دريافت ميکند.
زماني که Wumpusکشته ميشود ،فريادي سر ميدهد که هر جايي از غار شنيده
ميشود.
ادراکات به عامل به صورت ليستي از پنج سيمبول داده ميشود.
مانند دنياي مکش ،عماليتي براي جلو رفتن ،چرخيدن 90به سمت چپ ،چرخيدن 90به
سمت راست وجود دارد.
عامل نابود خواهد شد زماني که وارد يک مربع شامل سياده چاله و يا کي Wumpusزنده
ميشود.
هدف عامل يافتن طال و برگرداندن آن به خانه شروع با سرعت تمام است ،بدون آنکه
کشته شود.
بازنمايي ،استدالل و منطق:
بازنمايي و استدالل با همديگر ،عملکرد يک عامل مبتني بر دانش را حمايت خواهند کرد.
بازنمايي دانش ) (knowledge representationدانش را در فرم حل شدني کامپيوتر
مطرح ميسازد ،که به عاملها کمک ميکند تا ارائه بهتري داشته باشند.
زبان بازنمايي دانش متوسط دو خاصيت تعريف ميشود:
نحو ( :)Syntaxيک زبان ساختاري ممکن براي تشکيل جمالت را ايجاد ميکند.
بازنمايي واقعي در داخل کامپيوتر :هر جمله توسط يک ساختار فيزيکي يا خاصيت فيزيکي
قسمتي از عامل پيادهسازي ميشود.
معني ( :)Semanticتعيين ميکند که حقايق موجود در دنيا به چه جمالتي نسبت داده
شوند.
با Semanticها ،ميتوانيم بگوييم زماني که ساختار ويژه با يک
عامل وجود دارد ،عامل به جمالت مربوطه ،اعتقاد دارد.
معنيهاي زبان تعيين ميکند که حقايق به کدام جمالت مربوط ميشوند.
تفاوت بين حقايق و بازنماييهاي آنها:
حقايق قسمتي از دنياي واقعي را تشکيل ميدهند ،اما بازنماييهاي آنها بايد به صورتي کد
شوند که بتواند به طور فيزيکي در يک عامل ذخيره شود.
جمالت قسمتي از ساختار فيزيکي عامل هستند و استدالل بايد پردازش ي از ايجاد ساختار جديد
فيزيکي از نمونههاي قديميتر باشد.
استدالل مطلوب بايد اين اطمينان را حاصل کند که ساختار جديد حقايقي را بازنمايي ميکند
که از حقايقي که ساختار قديمي ايجاد کرده بود ،پيروي کنند.
SENTENCES
SENTENCES
Semantics
World
Semantics
Representation
Entails
FACTS
FOLLOWS
FACTS
.ارتباط بين جمالت و حقايق توسط معناي زبان توليد ميشوند
استلزام:
ارتباط بين حقايقي که دنباله رو يکديگر هستند را نشان ميدهد.
در عالئم رياض ي ،ارتباط استلزام بين يک پايگاه دانش KBو يک جمله aبه صورت «KB
مستلزم aاست» تلفظ ميشود و به صورت KB|= aنوشته ميشود.
رويه استنتاج ميتواند يکي از دو عامل ذيل را انجام دهد:
.1با داشتن پايگاه دانش KBميتواند جمالت تازهاي از aتوليد کند که مفهوم آن
استلزام توسط KBباشد.
.2يا با داشتن يک پايگاه دانش KBو جمله aديگري ،اين رويه ميتواند گزارش دهد که a
توسط KBمستلزم شده است يا خير.
رويه استنتاج iميتواند توسط جمالتي که آنها را مشتق ميکند ،تعريف شود .اگر iبتواند a
را از KBمشتق کند ،منطقدان ميتواند بنويسيد KB |_ I a :که خوانده ميشود «آلفا از
KBتوسط iمشتق شده است يا « iمشتق ميکند آلفا از .»KB
ثبت عمليات رويه استنتاج صحيح ،اثبات ) (Proofناميده ميشود.
کليد استنتاج صحيح:
داشتن مراحل استنتاج است که به جمالت مورد عمل قرار گرفته ،توجه داشته باشد.
بازنمايي:
زبانهاي برنامهنويس ي (مانند Cيا پاسکال يا )Lipsبراي تعريف الگوريتمها مناسب
هستند و بين ساختارهاي داده پيوستگي ايجاد ميکنند.
زبانهاي طبيعي بيشتر محتاج محاوره بر خالف بازنمايي هستند.
مزايا و معايب زبان طبيعي:
زبان طبيعي راهي خوب براي سخنگو است تا مخاطب را متوجه منظور خود سازد؛ اما اغلب
اين تقسيم دانش بدون بازنمايي صريح خود دانش انجام ميشود .زبانهاي طبيعي هم چنين
از ابهامات رنج ميبرند ،مانند عبارت «سگها و گربههاي کوچک» ،روشن نيست که آيا
سگها نيز کوچک هستند يا خير.
يک زبان بازنمايي خوب ميبايست:
مزاياي زبانهاي طبيعي و رسمي را با هم داشته باشد.
پرمعني و رسا باشد.
دقيق و غير مبهم
مستقل از متن
قابل استنتاج
معاني:
يک جمله خودش به تنهاي معنايي ندارد.
ميتوان زباني را تعريف نمود که در آن هر جمله يک تفسير اختياري داشته باشد .اما در عمل
تمام زبانهاي بازنمايي ارتباط سيستماتيکي بين جمالت اعمال ميکنند.
صدقپذيري:
ً
يک جمله معتبر ( )Validيا لزوما صحيح است اگر و فقط اگر تحت تمام تفسيرهاي ممکن در
تمام دنياي ممکن ،بدون توجه از آنچه که تصور ميشد که معنا دهد و بدون توجه به حالت
آن مطلب در کل ،تعريف شده باشد.
يک جمله صدقپذير ( )satisfiableاست اگر و فقط اگر تفسيري در دنيايي براي صحت
آن وجود داشته باشد .جمله در خانه [1,2] Wumpusوجود دارد " Satisfiable
است زيرا امکان دارد که Wumpusدر آن خانه باشد ،حتي اگر چنين اتفاقي نيفتاده
باشد ،جملهاي که صدقپذير نباشد صدق ناپذير ( )unsatisfiableاست.
جمررالت خررود تناقض ر ي صرردقناپذير هسررتند ،اگررر تنرراقض برره معنرراي سرريمبولهررا بسررتگي نداشررته
باشد.
استنتاج در کامپيوترها:
معتبر بودن و صدق ناپذيري به قابليت کامپيوتري که استدالل ميکند ،بستگي دارد.
کامپيوترها از دور نقطه ضعف رنج ميبرند:
ً
کامپيوتر لزوما تفسيري را که شما براي جمالت در پايگاه دانش به کار ميبرديد ،نميداند.
چيزي در مورد دنيا نميداند به جز آنچه که در پايگاه دانش ظاهر ميشود.
چيزي که استنتاج رسمي را قدرت ميبخشد ،نبودن محدوديت بر روي پيچيدگي جمالتي
است که کاميپوتر بايد آنها را مورد عمل قرار دهد.
بزرگترين چيز در مورد استنتاج رسمي ،قابليت آن براي بدست آوردن نتايج صحيح است
حتي زماني که کامپيوتر اطالعي از تفسير استفاده شده توسط شما نداشته باشد.
کامپيوتر فقط نتايج معتبر را گزارش ميکند ،که بايست بدون توجه به تفسير شما ،صحيح
باشد.
ير ميشود:
منطق شامل موارد ز
-1يک سيستم رسمي براي تعريف حالتهاي مطلب که شامل:
الف -نحو ( )syntaxزبان ،که روش درست کردن جمالت را شرح ميدهد.
ب -معاني ( )semanticزبان ،که محدوديتهاي سيستماتيکي را روي چگونگي ارتباط
جمالت با حاالت موضوع قرار ميدهند.
-2تئوري اثبات -مجموعهاي از قوانين براي استنباط استلزامي يک سري از جمالت.
ما روي دو نوع منطق تمرکز خواهيم کرد:
منطق بولين يا گزارهاي،
منطق مرتبه اول (دقيق تر بگوييم ،حساب گزاره مرتبه اول با تساوي).
در منطق گزارهاي سيمبولها تمام گزارهها را بازنمايي ميکنند.
سيمبولهاي گزارهاي ميتوانند با استفاه از ربطدهندههاي بولين ( Boolin
)connevtivesجمالت را با معناهاي پيچيدهترين توليد کنند.
منطق مرتبه اول با بازنمايي دنياهايي به نام اشياء ( )objectsو گزاره ها روي اشياء (به
عنوان مثال ،خواص اشياء يا ارتباط بين اشياء) ،به خوبي استفاده از ربط دهنده ها و سورها
( ،)quantifiersبه جمالت اجازه ميدهند تا در مورد چيزي در دنيا به سرعت نوشته شوند.
در منطق مرتبه اول گزارهاي يک جمله يک حقيقت را بيان ميکند و عامل باور دارد که جمله
صحيح است ،يا جمله نادرست است يا قادر نيست تا از راه ديگري تنيجهگيري کند.
سيستمهايي که مبتني بر منطق شوال ( )Fuzzyهستند ،ميتوانند در جايي از اعتقاد را در
يک جمله داشته باشند و همچنين به درجات حقيقت نيز اجاره دهند :يک حقيقت نيازي به
درست يا نادرست بودن در دنيا ندارد ،اما مي تواند تا يک ميزاني صحت داشته باشد.
منطق گزارهاي :يک منطق بسيار ساده:
عالئم منطق گزارهاي:
ثابتهاي منطقي ()true, False
عالئم گزارهايQ, P :
هاي , , , ,
رابط
پرانتز ()
تمام جمالت توسط قرار دادن اين عالئم با هم و با استفاده از قوانين زير،
ساخته ميشوند:
ثابتهاي منطقي ( )true, Falseخودشان جمله محسوب ميشوند.
عالمات گزارهاي نظير Q, Pهر کدام به تنهايي يک جمله هستند.
پرانتزهاي اطراف يک عبارت ،آن عبارت را تبديل به يک جمله واحد ميسازند مثل (P
).^ Q
يک جمله ميتواند توسط ترکيب جمالت سادهتر با يکي از پنج رابط منطقي ايجاد
ميشود.
روش رفع ابهام منطق گزارهاي بسيار شبيه عبارت رياض ي است.
معاني:
يک سيمبول گزارهاي ميتواند آنچه که خواست شما است ،معني بدهد .يعني اينکه،
تفسير آن هر حقيقت اختياري ميتواند باشد.
يک جمله پيچيده ،معنايي مرکب از معناهاي هر قسمت از جمله را دارد ،هر رابط ميتواند
به عنوان يک تابع تصور شود.
اعتبار و استنتاج:
جدول درستي براي تعريف رابطها و براي کنترل جمالت معتبر به کار ميرود.
ماشين هيچ ايدهاي از معناي نتايج ندارد ،کاربر ميتواند نتايج را بخواند و از تفسير خود
براي سيمبولهاي گزارهاي به معناي نتيجه پي ببرد.
WORLD
وجود يک يک سيستم استدالل ضروري است تا قادر باشد ،نتايجي را استخراج کند که از
مقدمها ،بدون توجه به دنيا که اولويت رجوع جمالت را مشخص ميکند ،پيروي کنند.
Input sentences
conclusions
?
User
effectors
جمالت اغلب به دنيايي رجوع ميکنند که عامل دسترس ي مستقلي به آن نداشته باشد.
مدلها :Models
دنيايي که در آن جملهاي تحت تفسيري ويژه ،درست باشد .يک مدل ( )Modelاز آن جمله
ناميده ميشود.
مدلها در منطق بسيار حائز اهميت هستند زيرا ،دوباره استلزام را مطرح ميکنند ،جمله a
توسط يک پايگاه دانش KBمستلزم ميشود ،اگر مدلهاي KBتمام مدلهاي aباشند.
سپس زماني که KBدرست باشد a ،نيز درست خواهد بود.
«دنياهاي واقعي» متفاوت بسياري وجود دارند که مقادير درستي مشابهي براي آن سيمبولها
دارند .تنها تقاضايي که براي کامل شدن تصفيه الزم است ،درستي يا نادرستي هر سيمبول
گزارهاي در هر دنيا است
قوانين استنتاج براي منطق گزارهاي:
پردازش ي که توسط هر کدام از آنها ،صحت يک استنباط از طريق جداول درستي بدست
آمده است ،ميتوند به کالسهاي استنتاجها گسترش داده شود.
نمونههاي مطمئني از استنتاجها وجود دارند .که بيشتر و بيشتر بوجود ميآيند ،و صحت
آنها ميتواند يکبار براي هميشه نشان داده شوند.
زماني که يک قانون پياده شد ،ميتوان به منظور ساخت استنتاجها بدون ساخت جداول
درستي ،استفاده شود.
اين جمله نيست ،اما يک قانون استنتاج است.
يک قانون استنتاج زماني درست است اگر نتيجه آن در تمام موارد درست باشد و مقدمها
نيز درست باشند.
يک اثبات منطقي شامل دنبالهاي از کاربردهاي قوانين استنتاج است که ابتدا با جملههاي
موجود در KBآغاز ميشود ،و منجر به توليد جملهاي ميشود که اثبات را پايان ميدهد.
يکنوايي:
استفاده قوانين استنتاج به منظور يافتن نتيجه از يک پايگاه دانش ،به طور صريح مبتني بر
خواص عمومي منطقهاي قطعي (شامل گزارهاي و منطق مرتبه اول) است که يکنوايي
) (monotonicityناميده ميشود.
ميتوانيم خواص يکنوايي منطق را به طور زير شرح دهيم:
then ( KB1 KB2 ) |
if KB1 |
منطق مرتبه اول وگزارهاي دراين حالت ،يکنوا هستند.
تئوري احتمال ،يکنوا نيست.
کالس مفيدي از جمالت براي زماني که رويه استنتاجي با زمان چند جملهاي وجود دارد که
اين کالس جمالت هورن ) (Horn sentencesناميده ميشود .يک جمله هورن فرمي به
صورت زير دارد:
P1 P2 ... Pn Q
که Piو Qاتمهاي خنثي هستند .دو مورد مهم وجود دارد :اول ،زماني که Qثابت False
است.
ما به جملهاي ميرسيم که برابر است با:
P1 ... Pn
دوم اينکه ،زماني که n=1و P1=Trueما به True=>Qميرسيم که برابر است با جمله
اتمي .Q
منطق گزارهاي به ما اجازه ميدهد که به تمام نکات مهم درمورد منطق و چگونگي استفاده از
ً
آن به منظور ارائه استنتاج که نهايتا به عمليات تبديل ميشود ،برسيم .اما منطق گزارهاي
بسيار ضعيف است.
مشکل کند شدن رويه استنتاج:
)1مشکل فقط نوشتن اين قوانين نيست بلکه تعداد زياد آنها ،باعث مشکل ميشود.
)2مشکل ديگر ،روبرو شدن با تغييرات محيط است .ما جزيي از عامل استدالل کننده را در
يک مکان و زمان ويژه نشان داديم ،و تمام گزارهها در پايگاه دانش در آن زمان خاص ،درست
بودند .اما در حالت کلي ،دنيا هر لحظه در حال تغيير است.
اندازه يک جدول درستي 2nاست .که nتعداد سيمبولهاي گزارهاي در پايگاه دانش است.
براي اجتناب از سردرگمي ،ما به سيمبولهاي گزارهاي متفاوتي ،براي تشخيص مکان عامل
در هر مرحله نيازداريم.
-1ما نميدانيم که بازي چه مدت طول خواهد کشيد ،بنابراين نميدانيم که چه تعداد از
اين گزارههاي وابسته به زمان ،نياز داريم.
-2اکنون بايد برگرديم و حالتهاي وابسته به زمان از هر قانون را بنويسيم.
فصل هفتم :
منطق مرتبه او ل
.
.
منطق گزارهاي هستي شناس ي بسيارمحدودي دارد و فقط براي دنيايي که شامل حقايق
باشد ،تعهد قبول ميکند و اين امر بازنمايي مسائل ساده را نيز مشکل ساخته است.
منطق مرتبه اول ) )First-Order_logicتعهدات هستي شناسانه قويتري را
نسبت به منطق گزارهاي ايجاد ميکند.
در اين منطق وجود دارند:
اجزايي که
اشياء) :(Objectsمردم ،خانهها ،اعداد ،تئوريها ،رنگها ،بازيهاي بيسبال ،جنگلها،
کشورها...
روابط) :(Relationsبرادر ،بزرگتر از ،داخل ،قسمتي از ،رنگ ...دارد ،بدهکار است،
اتفاق افتاد بعد از...
خواص) :(Propertiesقرمز ،گرد :غيرواقعي ،رسمي...
توابع) :(Functionsپدر ،بهترين دوست ،يکي بيشتر از ،نوبت سوم...
ً
ما ادعا نميکنيم که دنيا واقعا از اشياء و روابط بين آنها ساخته شده است ،بلکه اين
جداسازي به ما کمک ميکند با بهتر در مورد دنيا قضاوت کنيم.
منطق مرتبه اول قادر است تا حقايقي را در مورد تمام اشياء جهان بيان دارد.
اگرچه منطق مرتبه اول ،موجوديت اشياء و روابط آنها را ممکن ميسازد ،اما هيچ تعهد
هستيشناس ي را براي چيزهايي مثل طبقات ،زمان و حوادث قبول نميکند.
منطق مرتبه اول از اين نظر جهاني است که قادر است تا هر چيزي را که قابل
برنامهريزي باشد ،بيان کند.
نح و و معاني:
منطق مرتبه اول جمالتي دارد ،اما همچنين واژههايي termنيز دارد که اشياء را بازنمايي
ميکنند.
سيمبولهاي ثابت ،متغيرها و سيمبولهاي تابع براي ساخت واژهها استفاده ميشوند ،و
کميتسنجها و سيمبولهاي گزارهاي براي ساخت جمالت به کار برده ميشوند.
تعريف دقيق هر عنصر به صورت زير است:
سيمبولهاي ثابت ):(Constant Symbols
يک تفسير ميبايست معين کند که کدام ش يء توسط کدام سيمبول ثابت در اشياء ارجاع
داده ميشود.
ً
هر سيمبول ثابت ،دقيقا به اسم يک ش يء نامگذاري ميشود ،اما تمام اشياء نيازي به
داشتن نام ندارند و بعض ي از آنها ميتوانند چند اسم داشته باشند.
سيمبولهاي گزاره ):(Predicate Symbols
يک تفسير معين ميکند که يک سيمبول گزاره به يک رابطه ويژه درمدل رجوع ميکند.
سيمبولهاي تابع ):(Function Symbols
ً
بعض ي از روابط تابع هستند ،بدين معنا که هر شيئ دقيقا به شيئ ديگري توسط رابطه
رجوع ميکند.
انتخاب ثابت ،گزاره ،و سيمبولهاي تابع به کلي به کاربرد بستگي دارد.
ترمها ):(Terms
يک ترم ،يک عبارت منطقي است که به يک شيئ رجوع ميکند.
معاني رسمي ترمها بسيار صريح است .تفسير ،يک رابطه تابعي ارجاع داده شده توسط
سيمبول تابع ،و اشياء ارجاع داده شده توسط واژهها را اختصاص ميدهد که آرگومانهايش
هستند .از اين رو ،تمام ترم به شيئ رجوع ميکند که به عنوان ) (n+1امين مدخل در آن
tupleدر رابطهاي که اولين nعنصر آن اشياء ارجاع شده توسط آرگومانها هستند ،ظاهر
ميشود.
جمالت اتمي ):(Atomic sentences
ميتوانيم با استفاده از ترمهايي براي ارجاع به اشياء و گزارههايي براي ارجاع به روابط،
جمالت اتمي به وجود آوريم ،که حقايق را پايهگذاري ميکنند.
پرانتز ا ز واژهها
يک جمله اتمي از يک سيمبو ل گزارهاي تشکيل يافته و توسط يک ليست
دنبال ميشود.
يک جمله اتمي درست است اگر رابطه ارجاع شده توسط سيمبول گزاره با اشياء ارجاع شده
توسط آرگومانها مطابقت داشته باشد.
رابطه در صورتي صحت دارد که tupleاشياء در رابطه باشد.
حقيقت يک جمله بنابراين هم به تفسير و هم به دنيا بستگي دارد.
جمالت پيچيده:
ما ميتوانيم از رابطهاي منطقي براي تشکيل جمالت پيچيدهتر فقط در محاسبات گزارهاي
استفاده کنيم.
معاني جمالت که با استفاده از رابطهاي منطقي فرم گرفتهاند ،ازلحاظ گزارهاي با آن يکسان
هستند.
سورها ):(Quantifires
زماني که ما منطقي در اختيار داريم که شامل اشياء است ،طبيعي است که ذکر خواص کلي
اشياء را بر شمارش اشياء توسط نام ترجيح ميدهيم .سورها به ما اجازه اين کار را ميدهند.
منطق مرتبه اول دو سور استاندارد دارد:
عمومي )(universal
وجودي )(existential
سور عمومي(Universal Quantification) :
ً
معموال به معني «براي تمام» است.
معادل با )
(عطفي
ترکيب
A
A
شما يک جمله را ميتوانيد به صورت
xP
که Pيک عبارت منطقي است تصور کنيد .و P
تمام جمالت حاصل شده توسط جانشيني نام يک شيئ براي
متغير xهرجا که در Pظاهر شود ،است.
به صورت «وجود دارد »...تلفظ ميشود .درحالت کلي
E
سور وجودي ):(Existential
xP
زماني درست است که P
E
براي بعض ي از اشياء در دنيا درست باشد .بنابراين ميتواند به عنوان معادلي براي ترکيب
فصلي جمالت بدست آمده توسط جانشيني اسم يک اشياء براي متغير ،xتصور شود.
بنابراين ،يک جمله شرطي با سور وجودي در دنيايي شامل هر شيئ که مقدم آن ترکيب
ً
شرطي نادرست باشد ،درست است .از اين رو همچنين جمالتي اصال چيزي براي گفتن
ندارند.
سورهاي النهاي ):(Nested Quantifiers
A
A
A
x,y
معادل با x
و yاست
ترتيب سورها بسيار مهم است .اگر ما آنها را در پرانتز قرار دهيم روشنتر ميشود.
A
E
در حالت کليy P(x,y)) ،
(x
جمله دلخواهي است که شامل x,yميباشد.
ميگويد که هر شيئي در دنيا يک خاصيت ويژهاي دارد ،و آن خاصيت به چند شيئي توسط
E
A
رابطه pمربوط ميشود.
از طرف ديگرy P(x,y)) ،
(x
ميگويد که در دنيا شيئي وجود دارد که خاصيت
ويژهاي دارد و خاصيت توسط pبه هر شيئي در دنيا مربوط ميشود
مشکل اساس ي زماني بوجود ميآيد ،که دو سور با يک متغير استفاده ميشوند.
قانون اين است که متغير به داخليترين سور که آن را بيان ميکند ،پس اين متغير ارتباطي با ديگر سورها
نخواهد داشت.
ارتباط بين
A
و
E
در واقع دو سور وجودي و عمومي از طريق تناقض با هم در ارتباط هستند.
E
A
بدليل اينکه
در واقع رابط عاطفي در دنياي اشياء است و
رابط فصلي است ،تعجب آور
نخواهد بود که آنها از قوانين دمورگان پيروي کنند .قوانين دمورگان در ارتباط با جمالت سوري
به شرح زير است:
)P Q ( P Q
( P Q) P Q
)P Q (P Q
)P Q (P Q
xP xP
xP xP
xP xP
xP xP
براي اهداف ،AIمحتوا و از اين رو قابليت خواندن جمالت مهم هستند.
بنابراين:
ما هر دو سور را نگه ميداريم.
تساوي (:)Equality
ً
به غير از گزارهها و ترمهايي که قبال به آنها اشاره ميتوانيم از سيمبول تساوي ( equality
)symbolبراي ساختن عباراتي که دو ترم به شيئي مشابه رجوع کنند ،استفاده ميکنيم.
سيمبول تساوي :ميتواند به منظور شرح خواص يک تابع داده شده ،استفاده شود .اين
سمبول هم چنين ميتواند با عالمت نقيض براي نشان دادن عدم تشابه دو شيئي استفاده
شود.
توسعهها و تمايزات نگارش ي:
سه نوع از روشهاي که روي منطق مرتبه اول اعمال ميشود:
-1منطق مرتبه باالتر
1-2عبارات تابعي و گزارهاي با استفاده از عملگر λ
2-2سور يکتايي
3-2عملگر يکتايي
-3انواع عالئم
منطق مرتبه باالتر:
ما را قادر ميسازد تا بتوانيم کيفيت روابط و توابع اشياء را به خوبي تعيين کنيم.
قدرت معنا دارتري نسبت به منطق اول دارد.
عبارات تابعي و گزارهاي با استفاده از عملگر : λ
اغلب مفيد است که توابع و گزارههاي پيچيده را از قسمت هاي سادهتري تشکيل دهيم.
عملگر λمرسوم است که براي اين منظور استفاده شود.
اين λ –expressionميتواند براي آرگومانها نيز به کار برده شود تا به يک ترم
منطقي منتهي شود.
براي مثال گزارة «از جنيست متفاوت و از آدرس مشابه هستند ».را ميتواند به صورت زير
نوشت:
x, y Gender( x) gender( y) Address( x) Address y
سور يکتايي:
راه دقيقي براي گفتن اينکه يک شيئي منحصر به فرد يک گزاره را قانع ميکند ،وجود ندارد.
E
بعض ي از مؤلفان عالمت )! x King(x
را استفاده ميکنند.
جمله باال بدين معناست که «يک شيئي منحصر به فرد xوجود دارد که ) King(xرا قانع
ً
ميکند «يا غير رسمي تر بگوييم» دقيقا يک Kingوجود دارد.
عملگر يکتايي:
براي مفهوم يکتايي استفاده ميکنيم.
ً
عالمت) xp(xﺎ عموما براي بازنمايي مستقيم شيئي مورد نظر استفاده ميشود.
iE
:انواع عالئم
:تعدادي از عالئم رايج در منطق مرتبه اول
Syntax item
Negation (not)
Conjunction (and)
Disjunction (or)
Implication (if)
Equivalence (iff)
Universal (all)
Existential (exists)
Relation
This book
Others
P
PQ
~ PP
P & Q P.Q PQ P, Q
PQ
PQ
PQ
P | Q P; Q P Q
x P ( x )
x P ( x )
(x) P( x) xP( x) P( x)
(x) P( x) xP( x) P ( Skolemi )
R ( x, y )
( Rxy) Rxy xRy
PQ P Q
PQ PQ
استفاده از منطق مرتبه او ل:
دامنه Kinship
اصل موضوعات ،تعاريف و قضايا
دامنه مجموعهها
عالئم خاص براي مجموعهها ،ليستها و محاسبات
طرح پرسش و گرفتن پاسخ
عاملهاي منطق براي دنياي :Wumpus
ما معماري سه عامل را در نظر ميگيريم:
(1عاملهاي ( )reflexکه فقط ادراکات و عملياتشان رامطابق هم طبقهبندي ميکنند.
(2عاملهاي مبتني بر مدل ( )model-basedکه بازنمايي داخلي از دنيا را تشکيل
ميدهند و از آن براي عملکردشان استفاده ميکنند.
(3عاملهاي مبتني بر هدف goal-basedکه اهداف را صورت ميدهند و سعي دارند تا
ً
به آنها برسند( .عاملهاي مبتني بر هدف معموال عاملهاي مبتني بر مدل نيز هستند).
عامل واکنش ي ساده:
ً
سادهترين نوع ممکن عامل ،قوانيني دارد که مستقيما ادراکات را به عمليات مرتبط ميسازد.
اين قوانين مشابه واکنش يا غرايز هستند.
محدوديتهاي عاملهاي واکنش ي ساده:
وجود مسائلي که بايد به عامل از طريق بازنمايي دنيا فهمانده شود.
عاملهاي واکنش ي نميتوانند از حلقههاي نامحدود اجتناب ورزند.
در دنيا:
تغيير
بازنمايي
در طراحي عامل ،تمام ادراکات به پايگاه دانش اضافه ميشود ،و در اصل تاريخچه ادراک
تمام آن چيزهايي است که در مورد دنيا بايد دانسته شود .اگر ما قوانيني داشته باشيم که
به گذشته به همان خوبي زمان جاري رجوع کنند ،ميتوانيم قابليتهاي يک عامل را براي
يافتن جايي که عملکرد بهينه دارد ،افزايش دهيم.
هر سيستمي که تصميماتي را بر پايه ادراکات گذشته ميگيرد ،ميتواند براي استفاده مجدد از
جمالتي در مورد حالت جاري ،دوباره نوشته شود ،به شرط اينکه اين جمالت به محض
رسيدن هر درک تازهاي و در عمل تازهاي که انجام ميشود ،به روز درآورده شود.
قوانيني که روشهايي در آن دنيا ميتواند تغيير کند (تغيير نکند) را تعريف ميکنند ،قوانين
diachronicناميده ميشوند که از زبان يوناني به معناي «سرتاسر زمان» برگرفته شده
است .بازنمايي تغييرات يکي از مهمترين حيطهها در بازنمايي دانش است.
تغيير پايگاه دانش است.
سادهترين راه براي کنار آمدن با تغييرات ،
يک عامل ميتواند در فضاي گذشته و حاالت ممکن آينده ،به جستجو بپردازد ،و هر حالت
توسط پايگاه دانش متفاوتي بازنمايي ميشود.
در اصل ،بازنمايي موقعيت و عمليات تفاوتي با بازنمايي اشياء واقعي يا روابط واقعي ندارد.
ما نياز داريم که در مورد اشياء و روابط مناسب ،تصميمگيري کنيم و سپس قضايايي در
رابطه با آنها بنويسيم.
محاسبه موقعيت:
محاسبه موقعيت ) (Situation Calculusروش خاص ي براي تعريف تغييرات در منطق
مرتبه اول است.
تصوري که از دنيا ميشود ،آن را به صورت دنبالهاي از موقعيتها در نظر ميگيرد ،که هر
کدام از آنها يک " "snapshotاز حالت دنيا است.
استنتاج خواص پنهاني دنيا:
زماني که عامل بتواند تشخيص دهد که کجا قرار دارد ،ميتواند کيفيتها را با محل ،به
جاي موقعيت تطبيق دهد.
قوانين همزمان:
قضايايي را که ما براي تسخير اطالعات ضروري براي اين استنباطها خواهيم داشت ،قوانين
همزمان ) (Synchronicناميده ميشوند ،زيرا آنها خواص حالت يک دنيا را به ديگر
خواص حالت دنياي مشابه ،مربوط ميکنند.
دو نوع اصلي از قوانين همزمان وجود دارند:
قوانين :Causal
قوانين سببي جهت مفروض شده علت را در دنيا منعکس ميکنند :بعض ي از خواص پنهاني
دنيا ،ادراکات مطمئني را براي توليد شدن باعث ميشوند.
)2قوانين تشخيص ي ):(Diagnostic rules
ً
ر
قوانين تشخيص ي مستقيما داللت بر حضو خواص پنهان شده از اطالعات مبتني بر ادراک
دارند.
ً
اگرچه قوانين تشخيص ي به نظر ميآيد که اطالعات مطلوبي را مستقيما توليد کنند ،خيلي
حيلهگيرانه است ،اطمينان داشته باشيم که آنها قويترين نتايج ممکن را از اطالعات
موجود به دست ميآورند.
مهمترين مسئله براي به خاطر سپردن اين است که اگر قضايا به درستي و کمال ،روش
عملکرد دنيا و روش ي که ادراکات توليد ميشوند را تعريف کنند ،رويه استنتاج به درستي
قويترين شرح ممکن از حالت دنيا با ادراکات داده شده را استخراج خواهد کرد.
اولويت بين عمليات:
تغييرات عقايد عامل در مورد بعض ي از چهرههاي دنيا نياز به تغييرات در قوانيني که با ديگر
چهرهها سروکار دارند ،دارد.
عامل ما به سادگي توسط پرسش براي رسيدن به چيزي متفاوت ،ميتواند دو مرتبه برنامهريزي شود.
اهداف ،مطلوب بودن حاالت حاصل را بدون توجه به روش به دست آمدن آنها توضيح ميدهند.
اولين قدم ،شرح مطلوبيت خود عمليات ) ،(actionو ترک ماشين براي انتخاب بهترين
عمل است.
از يک مقياس ساده استفاده ميکنيم:
عمليات ميتوانند عالي ،خوب ،متوسط ،ريسکي و يا مهلک باشند.
عامل هميشه بايد يک عمل فوقالعادهاي را در صورت يافتن انجام دهد؛ در غير اينصورت،
يک عمل خوب در غير اينصورت ،يک عمل متوسط ،و يک عمل ريسکدار اگر تمام قبليها
شکست بخورند.
سيستم مقدار عملياتي:
سيستمي که حاوي قوانيني از اين نوع است يک سيستم مقدار عملياتي (action-
) valueناميده ميشود.
ً
توجه کنيد که قوانين به آنچه که واقعا عمليات انجام ميدهند ،رجوع نميکنند ،فقط
به مطلوب بودن آنها توجه دارند.
به سوي يک عامل هدفدار:
حضور يک هدف دقيق به عامل اجازه ميدهد تا دنبالهاي از عملياتي که منجر رسيدن به
هدف ميشوند را پيدا کند.
حداقل سه روش براي يافتن چنين دنبالهاي وجود دارد:
(1استنتاج
(2جستجو
(3برنامهريزي
استنتاج:
نوشتن قضايايي که به ما اجازه ASKاز KBرا براي دنبالهاي از عمليات بدهد که ضمانت
رسيدن به هدف را به طور امن بکند ،چندان مشکل نيست.
مشکالت اين روش:
براي دنياهاي بزرگ ،تقاضاهاي محاسباتي بسيار زياد است. -مشکل تشخيص راهحلهاي خوب از راهحلهاي بيهوده وجود دارد.
جستجو:
ما ميتوانيم از رويه جستجوي سطحي براي يافتن مسيري به هدف استفاده کنيم .اين از عامل
درخواست ميکند تا دانش خود را به صورت مجموعهاي از عملگرها درآورد ،و بازنمايي حاالت
را دنبال کند ،بنابراين الگوريتم جستجو ميتواند به کار برده شود.
ي:
برنامه ريز
شامل استفاده از سيستمهاي استدالل خاص ي ميشود که براي استدالل در مورد عمليات
طراحي شدهاند.
فصل هشتم :
استنتاج در منطق مرتبه او ل
.
.
:قوانين استنتاج مربوط به سورها
:قوانين استنتاج براي منطق گزارهاي
1. Modus Ponens
2. And – Elimination
3. And – Introduction
4. Or – Introduction
5. Resolution
سه قانون استنتاجي جديد:
-1حذف سو ر عمومي ):(Universal Elimination
براي هر جمله αمتغير ،vو ترم زميني gداريم:
, a
)SUBST({ / g}, a
-2حذف سور وجودي:
براي هر جمله ،αمتغير ، vو سيمبول ثابت kکه جاي ديگري از پايگاه دانش ظاهر نشده
است ،داريم:
, a
)SUBST({ / K }, a
:(Existential Introduction) -3
براي هر جمله ،αمتغير vکه در αواقع نباشد ،و ترم زميني gکه در αواقع نشود داريم:
a
) SUBST({g / }, a
ميتوان اين قوانين را با استفاده از:
يک جمله با سور عمومي به عنوان ترکيب عطفي تمام مقداردهيهاي ممکن آن ،و تعريف
يک جمله با سور وجودي به عنوان ترکيب فصلي تمام مقداردهيهاي ممکن آن ،کنترل کرد.
کاربرد قوانين استنتاج ،در واقع پرسش ي از مطابقت نمونههاي پيشفرضيات آنها با جمالت
موجود در KBو سپس افزودن نمونههاي جديد آنهاست.
اگر ما فرايند يافتن اثبات را به عنوان يک پردازش جستجو فرمولهسازي کنيم ،پس واضح
است که اثبات همان راه حل مسئله جستجو است و روشن است که بايد برنامهاي
هوشمند براي يافتن اثبات بدون دنبال کردن هر گونه مسير نادرست موجود باشد.
: تعميم يافتهModus Ponens
Canonical فرم
(Unificaiton) يکسانسازي
فرم :Canonical
تمام جمالت موجود در پايگاه دانش بايد به صورتي باشند که با يکي از پيشفرضيات
قانون Modus Ponensمطابقت داشته بشاند ،فرم Canonicalبراي
Modus Ponensمتضمن اين نکته است که هر جمله در پايگاه دانش از چه نوع
اتمي يا شرطي با يک ترکيب عطفي از جمالت اتمي در طرف چپ و يک اتم منفرد در طرف
راست بايد باشد.
ما جمالت را به جمالت Hornزماني تبديل ميکنيم که ابتدا وارد پايگاه دانش ،با استفاده
از حذف سور وجودي و حذف Andشده باشند.
ي ):(Unificaiton
يکسانساز
وظيفه روتين يکسانساز ،Unifyگرفتن دو جمله اتمي q ،pو برگرداندن يک جانشين که
q ،pرا مشابه هم خواهد ساخت ،است( .اگر چنين جانشيني موجود نباشدfail ،Unify ،
برميگرداند).
)UNIFY(p,q) , SUBST ( , p) SUBST ( , q
،UNIFYعموميترين يکسانساز ) (Most General Unifierيا ) (MGUرا
برميگرداند ،که جانشيني است که کمترين تعهد را در قبل محدودسازي متغيرها دارد.
زنجيرهسازي به جل و و عقب ):(Forward AND Backward Chaining
زنجيرهسازي به جلو ):(forward chaining
قانون Modus Ponensتعميم يافته به دو صورت استفاده ميشود .ميتوانيم با
جمالت موجود در پايگاه دانش شروع کنيم و نتايج جديدي را که ميتوانند
استنباطهاي بيشتري را بسازند ،توليد کنيم .اين روش زنجيرهسازي به جلو ناميده
ميشود.
اين روش زماني استفاده ميشود که حقيقت جديدي به پايگاه داده ما اضافه شده باشد و
خواسته باشيم نتايج آن را توليد کنيم.
ي به عقب ):(Backward Chaining
زنجيرهساز
ميتوانيم با چيزي که قصد اثباتش را داريم آغاز کنيم و جمالت شرطي را پيدا کنيم که به ما
اجازه بدهند نتيجه را از آنها استنتاج کنيم ،و سپس سعي در ايجاد پيشفرضيات آنها داشته
باشيم.
اين روش زماني استفاده ميشود که هدفي براي اثبات وجود داشته باشد.
الگوريتم زنجيرهسازي به جلو:
زنجيرهسازي به جلو توسط افزودن يک حقيقت جديد pبه پايگاه دانش ،فعال ميشود و
ميتواند به عنوان قسمتي از پردازش TELLبراي مثال ،همکاري داشته باشد .در اينجا
ايده ،يافتن تمام ترکيبات شرطي است که Pرا بهعنوان پيشفرض داشته باشد ،سپس
اگر بقيه پيشفرضيات برقرار باشند ،ميتوانيم نتيجه ترکيب شرطي را به پايگاه دانش
توسط راهاندازي استنتاجهاي بعدي اضافه کنيم.
ما به ايدة ترکيب ) (Compositionجانشيني نيز نياز داريم.
) COMPOSE(1 , 2جانشيني است که اثر آن با اثر اعمال هر جانشيني به نوبت ،برابر
است .زيرا:
)SUBST(COMPOSE(1 ,2 ), P) SUBST(1 , P
زنجيرهسازي به جلو ،تصويري تدريجي از شرايط در حالي که دادههاي جديد وارد ميشوند ،ميسازد.
ً
پردازشهاي استنتاجي آن مستقيما با حل مسئله ويژه در ارتباط نيستند،
به همين دليل روية data-drivenيا data-directedناميده ميشود.
الگوريتم زنجيرهسازي به عقب:
زنجيرهسازي به عقب به منظور يافتن تمام پاسخها براي سؤال طرح شده ،به وجود آمده است.
بنابراين زنجيرهسازي به عقب ،وظيفهاي که از رويه ASKخواسته شده را انجام ميدهد .الگوريتم
ً
زنجيرهسازي به عقب BACK-CHAINابتدا توسط کنترل درمييابد که آيا پاسخها مستقيما از
جمالت پايگاه دانش ،توليد ميشوند يا خير .سپس تمام ترکيبات شرطي که نتايجشان با پرسش
) (queryمطابقت دارد را پيدا ميکند و سعي دارد تا پيشفرضهاي آن ترکيبات شرطي را توسط
زنجيرهسازي به عقب ايجادکند.
اگر پيشفرض ،يک ترکيب عطفي باشد ،سپس BACK-CHAINترکيبات عطفي را عطف به
عطف پردازش ميکند ،تا يکسانساز را براي تمام پيشفرض بسازد.
کامل بودن :Completeness
تصور کنيد که ما پايگاه دانش زير را در اختيار داريم:
) P ( x ) Q( x
)P( x) R( x
x
x
) Q( x ) S ( x
)R( x) S ( x
سپس ما ميخواهيم که ) S(Aرا نتيجه بگيريم S(A) ،درست است،
x
x
اگر )Q(Aيا ) R(Aدرست باشد ،و يکي از آنها بايد درست باشد زيرا:
يا ) P(Aيا ) ¬ P(Aدرست است.
متأسفانه ،زنجيرهسازي با Modus Ponensنميتواند ) S(Aرا نتيجه بگيرد.
مشکل اين است که ) xP( x) R( xنميتواند به صورت Hornدربيايد ،و از اين رو
توسط Modus Ponensنميتواند استفاده شود.
اين بدان معني است که رويه اثباتي که از Modus Ponensاستفاده ميکند ناکامل
) (incompleteاست:
جمالتي که در پايگاه دانش مستلزم شدهاند ولي رويه نميتواند آنها را استنتاج کند.
پرسش در مورد وجود رويههاي اثبات کامل بحثي است که ارتباط مستقيم با رياضيات
دارد .اگر يک رويه اثبات کامل بتواند براي عبارات رياض ي پيدا شود ،دو چيز دنبال ميشود:
تمام مفروضات ميتوانند به طور مکانيکي ايجاد شوند.
تمام رياضيات ميتوانند به عنوان نتيجة منطقي مجموعهاي از اصل موضوعهاي
پايهاي ايجاد شوند.
يک رويه اثبات کامل براي منطق مرتبه اول ارزش بسياري در AIدارد:
نظريههاي عملي در رابطه با پيچيدگي کامپيوتري.
فعال ساختن يک ماشين براي حل هر گونه مسئله که در زبان ميتواند قرار داده شود.
قضيه کامل بودن گودل نشان داد که ،براي منطق مرتبه اول ،هر جملهاي که توسط مجموعه جمالت
ديگري مستلزم شود ميتواند از آن مجموعه اثبات شود .بنابراين ميتوانيم قوانين استنتاجي را که به يک
رويه اثبات کامل Rاجازه ميدهد ،پيدا کنيم:
if KB | then KB | R
اين قضيه کامل بودن مشابه اين است که بگوييم رويهاي براي يافتن سوزني در يک پشته کاه وجود دارد و
اين ادعاي بيهوده نيست زيرا جمالت با سود عمومي و سيمبولهاي تابع النهاي دلخواهي در پشتههاي کاه با
اندازه نامحدود ،استفاده ميشوند.
گودل نشان داد که رويه اثباتي وجود دارد اما هيچ رويهاي را ذکر نکرد.
استلزام در منطق مرتبه اول ،نيمه تصميمپذير ) (Semidecidableبنابراين ميتوانيم
نشان دهيم که جمالت از پيشفرضيات تبعيت ميکنند ،اما هميشه نميتوانيم نشان دهيم که
آنها از پيشفرضيات تبعيت نميکنند.
بهعنوان يک فرضيه ،سازگاري ) (consistencyمجموعه جمالت (سؤالي در مورد وجود
راهحلي براي تبديل تمام جمالت به جمالت درست) نيز نيمه تصميمپذير است.
:Resolutionيک رويه استنتاج کامل
از دو ترکيب شرطي ميتوانيم ترکيب سومي را مشتق کنيم که پيشفرض اولي را به نتيجه دومي
متصل ميکند.
Modus Ponensبه ما اجازه استخراج ترکيب شرطي جديد را نميدهد و فقط نتايج
اتمي را استخراج ميکند .از اين رو قانون resolutionقدرتمندتر از Modus
Ponensاست.
قانون استنتاج :resolution
ً
در فرم ساده قانون ،resolutionپيشفرضيات داراي دقيقا دو ترکيب فصلي هستند .ما
ميتوانيم اين قانون را براي دو ترکيب فصلي به هر طولي وسعت بخشيم ،که اگر يکي از
قسمتهاي ترکيب فصلي در يک ) clause(Pjبا نقيض قسمت ديگر ترکيب فصلي )(qk
يکسان باشند ،سپس ترکيب فصلي از تمام قسمتها استنتاج ميشود بغير از آن دو:
Resolution تعميم يافته (ترکيبات فصلي)
Resolution تعميمي يافته (ترکيبات شرطي)
Resolutionتعميم يافته (ترکيبات فصلي):
براي Piو qiفرض ي که UNIFY (Pj ¬ qk)=θ
Pm
...
Pj
...
P1
qn
...
... qk
q1
)) SUBST( , (P1 ...Pj 1 Pj 1 ...pm q1 ...qk 1 qk 1 ...qn
ً
معادال ،ميتوانيم اين عبارت را به صورت ترکيب شرطي بنويسيم.
:) تعميم يافته (ترکيبات شرطيResolution
کهsi وri وqi وPi براي اتمهاي
UNIFY (Pj , qk)=θ
P1
...
Pj
...
s1
...
sn 3
q1
Pn1 r1 ... rn 2
... qk ...
qn 4
SUBST( , (P1 ...Pj 1 Pj 1 pn1 s1 ...sn3 r1 ...rn2 q1 ...qk 1 qk 1 ... qn4 ))
فرمهاي Canonicalبراي :resolution
در نسخه اوليه قانون ،resolutionهر جمله يک ترکيب فصلي از حروف فرض ي است.
تمام ترکيبات فصلي در KBفرض شدهاند که در يک ترکيب عطفي صريح (مانند يک
KBمعمولي) به هم متصل شدهاند ،بنابراين اين فرم ،فرم نرمال عطفي Conjunctive
) normal form (CNFناميده ميشود.
اگرچه هر جمله به تنهايي يک ترکيب فصلي است.
در صورت ثانويه قانون ،resolutionهر جمله يک ترکيب شرطي با يک ترکيب عطفي از اتمها
در سمت چپ و يک ترکيب فصلي از اتمها در طرف راست است.
اين حالت ،فرم نرمال شرطي) (implicative normal form (INFناميده ميشود.
هر مجموعه از جمالت ميتوانند به دو فرم ترجمه شوند .فرم نرمال عطفي رايجتر است ،اما فرم نرمال
شرطي طبيعيتر به نظر ميآيد.
Resolutionتعميمي از Modus Ponensاست.
فرم نرمال شرطي رايجتر از فرم Hornاست ،به دليل اينکه طرف سمت راست ميتواند يک
ترکيب شرطي باشد و نه فقط يک اتم تنها.
Modus Ponensقابليت ترکيب اتمها با يک ترکيب شرطي را به منظور استخراج
نتيجه به صورتي دارد که resolutionقادر به انجام آن نيست.
زنجيرهسازي با resolutionقدرتمندتر از زنجيرهسازي با Modus Ponensاست ،اما
هنوز کامل نيست.
برهان خلف:
رويه استنتاج کاملي که از resolutionاستفاده ميکند برهان خلف )(refutation
ناميده ميشود و همچنين به عنوان اثبات توسط تناقض
(proof by
) contradictionو (reduction and absurdumشناخته شده است.
تبديل به فرم نرمال:
هر جمله مرتبه اولي ميتواند به صورت فرم نرمال شرطي (يا عطفي) دربيايد.
از يک مجموعه از جمالت به فرم نرمال ميتوانيم اثبات کنيم که يک جمله نرمال از
مجموعه پيروي خواهد کرد.
رويهاي براي تبديل به فرم نرمال:
)1حذف ترکيب شرطي:
ميتوان تمام ترکيبات شرطي را با معادل فصلي جايگزين نمود.
)2حذف ¬:
نقيض فقط براي فرم نرمال عطفي مجاز است ،و براي تمام فرمهاي نرمال شرطي قدغن
است.
)3استاندارد کردن متغيرها:
ً
اين عمل بعدا از ايجاد ابهام زمان حذف سورها جلوگيري ميکند.
)4انتقال سورها به سمت چپ:
:Skolemize )5
Skolemizationپردازش ي است که در آن تمام سورهاي وجودي حذف ميشوند.
)6توزيع Λبر : ν
)7ترکيبات فصلي و عطفي النهاي مسطح شده:
در اين مورد ،جمله به فرم نرمال عطفي )(CNFاست.
)8تبديل ترکيبات فصلي به ترکيب شرطي:
ي:
برخورد با مسئله تساو
يکسانسازي يک تست نحوي مبتني بر ظاهر ترمهاي آرگوماني است و تست صحيح معنايي
مبتني بر اشيايي که نمايش ميدهند ،نيست.
دو روش براي انجام اين امر:
ذکر خواص آن:
)1بديهي نمودن تساوي به وسيله
بايد ذکر شود که تساوي ،انعطافپذير ،متقارن و (متعدي) است.
)2استفاده از يک قانون استنتاج از يک قانون استنتاج:
ميتوانيم قانون استنتاج را به صورت زير تعريف کنيم:
:Demodulationبراي تمام ترمهاي z,y,xکه UNIFY (x,y) = θ
)x y, (...z ...
)(... SUBST( , y)...
استراتژيهاي :Resolution
4استراتژي که براي راهنمايي جستجو به سمت يک اثبات استفاده ميشوند ،را بررس ي
خواهيم کرد:
:Unit preference (1
در اينجا ما سعي بر توليد جمله کوتاهي به صورت True => Falseداريم.
اين استراتژي يک کشفکننده مفيد است که ميتواند با ديگر استراتژيها ترکيب شود.
)2مجموعه Support
هر resolutionجملهاي را از مجموعه Supportبا جمله ديگري ترکيب ميکند و
نتيجه را به مجموعه Supportاضافه ميکند .اگر مجموعه Supportبه نسبت تمام
پايگاه دانش کوچک باشد ،فضاي جستجو را قطع خواهد کرد.
يک انتخاب بد براي مجموعه Supportالگوريتم را ناکامل خواهد ساخت.
استراتژي مجموعه Supportداراي اين مزيت است که درختهاي اثباتي توليد ميکند
که اغلب براي درک افراد آسان هستند ،زيرا آنها هدفگرا هستند.
Resolution )3ورودي:
در استراتژي resolutionورودي هر resolutionيکي از جمالت ورودي را (از KBيا
)queryبا جمله ديگر ترکيب ميکند.
در پايگاههاي دانش Modus Ponens ،Hornنوعي از استراتژي resolution
ورودي است ،زيرا يک ترکيب شرطي از KBاصلي را با ديگر جمالت ترکيب ميکند .از اين رو
شگفتيآور نخواهد بود که resolutionورودي براي پايگاههاي دانش ي که به صورت
Hornهستند ،کامل باشد اما در حالت کلي ناکامل است.
:Subsumption )4
متد Subsumptionتمام جمالتي که توسط يک جمله موجود در Subsume ،KB
ميشوند ،را حذف ميکند.
Subsumptionبه نگهداري KBبه صورت کوچک کمک ميکند ،و در نتيجه فضاي
جستجو را کوچک ميسازد.
فصل نهم :
ي
برنامهريز
.
.
تفاوت عامل برنامهريزي با عامل حل مسئله در سه چيز است:
بازنمايي اهداف ،حاالت و عمليات
استفاده از بازنماييهاي منطقي و صريح برنامهريز را قادر ميسازد تا سنجش عامل را معقوالنه
هدايت کند.
عامل برنامهريزي همچنين در روش بازنمايي و جستجو براي راهحلها نيز تفاوت دارد.
يک عامل ساده برنامهريزي:
زماني که حالت دنيا قابل دسترس ي است ،عامل ميتواند از ادراکات توليد شده توسط محيط
استفاده کرده و مدل کامل و صحيحي از حالت دنياي جاري بسازد .سپس ،با داشتن هدف،
ميتواند الگوريتم برنامهريزي مناسبي را براي توليد برنامه عمل فراخواني کند .عامل سپس
ميتواند در طي مراحل برنامه ،هر لحظه يک عمل را اجرا کند.
عامل با محيط از طريق يک روش حداقل در عمل است و از ادراکاتش براي شرح حالت
اوليه استفاده ميکند و از اين رو هدف اوليه را دنبال ميکند؛ اما به سادگي توانسته
مراحل برنامه را تشکيل بدهد.
ي:
از حل مسئله به برنامهريز
برنامهريزي و حل مسئله موضعات متفاوتي هستند زيرا در بازنمايي اهداف و حاالت و عمليات
و هم چنين بازنمايي ساختار دنبالههاي عملياتي متفاوت عمل ميکنند.
بر جستجو:
عناصر اوليه يک حل مسئله مبتني
بازنمايي عمليات.
بازنمايي حاالت.
بازنمايي اهداف.
بازنمايي برنامهها.
بازنمايي عمليات:
عمليات توسط برنامههايي که شرح حالت مابعد را توليد ميکنند ،تعريف ميشود.
بازنمايي حاالت:
در حل مسئله ،شرح کامل حالت اوليه داده شده است و عمليات توسط برنامهاي که شرح
کامل حالت را توليد ميکنند ،بازنمايي ميشوند.
بنابراين:
تمام بازنماييهاي حالت ،کامل هستند.
بازنمايي اهداف:
تنها دانش ي که عامل در مورد هدف در اختيار دارد ،تست هدف و تابع کشفکننده است.
هر دو اينها بر روي حالتها اعمال ميشوند تا مطلوبيت آنها مورد ارزيابي قرار گيرد.
بازنمايي برنامهها:
در حل مسئله يک راهحل دنبالهاي از عمليات است .در طول تشکيل راهحلها ،الگوريتمهاي
جستجو فقط دنبالههاي پيوسته عمليات را که از حالت اوليه آغاز ميشوند (يا در مورد
جستجوي دوطرفه ،خاتمه دادن به حالت هدف) در نظر ميگيرند.
حال ببينيم چطور اين تصميمات بر روي قابليت عامل تأثير ميگذارند ،تا مسئله ساده زير را
حل کنند:
«يک ليتر شير و يک خوشه موز و يک مته چندسرعته را بخر».
حالت اوليه :عامل در خانه است اما بدون هيچ يک از اشياء موردنظر.
عملگر :تمام کارهايي که عامل قادر به انجام آن است.
تابع کشفکننده :تعداد چيزهايي که هنوز به دست آورده نشدهاند.
در وراي برنامهريزي:
اولين ايده کليدي
«بسط دادن» بازنمايي حاالت ،اهداف و عمليات است .الگوريتمهاي برنامهريزي از تعاريفي به
ً
زبانهاي رسمي استفاده ميکنند که معموال منطق مرتبه اول و يا زيرمجموعهاي از آن است.
حاالت و اهداف توسط مجموعههايي از جمالت بازنمايي ميشوند و عمليات توسط شرح
پيششرطها و تأثيرات منطقي بازنمايي ميشوند که برنامهريزي را قادر ميسازد تا ارتباطات بين
حاالت و عمليات را هدايت کند.
در وراي برنامهريزي:
دومين ايده کليدي
اين است که برنامهريز آزاد است تا عمليات را به برنامه هر زمان که الزم باشد ،اضافه
کند .هرچند که دنباله افزايش ي در حالت اوليه وجود داشته باشد.
هيچ الزامي بر وجود ارتباط بين مرتبه برنامه ريزي و مرتبه اجرا نيست .با ساختن
تصميمات «مشخص» و «مهم» در ابتدا ،برنامهريزي ميتواند فاکتور انشعاب را براي
انتخابهاي بعدي و نياز به پيجويي به عقب را براي تصميمات اختياري کاهش دهد.
در وراي برنامهريزي:
سومين ايده کليدي
اين است که بيشتر بخشهاي دنيا مستقل از ديگر بخشها هستند.و اين امر داشتن يک
هدف عطفي را ممکن ميسازد و ميتوان آن را با يک استراتژي تقسيم و غلبه حل نمود.
ً
الگوريتمهاي تقسيم و غلبه مؤثر هستند؛ زيرا تقريبا هميشه حل چندين زيرمسئله کوچک
آسانتر از يک مسئله بزرگ است .بهر حال تقسيم و غلبه در مواردي که هزينه ترکيب
راهحلهاي زيرمسائل زياد باشد ،با شکست مواجه ميشود .بسياري از معماها داراي اين
خاصيت هستند.
دليل اينکه معماها «گولزننده» هستند ،اين است که قرار دادن زيربرنامهها کنار هم کار
دشواري است.
فصل دهم :
عدم قطعيت
.
.
مسئلهاي که با منطق مرتبه اول و بنابراين با رهيافت عامل منطقگرا وجود دارد اين است که:
عاملها اغلب هيچگاه دسترس ي کامل به تمام حقيقت درباره محيط خود را ندارند.
سؤاالت بسيار مهمي وجود دارند که عامل نميتواند پاسخ طبقهبندي شده به آن را
بيابد .بنابراين بايد تحت عدم قطعيت ) (uncertainityعمل کند.
عدم قطعيت به علت کامل نبودن ،و
عدم صحت درک عامل از خواص محيط ناش ي ميشود.
مسئله کيفيت:
قوانين بسياري در دامنه کامل نيستند؛ زيرا:
ً
)1شرايط بسيار زيادي بايد دقيقا شمارش شوند،
يا
)2برخي از شرايط ناشناخته هستند.
برخورد با دانش غيرقطعي:
ابزار اصلي ما براي کنار آمدن با درجات باور ،تئوري احتماالت خواهد بود که درجه عددي
از باور را بين 0و 1به جمالت اختصاص ميدهد.
احتماالت روش ي از خالصهسازي عدم قطعيت را به وجود ميآورد که از تنبلي و جهل ما
ناش ي ميشوند.
احتمال 0براي باور مبهمي که داراي جمالت نادرست است ،و
احتمال 1براي باور مبهمي که داراي جمله درست است ،تخصيص داده ميشود.
جمله در حقيقت خودش هم درست و هم نادرست است.
مهم است توجه داشته باشيم که درجه باور با درجه درستي متفاوت است.
تئوري احتماالت تعهد ontologicalرا همانند منطق ايجاد ميکند ،که حقايق در دنيا هم
وجود دارند و هم ندارند.
در تضاد است ،موضوع منطق فازي است.
درجه درستي که با درجه باور
در منطق مرتبه اول و گزارهاي ،جمله بسته به تعبير و دنيا ،درست يا نادرست خواهد بود و
زماني درست است که حقيقتي را که به آن رجوع ميکند ،موضوع اصلي باشد.
ً
عبارات احتمالي کامال مشابه اين نوع معناها نيستند .به آن علت است که احتماالتي که
عامل به يک گزاره تخصيص ميدهد به ادراکاتي که تا آن لحظه دريافت کرده است بستگي
دارد.
در بحث استدالل غيرقطعي ،ما آن را شاهد ) (evidenceمي ناميم.
همانطور که وضعيت استلزام زماني که جمالت بيشتري به پايگاه دانش اضافه ميشوند تغيير
ميکند ،احتماالت نيز در صورت وجود شواهد بيشتر ،تغيير خواهند کرد.
تمام عبارات احتمالي بايد شواهدي را با توجه به اينکه کدام احتمال تشخيص داده شده
است ،تعيين کنند .همانگونه که عامل ادراکات جديدي را دريافت ميکند ،ارزيابيهاي
احتمالي به منظور انعکاس شاهد جديدي ،به روز درآورده ميشوند.
عدم قطعيت و تصميمات عقالني:
ً
حضور عدم قطعيت روشهاي تصميمگيري عامل را تغيير داده است .عامل منطقي عموما
هدف واحدي دارد و هر برنامهاي که امکان رسيدن به آن قطعي است را اجرا ميکند .يک
عمل ميتواند انتخاب و يا رد شود ،چه به هدف برسد و چه نرسد و بدون توجه به آنچه
که ديگر عمليات انجام ميدهند.
تئوري سودمندي:
اين تئوري اين گونه بيان ميشود:
هر وضعيت درجهاي از فايده يا سودمندي را براي يک عامل دارد وعامل به حاالتي با
سودمندي باالتر رجوع خواهد کرد.
سودمندي يک حالت به عاملي وابسته است که مفروضاتش توسط تابع سودمندي بازنمايي
شده است.
ً
تئوري سودمندي رعايت حال ديگران را نيز ميکند .براي يک عامل کامال منطقي است که
سودمندي باالتر را به وضعيتي اختصاص دهد که عامل خودش از آن رنج ولي ديگران منفعت
ميبرند.
مفروضات که به عنوان سودمنديها ،مطرح شدند با احتماالت در تئوري عمومي تصميمات
عقالني که تئوري تصميمگيري ناميده ميشود ،ترکيب ميشوند:
Dicision theory=probalility+utility theory
ايده اساس ي در مورد تئوري تصميمگيري اين است که يک عامل منطقي است
اگر و فقط اگر
عملي را که منتهي به باالترين سودمندي ميشود ،انتخاب کند.
اين اصل سودمندي مورد انتظار ماکزيمم) (MEUناميده ميشود.
احتماالت و سودمنديها در ارزيابي يک عمل توسط توزين سودمندي يک نتيجه ويژه و با
احتمالي که پديد آورده است ،ترکيب ميشوند.
ي:
طراحي براي يک عامل تصميمگيري نظر
ساختار عاملي که از تئوري تصميمگيري براي انتخاب عمليات استفاده ميکند ،در سطح
انتزاعي با عامل منطقي يکسان است.