Transcript موتورهای جستجو
Slide 1
به نام حضرت دوست
موتور های جستجو
اسماعیل یلمه ها
مجتمع آموزش عالی فنی ومهندس ی قوچان
زمستان 1389
Slide 2
مقدمه
1
آخرین آمار ها ( )2009حاکی از وجود 234میلیون وب سایت بر روی وب است.
2
تعداد وب سایت های افزوده شده در سال 47 ، 2009میلیون وب سایت است.
3
برای دست رس ی به اطالعات نیاز به دسته بندی خاص مطالب است.
4
با وجود این که دانش هر سال دو برابر می شود چگونه می توانیم دسته بندی کنیم؟
استفاده از موتور های جستجو راه حل موضوع
Slide 3
تاریخچه موتور های جستجو
اولین موتور جتسجو به نام ”وندکس“ در اوایل دهه ی 90معرفی شد.
اولین موتور جستجوی محبوب به نام “لیکوس ( ”)lycosتوسط دانشگاه کارنگی راه اندازی شد.
آلتا ویستا دومین موتور جستجوی محبوب بود.
در پایان دهه ی 90موتور جستجوی یاهو به عنوان محبوب ترین موتور جستجوی شناخته شد.
گوگل از سال 2001یکه تاز موتور های عرصه وب شد.
Slide 4
مختصری در مورد گوگل
کلمه Googleاز لغت googolگرفته شده که به معنای عدد یک با صد صفر در جلوی آن است.
گوگل دلیل استفاده از این کلمه را تعداد بی نهایت و نامحدود اطالعات موجود در دنیای اینترنت عنوان
کرده و هدف خود را در اختیار قرار دادن این حجم از اطالعات برای کاربران عنوان کرده است.
لری پیچ و سرگئی برین موسسین این وب سایت هستند (در سن حدود 23سالگی)
شروع طوفانی گوگل با نو آوری جدیدی جهت دنبال کردن لینک های مرتبط به هم
Slide 5
مختصری در مورد گوگل
جدی گرفته نشده گوگل و طرد شدن توسط بسیاری از سرمایه گذاران
راه اندازی شرکت گوگل با سرمایه ای بالغ بر یک میلیون دالر
در سال (1998حدود دو سال پس از راه اندازی گوگل) نشریه pc worldگوگل را بین 100سایت برتر
معرفی کرد.
راه اندازی سرویس های تبلیغات کلیکی ،تحت پوشش قرار گرفتن 26زبان ،جستجوی تصاویر ،میزبان
وبالگ ،صندوق پست الکترونیکی google earth ،و ...
Slide 6
انواع موتور های
جستجو
تکمیل دستی
•فهرست های تکمیل دستی
فهرست هایی هستند که
مدیران می توانند سایت خود
را در آن ثبت نمایند.
•در هنگام جستجو در این
جستجو گر های تنها جستجو
در بین این فهرست و
توضیحاتی که برای هر وب
سایت وارد شده انجام می
گیرید.
پیمایش ی
Dmoz
Excite
Yellowpage
به طور خود کار سایت هایی
را که در فهرستشان قرار
گرفته را بازیابی می کنند و
تمام یا برخی مطالب آنها را
بسته به نوع جستجو گر
برداشته و پایگاه داده خود
قرار می دهند .که به دو نوع
زیر تقسیم بندی می شوند:
Searchable .1
subject index
full text search .2
engine
Slide 7
اجزاء اصلی یک موتور جستجوی پیمایش ی
Ranker
توسط الگوریتم خاص ی
اقدام به رتبه بندی
مطالب می کند.
Indexer
اطالعات دریافتی پس از
تجزیه و تحلیل تقسیم
بندی می شود.
crawler
یک ربات خزنده ،که
مامور یافتن صفحات
اینترنتی است.
Slide 8
یک نکته بسیار مهم
مهم ترین موارد مورد توجه موتور های جستجو جهت ارائه یک نتیجه
مناسب برای جستجو عبارتند از:
1مولفه متن
2
مولفه لینک
3
مولفه محبوبیت
5
نتیاج دیگر موتور های جستجو
Slide 9
مولفه متن
گوگل توجه زیادی به متن دارد به طوری که اگر سایت شما رتبه
10را نیز دارا باشد اما متن مورد نظر در وب سایت شما نباشد
وب سایت شما حتی در صفحه آخر نیز ظاهر نمی شود.
وب سایت هایی از اهمیت بیشتری برخوردارند که بر روی
موضوعی خاص کار می کنند.
ویرایش صحیح مطالب
افزدون کلمات کلیدی مناسب
(کلمات کلیدی :کلماتی که موضوع اصلی مطلب را می رسانند)
تمرکز بر روی اضافه کردن مطالب جدید
ترغیب بازید کننده به بازدید بیشتر از سایت شما(مربوط به مولفه محبوبیت)
مطالب جدید جایگاه بهتر ی در جستجو ها دارند.
Slide 10
مولفه متن
از این موارد بپرهیزید
مطالب خیلی ریز
صفحات سنگین تر از 150کیلو
بایت(بدون احتساب تصاویر و فایل
های ضمیمه شده)
هشدار
عنوان بزرگ تر از 70
کاراکتر
تکرار کلمات
کلیدی در یک
صفحه
Slide 11
مولفه متن
پیشنهاداتی برای حرفه ای ها
1
2
3
یافتن کلمات کلیدی در متون:
اطالع یافتن از محبوبیت کلمات:
بخش های مهم صفحات:
برای یافتن کلمات کلیدی
در متون می توانید از
ابزار های سایت زیر
استفاده کنید:
برای یافتن کلمات کلیدی
مشابه با کلمه ای می
توانید از ابزارهای سایت
زیر استفاده کنید:
مطالبی که در بین تگ های
زیر قرار می گیرند از نظر
گوگل از اهمیت بیشتری
برخوردارند:
Keywordtool.mobile
press.org
Adwords.google.com
/select/keyword tool
external
، header ، Bold
underline ، italicو ...
Slide 12
مولفه لینک
فرمول زیر معرف الگوریتم خاص ی است که عنوان می شود گوگل
از آن برای تعیین رتبه سایت با استفاده از لینک ها می نماید:
• ) : F(gضریبی که معموال برابر 0.85در نظر گرفته می شود.
• ) : Pr(tرتبه سایتی که به شما لینک داده است.
• ) : C(tوزن لینکی که به شما داده شده است.
مکان لینک در صفحه
تعداد کلمات کلیدی در متن لینک
Slide 13
مولفه لینک
لینک ها همانند رای هستند یعنی هر چقدر لینک بیشتری توسط سایت
های مشهور تری به شما داده شده باشد یعنی محبوب ترید پس باید رتبه
بهتری هم در گوگل داشته باشید.
لینک ها به دو دسته تقسیم می شوند:
لینک های ورودی
لینک هایی که از سایت های دیگر به شما می شود.
باعث افزایش رتبه شما می شود.
لینک های خروجی
لینک هایی که از سایت شما به سایت های دیگر می شود.
باعث کاهش رتبه شما می شود.
نکته :لینک های دو طرفه حالتی خنثی متمایل به افزایش وب سایت شما
را به دنبال دارد.
Slide 14
مولفه لینک
شرایط تبادل لینک موثر تر
تبادل لینک با سایت های با رتبه برابر یا باال تر
تبادل لینک با سایت های هم موضوع
قرار دادن کلمات کلیدی مناسب در متن لینک
استفاده از جمله ی اسمیه برای متن لینک
رتبه سایت
موضوع سایت
متن لینک
متن لینک
Slide 15
مولفه لینک
لینک هایی با متن
اینجا را کلیک کنید.
لینک به سایت هایی که از مصادیق
سایت های spamهستند.
از این موارد بپرهیزید
هشدار
لینک هایی با عمق بیش تر از
4قسمت
Iran.ir/old/news/
sport/football/alik
arimi
Slide 16
مولفه لینک
پیشنهاداتی برای حرفه ای ها
1
2
3
ثبت وب سایت در دایرکتوری های با
رتبه باال
استفاده از خاصیت
”rel=“nofollow
استفاده از breadcrumb
استفاده از دایرکتور های موضوعی با رتبه
باال که با هدف های دسترس ی آسان برای
کاربران و موتور های جستجو راه اندازی
شده اند.
با این خاصیت به موتور جستجو می
گویید که لینک شما را به مقصد
دنبال نکند .بدین گونه سایت شما از
بسیاری از مضرات لینک خارجی در
امان خواهد بود.
”درگاه >”rel=“nofollow
>
Dmoz.ir
Digg.com
این سیستم که در یک خط مسیر
صفحه ی فعلی کاربر را به او نشان
می دهد .کاربر به راحتی می تواند به
صفحات قبلی و اصلی مراجعه نماید.
Slide 17
مولفه محبوبیت
• مهمترین مولفه است چرا که تمام تالش یک وب سایت حذف
مخاطب و نگه داری آن است.
• اگر یک وب سایت با ذائقه مخاطب همسان نباشد به زودی
توسط کاربر کنار گذاشته می شود.
Slide 18
مولفه محبوبیت
مهمترین فاکتور ها در محبوبیت سایت:
1
تمرکز بر موضوعی خاص
2
جلوه ظاهری متناسب با موضوع
3
آرایش مطالب
4
سادگی چیدمان لینک ها و سلسه مراتب وب سایت
Slide 19
چالش در نتایج موتور های جستجو
موتورهای جستجو سعی دارند تا با در پیش گرفتن راه کارهای مختلف اقدام به ارائه بهترین
نتایج جستجو نمایند اما می توان با در پیش گرفتن شیوه های زیر وب سایت را در بین این نتایج
قرار داد هر چند شایستگی آن را نداشته باشد.
تبادل لینک با
سایت های
مختلف
استفاده از کلمات
کلیدی و متاتگ های
مشهور و غیر اخالقی
دستکاری فایل Robots.txt
به صور زیر:
*User-agent:
Crawl-delay:10
استفاده از ربات
های افزایش
دهنده آمار سایت
در alexa
استفاده از
MiniSite
ها
Slide 20
مقایسه موتور های جستجو گر
Google 57.7%
Yahoo 17.2%
Google 71.59%
سال2007
سال2010
Microsoft site(msn) 12%
Yahoo 14.28%
Microsoft site(bing) 9.87%
سهم هر یک از موتور های جستجو از
جستجو های انجام شده
Slide 21
انتقاداتی از موتور های جستجو
انتقادات
•سیستم رتبه بندی باعث
می شود تا سایت های
بسیاری بر اساس سلیقه
عامه کاربران فهرست
شوند به براسای محتوای
آنها
نفوذ موتور های جستجو
به حیطه خصوص ی
کاربران و جمع آوری
اطالعات آنها و امکان بهره
وری از آنها به شدت مورد
انتقاد است.
Slide 22
از حسن توجه شما متشکریم.
به نام حضرت دوست
موتور های جستجو
اسماعیل یلمه ها
مجتمع آموزش عالی فنی ومهندس ی قوچان
زمستان 1389
Slide 2
مقدمه
1
آخرین آمار ها ( )2009حاکی از وجود 234میلیون وب سایت بر روی وب است.
2
تعداد وب سایت های افزوده شده در سال 47 ، 2009میلیون وب سایت است.
3
برای دست رس ی به اطالعات نیاز به دسته بندی خاص مطالب است.
4
با وجود این که دانش هر سال دو برابر می شود چگونه می توانیم دسته بندی کنیم؟
استفاده از موتور های جستجو راه حل موضوع
Slide 3
تاریخچه موتور های جستجو
اولین موتور جتسجو به نام ”وندکس“ در اوایل دهه ی 90معرفی شد.
اولین موتور جستجوی محبوب به نام “لیکوس ( ”)lycosتوسط دانشگاه کارنگی راه اندازی شد.
آلتا ویستا دومین موتور جستجوی محبوب بود.
در پایان دهه ی 90موتور جستجوی یاهو به عنوان محبوب ترین موتور جستجوی شناخته شد.
گوگل از سال 2001یکه تاز موتور های عرصه وب شد.
Slide 4
مختصری در مورد گوگل
کلمه Googleاز لغت googolگرفته شده که به معنای عدد یک با صد صفر در جلوی آن است.
گوگل دلیل استفاده از این کلمه را تعداد بی نهایت و نامحدود اطالعات موجود در دنیای اینترنت عنوان
کرده و هدف خود را در اختیار قرار دادن این حجم از اطالعات برای کاربران عنوان کرده است.
لری پیچ و سرگئی برین موسسین این وب سایت هستند (در سن حدود 23سالگی)
شروع طوفانی گوگل با نو آوری جدیدی جهت دنبال کردن لینک های مرتبط به هم
Slide 5
مختصری در مورد گوگل
جدی گرفته نشده گوگل و طرد شدن توسط بسیاری از سرمایه گذاران
راه اندازی شرکت گوگل با سرمایه ای بالغ بر یک میلیون دالر
در سال (1998حدود دو سال پس از راه اندازی گوگل) نشریه pc worldگوگل را بین 100سایت برتر
معرفی کرد.
راه اندازی سرویس های تبلیغات کلیکی ،تحت پوشش قرار گرفتن 26زبان ،جستجوی تصاویر ،میزبان
وبالگ ،صندوق پست الکترونیکی google earth ،و ...
Slide 6
انواع موتور های
جستجو
تکمیل دستی
•فهرست های تکمیل دستی
فهرست هایی هستند که
مدیران می توانند سایت خود
را در آن ثبت نمایند.
•در هنگام جستجو در این
جستجو گر های تنها جستجو
در بین این فهرست و
توضیحاتی که برای هر وب
سایت وارد شده انجام می
گیرید.
پیمایش ی
Dmoz
Excite
Yellowpage
به طور خود کار سایت هایی
را که در فهرستشان قرار
گرفته را بازیابی می کنند و
تمام یا برخی مطالب آنها را
بسته به نوع جستجو گر
برداشته و پایگاه داده خود
قرار می دهند .که به دو نوع
زیر تقسیم بندی می شوند:
Searchable .1
subject index
full text search .2
engine
Slide 7
اجزاء اصلی یک موتور جستجوی پیمایش ی
Ranker
توسط الگوریتم خاص ی
اقدام به رتبه بندی
مطالب می کند.
Indexer
اطالعات دریافتی پس از
تجزیه و تحلیل تقسیم
بندی می شود.
crawler
یک ربات خزنده ،که
مامور یافتن صفحات
اینترنتی است.
Slide 8
یک نکته بسیار مهم
مهم ترین موارد مورد توجه موتور های جستجو جهت ارائه یک نتیجه
مناسب برای جستجو عبارتند از:
1مولفه متن
2
مولفه لینک
3
مولفه محبوبیت
5
نتیاج دیگر موتور های جستجو
Slide 9
مولفه متن
گوگل توجه زیادی به متن دارد به طوری که اگر سایت شما رتبه
10را نیز دارا باشد اما متن مورد نظر در وب سایت شما نباشد
وب سایت شما حتی در صفحه آخر نیز ظاهر نمی شود.
وب سایت هایی از اهمیت بیشتری برخوردارند که بر روی
موضوعی خاص کار می کنند.
ویرایش صحیح مطالب
افزدون کلمات کلیدی مناسب
(کلمات کلیدی :کلماتی که موضوع اصلی مطلب را می رسانند)
تمرکز بر روی اضافه کردن مطالب جدید
ترغیب بازید کننده به بازدید بیشتر از سایت شما(مربوط به مولفه محبوبیت)
مطالب جدید جایگاه بهتر ی در جستجو ها دارند.
Slide 10
مولفه متن
از این موارد بپرهیزید
مطالب خیلی ریز
صفحات سنگین تر از 150کیلو
بایت(بدون احتساب تصاویر و فایل
های ضمیمه شده)
هشدار
عنوان بزرگ تر از 70
کاراکتر
تکرار کلمات
کلیدی در یک
صفحه
Slide 11
مولفه متن
پیشنهاداتی برای حرفه ای ها
1
2
3
یافتن کلمات کلیدی در متون:
اطالع یافتن از محبوبیت کلمات:
بخش های مهم صفحات:
برای یافتن کلمات کلیدی
در متون می توانید از
ابزار های سایت زیر
استفاده کنید:
برای یافتن کلمات کلیدی
مشابه با کلمه ای می
توانید از ابزارهای سایت
زیر استفاده کنید:
مطالبی که در بین تگ های
زیر قرار می گیرند از نظر
گوگل از اهمیت بیشتری
برخوردارند:
Keywordtool.mobile
press.org
Adwords.google.com
/select/keyword tool
external
، header ، Bold
underline ، italicو ...
Slide 12
مولفه لینک
فرمول زیر معرف الگوریتم خاص ی است که عنوان می شود گوگل
از آن برای تعیین رتبه سایت با استفاده از لینک ها می نماید:
• ) : F(gضریبی که معموال برابر 0.85در نظر گرفته می شود.
• ) : Pr(tرتبه سایتی که به شما لینک داده است.
• ) : C(tوزن لینکی که به شما داده شده است.
مکان لینک در صفحه
تعداد کلمات کلیدی در متن لینک
Slide 13
مولفه لینک
لینک ها همانند رای هستند یعنی هر چقدر لینک بیشتری توسط سایت
های مشهور تری به شما داده شده باشد یعنی محبوب ترید پس باید رتبه
بهتری هم در گوگل داشته باشید.
لینک ها به دو دسته تقسیم می شوند:
لینک های ورودی
لینک هایی که از سایت های دیگر به شما می شود.
باعث افزایش رتبه شما می شود.
لینک های خروجی
لینک هایی که از سایت شما به سایت های دیگر می شود.
باعث کاهش رتبه شما می شود.
نکته :لینک های دو طرفه حالتی خنثی متمایل به افزایش وب سایت شما
را به دنبال دارد.
Slide 14
مولفه لینک
شرایط تبادل لینک موثر تر
تبادل لینک با سایت های با رتبه برابر یا باال تر
تبادل لینک با سایت های هم موضوع
قرار دادن کلمات کلیدی مناسب در متن لینک
استفاده از جمله ی اسمیه برای متن لینک
رتبه سایت
موضوع سایت
متن لینک
متن لینک
Slide 15
مولفه لینک
لینک هایی با متن
اینجا را کلیک کنید.
لینک به سایت هایی که از مصادیق
سایت های spamهستند.
از این موارد بپرهیزید
هشدار
لینک هایی با عمق بیش تر از
4قسمت
Iran.ir/old/news/
sport/football/alik
arimi
Slide 16
مولفه لینک
پیشنهاداتی برای حرفه ای ها
1
2
3
ثبت وب سایت در دایرکتوری های با
رتبه باال
استفاده از خاصیت
”rel=“nofollow
استفاده از breadcrumb
استفاده از دایرکتور های موضوعی با رتبه
باال که با هدف های دسترس ی آسان برای
کاربران و موتور های جستجو راه اندازی
شده اند.
با این خاصیت به موتور جستجو می
گویید که لینک شما را به مقصد
دنبال نکند .بدین گونه سایت شما از
بسیاری از مضرات لینک خارجی در
امان خواهد بود.
”درگاه >”rel=“nofollow
>
Dmoz.ir
Digg.com
این سیستم که در یک خط مسیر
صفحه ی فعلی کاربر را به او نشان
می دهد .کاربر به راحتی می تواند به
صفحات قبلی و اصلی مراجعه نماید.
Slide 17
مولفه محبوبیت
• مهمترین مولفه است چرا که تمام تالش یک وب سایت حذف
مخاطب و نگه داری آن است.
• اگر یک وب سایت با ذائقه مخاطب همسان نباشد به زودی
توسط کاربر کنار گذاشته می شود.
Slide 18
مولفه محبوبیت
مهمترین فاکتور ها در محبوبیت سایت:
1
تمرکز بر موضوعی خاص
2
جلوه ظاهری متناسب با موضوع
3
آرایش مطالب
4
سادگی چیدمان لینک ها و سلسه مراتب وب سایت
Slide 19
چالش در نتایج موتور های جستجو
موتورهای جستجو سعی دارند تا با در پیش گرفتن راه کارهای مختلف اقدام به ارائه بهترین
نتایج جستجو نمایند اما می توان با در پیش گرفتن شیوه های زیر وب سایت را در بین این نتایج
قرار داد هر چند شایستگی آن را نداشته باشد.
تبادل لینک با
سایت های
مختلف
استفاده از کلمات
کلیدی و متاتگ های
مشهور و غیر اخالقی
دستکاری فایل Robots.txt
به صور زیر:
*User-agent:
Crawl-delay:10
استفاده از ربات
های افزایش
دهنده آمار سایت
در alexa
استفاده از
MiniSite
ها
Slide 20
مقایسه موتور های جستجو گر
Google 57.7%
Yahoo 17.2%
Google 71.59%
سال2007
سال2010
Microsoft site(msn) 12%
Yahoo 14.28%
Microsoft site(bing) 9.87%
سهم هر یک از موتور های جستجو از
جستجو های انجام شده
Slide 21
انتقاداتی از موتور های جستجو
انتقادات
•سیستم رتبه بندی باعث
می شود تا سایت های
بسیاری بر اساس سلیقه
عامه کاربران فهرست
شوند به براسای محتوای
آنها
نفوذ موتور های جستجو
به حیطه خصوص ی
کاربران و جمع آوری
اطالعات آنها و امکان بهره
وری از آنها به شدت مورد
انتقاد است.
Slide 22
از حسن توجه شما متشکریم.