محركات البحث

Download Report

Transcript محركات البحث

‫زين عبد الهادي‬
‫القاهرة – يونيه ‪2009‬‬
‫لماذا محركات البحث‬
‫‪‬تكتظ االنترنت بماليين المواقع التى تحتوى على مليارات المعلومات‪ ،‬وتعتبر‬
‫عملية الوصول الى معلومات محددة من اصعب العمليات عند التعامل مع االنترنت‪.‬‬
‫‪‬ماليين الصفحات التى تحتاج من الباحث الواحد أن يتفرغ طيلة عمره لقراءة‬
‫‪ %1‬منها‬
‫‪‬تزداد مواقع االنترنت يوميا َ بما يقارب ‪ 50‬الف موقع يوميا‬
‫‪‬ظهور ما يعرف بأدوات البحث ‪ Search tools‬والتى تساعد المتصفحين فى‬
‫الوصول الى إجابات على أسئئلتهم‪.‬‬
‫أنواع ادوات البحث‬
‫املتصفحات‬
‫‪Web Browsers‬‬
‫محركات البحث العمالقه‬
‫محركات البحث‬
‫‪Meta Search Engine‬‬
‫‪Search Engine‬‬
‫مجرد محرك بحث أم‬
‫مجموعة من الحلول‬
‫البوابات‬
‫‪Portals‬‬
‫أدوات البحث الذكية‬
‫‪Intelligent Search Agents‬‬
‫االدلة‬
‫قواعد البيانات‬
‫‪Directories‬‬
‫‪Date Bases‬‬
‫محركات البحث العربية‪..‬ماموقعها؟‬
‫متى؟‬
‫•ظهرت خدمة اإلنترنت فى الوطن العربى متأخرة عن ظهور الشبكة فى البلدان‬
‫األخرى‪ ،‬حيث ظهرت فى السنوات األولى من التسعينيات مجموعة من المواقع‬
‫العربية التى تتعامل باللغة اإلنجليزية‪ ،‬ويعتبر موقع الشبكة العربية ‪ArabNet‬‬
‫من المواقع العربية األولى التى دخلت عالم اإلنترنت والذى تأسس من قبل‬
‫الشبكة السعودية لألبحاث والتسويق فى لندن‪ ،‬وقد ظهر هذا الموقع تقريبا فى‬
‫أواخر عام ‪ 1994‬وبدايات ‪،1995‬‬
‫•بدأت محركات البحث العربية فى الظهور منذ عام ‪ 1997‬مع محرك البحث‬
‫"اين©"‪ ،‬أى أنها حديثة العهد مقارنة بمثيالتها فى اللغات األخرى ‪.‬‬
‫مالسبب في ظهور محركات البحث العربية؟‬
‫‪EndUser‬‬
‫المستفيد النهائى‬
‫‪Spider‬‬
‫جمع المواقع‬
‫تكشيف‬
‫المواقع‬
‫‪Query‬‬
‫االستفسار‬
‫كلمات مفتاحية‬
‫جملة‬
‫‪Index‬‬
‫بناء الكشاف‬
‫‪Checker‬‬
‫مطابقة االستفسار بالكلمات‬
‫المفتاحية‬
‫‪Data Base‬‬
‫قاعدة البيانات‬
‫مواقع الشبكة‬
‫‪Web‬‬
‫‪Results‬‬
‫النتائج المدفوعة‬
‫‪Paied‬‬
‫‪Results‬‬
‫الوصالت اإلعالنية‬
‫‪Sponserd‬‬
‫‪links‬‬
‫معايير تقييم واختيار محركات البحث‬
‫االختالفات بين ادوات البحث ‪:‬‬
‫ان فهم االختالفات الموجودة بين مستوى قيام كل اداة بحث لعملها يساعد على‬
‫تحسين فاعلية استرجاع المعلومات من االنترنت‪ .‬و تكمن االختالفات االساسىية‬
‫بين ادوات البحث في الجوانب التالية ‪:‬‬
‫‪ -1‬التفاعل اثناء إنجاز البحث ‪.‬‬
‫‪ -2‬حجم قاعدة البيانات ‪.‬‬
‫‪ -3‬أساليب إنشاء قاعدة البيانات ‪.‬‬
‫‪ -4‬عمق التكشيف ‪. Indexing‬‬
‫‪ -5‬تنظيم قائمة نتائج البحث ( الترتيب حسب المالئمة ) ‪.‬‬
‫‪ -6‬خصائص البحث المتقدم ‪.Advanced Search‬‬
‫‪ -7‬تقديم نتائج البحث ‪.‬‬
‫لماذا؟‬
‫‪ -8‬حفظ نتائج وجلسات البحث السابقة‪.‬‬
‫معايير تقييم واختيار محركات البحث‬
‫تقييم محركات البحث (مالذي يراه المتصفح)‬
‫•الواجهة ‪:User Interface‬‬
‫مدى تناسق الواجهه وسهولة استخدامها‪.‬‬
‫•مدى الدقة‪:‬‬
‫مدى دقة نتائج البحث وعالقتها بموضوع البحث‪.‬‬
‫•التغطية‪:‬‬
‫مدى شمول نتائج البحث للموضوع وتغطية كافة جوانبه‪.‬‬
‫•عدد الصفحات الت يتم تكشيفها يوميا‪:‬‬
‫يوضح هذا العنصر إل أي مدى يمكن لمحرك البحث أن يكشف عددا من الصفحات في‬
‫اليوم الواحد‪ .‬وكلما كانت قدرة المحرك عل الفحص والتجول في المواقع كبيرة‪ ،‬كلما كان‬
‫الكشاف الخاص به أكثر حداثة وتعبيرا عن صحة البيانات‪.‬‬
‫•خيارات االسترجاع‪:‬‬
‫ما ه الخيارات المتاحه لطرق استرجاع وعرض النتائج‬
‫معايير تقييم واختيار محركات البحث‬
‫•زمن االستجابة‪:‬‬
‫•ماهو زمن االستجابه لإلستفسار ؟‬
‫•سمات خاصة‪:‬‬
‫هل يتميز المحرك بسمات خاصة تميزة عن غيره من المحركات؟‬
‫•شاشات المساعدة‪:‬‬
‫•هل يتيح المحرك شاشات مساعدة ؟‬
‫•المحتوى‪:‬‬
‫•هل المحتوى الذى يقدمة محرك البحث محتوى علم أم مجرد أخبار فقط ؟‬
‫•الحداثة‪:‬‬
‫هل النتائج الت يقدمها محرك البحث حديثة أم متقادمه‬
‫•حجم قاعدة البيانات‪:‬‬
‫كلما كان محرك البحث كبيرا (بناء عل عدد الصفحات المكشفة ) كلمىا كىان عىدد الصىفحات التىي‬
‫يمكن تكشيفها في المواقع أكثر‪.‬‬
‫معايير تقييم واختيار محركات البحث‬
‫•مدى االستخدام‪:‬‬
‫عدد حاالت الرجوع ال موقع بعينه‪ .‬هل يتغير ترتيب الموقع خالل فترات منتظمة؟‬
‫•كلمات داخل السياق‪:‬‬
‫هل يستطيع البحث عن كلمات داخل السياق؟‬
‫•كلمات مهملة‪:‬‬
‫هل يقوم محرك البحث بإهمال الكلمات الت ليس لها معن ؟‬
‫•اكتشاف التكرار‪:‬‬
‫هل يقوم محرك البحث باكتشاف التكرارات ف نتائج البحث واستبعادها؟‬
‫•متوسط أعمار الوثائق المتاحة‪:‬‬
‫هل يوجد فترة زمنية محددة يحتفظ فيها المحرك بالبيانات الموجودة ف قاعدة البيانات؟‬
‫•الترجمة‪:‬‬
‫هل يقوم المحرك بترجمة النتائج للغات المختلفة؟‬
‫هل يمكنه البحث بالمفاهيم؟ اللغة العربية – اللغة العربية – اللغة العربية – اللغة العربية‬
‫معايير تقييم واختيار محركات البحث‬
‫•كم المواقع الناتجة عن االستفسار‪:‬‬
‫ما هو عدد المواقع الناتجه عن االستفسار بأشكاله المختلفة؟‬
‫•المقارنة بين الواقعات العشر األول لكل محرك‪:‬‬
‫ما ه المواقع والدول الت تسيطر عل النسبة االكبر من نتائج البحث؟‬
‫•الصفحات الراضخة وغير الراضخة‪:‬‬
‫الصىىفحات التى تخلىىع للتكشىىيف مىىن قبىىل الروبىىوت وتلى التى ال يسىىمح الموقىىع‬
‫بتكشيفها؟‬
‫•الخرائط والصور‪:‬‬
‫هل يقوم المحرك بتكشيف الخرائط والصور؟‬
‫•العمق‪:‬‬
‫ما مدى العمق الذى يصل اليه الزاحف ف تكشيف المواقع؟‬
‫معايير تقييم واختيار محركات البحث‬
‫•شيوع الرابطة أو الوصلة ‪: Popularity‬‬
‫عدد مرات الربط لهذه الصفحة داخل الموقع‪ ،‬أو ف المواقع األخرى‪.‬‬
‫•التعلم بالتردد عل الصفحة‪:‬‬
‫هل يستطيع الزاحف تحديد المواقع الت تمت زيارتها مسبقا واستخدام هذه المعرفة ف‬
‫جمع البيانات بشكل أفلل من حيث معرفة مواعيد التحديث ومدى التغير ف الصفحة‪.‬‬
‫•اختبار حالة عنوان الموقع‪:‬‬
‫حيث يمكن معرفة إذا كان قد تم تكشيف الصفحة من قبل أم ال‬
‫•ترتيب النتائج‪:‬‬
‫ما ه الطريقة الت يستخدمها محرك البحث ف ترتيب النتائج ؟‬
‫•المسئولية‪:‬‬
‫المؤسسة المسئولة عن بناء المحرك وقدراته‪.‬‬
‫رفع أداء محرك البحث (رام)‬
‫‪Search Engine Optimization‬‬
‫مجموعة من األدوات والمقاييس التكنولوجية والتحليلية التى تستخدم‬
‫لدفع أحد المواقع ألن يظهر فى مقدمة نتائج بحث فى أحد محركات‬
‫البحث ‪.‬‬
‫رفع أداء محرك البحث (رام)‬
‫‪Search Engine Optimization‬‬
‫لماذا رفع أداء محركات البحث؟‬
‫فى ظل العدد الهائل من مواقع اإلنترنت تصبح عملية البحث عن المواقع عملية فى غاية الصعوبة للعديد من‬
‫العوامل‪ ،‬البعض منها يرتبط بقدرات أداة البحث نفسها والبعض اآلخر يرتبط بقدرة كل موقع عن التعبير عن‬
‫ذاته‪ ،‬ويمكن بيان هذه العناصر فيما يلي‪:‬‬
‫•من الذى قام بإعداد فقرة الميتاداتا؟ وماهى األساليب والمعايير التى استخدمها للتعبير عن مضمون الموقع‬
‫وشكله؟‬
‫•ماهى الكلمات المفتاحية التى استخدمها فى التعبير عن مضمون الموقع؟‬
‫•هل استخدم مصمم الموقع أى من أشكال التحايل على أدوات البحث؟‬
‫• هل يمكن تحسين مركز الموقع فى النتائج التى خرجت من محرك البحث على سبيل المثال؟‬
‫•ماهو عدد االستشهادات ‪ Links / citations‬للموقع بين المواقع األخرى؟ وماهى القيمة العلمية لهذه‬
‫المواقع؟‬
‫•هل هناك أى نوع من التناقض بين معايير بناء الموقع مما ينعكس على مركز الموقع فى النتائج؟‬
‫•هل يمكن تحسين مركز موقع ما فى نتائج البحث دون أن تستخدم أدوات تسويقية أو يتم الدفع لجهة ما‬
‫للتعريف وتحسين أداء الموقع؟‬
‫رفع أداء محرك البحث (رام)‬
‫‪Search Engine Optimization‬‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫‪.6‬‬
‫المشكالت المتعلقة بتصميم الموقع كأن تضع فى الصفحة األولى برامج مثل الفالش ‪ Flash‬مما قد‬
‫يعرقل محرك البحث عن الحصول على المعلومات التى يريدها‬
‫المشكالت المتعلقة بحشو الموقع بكلمات مفتاحية ‪ :Keywords‬حيث يجب على منشئ الموقع من‬
‫أن يضع الكلمات المفتاحية المناسبة‬
‫المشكلة المتعلقة بأهمية مطابقة محتوى الموقع للكلمات المفتاحية التى وضعت للتعبير عن مضمون‬
‫الموقع‬
‫المشكالت المتعلقة باستخدام تكنولوجيات قديمة فى معالجة الصفحات كاستخدام تعبيرات برمجية معينة‬
‫فى تصميم اإلطارات ‪ Frames‬أو استخدام متصفحات قديمة أهمية وضع الروابط الفائقة ‪Links‬‬
‫داخل الموقع على أن تتميز هذه الروابط بوجود عالقة موضوعية بينها وبين موضوع‪/‬موضوعات‬
‫الموقع ألنه عند هذه المطابقة قد تتجنب محرك البحث زيارة موقع ما‪ ،‬وعلى ذلك فتحاشى أى نوع من‬
‫خداع محرك البحث هنا سوف ينجم عنه االلتزام بمصداقية الموقع والعكس صحيح‪.‬‬
‫عدم استخدام عناوين نطاقات متعددة للموقع أخرى ‪ ،Domain name‬بمعنى أن استخدام أكثر من‬
‫عنوان نطاق لنفس الموقع سيدفع محرك البحث إلى أن ينطلق بعيدا عن الموقع المراد تكشيفه‪.‬‬
‫أهمية أن يقوم المسئولون عن الموقع بتسجيل ‪ Submitting‬الموقع يدويا ‪ Manually‬لدى‬
‫محرك البحث المرغوب‬
‫أسرار‬
‫‪ -1‬كلما كانت االشارة لموقع في المواقع األخرى أكثر كلما كان ذل اشعارا لمحرك البحث‬
‫بمدى أهمية موقع‬
‫‪ -2‬كلما كانت الميتاداتا التي وضعتها معيارية كلما كان ذل لصالح الموقع ورفعه في مقدمة‬
‫النتائج‬
‫‪ -3‬كلما كان النص به العديد من االشارات لخدمات وهي مكتوبة بلغة منلبطة كلما كان‬
‫ذل أدع لظهور موقع في البداية‬
‫‪ -4‬لكل محرك سماته الخاصة يجب أن تتعلم ماهي الفروقات بينها وماتل التكنولوجيات‬
‫التي تستخدمها لدفع موقع لمقدمة النتائج‬
‫محركات البحث العربية‬
‫‪ -1‬محركات البحث العربية متعددة ولكل منها خصائصة المنفردة‪ ،‬يجب أن تدرسها بعناية‬
‫لتقرر مت تستخدم أي منها‬
‫‪ -2‬العديد من محركات البحث العربية تعمل بتقنيات غربية في األصل ولذل تكون هناك‬
‫العديد من الصعوبات في التعامل مع اللغة العربية‬
‫‪ -3‬العديد من أدوات البحث العربية يراها المستخدم العربي‪ ،‬مت يمكن أن تقرر أن تذهب‬
‫إليها لتسويق موقع ؟‬
‫‪ -4‬لكل محرك سماته الخاصة يجب أن تتعلم ماهي الفروقات بينها وماتل التكنولوجيات‬
‫التي تستخدمها لدفع موقع لمقدمة النتائج‬
‫هل يمكن أن ننطلق اآلن ونحلق؟‬
‫خالص تحياتي‬
Dr Zain Abd El Hady
Novelist and Professor
[email protected]