אסטרטגיות ושיטות חיפוש ואיתור מידע ברשת.

Download Report

Transcript אסטרטגיות ושיטות חיפוש ואיתור מידע ברשת.

Slide 1

‫‪The Invisible Web‬‬
‫האינטרנט הסמוי‪ ,‬או הרשת‬
‫העמוקה‬

‫אביבה שרבט‬


Slide 2

‫רשת האינטרנט היא מתווך המידע‬
‫הגדול והמהיר ביותר בעולם‬
‫מנועי החיפוש‪ ,‬הם הכלים הראשיים לאיתור‬
‫ואיחזור מידע ברשת‪.‬‬
‫אולם‪ ,‬הציפיה שמנועי החיפוש יעזרו לנו אינה‬
‫מתגשמת‪ ,‬אפילו לאחר שרכשנו מיומנויות‬
‫חיפוש טובה יותר‪.‬‬
‫מנועי חיפוש אינם דומים לקטלוג של ספריה‪,‬‬
‫הממשק הידידותי מסווה בעצם כאוס‬
‫ואנרכיה‪.‬‬


Slide 3

‫מחקרים עדכניים מראים שתוצאות‬
‫החיפוש של המנועים‪ ,‬מניבים רק‬
‫‪ 16%‬מהמידע ברשת‬
‫מנועי החיפוש הרגילים אינם עומדים בקצב‬
‫הגידול של הרשת‪.‬‬
‫האתגר העיקרי שניצב בפני מנועי החיפוש‬
‫הוא המידע האבוד בצד האפל של האינטרנט‪,‬‬
‫הקרוי "הרשת העמוקה" או "האינטרנט‬
‫הסמוי"‪.‬‬


Slide 4

‫כמה מידע אנו באמת מפסידים‬
‫בחיפוש בגלל אינטרנט סמוי?‬
‫היקף המידע המצוי באתרים נסתרים אלה‬
‫גדול בהרבה מהמידע המצוי באתרים‬
‫הבנויים מדפי ‪ HTML‬פשוטים וקצב הגידול‬
‫של המידע בהם גדול אף הוא‪.‬‬
‫הרשת העמוקה היא אחת השכבות התת‬
‫קרקעיות ברשת‪ ,‬שבהן זורם מידע בעל ערך‬
‫רב‪ ,‬החבוי ברשת הסמויה מן העין והוא עשיר‬
‫וגדול‪.‬‬


Slide 5

Chris Sherman
and Gary Price


Slide 6

‫מעריכים בספרם‬
‫‪The Invisible Web‬‬
‫שהיחס בין האינטרנט הגלוי לסמוי‬
‫הוא יחס של ‪ 2‬ל‪ 50 -‬לטובת הסמוי‬


Slide 7

‫הקושי לבצע חיפוש ישיר במידע שנמצא באתרים‬
‫הנסתרים הופך לבעיה משמעותית לכל מי שמחפש‬
‫מידע באינטרנט גם אם אינו מודע לכך‪.‬‬
‫הרשת העמוקה כוללת כמות עצומה של מידע מהימן‬
‫ועדכני‪ ,‬שיכול להיות נגיש באמצעות דפדפן‪ ,‬שלא‬
‫ניתן לאתרו בקלות באמצעות מנועי החיפוש המוכרים‪.‬‬


Slide 8

‫ממה מורכב הרובד העמוק והסמוי‬
‫של האינטרנט?‬
‫לרוב‪ ,‬מדובר במידע איכותי הנסתר מעיני‬
‫הגולשים‪ ,‬כולל מידע מאוניברסיטאות‪,‬‬
‫ספריות‪ ,‬עסקים‪ ,‬וממשלות מסביב לעולם‪.‬‬
‫מאגרי מידע ייעודיים הכוללים מנועי חיפוש‬
‫פנימיים‪.‬‬
‫דפי אינטרנט דינמיים ‪ ,ASP‬שמנועי החיפוש‬
‫לא יכולים לקטלג‪ ,‬כי הם לא דפי ‪.HTML‬‬
‫אתרים הדורשים שם משתמש וסיסמא‪.‬‬


Slide 9

‫רשימה נבחרת של מנועי חיפוש לאינטרנט‬
‫הסמוי‪:‬‬
‫המדריך האולטימטיבי לאיתור מקורות מידע‬
‫ברובד העמוק של האינטרנט‬
‫‪http://www.completeplanet.com‬‬
‫כלי עזר מעולה לאיתור פרטני‪-‬אישי של‬
‫מקורות המידע ברשת העמוקה (בתשלום)‬
‫‪http://www.lexibot.com‬‬
‫הגרסה החדשה של מנוע האיסוף‬
‫‪ COPERNIC‬מצליחה לדלות מידע‬
‫משכבות עמוקות למדי‬
‫‪http://www.copernic.com/en/products‬‬
‫‪/agent/index.html‬‬


Slide 10

‫ארכיונים‬
‫ארכיון עיתון הארץ‬
http://www.haaretz.co.il/hasite/pages/arc
h/ArchSearchArt.jhtml?navColor=1
‫הקטלוג הממוחשב של הארכיון הבריטי הרשמי‬
http://www.pro.gov.uk/online/default.htm


Slide 11

‫במצולות האתרים הממשלתיים‪:‬‬
‫מנוע חיפוש אינטגרטיבי באתרי משרדי‬
‫הממשלה הרשמיים בישראל‬
‫‪http://www.search.gov.il‬‬
‫מנוע חיפוש ייעודי לכל אתרי הממשל‬
‫בארה"ב מימשק חיפוש מבוסס ‪GOOGLE‬‬
‫‪http://www.google.com/unclesam‬‬


Slide 12

‫במצולות הבלוגים ‪:‬‬
‫הבלוגים הם אחת השכבות התת‪-‬קרקעיות החדשות‬
‫באינטרנט בהן זורם מידע‪ ,‬בחלקו בעל ערך ‪.‬‬
‫עד כה מנועי החיפוש לא יכלו כמעט לאתר את המידע‬
‫בשכבה התת‪-‬קרקעית הזו‪.‬‬
‫מנועי החיפוש גוגל ולייקוס‪ ,‬גילו את הפוטנציאל הבלתי‬
‫מנוצל הזה והחליט להיכנס לתחום‬
‫‪http://www.blogger.com/start‬‬
‫‪http://blog.tripod.lycos.com‬‬