Transcript אסטרטגיות ושיטות חיפוש ואיתור מידע ברשת.
Slide 1
The Invisible Web
האינטרנט הסמוי ,או הרשת
העמוקה
אביבה שרבט
Slide 2
רשת האינטרנט היא מתווך המידע
הגדול והמהיר ביותר בעולם
מנועי החיפוש ,הם הכלים הראשיים לאיתור
ואיחזור מידע ברשת.
אולם ,הציפיה שמנועי החיפוש יעזרו לנו אינה
מתגשמת ,אפילו לאחר שרכשנו מיומנויות
חיפוש טובה יותר.
מנועי חיפוש אינם דומים לקטלוג של ספריה,
הממשק הידידותי מסווה בעצם כאוס
ואנרכיה.
Slide 3
מחקרים עדכניים מראים שתוצאות
החיפוש של המנועים ,מניבים רק
16%מהמידע ברשת
מנועי החיפוש הרגילים אינם עומדים בקצב
הגידול של הרשת.
האתגר העיקרי שניצב בפני מנועי החיפוש
הוא המידע האבוד בצד האפל של האינטרנט,
הקרוי "הרשת העמוקה" או "האינטרנט
הסמוי".
Slide 4
כמה מידע אנו באמת מפסידים
בחיפוש בגלל אינטרנט סמוי?
היקף המידע המצוי באתרים נסתרים אלה
גדול בהרבה מהמידע המצוי באתרים
הבנויים מדפי HTMLפשוטים וקצב הגידול
של המידע בהם גדול אף הוא.
הרשת העמוקה היא אחת השכבות התת
קרקעיות ברשת ,שבהן זורם מידע בעל ערך
רב ,החבוי ברשת הסמויה מן העין והוא עשיר
וגדול.
Slide 5
Chris Sherman
and Gary Price
Slide 6
מעריכים בספרם
The Invisible Web
שהיחס בין האינטרנט הגלוי לסמוי
הוא יחס של 2ל 50 -לטובת הסמוי
Slide 7
הקושי לבצע חיפוש ישיר במידע שנמצא באתרים
הנסתרים הופך לבעיה משמעותית לכל מי שמחפש
מידע באינטרנט גם אם אינו מודע לכך.
הרשת העמוקה כוללת כמות עצומה של מידע מהימן
ועדכני ,שיכול להיות נגיש באמצעות דפדפן ,שלא
ניתן לאתרו בקלות באמצעות מנועי החיפוש המוכרים.
Slide 8
ממה מורכב הרובד העמוק והסמוי
של האינטרנט?
לרוב ,מדובר במידע איכותי הנסתר מעיני
הגולשים ,כולל מידע מאוניברסיטאות,
ספריות ,עסקים ,וממשלות מסביב לעולם.
מאגרי מידע ייעודיים הכוללים מנועי חיפוש
פנימיים.
דפי אינטרנט דינמיים ,ASPשמנועי החיפוש
לא יכולים לקטלג ,כי הם לא דפי .HTML
אתרים הדורשים שם משתמש וסיסמא.
Slide 9
רשימה נבחרת של מנועי חיפוש לאינטרנט
הסמוי:
המדריך האולטימטיבי לאיתור מקורות מידע
ברובד העמוק של האינטרנט
http://www.completeplanet.com
כלי עזר מעולה לאיתור פרטני-אישי של
מקורות המידע ברשת העמוקה (בתשלום)
http://www.lexibot.com
הגרסה החדשה של מנוע האיסוף
COPERNICמצליחה לדלות מידע
משכבות עמוקות למדי
http://www.copernic.com/en/products
/agent/index.html
Slide 10
ארכיונים
ארכיון עיתון הארץ
http://www.haaretz.co.il/hasite/pages/arc
h/ArchSearchArt.jhtml?navColor=1
הקטלוג הממוחשב של הארכיון הבריטי הרשמי
http://www.pro.gov.uk/online/default.htm
Slide 11
במצולות האתרים הממשלתיים:
מנוע חיפוש אינטגרטיבי באתרי משרדי
הממשלה הרשמיים בישראל
http://www.search.gov.il
מנוע חיפוש ייעודי לכל אתרי הממשל
בארה"ב מימשק חיפוש מבוסס GOOGLE
http://www.google.com/unclesam
Slide 12
במצולות הבלוגים :
הבלוגים הם אחת השכבות התת-קרקעיות החדשות
באינטרנט בהן זורם מידע ,בחלקו בעל ערך .
עד כה מנועי החיפוש לא יכלו כמעט לאתר את המידע
בשכבה התת-קרקעית הזו.
מנועי החיפוש גוגל ולייקוס ,גילו את הפוטנציאל הבלתי
מנוצל הזה והחליט להיכנס לתחום
http://www.blogger.com/start
http://blog.tripod.lycos.com
The Invisible Web
האינטרנט הסמוי ,או הרשת
העמוקה
אביבה שרבט
Slide 2
רשת האינטרנט היא מתווך המידע
הגדול והמהיר ביותר בעולם
מנועי החיפוש ,הם הכלים הראשיים לאיתור
ואיחזור מידע ברשת.
אולם ,הציפיה שמנועי החיפוש יעזרו לנו אינה
מתגשמת ,אפילו לאחר שרכשנו מיומנויות
חיפוש טובה יותר.
מנועי חיפוש אינם דומים לקטלוג של ספריה,
הממשק הידידותי מסווה בעצם כאוס
ואנרכיה.
Slide 3
מחקרים עדכניים מראים שתוצאות
החיפוש של המנועים ,מניבים רק
16%מהמידע ברשת
מנועי החיפוש הרגילים אינם עומדים בקצב
הגידול של הרשת.
האתגר העיקרי שניצב בפני מנועי החיפוש
הוא המידע האבוד בצד האפל של האינטרנט,
הקרוי "הרשת העמוקה" או "האינטרנט
הסמוי".
Slide 4
כמה מידע אנו באמת מפסידים
בחיפוש בגלל אינטרנט סמוי?
היקף המידע המצוי באתרים נסתרים אלה
גדול בהרבה מהמידע המצוי באתרים
הבנויים מדפי HTMLפשוטים וקצב הגידול
של המידע בהם גדול אף הוא.
הרשת העמוקה היא אחת השכבות התת
קרקעיות ברשת ,שבהן זורם מידע בעל ערך
רב ,החבוי ברשת הסמויה מן העין והוא עשיר
וגדול.
Slide 5
Chris Sherman
and Gary Price
Slide 6
מעריכים בספרם
The Invisible Web
שהיחס בין האינטרנט הגלוי לסמוי
הוא יחס של 2ל 50 -לטובת הסמוי
Slide 7
הקושי לבצע חיפוש ישיר במידע שנמצא באתרים
הנסתרים הופך לבעיה משמעותית לכל מי שמחפש
מידע באינטרנט גם אם אינו מודע לכך.
הרשת העמוקה כוללת כמות עצומה של מידע מהימן
ועדכני ,שיכול להיות נגיש באמצעות דפדפן ,שלא
ניתן לאתרו בקלות באמצעות מנועי החיפוש המוכרים.
Slide 8
ממה מורכב הרובד העמוק והסמוי
של האינטרנט?
לרוב ,מדובר במידע איכותי הנסתר מעיני
הגולשים ,כולל מידע מאוניברסיטאות,
ספריות ,עסקים ,וממשלות מסביב לעולם.
מאגרי מידע ייעודיים הכוללים מנועי חיפוש
פנימיים.
דפי אינטרנט דינמיים ,ASPשמנועי החיפוש
לא יכולים לקטלג ,כי הם לא דפי .HTML
אתרים הדורשים שם משתמש וסיסמא.
Slide 9
רשימה נבחרת של מנועי חיפוש לאינטרנט
הסמוי:
המדריך האולטימטיבי לאיתור מקורות מידע
ברובד העמוק של האינטרנט
http://www.completeplanet.com
כלי עזר מעולה לאיתור פרטני-אישי של
מקורות המידע ברשת העמוקה (בתשלום)
http://www.lexibot.com
הגרסה החדשה של מנוע האיסוף
COPERNICמצליחה לדלות מידע
משכבות עמוקות למדי
http://www.copernic.com/en/products
/agent/index.html
Slide 10
ארכיונים
ארכיון עיתון הארץ
http://www.haaretz.co.il/hasite/pages/arc
h/ArchSearchArt.jhtml?navColor=1
הקטלוג הממוחשב של הארכיון הבריטי הרשמי
http://www.pro.gov.uk/online/default.htm
Slide 11
במצולות האתרים הממשלתיים:
מנוע חיפוש אינטגרטיבי באתרי משרדי
הממשלה הרשמיים בישראל
http://www.search.gov.il
מנוע חיפוש ייעודי לכל אתרי הממשל
בארה"ב מימשק חיפוש מבוסס GOOGLE
http://www.google.com/unclesam
Slide 12
במצולות הבלוגים :
הבלוגים הם אחת השכבות התת-קרקעיות החדשות
באינטרנט בהן זורם מידע ,בחלקו בעל ערך .
עד כה מנועי החיפוש לא יכלו כמעט לאתר את המידע
בשכבה התת-קרקעית הזו.
מנועי החיפוש גוגל ולייקוס ,גילו את הפוטנציאל הבלתי
מנוצל הזה והחליט להיכנס לתחום
http://www.blogger.com/start
http://blog.tripod.lycos.com