1. Веб - каталоги

Download Report

Transcript 1. Веб - каталоги

Спецкурс ”Основи Інтернету”

Розділ 3 Пошук в Інтернеті Спеціальні програмні засоби для пошуку потрібної інформації в Інтернеті

• •

Різновиди пошуку

1. Веб - каталоги

Веб-каталог – сайт, на якому зберігаються впорядковані за темами посилання на інші сайти. Список тем, за якими відсортовано посилання має ієрархічну структуру (від загальних тем до підтем – загальної тематики) Веб-каталоги — це один зі способів організації та категоризації сайтів. Це модеровані і тематично погруповані збірки сайтів.

2. Пошукові машини

• • • • •

Адреси каталогів

Глобальні каталоги Каталог Yahoo — http://dir.yahoo.com

ODP — http://dmoz.org

Українські каталоги http://zikave.at.ua/ Український розділ ODP http://dmoz.org/World/Ukrainian/ MavicaNET http://www.mavicanet.com/direct ory/ukr/ — Багатомовний пошуковий каталог.

Глобальний каталог Yahoo

http://dir.yahoo.com

Глобальний каталог ODP

http://dmoz.org

Український каталог “Цікава інформація “ http://zikave.at.ua/

Український розділ глобального каталогу ODP

http://dmoz.org/World/Ukrainian/

MavicaNET— Багатомовний пошуковий каталог.

http://www.mavicanet.com/directory/ukr/

Загальні підходи до пошуку інформації

Визначальний фактор під час отримання з Інтернету будь-якої інформації – правильно обрана стратегія пошуку.

• • •

Правила пошуку інформації

Точно формулювати завдання правильно обирати засіб пошуку Чітко визначати початкову стратегію та критерії пошуку

Формулювання запиту

Запит до пошукової служби має складатися із загальних слів чи понять, які найточніше характеризують мету пошуку.

Завдання: Дізнатися в якому році було написано поему Шевченка “Гайдамаки”.

Запит: Шевченко Гайдамаки поема

Для отримання більш точних результатів доцільно використову4вати синоніми, або альтернативний опис поставленого завдання. Потрібна інформація може міститися в описі творчості письменника.

Запит: Шевченко творчість Гайдамаки

Фактори визначення якості знайденого матеріалу

Джерела наведеної на сторінці інформації Частота оновлення сайту Мета, з якою надають інформацію Якість тексту Якість процитований джерел

Стратегії пошуку інформації

1. Сформулюйте запит і виконайте пошук. Більшість пошукових систем запропонують лише ті сторінки, на яких згадано всі слова запиту, сторінки будуть показані в порядку зменшення релевантності (значущості) 2. Якщо результат вас не задовольняє, звузьте область пошуку. Використайте більше уточнювальних слів, або знайдіть слово, яке б чітко вказувало на шукане поняття.

3. Проаналізуйте результати пошуку. Можливо на одержаних сторінках є термін або слово, яке також можна використати для звуження області пошуку.

4. Якщо результат і надалі незадовільний, скористайтесь засобами розширеного пошуку і сформулюйте складніший критерій.

5. Якщо ж успіху так і не досягнули, спробуйте сформулювати запит інакше і знову застосуйте наведену методику.

Веб - каталоги

Веб-каталог – сайт, де зібрано величезну кількість посилань на інші сайти, відсортованих і розбитих по категоріях, залежно від теми сайту.

Кожний веб-каталог використовує свою систему класифікації, але більшість каталогів також мають власну систему пошуку за короткими описами сайтів і назвами категорій,а не за вмістом веб-сторінок, як у пошукових службах.

Завдання: Відшукати інформацію щодо одержання

післядипломної освіти

: Вибираємо веб-каталог (

Мета

), в реєстрі сайтів вибираємо

Наука і освіта

, потім вибираємо

Післядипломна освіта

, знаходимо більш цікаву інформацію.

Найбільший у Всесвітній павутині веб-каталог Open Directory Project

Каталог відомий як Mozilla ( http://dmoz.org/ ), містить посилання більше ніж на 4,5 мільйони сайтів. Каталог складають добровольці (80 тис. чол.) Каталог має посилання не лише на англомовні ресурси, але й на створені іншими мовами, зокрема

українською

.

Сайти в каталозі поділено на 16 категорій, кожна з яких містить підкатегорії.

В rатегорія

World

сайти відсортовано за мовою, якою їх створено.

Яндекс

Один із найбільших веб-каталогів російськомних ресурсів.

Містить посилання лише на російськомовні сайти.

Пошук здійснюється в усьому каталозі, незалежно від того, яку категорію відкрито, а для цього пошуку в поточній категорії потрібно встановити прапорець

Только в этой категории.

http://yaca.yandex.ru

Якщо відкрито категорію Наука, Навчання, то буде виведено посилання на його рубрики, та ще посилання на освітні сайти, новини.

Мета

Український веб-каталог

Мета,

розміщений за адресою http://meta.ua/reestr.asp

, має три мовні версії : • українську, • російську • англійську.

Зайти на головну сторінку, вибрати

Реєстр

.

Зверху на сторінці є поле для введення пошукової інформації. Нижче -

каталог.

Тут названо категорії, основні підкатегорії. Внизу – список посилань навеб-сервіси порталу:новини, пропозиції роботи, розклад руху потягів тощо.

Принципи організації та використання пошукових серверів

Веб-каталоги складають за участю людини. Вони містять порівняно небагато інформації (до кількох мільйонів записів). Бази даних пошукових машин генеруються автоматично і можуть бути дуже великими – їх обсяг у найбільших машинах (Google, Live Search, Yahoo!) становить кілька мільярдів записів.

Коли користувач підключається до пошукового сервера, задає критерії пошуку і переглядає одержані результати, він взаємодіє з пошуковою машиною цього сервера. Будь-який сайт, що має поле пошуку, можна вважати таким, що має пошукову машину.

Як влаштовано пошукові сервери

Компоненти пошукової машини:

Агенти (павуки, кроулери, роботи). • Програми, які пошукова служба використовує для сканування сайтів Інтернету з метою пошуку нових і змінених документів, збирання інформації та її передавання індексувальним програмам.

Індексувальна програма та індекс • Коли агент пошукової служби виявляє нову сторінку, він передає інформацію про неї індексувальній програмі, що сканує документ і заносить кожне слово до спеціального покажчика, який називається індексом.

Пошукова машина • Ця програма знаходить у базі даних інформацію про сторінки, що відповідають уведеному користувачем критерію. Крім пошуку, вона сортує знайдені записи так, що найважливіші з них відображаються на початку списку результатів пошуку. Веб-інтерфейс • Використовують для введення критерію пошуку й виведення результатів. Під веб-інтерфейсом зазвичай розуміють стартову сторінку сайту, де міститься поле для введення основного критерію пошуку й інших уточнювальних елементів, а також посилання на тематичні бази даних.

Задання критеріїв розширеного пошуку

Якщо запит складний, варто скористатися спеціальними елементами керування, які містяться на сторінці Розширеного пошуку. За допомогою полів і розкривних списків цієї сторінки можна складний критерій. Кожна пошукова машина має свій набір параметрів пошуку і власні способи її введення.

• • • • • Кілька стандартних можливостей:

Введення шуканого тексту Визначення мови Вибір частини сторінки, на якій має міститися текст(URL сторінки, заголовок, гіперпосилання) Вибір сторінок,створених або модифікованих упродовж певного проміжку часу.

Тип шуканих документів

.

Пошукові машини дають змогу формувати критерії з використанням логічних операцій “І”, “АБО”, “НЕ”.

• • • • • • • •

Критерії розширеного пошуку

Пошук у тексту Пошук у заголовку Пошук із зазначенням конкретного

URL

або доменного імені Пошук гіперпосилань Пошук з урахуванням мови Пошук за датою Пошук файлів певного типу Логічні операції у критеріях пошуку

Робота із сторінками результатів Використання кількох пошукових серверів

Бази даних пошукових серверів не ідентичні: через відмінності в механізмах збирання й індексування інформації, через наявність низки інших факторів кожна база містить записи,які відсутні в базах інших пошукових серверів. Тому доцільно виконувати той самий запит на кількох найбільших машинах.

Огляд популярних пошукових серверів

Головна сторінка Live Search

Live Search Google Яндекс