Поисковые машины и каталоги

Download Report

Transcript Поисковые машины и каталоги

Поисковые машины и каталоги
Брязгун О.А.
12 группа Менеджмент ()
Оглавление
Введение
1. Понятие поисковых машин и каталогов
2. Принцип работы поисковых машин и каталогов
3. Тенденции развития поисковых машин и
каталогов
Заключение
Список использованных источников
Введение
Поисковые машины и каталоги сейчас – это
огромные
и
сложные
механизмы,
представляющие
собой
не
только
инструмент поиска информации, но и
заманчивые сферы для бизнеса.
Актуальность данной темы заключается в том,
что поисковые машины и каталоги уже
давно
стали
неотъемлемой
частью
российского Интернета. В силу того, что
они, хотя и различными средствами,
самостоятельно обеспечивают все этапы
обработки информации от ее получения с
узлов-первоисточников до предоставления
пользователю возможности поиска.
Цель
исследования
является
изучение
пространственных масштабов, в которых
работают поисковые машины и каталоги, а
также изучение специализация поисковых
машин и каталогов.
1. Понятие поисковых машин
Поисковые
машины:
(spiders,
crawlers) постоянно исследуют
Сеть с целью пополнения своих баз
данных документов. Обычно это не
требует никаких усилий со стороны
человека. Примером могут быть
адреса
наиболее
популярных
поисковых машин:
за рубежом.
Google - www.google.com;
Altavista - www.altavista.com;
Excite - www.excite.com;
HotBot - www.hotbot.com
в России :
Яndex - www.yandex.ru;
Рамблер - www.rambler.ru;
Апорт - www.aport.ru
Понятие поисковых каталогов
Каталог
поисковая
система
с
классифицированным по темам списком
аннотаций со ссылками на web-ресурсы.
В каталоги: в отличие от поисковых машин
информация заносится по инициативе
человека. Добавляемая страница должна
быть жестко привязана к принятым в
каталоге категориям.
Наиболее популярными и серьезными
каталогами
считаются
следующие:
www.mail.ru (list.mail.ru); www.weblist.ru;
www.vsego.ru; www.myweb.ru.
Среди англоязычных ресурсов наиболее
популярным является каталог Yahoo!
(www.yahoo.com).
2. Принцип работы поисковых машин
Паук регулярно
посейщает сайты
Паук или робот
На них он находит ссылки на
другие сайты
Page A,B
Page B
Page A,B,C
Page A
Page D
Page E
Page F
Flights
Tickets
Airline
Bargain
New York
London
Paris
Индексация
Пользователь вводит
ключевые слова и получает
нужный ему результат
Поисковая
система
Паук создает список ключевых
слов и их расположение на
странице
Индексатор структурирует полученную
информацию и заносит ее в базу данных
Поисковая система обновляет данные о
позициях сайта
Принцип работы поисковых каталогов
• Процедура поиска нужного сайта в каталогах
состоит в последовательном переходе от одного
уровня к другому. Таким образом,
последовательно уточняя тематику поиска,
можно, продвигаясь по каталогу, дойти до самых
нижних ступеней иерархии и получить, наконец,
нужный список сайтов.
•
Тенденции развития поисковых
машин и каталогов
Поисковые средства постоянно развиваются.
Совершенствование идет по всем главным
аспектам: рост объемов баз данных,
возможности составления запроса и
дружественность интерфейса, выдача
результатов и наличие дополнительных
сервисных функций. Системы, которые долгое
время не внедряют новых элементов и не
оптимизируют уже имеющиеся функции,
постепенно выводятся из активного
использования.
Интересные факты «внутренней жизни» поисковых машин
является«Патент Google:
• Фильтрование результатов поиска с использованием аннотаций
• Изобретатели: Patrick F. Riley, Ramanathan Guha
Поисковая машина принимает запросы, включающие термины
запросов и ярлыки, применимые к определенным документам.
Фильтр домена создан так, что он фильтрует результаты поиска,
оставляя определенные домены, которые определяются
ярлыками, включенными в запрос. Фильтрованные результаты
поиска обрабатываются таким образом, чтобы обеспечивать
принадлежность определенных результатов поиска доменам,
включенным в фильтр. Результаты обрабатываются дальше так,
чтобы они включали ярлыки запросов с определенными
результатами.
Заключение
• Подводя итог, можно сделать вывод о
том, что на сегодня поисковые машины
и каталоги являются наиболее
мощным механизмом поиска сетевых
информационных ресурсов Internet.
Рост информации бесконечен, а потому
нет предела совершенствованию и
появлению поисковых машини
каталогов. Важнейшей задачей
разработчиков является улучшение
качества поиска, движение в сторону
большей эффективности и удобства в
использовании системы.
С этой целью постоянно меняются
поисковые алгоритмы, создаются
дополнительные сервисы,
дорабатывается дизайн.
Список использованных источников
• В. М. Романенко, Г.В. Никитина: Сетевой
Информационный поиск: прак. пособие, 288с.
• И. С. Галеева: Интернет как инструмент
библиографического поиска 248с.
• http://www.searchengines.ru/articles/008545.html
• http://vita-way.chat.ru/poisk.html
• http://shkolazhizni.ru/archive/0/n-6236/
Спасибо за внимание!!!