Интеллектуальная система поиска

Download Report

Transcript Интеллектуальная система поиска

Интеллектуальная
система поиска
Огромные объёмы библиотечных
информационных ресурсов
 Библиографическая информация
 Книжные фонды
 Научная литература
 Периодические издания
 Электронные подписки
 Аудиовизуальные материалы
 И другие
2
Традиционный поиск информации
 Поиск по полям библиографической карточки
 Поиск по рубрикторам
 Поиск на пересечении поисковых элементов (использование
нескольких фильтров)
3
Корпорация ЭЛАР
предлагает решение
«Интеллектуальная
система поиска
на основе ПО «Индекс»,
которое обеспечит быстрый
и эффективный поиск
информации по всему
многообразию материалов –
как традиционным способом,
так и с использованием
аналитических инструментов.
4
Схема решения
Удалённый доступ
Читательский билет и пароль
Виртуальные
читальные залы
Интеллектуальная система поиска
Сервер
системы
Поисковый
индекс
Полнотекстовое
индексирование
Служба
разграничения
доступа
Администрирование
Коннекторы для сбора информации и модули интеграции
АБИС
Полнотекстовые
коллекции
Оцифрованные
фонды
Медиаресурсы
5
Принцип работы
Интеллектуальная система
на основе ПО «Индекс»
реализует поиск
по электронным ресурсам:
 библиографические данные
из АБИС,
 полнотекстовые
электронные коллекции,
 оцифрованные фонды,
 фотоальбомы
и другие материалы.
6
Принцип работы
Сбор информации из различных
источников осуществляется
благодаря интеграции
с информационными
системами (АБИС, Электронная
библиотека) или за счет
использования коннекторов.
Для каждого источника
информации используется свой
коннектор, который настраивается
в соответствии с задачами библиотеки.
7
Принцип работы
Предварительный сбор
и анализ информации
(текстов, метаданных и др.) –
полнотекстовое
индексирование –
обеспечивает минимальную
скорость отработки
поискового запроса.
8
Принцип работы
В ходе обработки информации
осуществляется извлечение
текстов и метаданных из файлов
различного формата, определение
языка и кодировки, преобразование
стандартизованных данных
в единый формат.
Анализ текста предусматривает
определение словоформ, частей
речи и взаимосвязей слов
в предложении, выявление различных
сущностей в тексте, и даже анализ
эмоциональной окраски текста.
9
Принцип работы
Результаты обработки информации
помещаются в поисковый индекс,
который содержит тексты документов,
исходные метаданные документов,
связанную информацию, полученную
на этапе анализа.
Ядром поискового индекса является
инвертированный список
– отсортированный перечень
всех слов, встречающихся в документах,
где для каждого слова указаны документы,
в которых оно [слово] встречается.
Благодаря этому списку осуществляется оперативный поиск информации
10
Принцип работы
Сама система устанавливается
и настраивается на сервере
библиотеки.
Часть операций администрирования требуется выполнять непосредственно
на сервере, но большинство настроек может быть установлено через браузер.
11
Принцип работы
Работа пользователей
осуществляется через браузер.
При подключении требуется
авторизация пользователей через
логин и пароль, назначенный
или наследуемый из внутренних
систем библиотеки.
Например, для читателей может использоваться электронный читательский
билет, для сотрудников библиотеки – рабочая учетная запись.
12
Принцип работы
Служба разграничения прав
доступа осуществляет контроль
над правомерным использованием
ресурсов.
Интеллектуальная система
наследует права доступа,
принятые для источников
информации (Active Directory, АБИС,
Электронная библиотека и др.).
В результате, пользователю доступна только та информация,
право на чтение которой он имеет.
13
Методы поиска
Традиционный
атрибутный поиск
Классический поиск
по рубрикатору
или атрибутам
библиографического описания
с использованием
перекрестной фильтрации.
14
Методы поиска
Поиск по терминологическим
словарям
Позволяет сузить поиск
по области знаний,
или жанрам,
или по другой
тематической направленности
15
Методы поиска
Контекстный поиск
Поиск осуществляется из единой
строки по набору ключевых слов
с учётом морфологических форм.
Такой метод для тех, кто владеет
терминологией и имеет
представление о том, что ищет.
Ограничить диапазон поиска можно
при использовании логических
и контекстных операторов.
16
Методы поиска
Нечёткий поиск
Этот метод позволяет найти
информацию по запросам,
введенным с опечатками
или ошибками.
Или по документам
и данным, содержащим ошибки.
17
Методы поиска
Семантический поиск
Необходим, когда пользователь
затрудняется сформулировать запрос.
Поиск осуществляется по смысловому
содержанию, с учётом многозначных слов,
омонимов, синонимов и лингвистических связей
между словами.
Результат: информация, как содержащая слова из запроса,
так и не имеющая совпадений с поисковой фразой
18
Методы поиска
Интеллектуальный анализ
Дополнительный набор инструментов
анализа, визуализации и интерактивного
сужения поиска.
Средства интеллектуального анализа
позволяют определять закономерности
и группировать результаты, проводить
анализ и адаптацию поисковых запросов,
отображать похожие материалы и т.д.
для выявления данных в огромных
объемах электронных ресурсов.
19
Преимущества решения
 Высокий уровень информационно-библиотечного
обслуживания читателей
 Интеграция с различными источниками информации:
АБИС, базы данных, электронные полнотекстовые коллекции,
аудио- и видео-контент и др.
 Максимальный набор поисковых возможностей
и аналитических инструментов
 Защита контента от несанкционированного использования
 Встраиваемость системы интеллектуального поиска
в web-портал библиотеки
20
Система научного поиска
по библиотеке диссертаций РГБ




Свыше 1 000 000 томов диссертаций
Ежегодное поступление около 30 000 диссертаций
Поиск на трех языках: английском, русском и украинском
Поиск по одиннадцати научным дисциплинам
«Конечная цель проекта — доступный поиск по фондам библиотеки
диссертаций РГБ для пользователей интернета со всего мира.
Также мы планируем оцифровать около 20 тыс. наименований
научно-образовательной литературы и в будущем создать
аналогичную систему поиска по этому фонду».
А.И. Вислый, директор РГБ
21
Спасибо за внимание
Корпорация ЭЛАР
127015, г. Москва, Бумажный проезд, д. 14, стр. 2
Тел.: +7 (495) 792-31-31
Факс: +7 (499) 251-36-03
[email protected]
www.elar.ru