Координатное индексирование в информационно

Download Report

Transcript Координатное индексирование в информационно

Slide 1

Скипор И.Л., канд. пед. наук,
доцент кафедры ТАОИ
Кемеровского государственного
университета культуры и искусств
 (384-2) 35-80-63
e-mail: [email protected]
www.taoi.kemguki.ru


Slide 2

1. Характеристика понятийного аппарата в области
координатного индексирования
2. Сущность и назначение координатного
индексирования
3. Состояние теории и практики координатного
индексирования
4. Нормативно-справочная база координатного
индексирования


Slide 3

КООРДИНАТНОЕ (ПОСТКООРДИНАТНОЕ)

ИНДЕКСИРОВАНИЕ -

это индексирование путем

перечисления ключевых слов или дескрипторов, отражающих
основное смысловое содержание какого-либо сообщения
(документа или запроса).


Slide 4

КООРДИНАТНОЕ ИНДЕКСИРОВАНИЕ
в Индексирование
н Контролируемое координатное индексирование
Свободное координатное индексирование
а Дескрипторый словарь
Информационно-поисковый тезаурус
Поисковый образ документа
Поисковый образ запроса
Язык ключевых слов


Slide 5

Контролируемое
координатное
индексирование

Свободное
координатное
индексирование

Заключается в
индексировании
дескрипторами,
отраженными в ИПТ
или дескрипторном
словаре, предполагается
жесткий контроль
лексики
Заключается в
индексировании КС,
представленными в ПОД
в терминологии автора
без нормализации,
предполагает
минимальный контроль
лексики

Дескрипторные
ИПЯ

Язык
ключевых слов


Slide 6

Дескрипторный ИПЯ –
ИПЯ, предназначенный
для координатного
индексирования
документов и
информационных
запросов посредством
дескрипторов.

Дескрипторные
словари

Информационнопоисковые
тезаурусы

Язык ключевых слов –
ИПЯ, предназначенный
для координатного
индексирования
документов и
информационных
запросов посредством
ключевых слов.

Словари
ключевых слов


Slide 7

Контролируемый язык

Неконтролируемый язык

 возможность контроля
синонимии;
возможность определения
омографов;
 возможность
представления связей
термина с другими
терминами;
возможность
использования примечаний
о применении;
возможность применения
грамматического и
логического синтаксиса

 детальность
(подробность)
индексирования;
 исчерпывающий
характер отражения
содержания;
оперативное обновление
лексики;
использование авторской
терминологии


Slide 8

Язык
предметных
рубрик

ИПЯ
координатного
типа

Обеспечивает отражение в
ПОД предметов и аспектов их
рассмотрения
Предназначен для
проведения предметного
поиска информации

Обеспечивает отражение
в ПОД предметов
(объектов) рассмотрения и
аспектов их рассмотрения ,
а также логически
связанных с ними понятий
 Предназначен для
узкотематического поиска
информации

Предметные
рубрики

Ключевые слова
Дескрипторы


Slide 9

КЛЮЧЕВОЕ СЛОВО – слово или
словосочетание из текста документа или
запроса, которое несет в данном тексте
наибольшую смысловую нагрузку с точки
зрения информационного поиска.


Slide 10

термины- слова (унитермы);
термины-словосочетания;

термины-предложения;
численные характеристики;
хронологические характеристики;
символические обозначения;
 имена собственные;

аббревиатуры


Slide 11

1) Все служебные слова (предлоги, союзы, частицы и т.п.) следует
считать «неключевыми»;
2) Термины, частота встречаемости которых в данном документальном
массиве мала, не следует включать в словник ключевых слов, а
учитывать их в отдельном списке в качестве ключевых словкандидатов;
3) Часто встречающиеся, но весьма общие термины (например,
«описание», «устройство», «конструкция», «метод», «система»)
следует либо исключать, либо употреблять в сочетании с другими
словами, сужающими их значение;
4)

Термины, не относящиеся к данной терминологической области,
включать в словник ключевых слов не имеет смысла;

5) Полисемичные термины включаются только в тех значениях, в
которых они употребляются в данной тематической области, с
соответствующими пояснениями.


Slide 12

ДЕСКРИПТОР – это нормализованное
слово, которому искусственным путем
придана смысловая однозначность.
Остальные лексические единицы,
входящие в класс условной
эквивалентности, получают статус
аскриптора.
ЯЗЫКОЗНАНИЕ
с Лингвистика
Языковедение

дескриптор
аскрипторы


Slide 13

АСКРИПТОР – это лексическая единица,
подлежащая замене на дескриптор в
поисковых образах документов
(поисковых образах запросов) при поиске
и обработке информации.

Языковедение
см ЯЗЫКОЗНАНИЕ

аскриптор

дескриптор


Slide 14

Д с в н а, где

Д с вр вц нв нч а, где

Д – заглавный дескриптор

Д – заглавный дескриптор
с - синоним
вр – вышестоящий родовой
дескриптор
вц – вышестоящий дескриптор,
обозначающий целое
нв – нижестоящий видовой
дескриптор
нв – нижестоящий дескриптор,
обозначающий часть
а – ассоциативный дескриптор

с - синоним
в – вышестоящий дескриптор

н – нижестоящий дескриптор
а – ассоциативный
дескриптор


Slide 15

Объект рассмотрения

Период
времени

Авторы

Основные публикации

Семантические аспекты
теории информации , в т.ч.
ДИПЯ и проблемы
координатного
индексирования

19601970-е гг.

А.И.
Михайлов,
А.И.
Черный, Р.С.
Гиляревский

Основы информатики/ А.И.
Михайлов, А.И. Черный, Р.С.
Гиляревский. – М., 1968. –
756 с.

Методика создания
информационно-поисковых
тезаурусов и методика
координатного
индексирования

1970-е гг.

А.В.
Соколов,
Ю.И.
Шемакин

Методические материалы по
разработке информационнопоисковых тезаурусов/ А.В.
Соколов. – Л., 1975. – 68 с.
Тезаурус в
автоматизированных
системах управления и
обработки информации/ Ю.И.
Шемакин. – М., 1974. – 188 с.


Slide 16

Объект рассмотрения

Период
времени

Авторы

Основные публикации

Семантическая обработка
информации в
автоматизированных
документальнофактографических ИПС, в т.ч.
с использованием вербальных
ИПЯ

1970-1980-е
гг.

Д.Г. Лахути,
В.С.
Чернявский

Вопросы отладки и оценки
дескрипторных поисковых систем //
Семантические проблемы
информатики. -М., 1971.- С. 6-37
Автоматизированные документаль-нофактографические информацион-нопоисковые системы/ Д.Г. Лахути//
Итоги науки и техники. Сер. Информатика. Т.12. – М., 1988.- С.6- 79.
О проблеме оценки поисковых систем.
Ч.3. Влияние неоднознач-ности
содержательной выдачи на значение
формальных оценок/ Д.Г. Лахути, В.С.
Чернявский// НТИ. Сер. 2. – 1971. - №
11. – С. 10-15.

Методика создания
информационно-поисковых
тезаурусов

1990-е гг.

О.А.
Лавренова

Методика разработки и ведения
тезауруса информационно-поискового
(ИПТ) // Создание электронных
каталогов: Из опыта работы
Российской государственной
библиотеки/ Рос. гос. б-ка; Сост. О.А.
Лавренова. - М, 1996. – С. 65 – 77.


Slide 17

Объект рассмотрения

Период
времени

Авторы

Основные публикации

Методика координатного
индексирования

1990 -2000е гг.

Ф.С.
Воройский

Индексирование документов в
АБИС/ Ф.С. Воройский //
Библиотека. – 1996. - № 9. – С. 42-44.
Основы проектирования
автоматизированных библиотечноинформационных систем/ Ф.С.
Воройский. – М.,2002.–384с.

Проблемы разработки
информационно-поисковых
тезаурусов, подходы к
индексированию
документов, факторы,
влияющие на
индексирование

2000-е гг.

Е.Н. Пименов

Пименов Е.Н. Нормативность и
некоторые проблемы разработки
тезаурусов и других
лингвистических средств ИПС/ Е.Н.
Пименов // НТИ. Сер.1.- 2000.- № 5.С. 7-16.
Пименов Е.Н. О факторах,
влияющих на индексирование:
индексирование и предметная
область/ Е.Н. Пименов // НТИ.
Сер.1.- 2000.- № 2.- С. 15- 23.


Slide 18

 Нормативно-технические предписания
 Правила
 Технологические инструкции
 Методики
 Методические рекомендации


Slide 19

 анализ требований к составу и последовательности
выполнения технологических операций в ходе
координатного индексирования;
 анализ требований к составу поискового образа документа с
точки зрения количественных и качественных
характеристик;
 анализ требований к представлению лексических единиц в
составе ПОД.


Slide 20

Наименование характеристики

ГОСТ
7.66-92

ГОСТ
7.52-85

НТП
9-96

НТП
12-96

Шемак
ин
Ю.И.

(Объекты (предметы, тема) исследования.ю
изобретения (вещества, явления, процессы
и т.п.)

+

+

+

+

+

Состояния,
характеристики,
параметры объекта

+

+

+

+

+

+

свойства,

Составные части, узлы, детали объекта
Сторона (точка зрения), с которой
производство, автоматизация, эксплуатация
исследуется предмет или его свойства (и
т.п.)
Законы, уравнения, функции (Больцмана
уравнение, функция распределения и т.п.)
Вид исследования (теоретические расчеты,
лабораторные исследования и т.п.)

+

+

+


Slide 21

ГОСТ
7.6692

ГОСТ
7.5285

Цель исследования, разработки

+

+

Методы (методика) исследования

+

+

Средства исследования, технологическая
оснастка
Результаты исследования

+

+

+

+

Область применения объекта

+

+

Назначение объекта

+

+

Наименование характеристики

Условия,
характеризующие
процесс
исследования:
- Географическая локализация объектов

НТП
9-96

НТП
12-96

Шемак
ин
Ю.И.

+

+

+

+
+
+

+
+

+

- Временной период

+

-Физические, химические, биологические
и др. условия
Общенаучные термины и прочие слова
(обзоры, конференции и т.п.)

+
+


Slide 22

1. Правила нормализации ключевых слов на

морфологическом уровне:
1.1. Правила приведения к единой форме записи
ключевого слова (род, падеж, число)
1.2. Правила использования слов и словосочетаний
1.3. Правила установления порядка слов в
словосочетании

2. Правила нормализации ключевых слов на
семантическом уровне:
2.1. Правила субстантивации прилагательных,
причастий и глаголов
2.2. Правила устранения синонимии и полисемии


Slide 23

3. Правила представления специфических
характеристик
3.1. Правила написания географических названий
3.2. Правила написания номенклатур (названий
технических, программных средств, торговых
марок, фирм и т.п.)
3.3. Правила написания дат и хронологических
периодов
3.4. Правила написания имен собственных и
персоналий
3.5. Правила описания видов изданий

4. Правила оформления ключевых слов


Slide 24

Нормативные
документы

Стандарты:
ГОСТ 7.66-92 «СИБИД. Индексирование
документов. Общие требования к координатному
индексированию»
ГОСТ 7.74-96 СИБИД. Информационно-поисковые
языки. Термины и определения

Инструктивнометодические
документы

Общие и частные методики координатного
индексирования;
 Инструкции по координатному
индексированию;
Правила индексирования ключевыми словами
и т.п.

Файлы
авторитетных
записей

Авторитетные файлы:
ключевых слов;
географических названий и т.п.

Справочные
документы

Словари
Справочники
Справочные базы данных


Slide 25

Наименование
вида

Определение понятия

Наименование

подвидов

Инструктивные
издания

издания официального, нормативнопроизводственного характера,
регламентирующие производственную
деятельность, имеющие строго
нормализованную структуру.

Инструкция;
Инструктивное письмо

Методические
издания

издания рекомендательного характера,
содержащие совокупность принципов,
приемов, правил, предложений,
указаний по выполнению какой-либо
работы

Методика;
Методическая разработка;
Методические рекомендации;
Методические указания;
Методическое пособие;
Методическое руководство

Нормативные
издания

издания обязательного или
регламентирующего характера,
устанавливающие правила,
требования, нормы в сфере
практической деятельности

Нормативно-технические
предписания;
Стандарты;
Положения;
Порядок

Производственные
издания

издания, предназначенные для
самостоятельного овладения
приемами и навыками практической
работы

Практическое пособие;
Практическое руководство;
Практические рекомендации;
Практикум


Slide 26

1. Титульный лист
2. Информационная часть
2.1. Аннотация
2.2. Содержание
3. Основная часть
3.1. Общие положения
3.2. Технология работы
3.3. Технологический процесс
3.4. Результат технологического процесса
3.5. Оценка качества продукта, полученного в результате
технологического процесса


Slide 27

3. Основная часть
3.1. Общие положения
3.1.1. Назначение
3.1.2. Область применения
3.1.3. Объект, предмет
3.1.4. Описание цели, задач
3.1.5. Требования к конечному продукту
3.1.6. Уровень квалификации исполнителя
3.1.7. Организация-разработчик
3.1.8. Источники, использованные при разработке
3.1.9. Структура документа
3.2. Технология работы
3.2.1. Исходный продукт
3.2.2. Средства обработки информации
3.2.3. Способы (методы) преобразования информации


Slide 28

3.3. Технологический процесс
3.3.1. Сущность технологического процесса
3.3.2. Ожидаемый результат технологического процесса
3.3.3. Перечень выполняемых технологических операций
3.3.4. Последовательность выполнения технологических
операций
3.3.5. Особенности выполнения отдельной технологической
операции
3.3.6. Примечания
3.3.7. Примеры


Slide 29

3.4. Результат технологического процесса
3.4.1. Основные характеристики продукта, полученного в
результате технологического процесса
3.4.2. Свойства продукта
3.4.3. Особенности продукта
3.4.4. Оформление продукта
3.5. Оценка качества продукта
3.5.1. Критерии оценки качества продукта
3.5.2. Показатели качества продукта
3.5.3. Методы и средства оценки качества продукта
3.5.4. Порядок осуществления контроля качества продукта
3.5.5. Органы, должностные лица, осуществляющие контроль
качества продукта


Slide 30

Высокая
степень
регламентации

«должны»; «обязаны»;
«следует»; «необходимо»;
«недопустимо» и т.п.

Нормативные
документы,
инструктивные
документы

Средняя
степень
регламентации

«может быть»;
«рекомендуется»; «могут
состоять»; «обычно» и
т.п.

Методики,
методические
рекомендации

Низкая
степень
регламентации

«в зависимости»; «с
точки зрения референта»;
«не регулируются
заранее разработанной
схемой» и т.п.

Методические
разработки,
методические пособия,
методические
материалы