第三章(2)

Download Report

Transcript 第三章(2)

文献检索(信息检索)
第三章 信息检索概述
第二节
G252.7/160=2
信息检索基础知识
一、信息检索的概念
(一)信息检索的概念
信息检索有广义和狭义之分:
广义的信息检索是指将信息按一定的方式组
织和存储,根据信息用户的需求从信息集合中
找出信息的过程和技术。其全称为:信息存储
和检索。存储的过程是信息组织加工和记录的
过程,即建立检索系统(编制检索工具)的过
程-输入的过程;检索的过程是按一定的方法
从检索系统(检索工具)中查出信息用户需要
的特定信息的过程-输出的过程。
狭义的信息检索是对信息用户而言,就是信
息集合中找出所需的信息。
二、信息检索的类型
(一)按存储和检索的内容划分
1.文献检索:以文献全文为检索对象的一种检
索,从文献集合中检索出所需的、切题的文献
的过程、方法和策略。凡是查找某一主题、学
科时代、地区、著者等相关文献圴属此类。
2.事实检索:从文献中抽取的事项为检索内容
的检索。亦即从存储有大量知识信息、事实信
息和数据信息的检索工具和检索系统中获取某
一事物的现状、结果、发生的时间、地点和过
程的检索,如查找某产品的生产企业、性能、
人物的基本情况、历史变迁等。
3.数据检索:从存储大量数据、图表的检索系
统中获取数值型信息,检索结果是经过评估
的各种数据,可直接应用于比较分析、定性
或定量分析。
4.多媒体检索:随着计算机和网络技术的发展
而产生的新的检索类型,是利用特定的搜索
引擎从存储有多媒体文件的检索系统中获取
多媒体信息的一种检索方式。其检索结果是
文字、图像、声频、视频等或静、或动的信
息形式。
事实检索和数据检索是以从文献中提取
出来的各种事实、数据为检索对象的一种确
定性检索。
(二)按检索手段划分
1.手工检索
手工检索(manual retrieval)使用的多
为印刷型或书本型检索(paper-based
retrieval) 工具,早些时候有检索卡片,现
在使用最多的是检索刊,它们定期地将最新收
集到的信息、文献加以汇总、组织和报道。手
检的技术要求不高,以人的劳动为本,由人来
翻阅,由人来进行比较、选择,完成匹配。
以印刷文献为主要检索对象,以各类文摘、题
录和目录性工具书为可利用的主要检索工具,
以图书馆的参考咨询部为开展信息检索服务的
中心机构。
2.计算机检索
计算机的信息检索主要经历了早期的脱机批
处理,后来的联机实时检索、联机网络化和多元
化信息检索,到目前的以因特网的搜索引擎为核
心的网络化检索时期。
检索过程是在人与机器的合作、协同下完成
的,它们经常用实时的、交互的方式从计算机存
贮的大量数据中自动分拣出用户所需要的信息。
计算、比较、选择的匹配任务是由机器来执行的,
而人则是整个检索方案的设计者和操纵者。
检索用户由专业检索人员向个人终端用户转移。
三、信息检索工具
(一)信息检索工具的概念
信息检索工具是用来报道、存储和查找的
工具.也是借以鸟瞰科技发展历程以及学科进展
状况的重要工具。由专业人士将文献的外表和
内容特征转换成具有检索意义的标识,为信息
检索者提供有章可循的途径。
检索系统由一定的检索设备和加工整理好
并存储在相应的载体上的文献集合(如文献数
据库)及其他必要设备共同构成的,具有存储
和检索功能的信息服务设施。
检索系统和检索工具的区别
(1)检索工具常指纸质的书本或卡片,检索
系统指多个子系统构成的,需借助专门机器
进行检索的设施。
(2)检索工具结构简单,需要依靠人的智力
和知识进行信息比较和选择;检索系统依靠
机器语言来进行信息服务。
注:二者之间没有绝对的界线。
检索工具必备条件:
(1)对所收录的文献的各种特征(包括外部特征
和内容特征)有详细的描述;( 体现报道和
存储功能)
(2)每条记录有可供检索用的标识;(体现查
找功能)
(3)全部记录科学地组织成一个有机的整体;
( 查找功能,使记录存放有序)
(4)具有多种必要的检索手段。(查找功能,
满足用户多角度查找文献)
知识的产生
记录
文献整理
书目、目录
索引、文摘
新书通报
原始文献
知识重组
知识浓缩
词典、名录
指南、手册
年鉴
述评、专著
教科书、论文丛书
百科全书
二次整理
书目之书目
词典的指南
文献指南
传
播
研究、实验
实践、综合
知识的创新
科技信息的利用
检索工具在文献结构系统中的位置
(二)常用检索工具的类型
1.目录,也称书目,以整本图书、期刊作为报
道单元,收录文献的题名、著者、出版者、
收藏情况等外部特征信息,按类编排。亦就
是对一批相关文献外表特征(文献名称、著
者、文献出处等)的加以整理和分编,并按
一定顺序组织起来形成的一种检索工具。根
据编制目的和用途的不同,目录可分为国家
目录、馆藏目录、联合目录、出版商目录等。
传统的卡片式目录
电子目录
2.题录,与目录基本相同,也是对文献外部特
征(如文献题名、著者、文献出处等)的揭示
和报道,只是内容上是以独立的单篇文献(如
一篇文章或书中某一部分以至整个出版物)为
著录单元。(广、快、新)
•题录著录格式 如下:
记录号
题名
著者姓名
030301007 网络时代的管理创新/高维钫(北京
邮 电 大 学 文 法 经 济 学 院 ) // 经 济 管 理 .——
2002,13(6),53-55
著者单位
原文出处
著录对象不同
与目录区别
目录
题录
单位出版物
单篇文献
3.索引
将收录范围内的文献中的题名、主题、
人名、地名等名词术语以及其他有关款目抽
出,注明出处,并按一定的排检方式组织而
成的一种检索系统。是以文献中的“知识单
元”为单位,揭示各种文献外部特征或内容
特征的系统化记载工具。
索引揭示文献内容比目录更为深入和细
致,比目录应用更广泛。
4.文摘 也提要、摘要,文摘不仅描述文献的
外表特征,而且还揭示文献的内容特征,是带
有文摘内容的、扩展了的题录 。可以获取文献
的核心内容观点,是一种经济的文献形式。
•印刷版本文摘著录格式如下:
文摘号
著
者
姓
名
题名
文献类型
文种
9807471 OODB中的模式更改框架[刊,中]/郭
江//计算机应用与软件.——1997,14(3).——
原始文献的出处
23-34
模式演化是面向对象系统中的一个关键问
题 。 由 于 OODB ( 面 向 对 象 数 据 库 系 统 ) 的 应 用
……。参4
参考文献数目
摘要
电子版本文摘著录格式 如下:
文摘的作用
(1)通报最新的科学文献;
(2)深入提示文献内容,吸引读者去阅读原文;
(3)节约阅读时间;
(4)确定原文内容与课题的相关程度;
(5)帮助用户克服语言障碍 ;
(6)有助于提高标引质量;
(7)便于读者进行回溯性检索;
(8)是撰写综述、述评、研究科技发展史的重
要素材。
5.参考工具书
是汇集某一方面的知识和资料,按某种体例编排
的专供查考和检索特定知识或信息,而不需要
系统阅读的工具性著作,如字、词(辞)典,
百科全书、年鉴、手册、名录、类书、政书、
表谱、图录等
(1)字、词典:字典解释字形、读音、含义和用法;
词典解释词语的概念、意义及用法,可分语文
词典、专科词典和综合词典三大类。语文词典
有《现代汉语词典》、《汉语大字典》、《汉
语大词典》;专科词典有《经济大词典》、
《数学词典》;综合性词典有《辞源》(1884
年以前)和《辞海》(兼顾古今)
(2)百科全书
是以条目的形式,全面、系统地概述各学科
(人类一切门类)或某一学科领域知识,并
按词典形式编排的工具书,有“工具书之王”
之称。
百科全书可供一般阅读和学习使用,具有教
育性;它有完善的目录、索引和参见系统,
具有检索性;它的再版、补编等工作,保证
其所含内容的新颖性。百科全书是人类最有
用的知识的系统概述。
世界三大著名的英语百科全书《不列颠百科
全书》、《美国百科全书》、《科里尔百科
全书》
(3)年鉴
是按年度连续出版的工具书,是对一年内的重
大事件、最新成果和统计数据等汇集。
年鉴的内容和数据主要取材于政府公报、相关
文件、部门统计、重要报刊的报道以及专业
撰述等,具有专业性、权威性、资料性、时
效性和新颖性。
年鉴可分为综合性和专业性两大类,前
者如《中国百科年鉴》,后者如《中国经济
年鉴》、《中国法律年鉴》等。
(4)手册
它汇集某一主题或学科领域的各种基础知识
和基本数据资料,通常针对当前实践所需,
供随时翻检查阅之用,是一种便捷的查检
参考工具书。故又称“便览”,也常冠以
“概览”、“大全”、“要览”、“指
南”、“必备”等名称。
(5)名录
是一种系统编排的个人或机构名单,用以指
示地址及相关资料,是人们进行经济、文
化、学术交流的参考工具书。有机构名录
和人名录。
(6)类书
根据一定的意图,把群书中可供参考的文献资料
辑录出来,分类编排(也有分韵编排)的工具
书,类似于百科全书式的资料汇编。类书主要
用于查找辞藻典故和诗词文句出处,查考史实
和事物掌故,亦可用于辑佚和校勘古籍。
百科全书是以条目形式,对各种知识作概述性
的介绍,着重反映科学文化的最新成就;类书
是文献资料的分类辑存,以继承传统文化为主
要目的。
三国曹丕《皇览》、虞世南《北堂书钞》、解缙
《永乐大典》(22877卷)、陈梦雷《古今图
书集成》(1万卷)
(7)政书
辑集历代或某一朝代有关典章制度方面的文献
资料,分类编排与叙述。
唐杜佑《通典》、宋马端临《文献通
考》、南宋郑樵《通志》,清《续通典》、
《续通志》、《续文献通考》,《清朝通
典》、《清朝通志》、《清朝文献通考》,
刘锦藻《清朝续文献通考》,以上十部大书,
著名的“”十通。
还有一类断代型政书,记某一朝代或某一时期
典章制度,称“会要”,如《西汉会要》等。
(8)表谱
用编年、表格等形式来揭示时间概念或谱列历
史事实的工具书。特点是眉目清晰,简要易
查。
纪年表:不同的纪年系列进行对照。如《中国
历史纪年表》
历表:将不同历法的年月日进行对照。
大事年表:按年月编录大事,又称大事记。
专门性表谱:为某学科、某专题、某人物编撰
的表谱。如查官制《历代职官表》,查地理
沿革《历代地理沿革表》,查人物《历代人
物年里碑传综表》,个人年谱、年表等。
(9)图录
以图像为主体,辅以文字说明的工具书,又
称图谱。
地图:《中国历史地图集》
历史地图:《中国古代史参考图录》
文物图录:《中国历代货币》、《中国古代
服饰研究》、《中国版刻图录》
人物图录:《明清人物肖像画选》、《中国
历代名人图鉴》、《中国历代人物图像集》
以及科技图录、艺术图录等
6.全文数据库
全文数据库是以原始文献为著录单元,文献中每
个有意义的实词均可用作检索词,信息用户可得
到文献的全文或其中的某些部分。全文数据为是
近年来发展最快的检索工具,极受信息用户欢迎。
7.搜索引擎
以网页为著录单元,在Web中自动搜索信息(搜索
网页上的单词和简短的特定的描述内容)并将其
自动索引的Web服务器。为了搜集这些信息,网
页搜索软件沿着Web的超链,搜索整个Web上的主
页,将主页上的每个文字建立索引并返回集中管
理的索引数据库,索引信息包括文档的Web地址、
每个文档中单字出现的频率、位置等。
四、信息检索工具结构
(一)手工检索工具结构
一般由使用说明、目次表、正文、辅助索引、
附录组成。(首次使用新检索工具,阅使用
说明,并据所查的学科,利用目次表从分类
途径查或利用索引中主题、著者等查)
1.使用说明:有称凡例、包括编制目的、收录
范围、著录格式、代号说明、使用举例及注
意事项等,是用户使用前必读内容。
2.目次表:检索工具的正文一般按分类组织编
排,前面大多有详简不同的目次表,作为从
分类查找文献的依据。
3.正文:检索工具记录的不是文献的全文,仅著
录文献的外部特征和内容特征,包括文献篇名、
著者、出处或文摘等。
4.辅助索引:检索工具正文只提供单一线性检索
方式,为了快、准、全地查找所需信息,检索
工具都编有索引,提供从主题、著者、序号等
多种途径检索所需信息。(掌握检索工具的实
质就是熟悉各种辅助索引的使用方法)
5.附录:主要是使用该检索工具时必须参考的一
些内容,如引用期刊一览表、文献来源名称缩
写与全称的对照表、缩略语的解释以及收藏单
位代码等。
(二)计算机检索工具结构
一般由检索软件和数据库组成。
检索软件确定了该检索工具的检索方式,规定
了检索系统的检索算符,不同的计算机检索
工具采用不同的检索软件。
数据库主要由字段、记录、文档、帮助文件等
组成。
1.字段:是数据库最基本的著录单元。如题名、
著者、文摘、主题词、关键词字段等。每一
个字段均有其标志符,其内容是字段值或属
性值。
2.记录:多个字段组成记录。不同数据库中其
记录的字段数多少不同。记录是按一定标准格
式化的,以便于计算机识别和存储。
3.文档:经过有序化外理并附有检索标志的信
息集合称为文档,包括顺排文档和倒排文档。
顺排文档:又称线性文档,由每件信息的全记
录按一定顺序组成,是数据为的主文档,相当
于手工检索工具的正文部分。
倒排文档:又称索引文档,将记录中可检索字
段及其属性值提取出来,按一定的顺序组织起
来,成为用作索引的文档。
4.帮助文件:使用户了解数据库的使用方法。
五、信息检索语言
(一)检索语言概念
信息检索语言是信息资源存储和检索的共
同语言。 其实质是从自然语言中精选出来并
加以规范化的一套词汇符号,是概括信息资源
内容特征或外在特征及相互关系的概念标识体
系。
它是用于描述信息系统中信息的内容特征
及外部特征和表达用户信息提问的一种专门语
言。它要求文献的标引者和检索者共同遵守。
在信息存储时,检索语言用来描述信息的内容
和外部特征,从而形成检索标识;在检索过程
中,检索语言用来描述检索提问,然后形成提
问标识。
(二)信息检索语言种类
1、按规范化(受控)程度划分
人工语言
自然语言
人为对标引词和检索词
加以控制和规范,使每个
检索词只能表达一个概念
直接从原始信息中抽取出自
由词作为检索点的检索语言
2.按检索时组配方式
先组式语言
后组式语言
指在检索前检索词已按固定
关系组配好,并编制在词表中
是指在检索前,检索词在词表中没有
被预先组配,检索时用户可根据不同
的检索需求对某些词进行任意组配
3.按描述信息外部特征的检索语言划分
是指文献信息的题名(书名、刊名、篇
名)、著者姓名/单位名称、出版者、代码/序
号(专利号、标准号、报告号)等,将不同的
文献信息按照题名、著者等字顺进行排列或按
报告号、专利号等顺序进行排列,就形成了以
文献题名、著者、号码等检索途径来满足用户
的需求的,用来描述文献特征和表达信息提问
内容的人工语言。
(1)题名语言
(2)责任者语言
(3)文献信息编号语言
4、按描述文献信息资源的内容特征划分
检
索
语
言
的
类
型
表述文献外表
特征的语言
题名(书名、刊名、篇名)
责任者(个人、机构名称)
号码(如专利号、标准号、报告号、
ISBN号、ISSN号等)
引文
分类法
表述文献内容
特征的语言
体系分类法
组配分类法
标题词语言
主题法
单元词语言
叙词语言
关键词语言
(1)分类语言
它是一种体现知识分类等级概念的标识
系统,具有按学科或专业集中地、系统地揭
示信息或文献内容的功能。它是以数字、字
母或字母与数字相结合作为基本字符,采用
字符直接连接并以圆点作为分隔符号的书写
法,以基本类目作为基本词汇,以类目的从
属关系来表达复杂概念的一种检索语言。
以知识属性来描述和表达信息内容的信息处理
方法称为分类法,著名的分类法有《国际十
进分类法》、《杜威分类法》、《中国图书
馆分类法》等。
•体系分类法(体系分类语言)
直接体现知识分类的等级制概念的检索系
统,是按文献内容特征进行分类的检索语言。
基 础
性指
的具
集有
合许
。多
共
同
属
对
科学分类
象
文献内容的学科性质
按照知识门类的逻辑次序
上位类(母类)
类1
知识
类2
类3
类21
……
类22
…
类23
同位类
下位类(子类)
分类语言的优缺点:
优点:便于查全某一学科专业的所有信息或文
献;分类语言有等级结构,便于扩大或缩小
检索范围;用分类检索,不受文种限制;分
类语言既可用于组织检索工具和检索系统,
又可用来组织书刊资料的分类排架。
缺点:将检索的内容转换成分类号,要熟悉分
类法,否则可能发生误差;分类语言修订的
周期性,与科技发展不同步;分类语言单维
式直线序列结构,难于处理交叉、相互渗透
的多维空间的课题检索等。
《中国图书馆分类
法》使用简介
《中国图书馆分类法》
简称《中图法》是我
国文献分类标引工作
的国家标准。被我国
图书信息行业广泛应
用。
一.《中图法》历史
1957年《中小型图书馆分类表草案》
1964年《中国图书馆图书分类法草案》
(下册)
1975年《中国图书馆图书分类法》第1版
1980年《中国图书馆图书分类法》第2版
1990年《中国图书馆图书分类法》第3版
1999年《中国图书馆图书分类法》第4版起
改名为《中国图书馆分类法》
2010年 《中国图书馆分类法》第5版
二.《中图法》基本序列及基本大类
五大部类序列:
马克思主义、列宁主义、毛泽东思想、邓小平
理论 (指导我们的思想的理论基础)
哲学、宗教(自然知识、社会知识的概括和总结)
社会科学
自然科学
综合性图书(内容庞杂、类无专属,无法按某一学科内
容性质分类的图书)
五大部类序列:(又称大部。这是编制分类法时,对图书首先作的最概括的区分)
《中图法》22个基本大类
A
B
C
D
E
F
G
H
I
J
K
马列、毛泽东思想
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育
语言、文字
文学
艺术
历史、地理
N
O
P
Q
R
S
T
U
V
X
Z
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
 C 社会科学总论
C8 统计学
C91 社会学
C92 人口学
C93 管理学
C931 管理技术方法
.1
.2
C933
C934
C935
C936
C939
管理数学
管理的方式方法
……
领导学
决策学
管理计划和控制
管理组织学
应用管理学
将T类展开
三. 类目之间的关系
示例
O1 数学
O11 古典数学
O12 初等数学
O121
算
术
O122
初等代数
O123
初等几何
O13 高等数学
从属关系
从属关系
上位类与下位类之间的关
系.一个类与其直接细分出
来的小类之间的关系,称从
属关系.
在类目表中,下位类一
定要带有上位类的属性,上
位类一定能包括它所属的
各级下位类,他们之间是属
种的总体和部分的关系.
并列关系
指处在同一划分层次上的不同类目的关系,一
个上位类分出若干个小类,这些小类之间的
关系,是用并列的方式来表达的,称为并列关系.
四.中图法标记系统
基本遵循层累制,又称等级标记制,是类号位数
与类目等相适应、层次分明的一种标记制度。
用一位或两位符号标记一个大类,再加一位符
号标记二级类目,如此层层累加,表示类目的
层层划分。
《中图法》采用 大写拉丁字母与阿拉伯数字相
结合的混合制号码。用字母标志一个大类,以
字母的顺序反映大类的序列。在字母后用数字
表示大类下类目的划分。
数字的编号制度,使用小数制,即首先顺
序字母后的第一位数字,然后顺序第二位,以
此类推。分类号的排列,严格按照小数制的排
列方法。
辅助标记符号
(1)间隔符号“.” 在字母段之后,自左向右每三位数字
加一圆点,当最后一段正好为三位的时候,就不在加圆
F830.31 F299.712
(2)- 总论复分符号(排在数字“0”的前面,是总论复
分号的前置标识符)
(3) : 组配符号(主类号之间的概念交叉关系
(4)a 推荐符号 (F2a)
(5)/ 起止符号 该号只在类目表中出现,表示类目的起
止范围
(6)[ ] 交替符号
(7) ( ) 国家、地区区分号
(8) = 时代区分表 (8) “ ” 民族、种族区分号
(9)< > 通用时间、地点区分号
(10) + 联合符号
中图法标记系统是层累制举例
如:
 F 经济
 F8 财政、金融
 F83 金融银行
 F830 金融银行理论
 F830.1
银行制度
 F830.2
金融银行体制
 F830.3
金融组织、银行
 F830.31
中央银行

…
……
(第一级类目)
(第二级类目)
(第三级类目)
(第四级类目)
(第五级类目)
(第五级类目)
(第五级类目)
(第六级类目)
……
类号位数与类目等相适应
中图法详表影印
五、中图法标记符号的排列规则。
类号由左至右逐位对比地进行排列,先
比字母部分,再比数字部分;
字母部分按英语字母固有的次序排列,类号中
的阿拉伯数字依小数制排列,数字之后如还
有字母,则在前部类相同的基础上,再按字
母顺序排列。
类号末位标有“a”者,排在本类的最前面;
类号中有辅助符号时,前面符号相同情况下,
由左至右逐位对比地进行由小到大排列
类号排列举例
B2
B3
E27
E512
TM92
TU201
X799
B021
B022
B022.2
C532
C54
D035.37
D035.4
TP312BA
TP312C
TP312+
TP312PA
类号由左至右逐位对比地进行排列,先比字母部分,
再比数字部分
类号排列举例
TP312BA
TP312C
TP312JA
Ea(毛恩列斯毛的军事理论)
E(军事)
E-54(军事年鉴)
E0(军事理论)
E2a(毛泽东的军事理论)
E2(中国军事)
类号末位标有“a”者,排在本类的最前面;有辅
助符号时,前面符号相同情况下,由左至右逐位
对比由小到大地进行排列
馆藏图书是按索书号的排列
六、图书排架
以图书所属学科门类为依据,按图书分类号顺序
排列图书的方法,对分类号相同的图书,再按
书次号顺序排列(同时考虑复分号),以决定
同类书排列的先后顺序。
书库每一类书都按照图书分类法进行类目排架,
架位排列是按英文字母顺序从A、B、C、
D………..Z依次排架。
图书馆老师面对书架从左手起架,从左到右,从
上到下,从小到大依次进行。书架架标显示的
概念是一个区间,开始号代表该排书架的第一
本书,从小到大,逐步过渡到末尾架,结束号
为该排架的最后一本书。第一排书架与第二排
书架之间呈“S”型迂回绕架连接。
图书排架举例
图书排架顺序是由小到大,由上到下,从左到右。
第一排书架与第二排书架之间呈“S”型迂回绕架连接
I0文学理论
…
…
…
I22诗歌、韵文
I26
I1世界文学
…
…
I24小说
…
…
I3/7
…
I2中国文学
(2)主题语言
主题语言是采用表达某一事物或概念的名
词术语来标引、存储、检索的一种检索语言。
即以自然语言的字符为字符,以名词术语
为基本词汇,以概念间的形式逻辑为语法和构
词法,用一组名词术语作为信息检索标识的一
类检索语言。
根据选词原则、规范化处理、编制方法和
使用规划的不同,主题语言分为标题词语言、
单元词语言、叙词语言、关键词语言和纯自然
语言
A.单元词语言(字面组配)
是一种最基本的、不能再进一步分割的
单位词语,亦称元词。它从文献信息内容中抽
取出来,再经规范,能独立表达某一概念。如
“电子工程”不是元词,分割为“电子”、
“工程”才是。属人工语言,是一种规范语言,
属于后组式语言。
B.标题词语言
是从文献题名和内容中挑选出来,并通
过标题词表进行规范化处理的词和词组。一个
概念只用一个标题词表达,排除了多词一义现
象。如马达、电动机、电机。检索时按既定的
组配执行,是一种先组式规范语言,是一种人
工语言。按字顺排列成词表。主-副搭配
C.叙词(主题词)语言(概念组配)
从文献信息内容中抽出来,能概括表达文献信息
内容基本概念的并经过规范化的名词或术语。
它以自然语言词汇为基础,以概念组配为基本特
征,综合了多种信息检索语言的原理和方法,适
用于机检和手检,是目前应用较广的一种规范化
语言。
是一种后组式规范语言,也属于人工语言。叙词
语言是采用表示单元概念的规范化语词的组配来
对文献内容主题进行描述的检索语言。如《汉语
主题词表》、英国《科学文摘》使用的主题词表、
《工程索引》使用的主题词表。
D.关键词语言
属自然语言。直接取自文献信息资源的题名、
文摘或正文等。凡在概念上有意义并且能够
代表文献信息的主要内容的词都可关键词。
它没能经过规范化处理,不需要编制关键词
表。但有一些词列为禁用词,如一些冠词、
介词、副词或连词等。适用于目的性不强的
浏览性检索或对全、准要求不强查找。
E.纯自然语言
完全使用自然语言,即对一条完整的信息中
任何词汇都可以进行检索。它采用全文匹配
法检索,主要运用于计算机全文数据库和网
络信息检索中。
例:标引课题“微机在企业管理中的应用”
标题词标引:

企业管理----计算机应用
叙词标引:

企业管理、计算机应用
关键词标引:

企业管理、微机、微机应用、计算机、
计算机应用
分类标引:C93、TP319
六、信息检索方法、途径和步骤
(一)信息检索方法
1.常用法(工具法)
直接利用书目、索引、文摘等检索工具进行查找
文献的一种方法。包括顺查法、倒查法和抽查法。
顺查法:根据检索课题的起始年代,利用选定的检索
工具,按照由远及近,从过去到现在的时间顺序逐
年查找的方法。查得文献较系统全面,查全率高,
但量大、费时,效率不高。
倒查法:由近及远,从现在到过去的逆时顺序查找文
献的一种方法。适用于新课题、新理论、新技术的
检索,最新观点但不全面系统。
抽查法:根据检索课题所属学科的发展特点,选定其
中学科发展兴旺、发表文献较多的时段,逐年进行
查找的一种方法。针对性强,节省时间,但必须熟
悉学科发展特点和阶段。
2.引文法(追溯法)
是利用已有文献后附的参考文献或引用文献作为线索,
逐一追溯查找相关文献的方法。往往在缺乏检索工具
但拥有丰富原始文献的情况下使用。优点是文献系统
性较强,但参考文献往往有限。
3.综合法(循环法)
是交替使用常用法和追溯法来进行检索的综合方法。在
查找文献时先用常用法,查出一批文献,然后再选择
出与检索课题针对性较强的文献,利用这些文献所附
的参考文献追溯查找,如此反复,直到满足要求为止。
4.浏览法
直接利用最新的有关书刊查找所需文献的一种方法。优
点是及时获得最新文献,了解课题的学科发展的最状
况。缺点是受馆藏文献范围的局限以及对学科资源的
了解的情况。
(二)信息检索途径






文献内容特征
的检索点
文献外部特征
的检索点
分类检索
主题检索
作者检索
名称检索
号码检索
分类检索:分类检索是从文献内容所属的学
科类别出发来检索文献,它依据的是一个可
参照的分类体系。
主题检索:从反映文献内容的有关主题词出
发来检索文献,主题是检索点,它对应文献
主题概念。检索按主题词的音或形的字顺进
行,其方式如查字典、词典。
主题词有多种类型:有规范词和自由
词,有单元词和多元词,有先组结构和后组
结构等。主题词的合理选择与使用对检索结
果的优劣直接相关。
作者检索:是从文献的作者姓名出发来检索其
文献。 “作者”广义上还应包括:汇编者、编
者、主办者、译者等,此外,还有代表机构、
单位的团体作者,包括作者所在单位。
名称检索:是从各种事物的名称出发来检索文
献信息,包括书名、刊名、资料名、出版物名、
出版社名、会议名、物质名称等等,也包括人
名和机构名。检索的对象既包括对应的文献,
也包括有关的信息、事项等。
号码检索:包括文献的编号、代码等,它们是
文献信息的一些特有的外部标识,号码检索点
以号码特征来检索文献信息。号码多种多样,
通常用数字、字母或用它们结合的形式或以分
段的方式来表示其各部分的含义。如科技报告
有报告号、专利文献有专利号等。
(三)、检索步骤(检索程序)
1.分析检索课题,明确检索要求和检索目标
分析课题主要是分析该课题的学科范围、
主题内容、检索要达到的目的和意图、了解
检索课题背景知识和课题涉及的各种名词术
语及其相互关系,确定检索结果的时间范围、
文献类型、文种和需要的数量等,如果是正
在进行的课题,还要划分出已知的情报,确
定自己所要的检索范围;在此基础上,确定
检索标识,检索相关文献。
2.选择检索工具(检索系统)
各种检索工具都有自己的特点,不仅有综合
性检索工具和专业性检索工具的不同,覆盖
专业范围、收录文献类型、语种、出版物的
文字水平也圴有差别,所以选择检索工具时
要根据检索课题的要求和检索工具的特点为,
以及检索者的外语水平进行选择。选择检索
工具要注意几点(1)收录文献类型要全、文
献报道数量要大,内容准确权威。(2)时差
要短,更新及时。(3)检索途径要多,有完
备的检索系统。(4)文献的著录要标准。
(5)手工检索还要考虑检索工具的著录项目、
标引深度、辅助索引、排检方法等
3.选择检索途径(检索点),确定检索标识
检索工具选择好以后,要进一步选择检索
途径,以确定检索标识。检索工具有分类、著
者、主题、机构等检索途径。充分利用检索课
题所给的已知条件,选择合适的检索途径,配
合使用,以达到良好的检索效果。
检索途径选定之后,接着就是确定检索标识。主
题途径的检索标识是主题词,主题标识应注意
正确使用主题词表;分类途径的检索标识是分
类号,应注意分类表的族性关系和相关类目;
责任者途径的检索;责任者途径的检索标识是
著者、译者、编者姓名等,应注意不同国家和
民族姓名的特点和索引编制规则。
4.查找文献线索
查找文献线索就是用检索标识在检索工具中查找
文献线索的过程。将在检索工具中查得的文献题
录与检索课题的要求一一比照,并将符合检索要
求的文献题录记录下来。
5.索取原始文献
利用检索工具检出的结果,只是文献题录或文摘,
文献的详细内容存在于原始文献,根据检出的文
献线索的相应的藏有单位索取原文。
6.提取所需信息
信息检索的目的就是利用检出的原始文献,择其
所需,从中提取有关的资料、事实、方法、理论
依据等具体信息内容。
思考题:
利用《中图法》确定本专业的类目,上下位
类各是什么?