第一章 信息检索理论基础

Download Report

Transcript 第一章 信息检索理论基础

第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索原理--信息检索及其发展
(1)信息检索(Information Retrieval)是“一种时间性的通讯形
式”,“在时间上从一个时刻通往一个较晚的时刻,而在空间上可
能还在同一地点” 。这一看法,揭示了信息存储与获取两个环节是
一种延时行的通讯形式。
(2)信息检索的基本原理,是对信息集合与需求集合的匹配
和选择。信息集合是有关某一领域的文献或数据的集合体,它是一
种公共知识结构,可能可以弥补该用户的知识结构缺陷。而匹配与
选择则是一种机制,它负责把需求集合和信息集合进行比较,然后
根据一定的标准选出符合需求的信息。
(3)在社会科学化的进程中,信息检索经历了从手工检索到
机械检索再到计算机化检索的发展过程。
信息检索原理--信息检索模型简介
(1)信息检索的模型的含义:信息检索的模型就是运用数学的语
言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表
述为某种数学公式,再经过演绎、推断、解释和实际检验,反过来指导
信息检索实践。
(2)布尔逻辑模型:它是由Y. Bar-Hillel在1957年首先提出的,他
提出了将布尔逻辑应用于计算机检索的可能性,10年后,正式被大型文
献检索系统所采用,并逐渐成为各种大型联机检索系统、甚至是网络搜
索引擎的典型、标准检索模式。布尔检索模型采用布尔代数和集合论的
方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运
算来检索文献。
信息检索原理--信息检索模型简介
在传统的布尔模型中,每一文献用一组标引词表示。如,表达式Di = ( T1,
T2, T3, …, Tm ),为文献i,式中T1, T2, T3, …, Tm表示文献i中的所有标引词
集合。每个提问式Q除表示用户需求中的标引词组合外,还有各标引词的布尔
组配。系统在对提问进行处理时,输出一个包含有该提问式的组配元(标引词)
且符合组配条件(逻辑运算符)的文献集合。布尔检索模型因其简单、易理解、
易实现、能处理结构化提问等优点,在信息检索系统 中得到了广泛的实际应
用。
传统布尔检索模型的具体缺陷主要表现在以下五方面:
①布尔检索式的非友善性,即构造一个好的检索式是不容易的。
② 易造成零输出或输出过量。
③ 无差别的组配元,不能区分各组配元的重要程度;
④ 匹配标准存在某些不合理的地方。对于文献中标引词的数量没有评判,
都一视同仁;
⑤ 检索结果不能按照重要性排序输出。
信息检索原理--信息检索模型简介
(3)向量空间检索模型:向量检索是以向量的方式确定检索内容
的方法,系统中的每一篇文献和每个提问均用等长的向量表示。如:
文献集合中的第i篇文献用Di = ( T1, T2, T3, …, Tm )表示,其中T1,
T2, T3, …, Tm为系统中所有标引词集合;提问集合中的第j个提问用
Qj = ( T1, T2, T3, …, Tm )表示;Tk表示文献向量或提问向量中的第k
个分量,即文献表示或提问式中所含的第k个标引词或检索词。
传统的向量空间模型将Tk取值为“0”或“1”,现在大多在[0,1]
区间取值。这样,就可以构成一个向量空间,把信息检索中文献与提
问的匹配处理过程转化为向量空间中文献向量与提问向量的相似度计
算问题。某一文献与某一提问的相关程度通过计算该向量对之间的相
似度来测定。这种方法自然引入了检索的柔性和模糊性,从理论上使
检索更为合理。
信息检索原理--信息检索模型简介
与采用布尔模型的普通检索系统相比,该系统有以下几个特色:
① 采用自动标引技术为文献提供标引词;
② 改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度
可在[0,1]闭区间中取值;
③ 由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与
否,从而使检索更趋于合理;
④ 检索结果可按与提问的相关度排序输出,便于用户通过相关反馈技术
修正提问,控制检索量;
⑤ 布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。向量模
型也存在着某些明显的缺陷。如检索过程转化为向量的计算方法,不能反映出
文献之间的复杂关系;由于对任何一个提问都需要计算全部文献库中的每一篇
文献,因此计算量大、算法复杂性较高;由于标引加权和检索加权是分离的,
因此随意性较大,难以保证质量。
信息检索原理--信息检索模型简介
(4)概率检索模型:它是基于概率排序原理,即文献根据它们与提问
的相关概率来排序输出。有证据表示,在一定条件下,它可以产生优良的排
序结果。事实上,对于某个特定的检索提问,文献集合中的某一文献是否符
合用户的信息需求(即是否是相关文献)可以看成是一个随机事件,每篇文献
是相关文献的概率各不相同,综合信息需求的概率和文献与标引的相关概率,
才能更为合理地划分检索结果。概率检索模型正是基于这一思想建立起来的。
其主要优点是:
① 采用了理论上更为严密的方式来进行决策;
② 容易与加权方法结合起来使用,为人们提供了一种理论基础;
③ 不设计布尔逻辑运算符,回避了构造布尔提问式的困难;
④ 文献可按用户的期望值输出排序;
⑤ 吸收了相关反馈原理,可开发出理论上更为合理的方法。但是,它也
有明显的不足,如增加了存储和计算资源的开销;参数估计问题也增加了该
模型使用时的难度。
信息检索原理--信息检索模型简介
(5)扩展布尔逻辑检索模型:扩展布尔模型是以对布尔算符的一种
近似解释系统为基础,在此模型中,能以一种比传统布尔模型限制更小
的形式来处理布尔提问式。特别当某一给定文献中出现较多提问词时,
它的值就大于含提问词较少的文献。
这种扩展布尔检索模型具有以下优点:
① 它适应常规布尔检索中的标准提问式结构,且通过计算提问-文
献的相似度,可以避免潜在的无意义解释;
② 许可在文献表示和提问式中加入词权值;
③ 可以按相似度的来排列输出文献,因而在响应某一给定提问时,
可以控制要检索的文献数量;
④ 便于区分强制性短语和严格的同义解释与试探性短语和较不严格
的同义关系。
信息检索原理--信息检索模型简介
(6)相关反馈模型:用户在使用信息系统时,需要将自己的信息需求按
照系统所使用的概念和表达方式输入到系统中,由于用户表达问题的方式各有
不同,在将信息需求表达为提问式时会与原意有一定的出入,这样,就难以保
证检索到的文献能非常好地满足用户的需求。因此,一般的信息检索系统中都
需要有一种反馈装置,使用户可以通过反馈修改自己的提问式,从而达到较完
满的检索目的。
(7)信息检索模型的发展趋势:20世纪70年代末,人们又重新着手对传
统的布尔模型进行研究,并对改进布尔检索做了大量的工作。如用截词检索以
改进提问式中对同义词列举不全造成的漏检现象,用概念加权检索以弥补传统
布尔检索中不能揭示概念与检索主题相关程度的缺陷。因此,在今后信息检索
的理论研究中,布尔检索的研究仍将占据十分显著的地位。目前,商用信息检
索系统主要以布尔模糊逻辑加向量空间模型为主,辅以部分自然语言处理。自
然语言处理,特别是自然语言理解在信息检索中应用,将大大提高信息检索的
精度和相关性。文本检索中常用布尔模型,向量空间、相关反馈模型常被用在
多媒体检索、搜索引擎、自动分类、智能检索、数据挖掘等技术中。
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索技术简介—信息检索常用技术简介
(1)布尔检索技术:它是利用布尔逻辑算符进行检索词或代码的逻
辑组配,是现代信息检索中最常使用的一种方法。
(2)截词检索技术:它也是一种常用的检索技术,尤其在西文检索
中使用更广泛。它可以一次性地解决词干相同的词、英美不同拼法的词
的检索。
(3)限制检索技术:在信息检索系统中,为缩小命中文献的数量,
常将检索范围限定在某个字段、或某个范围中。
(4)位置检索技术:位置检索可以反映出两个检索词在文献中的邻
近关系。这种检索技术常用在全文检索中,可以弥补布尔检索的不足。
信息检索技术简介--信息检索常用技术简介
(5)加权检索技术:加权检索的侧重点并不是在于是否检索到某篇文
献,而是对检索出的文献与需求的相关度作评判。
(6)多媒体检索技术:基于内容的多媒体信息检索是指根据媒体和媒
体对象的内容及上下文联系在大规模多媒体数据库中进行检索。它的研究目
标是提供在没有人类参与的情况下能自动识别或理解声音、图像、视频重要
特征的算法。它色括基于内容的声频检索和基于内容的图像信息检索二类。
基于内容的多媒体检索技术的日益成熟不仅将创造出巨大的社会价值,而且
将改变人们的生活方式。
(7)超文本检索:超文本是一种信息的组织方法,它把不定长的基本
信息单元存放在结点上,这些基本信息单元可以是单个字、句子、章节、文
献,甚至是图像、音乐或录像,结点以链路方式链接,链路可以分为层次链、
交叉引用链、索引链等,构成网状层次结构。超文本的特点是以联想式的、
非线性的,链路的网状层次关系,允许用户在阅读过程中从其认为有意义的
地方入口,直接快速地检索到所需要的目标信息。
信息检索技术简介--信息检索当代技术简介
(1)并行检索技术:并行检索为实现大容量文本信息的存储与快速检索
提供了一条有效的途径,它一改以往利用顺序实现计算机信息检索的状况,这
就使在检索系统的信息规模较大时,也能满足用户的检索响应要求。目前的大
型搜索引擎中一般都采用并行检索技术,以提高检索的响应速度。
(2)分布式检索技术:分布式信息检索允许检索请求在分布在不同地点、
不同结构的系统平台上运作。主要原理是由检索代理程序将检索任务同时提交
给网络上的多个主机,由位于这些主机上的检索程序分别独立检索并将检索结
果返回到检索代理程序,并经整理后显示给用户。
(3)基于知识的智能检索技术:全文检索的效果需要进一步提高,其适
应不同应用的能力还需要改进,其核心是发展知识检索。智能检索常被理解为,
如检索“华人”,可把包含“中华人民共和国”的内容不被检索出来,检索
“电脑”,可以把包含“计算机”的内容检索出来,这些只是智能检索的初级
阶段。未来的智能化知识检索更应该注重文本挖掘的功能。
(4)知识挖掘技术:主要指文本挖掘技术的发展,目的是帮助人们更好
的发现、组织、表示信息,提取知识,满足信息检索的高层次需要。知识挖掘
包括摘要、分类(聚类)和相似性检索等方面。
信息检索技术简介--信息检索当代技术简介
(5)异构信息整合检索和全息检索技术:在信息检索分布化和网络化的趋
势下,需要信息检索系统能够检索和整合不同来源和结构的信息,这是异构信息
检索技术发展的基点。所谓“全息检索”的概念就是支持一切格式和方式的检索,
从目前实践来讲,发展到异构信息整合检索的层面,但这还有待于突破。
(6)自然语言检索技术:自然语言检索应是信息检索的发展趋势,但只有
自然语言与人工跨语言信息检索将用一种自然语言书写的信息需求通过机器翻译
自动转换成另一种可为系统接受的语言。即可以用一种语言去检索其他语言的资
源语言相结合,才能更好地发挥自然语言检索的优势。
(7)跨语言信息检索技术:跨语言信息检索将用一种自然语言书写的信息
需求通过机器翻译自动转换成另一种可为系统接受的语言。即可以用一种语言去
检索其他语言的资源。
信息检索技术简介--信息检索当代技术简介
(8)问答系统技术:问题回答输入的查询是问题,要求从给定语料库中
返回文本。问题回答系统可由三个模块组成:问题分析、候选窗口查找和答
案抽取。。
(9)概念空间技术:概念空间技术是为迎合信息检索的智能化而设计的,
主要针对网络信息资源。与词表不同的是,概念空间直接从目标文档构建而
来,通过对目标文档进行概念选取、概念聚类而形成,是一个概念网络。概
念空间实际上是一个智能化索引,每个索引项(概念)通过一层或多层的概念
与原文档建立联系。当用户用自然语言检索时,系统会自动地在概念语义空
间联想搜寻相似性最高的概念,并根据相似性递减规律列出检索结果。
(10)信息融合技术技术:信息融合技术是一种综合利用多种信息资源,
以获得对某一事物更客观、更本质认识的信息处理技术。信息融合技术应用
于信息检索系统中,通过对各种信息源中信息的集成(连接)、集成(连接)之
后对信息的取舍和集合的划分,可以合理地组织查询结果,使信息检索系统
能提供更好的服务功能。
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索系统
1、信息检索系统的组成:一个完整的信息检索系统,通常由以下几个
功能模块组成:信息源选择与采集子系统、标引子系统、建库子系统、词表
管理子系统、用户接口子系统、提问处理子系统。(参阅教材图1.4)
2、信息选择子系统:本功能模块的任务是:根据系统的目标和服务对
象的需要,确定数据收集范围,并广泛地、定期地采集各种信息源,为系统
提供充足而适用的数据。目前,本模块的工作主要由系统工作人员承担,计
算机只起辅助作用。
3、标引子系统:标引,就是根据系统的规则和程序,对文献内容进行
分析,然后赋予每篇文献以一定数量的内容标识(如分类号、主题词、关键词
等),作为存储与检索的依据。标引作业通常与文献编目和文摘工作一起进行,
然后把标引结果和其他描述事项(如著者、著者单位、文献出处等)填入工作
单,由录入员输入到计算机中。
4、建库子系统:本模块的功能是建立和维护可直接用于检索的数据库,
包括系统所用的各索引文档。其工作流程主要包括数据录入、错误检查与处
理、数据格式转换、生成并定期更新各种文档。
信息检索系统
5、词表管理子系统:词表管理子系统管理维护系统中已有的主题词表,使
它与标引、建库等子系统相连接,支持用户查询操作,并从提问、对话或其它
文本中采集新的词汇信息,以及输出各种形式的词汇数据或词表产品。
6、用户接口子系统:它的全称是“系统-用户接口”,简称用户接口,是
面向系统用户的人-机接口程序。它承担用户与系统之间的交流功能,是信息系
统中不可缺少的模块。
7、提问处理子系统:提问处理子系统专门负责处理用户输入的提问式,将
提问式中的检索元和算符区分,并转换成系统内部的可接受的命令方式。在对
提问进行转换后,与数据库中存储的数据进行比较运算,然后把运算结果输出
给用户。
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索语言
1、信息检索语言及其在信息检索中的作用:信息检索语言是根据信息
检索的需要而创制的人工语言,又称信息语言、检索语言、标引语言、标识
系统等等。信息检索语言是沟通讯息存储和检索两个过程中标引人员和检索
人员的。因此,它在信息检索过程中所起的作用是极为重要的。
2、信息检索语言的基础:概念逻辑和知识分类是信息检索语言的基础。
概念逻辑是一种科学思维方法,它能揭示事物的本质属性及各种事物之间的
联系与区别,概念则是事物本质属性的概括。
3、信息检索语言的分类:信息检索语言按其构成原理,可分为分类语
言、主题检索语言和代码检索语言三大类型。分类检索语言用分类号表达各
种概念,将各种概念按学科性质进行和系统排列。它集中体现学科的系统性,
反映事物的从属、派生关系,由上至下,从总体到局部层层展开,是一种等
级体系。主题检索语言用语词来表达各种概念,将各种概念忽略其相关关系
按字顺排列。由主题词汇构成,表达的概念较准确,主题词表中通过参照系
统反映词汇之间的关系,具有较好的灵活性和专指性。代码检索语言一般针
对事物的某一方面特征用某种代码系统来加以标引和排列。
信息检索语言
4、信息检索语言基本方法:信息检索语言使用的标识可分为号码
标识、语词标识和代码标识三类。这三类标识形成信息检索语言的三个
语系,即分类检索语言(分类法系统)、主题检索语言(主题法系统)和代
码检索语言(代码系统)。标识中需要做规范化处理,使其符合唯一性、
规律性、定型性、通用性、准确性、及正确性的要求,这也是提高标识
质量的重要措施。
5、自然语言在信息检索中的应用:自然语言在信息检索中大体分
为无标引方式、自动标引方式、和人工标引方式三种。无标引方式包括
文本关键词匹配检索、单字检索。自动标引方式包括:自动抽词标引、
自动赋词标引、自动赋分类号、自动聚类、人机结合抽词标引。人工标
引方式包括:自由标引、自由词补充标引。上述各种自然语言在信息检
索中应用的方式,都可借助于后控制词表来弥补其缺点。自然语言与信
息检索语言各有优缺点。自然语言由于适用于现代的网络信息检索,无
需标引,文献处理成本较低,检索时无需对照词表选词,因此越来越受
到某些领域专家的赞同。而信息检索语言由于其比较严谨、适应范围广、
检索效率高,而受到信息界人士的认可。
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索评价—检索系统评价
(1)信息源评价:数据库规模、收录范围、信息源质量控制等指标可反映信
息源的质量。
(2)信息组织管理:主要指信息标引的方法、组织方式、及更新周期。
(3)系统功能评价:取决于系统所能提供的检索途径、检索方式、和检索方
法。
(4)输出结果评价:主要包括信息检索系统对用户提问的响应时间、命中记
录的排序功能和输出显示形式。
(5)用户接口:“用户友好”是信息检索系统用户接口的建设宗旨,它决定
了用户是否喜欢使用该系统。
(6)系统技术支持:系统技术支持主要指系统及其软、硬件平台的通用性、
兼容性、先进性、可靠性和稳定性。系统的性能价格比也是评价系统技术经济性能
的指标。
信息检索评价--检索效果评价
(1)查全率:定义为:
检出的相关信息数
查全率 = —————————————×100%
信息库中相关信息总数
(2)查准率:定义为:
检出的相关信息数
查准率 = ———————————————×100%
检出的信息总数
(3)误检率:定义为:
检出的非相关信息数
误检率 = ————————————×100%
检出的信息总数
(4)漏检率:定义为:
未检出的相关信息数
误检率 = ———————————————×100%
信息库中相关信息总数
信息检索评价--检索效果评价
(5)其它评价指标
并不是每个用户都喜欢高查全率,不同的用户对查全率和查准
率的要求都有不同。用户对查准率的容忍程度可能与他对查全率的
要求有直接关系。由于查全率和查准率是基于与提问相关的文献数
来计算的,而此相关文献数是由用户来判定的,不同的用户具有不
同的判定标准。因此,提出了一种基于用户的评价方法,诸如覆盖
度、新颖度、相关查全率和查全影响度等。检索效果评价的指标还
有错检率,是测定检出的非相关信息数占库中非相关信息总数的比
例;相关率,表明与提问相关的信息在系统中的分布密度等。
检索效益评价
对于检索效益的评价取决于社会效益和经济效益,评价并不是
直接就可以显现的,因为它由一些不可比较的因素组成,有些方面
需要通过间接的方法才能获得。另外,检索效益还具有潜在性和不
确定性。因此在对检索效益评价时,需要考虑各个方面的问题。
第一章 信息检索理论基础
主要知识点
(一)信息检索原理
(二)信息检索技术简介
(三)信息检索系统
(四)信息检索语言
(五)信息检索评价
(六)信息检索与数字图书馆
信息检索与数字图书馆
数字图书馆是信息存储技术、信息检索技术、信息检索系统与现代
网络技术结合的一个综合性应用的案例。数字图书馆定义有多种,其中
之一认为“数字图书馆是全球信息高速公路上信息资源的基本组织形式,
这一形式满足了分布式面向对象的信息查询需要”。数字图书馆并不是
简单地将图书馆信息进行数字化存储,而是一个以统一的标准和规范为
基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以
智能检索技术为手段,以宽带高速网络为传输通道的将丰富多彩的知识
领域信息传递到千家万户的虚拟图书馆。
第一章 信息检索理论基础
重点和难点
重点和难点
(一)本章重点:信息检索模型及其特点;信息检索技术及其特点;信息
检索系统及其组成;信息检索语言的作用、分类及应用。
(二)本章难点:信息检索模型、信息检索技术、信息检索语言的内含正
确理解。
第二章 文献信息及其数字化发展
主要知识点
(一)文献信息源及其形式知识
(二)图书及其数字化发展
(三)期刊及其全文数据库
(四)特种文献及其网上分布
文献信息源及其形式知识—信息与文献的含义
(1)信息的定义:
信息可定义为:生物以及具有自动控制系统的机器,通过感觉器官和相应
的设备与外界进行交换的一切内容。但是,人们一般意义上所理解的信息则只
是信息的一部分,即构成人们所需的人类社会信息。
(2)信息资源的含义:
信息资源是信息的一部分,是信息世界中与人类需求相关的信息;信息资
源是可利用的信息,是在当前生产力水平和研究水平下人类所开发与组织的信
息;信息资源是通过人类的参与而获取的信息,人类的参与在信息资源的形成
过程中具有重要作用。总之,信息资源就是经过人类开发与组织的有用信息的
集合。
(3)文献的含义:
文献是记录有知识信息的一切载体的统称,是用文字、图形、图像、符号、
声频、视频等技术手段记录人类知识信息的物质载体,或称其为固化在一定物
质载体上的知识或信息。它包括两个核心部分:载体及其承载的信息。我们通
常所说的信息资源主要指依附于信息载体的信息资源,也可以称之为文献信息
资源。
文献信息源及其形式知识—文献的类型和出版形式
(1)按文献的载体形式划分 :
可分为:刻写型;印刷型;缩微型;声像型;电子型。
(2)按文献被加工处理的深度划分:
可分为:一次文献;二次文献;三次文献。
(3)按文献的出版形式划分:
可分为:图书;期刊(含报纸、工具书等);特种文献(包括:会议
文献、学位论文、专利文献、标准文献、政府出版物、科技报告、产品样本
和产品目录、档案)。
第二章 文献信息及其数字化发展
主要知识点
(一)文献信息源及其形式知识
(二)图书及其数字化发展
(三)期刊及其全文数据库
(四)特种文献及其网上分布
图书及其数字化发展—经典著作及其网上分布
(1)什么是经典著作?
经典著作是人类思想与文化的源泉,它们集中了前人积累的知识和经验,是
读书治学的门径。
(2)经典著作的推荐及有关信息
基于对中西学术文化的整体考察,结合学术史的总结,本书推荐经典著作50
种,并按照中等以上文化程度的一般人了解学术思想的目的,本书从中选择了核
心经典30种,供大学生、研究生阅读。这些经典著作的学科分布如下:
科学: 推荐经典8种,其中核心经典6种;
哲学: 推荐经典8种,其中核心经典6种;
宗教与历史: 推荐经典8种,其中核心经典6种;
文学: 推荐经典12种,其中核心经典6种;
社会科学:推荐经典8种,其中核心经典6种;
艺术: 推荐经典6种。
以上著目及有关情况参阅教材2-1。
图书及其数字化发展--电子图书网站及数据库
(1)什么是电子图书?
电子图书是指以数字代码方式将图、文、声、像等信息存储在磁、光、
电介质上,通过计算机或类似设备使用,并可复制发行的大众传播体。
(2)免费电子图书网站
免费电子图书网站可以说是互联网上最先涌现出来的电子图书网站
(3)收费电子图书网站/数据库
收费电子图书网站在阅读图书时需要交费。这类网站一般采取两种方
式运行。其一是发行读书卡,它主要针对个人用户,通过用户名和密码的
控制,方便读书卡持有者随时上网使用该网站中的电子图书。其二是以机
构租赁形式提供使用。
图书及其数字化发展
—图书相关信息的网上分布及查询技巧
(1)什么是图书相关信息?
图书的各种相关信息,是指有关图书的信息,如内容信息(书名、作
者等)、出版信息(出版社、出版年等)、收藏信息等,是我们获取图书的
主要线索。
(2)图书出版信息的网上分布
①综合性的图书(出版)网站:除了部分网络出版的电子图书,绝大
部分的图书都是由出版社出版并通过多种途径进行发行的。目前互联网
上有许多专业图书出版网站,他们为我们提供了许多与图书相关的信息。
②出版社网站:由出版社(尤其是大型出版社)建立的宣传自己的产
品和服务的网站,一般都提供如下信息:
出版社信息;
最新图书信息;
图书目录 ;
辅助信息;
图书及其数字化发展
—图书相关信息的网上分布及查询技巧
③网上书店:各类网上书店通常集成了以下信息:
大量的图书信息;
详细的书目信息;
增值服务信息
在互联网上获取图书的馆藏信息一般可以采取以下步骤:
首先,根据自己掌握的有关所需图书的部分信息,如主题、部分书名、
作者等猜测其馆藏地的可能性,以此确定可能的收藏单位;
其次,根据对收藏地的推测,首先选择本地区的图书馆进行查询。在本
地区查不到的情况下再查找国内其他地区图书馆甚至国外图书馆的OPAC系统;
第三,进入选定的某个图书馆的主页(如果不知道网址,可以利用搜索
引擎搜索该图书馆),找到并进入其联机公共书目系统(OPAC在不同图书馆的
主页上可能有不同的标示,例如馆藏查询或馆藏书目等);
第四,根据自己所掌握的图书信息的不同,选择相应的检索途径(书名、
作者、主题等),进行检索;
图书及其数字化发展
—图书相关信息的网上分布及查询技巧
第五,查看检索结果,确定是否有需要的图书信息,如果有,选择并下载详细
的书目信息。
上述直接查询各个图书馆OPAC的方法带有较大的猜测成分,因而有可能需要花
费不少时间。为了减少查找馆藏信息的盲目性,快速确定图书的馆藏地点,我们可
以利用国内外各种地区性、全国性乃至全球性的联合目录数据库,一次性查询多个
图书馆的馆藏图书书目。
根据互联网上图书信息的分布规律,我们可用四种不同的方法定位和获取因特
网上的图书或图书信息:
①如果我们知道某个出版社、网上书店或电子图书网站的网址,通过该信息的
URL就可直接找到其Web页面。
②在Web页面上的超文本链接往往是页面作者所考虑的与其网站(页)相关的一些
站点。在前面介绍的每个网站上都有一些相关的链接点,通过它们,我们可以找到
更多的图书信息;
③通过搜索引擎查询所需图书信息的网站或网页。但需要注意的是这种方式检
索出来的结果往往很多,需要我们仔细鉴别和筛选。
④利用搜索引擎获取有关出版社或网上书店等网址信息再查询。
第二章 文献信息及其数字化发展
主要知识点
(一)文献信息源及其形式知识
(二)图书及其数字化发展
(三)期刊及其全文数据库
(四)特种文献及其网上分布
期刊及其全文数据库—核心期刊及其网上分布
(1)核心期刊的含义
在某一学科中,少数期刊覆盖了该学科的大部分最有参考价值的文
献,而多数期刊仅包含该学科的少量最有参考价值的文献,这少数期刊
就是该学科的核心期刊。
(2)核心期刊的网上分布
各学科代表性核心期刊及网址参见教材表2-2。
期刊及其全文数据库—国内外电子期刊全文数据库
电子期刊全文数据库既是电子期刊的集成,也是电子期刊提供服务的
主要载体和方式。这里对国内外一些主要的电子期刊全文数据库进行简要
介绍。
(1)中文电子期刊全文数据库
①中国期刊全文数据库:由清华同方光盘股份有限公司组织实施的中
国知识基础设施工程(China National Knowledge Infrastructure,CNKI)
的核心数据库资源之一,也是国内最大型的学术期刊全文数据库之一。
②中文科技期刊数据库:由重庆维普公司开发,包含1989年以来的经
济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技
术等学科8000余种期刊刊载的600余万篇文献,并以每年100万篇的速度递
增。
③万方数字化期刊:数字化期刊收纳了基础科学、农业科学、医药卫
生、工程技术等四大学科70余个类目的3000余种期刊,多为2000年以来的
文献。该库期刊浏览功能强,可以按从类——刊——期——目录——全文
的方式浏览期刊,符合传统的期刊浏览习惯。但其检索功能则相对较弱。
期刊及其全文数据库—英文电子期刊全文数据库
①Elsevier SDOS:荷兰Elsevier Science公司是世界著名的出版公司,
已有100多年的历史。除了出版图书外,还出版有近2000多种世界公认的高
品位学术期刊。1997年,该公司开始推出名为Science Direct的电子期刊
计划,将该公司的全部印刷版期刊转换为电子版,同时也推出了其本地服
务措施Science Direct Onsite(SDOS),即在用户本地建立镜像服务器。
2000年1月,SDOS进入中国。
②Kluwer Online:荷兰Kluwer Academic Publisher是具有国际性声
誉的学术出版商。Kluwer Online是其出版的800余种期刊的网络版,专门
基于互联网提供Kluwer电子期刊的查询、阅览服务。
③Springer Link:德国施普林格(Springer-Verlag)是世界上著名的
科技出版集团,它出版的期刊、图书深受专家、学者青睐。LINK是施普林
格出版社和它的合作公司推出的科学、技术和医学(STM)方面的在线信息资
源。目前,Springer LINK全文期刊可在线阅读约490种。
④Wiley Interscience:美国约翰威利出版公司(John Wiley & Sons,
Inc)是世界上著名的科技出版公司。该出版社期刊的学术质量很高,是相
关学科的核心资料,其中被SCI收录的核心期刊达200种以上。
期刊及其全文数据库—英文电子期刊全文数据库
⑤Blackwell Synergy:Blackwell Publishing出版社综合出版社会科学、科学
与医学方面的资料。目前Blackwell共有670多种电子刊通过Internet提供服务。
⑥IEEE/IEE Electronic Library:IEEE/IEE Electronic Library (简称IEL)是
美国电气电子工程师学会(IEEE)和英国电气工程师学会(IEE)所有出版物的电子版全
文数据库,它包括IEEE和IEE编辑出版的全部学术期刊120多种,科技会议录600多种
和875个IEEE工业标准。
⑦Academic Research Library:是Proquest 公司出品的一个
文图像期刊
数据库。ProQuest公司是全球最大的文献信息服务公司之一,Academic Research
Library是其出品的20余个全文数据库中的一个,它收录2831种综合性期刊和报纸的
文摘/索引(内含同行评审期刊1502种),其中1955余种是全文期刊(其中477种期刊的
全文延期几个月到1年上网),包括SCI收录的核心全文刊170多种,SSCI收录的核心全
文刊400多种。
⑧Academic Search Premier:EBSCO公司出品,该公司也是全球最大的文献信息
服务公司之一,它可以提供近百个数据库为全世界用户服务,Academic Search
Premier是其中一个比较适合大学使用的数据库。该库收录有生物科学、工商经济、
资讯科技、通讯传播、工程、教育、艺术、文学、医药学等领域的7000多种期刊(内
含同行评审期刊6477余种),其中有4,000余种全文刊(内含同行评审期刊2401种)。
期刊及其全文数据库—英文电子期刊全文数据库
⑦Academic Research Library:是Proquest 公司出品的一个
文图
像期刊数据库。ProQuest公司是全球最大的文献信息服务公司之一,
Academic Research Library是其出品的20余个全文数据库中的一个,它收录
2831种综合性期刊和报纸的文摘/索引(内含同行评审期刊1502种),其中1955
余种是全文期刊(其中477种期刊的全文延期几个月到1年上网),包括SCI收录
的核心全文刊170多种,SSCI收录的核心全文刊400多种。
⑧Academic Search Premier:EBSCO公司出品,该公司也是全球最大的
文献信息服务公司之一,它可以提供近百个数据库为全世界用户服务,
Academic Search Premier是其中一个比较适合大学使用的数据库。该库收录
有生物科学、工商经济、资讯科技、通讯传播、工程、教育、艺术、文学、
医药学等领域的7000多种期刊(内含同行评审期刊6477余种),其中有4,000
余种全文刊(内含同行评审期刊2401种)。
期刊及其全文数据库—期刊信息的网上获取
(1)通过专业数据库:目前已经有一些专业的期刊信息数据库供我
们选择。例如《中国报刊订阅指南信息库》光盘是期刊报纸的快速、方
便、简捷的查询工具。中文的还有清华同方的《中国期刊信息与知识数
据库》、《中国核心期刊要目数据库》等。而美国ISI的期刊引证报告数
据库(Journal Citation Reports,JCR)则是对权威期刊进行系统客观评
价的有效工具,它收录了世界上自然科学和社会科学各学科最具影响的
7000多种期刊,涵盖了200多门学科,从中不仅可以找到期刊的各种出版
信息,还可以查到系统客观的评价数据。
期刊及其全文数据库—期刊信息的网上获取
(2)利用期刊联合目录和各馆的联机公共检索目录:期刊联合目
录是查询期刊出版信息和馆藏信息的最主要的工具。中科院的《全国期
刊联合目录》提供国内近300家主要文献机构收藏的西、日、俄、中文
期刊8万种可供查询。国家科技图书文献中心提供了基础科学、医学、
农学、工程技术等四大类近百个子类的期刊浏览,同时也提供了检索功
能。OCLC的WorldCat数据库则是一个包含其成员馆的所有类型资料的联
合目录数据库,其中也同样可以查到连续出版物的信息。
(3)访问一些相关的网站或利用搜索引擎查找:网上有一些网站
提供了诸如专业核心期刊目录或其他一些信息,如果我们知道这些网站,
可以直接访问它们;如果不知道上述网址,则可以直接利用搜索引擎查
找某种刊物,一般也能获取需要的信息。
期刊及其全文数据库—文献的网上查询
(1)利用文摘索引型检索工具/数据库
①如果需要查找外文期刊文献,那么选择查找自然科学的《科学引
文索引》(Science Citation Index,SCI)、查找社会科学的《社会科学
引文索引》(Social Science Citation Index,SSCI)、查找工程技术信
息的《工程索引》(Engineering Index,EI)、查找化学文献的《化学文
摘》(Chemical Abstract,CA)、查找生命科学的《生物学文摘》
(BIOSIS Previews,BP)、查找医学信息的《MEDLINE》等世界著名的权
威检索工具将帮助我们迅速快捷的获取所需的期刊文献信息,包括文章
名称、作者、期刊名、卷期页码等,我们可以根据这些信息找到相应的
期刊获取全文。
期刊及其全文数据库—文献的网上查询
②如果需要查找中文社会科学方面的期刊文献,那么可以选择《全
国报刊索引》《报刊资料索引》等检索工具。《全国报刊索引》是上海
图书馆上海科学技术情报研究所主办出版的报道国内报纸、期刊的大型
综合性检索刊物。该库已回溯至1950年,内容主要涉及马列主义、毛泽
东思想、哲学、社会科学、政治、军事、经济、文化、科学、教育、体
育、语言文字、文学、艺术、历史地理等各个学科,是查找国内社会科
学期刊文献的首选数据库。《报刊资料索引》系列刊是由中国人民大学
书报资料中心按月度或年度编排的大型检索工具书,也是检索社会科学
文献的重要工具。《复印报刊资料索引》数据库是其对应的电子版。它
汇集1978年以来《报刊资料索引》系列刊(S1~S8)的全部内容。
③如果需要查找中文自然科学领域的期刊文献,则可以选择重庆维
普的《中文科技期刊篇名数据库》和万方的系列科技文献数据库。
期刊及其全文数据库—文献的网上查询
(2)访问期刊出版商的网站和数据库
电子期刊的出版商通常在网站上提供了其出版期刊的题录和文摘的免费
检索和浏览,有的还提供免费的全文或者是收费的全文数据库。所以如果知
道期刊的出版商,直接访问该出版商网站是一个比较可靠的方法。
(3)检索期刊集成商提供的数据库
网络期刊集成商本身不出版电子期刊,而是将出版商(通常是多个)的网
络期刊集成在一起,建立统一的检索界面提供检索服务。
(4)通过提供电子期刊链接的网站获取
有的网站搜集了大量的电子期刊链接,包括相当数量的免费期刊,为我
们获取电子期刊信息提供了一条捷径。
(5)通过搜索引擎获取
在查找不知网址的电子期刊时,搜索引擎仍然是常用的一种方法。有些
搜索引擎中提供了关于电子期刊的一些类目,直接点击可以获得一些电子期
刊的链接点。
第二章 文献信息及其数字化发展
主要知识点
(一)文献信息源及其形式知识
(二)图书及其数字化发展
(三)期刊及其全文数据库
(四)特种文献及其网上分布
特种文献及其网上分布—什么是特种文献
特种文献通常指那些在出版发行方面或获取途径方面比较特殊的文献,
它包括会议文献、学位论文、专利文献、标准文献、政府出版物、科技报告
等类型。因为具有独特的信息价值,所以是不可忽视和遗漏的信息源。
特种文献及其网上分布—会议文献
会议文献是产生于会议过程中的各种资料和基于会议资料的各类出版物
的总称。它一般能反映该学科或专业领域内的最新进展和成就,许多新发现
和新设想也会在会议上首次公布和讨论,其内容新颖,学术性强,往往代表
各国科学技术的水平和动态。
(1)会议信息服务网站
网上有些站点专门致力于搜集各类会议信息及其文献并提供免费服务。
它们提供的会议相关信息非常丰富,既有关于会议本身的会议预告、会议日
程、会议视频点播,也提供会议论文目录甚至全文。
(2)相关研究机构或组织的网站
许多学术研究机构或者各级学会、协会等组织经常定期、不定期召开学
术会议。这些会议的级别一般较高,影响较广。在其主页上一般都能找到其
会议预告、会议征文等消息,许多情况下还能第一时间获取相关的会议论文。
特种文献及其网上分布—会议文献
(3)专门的会议论文数据库
查找正式出版的会议文献最有效的方法就是利用专门的会议论文数据库。
如:
①中国学术会议论文数据库(http://www.wanfangdata.com.cn )。
②ISI proceedings(http://isiknowledge.com ) 是美国科学情报研究
所(ISI)出版的两大会议录索引ISTP(科学技术会议录索引)和ISSHP(社会科学
及人文科学会议录索引)的集成,是世界最权威的会议论文数据库;
③OCLC(http://firstsearch.oclc.org/FSIP )也提供了两个会议数据库:
PapersFirst和Proceedings。前者是在会议上提交的文章索引;后者是会议
出版物索引,包括在世界各地举行的学术会议上发表的论文的目录表。
如果通过以上途径都无法获取所需会议信息,则不妨试试专门收录会议信息
的搜索引擎。
特种文献及其网上分布—学位论文
(1)检索大型学位论文数据库
①ProQuest Digital dissertations
(http://wwwlib.umi.com/dissertations)
它是ProQuest公司出品的美国博硕士论文数据库,简称PQDD。它收录欧美
1000余所大学1861年以来文、理、工、农、医等领域的160万博士、硕士论文
的摘要及索引。
②ProQuest博士论文全文数据库(http://proquest.calis.edu.cn)是对
应于ProQuest Digital dissertations的国外博士论文全文数据库。
③中国学位论文数据库(http://www.wanfangdata.com.cn )
中国科技信息研究所是国家法定的学位论文收藏机构之一,1980年开始收
集了我国自然科学领域的博士、博士后及重点高校、硕士研究生论文。1995
年由万方数据公司制成文摘数据库。
特种文献及其网上分布—学位论文
④中国优秀博硕士学位论文全文数据库
清华同方出品。收录2000年以来300多家博硕士培养单位的8万多篇学位
论文的全文。
⑤高校学位论文库(http://162.105.138.230/ )
是CALIS子项目之一,目的是通过对分散在各大学中各类学科的学位论文
文献信息的收集、整理、建库、上网,使原始的论文信息获得升值。
(2)访问各高校图书馆网站
高等院校是产生学位论文的主要信息源,图书馆作为信息资源的收藏地,
一般收藏了本校的学位论文。许多学校或者将学位论文的信息反映在其书目
数据库中,或者直接建立起规模不一的本校或地区学位论文数据库。
特种文献及其网上分布—专利文献
(1)什么是专利?
专利是对技术发明给予法律保护的一种制度,专利权与商标权、工业品
外观设计等一道构成工业产权,工业产权又与版权一道构成知识产权。专利
文献狭义上是指专利说明书、权利要求书、说明书附图、说明书摘要等;广
义上是指各种专利申请文件、专利公报、专利分类表、专利索引、专利题录、
专利文摘、专利证书等。
(2)各国专利局网站
目前有许多国家的工业产权局或相关组织和机构纷纷上网。这些网站常
常提供了许多专利信息,有的甚至还提供了免费或收费的专利数据库。例如:
世界知识产权组织数字图书馆(IPDL) http://ipdl.wipo.int/ ;中国知识
产权局 http://www.sipo.gov.cn/等。
特种文献及其网上分布—专利文献
(3)免费专利数据库
网上有许多免费的专利数据库,许多是由各国专利局提供,也有部分是
由一些民间的组织提供。例如:中国专利信息检索系统
(http://www.sipo.gov.cn/sipo/zljs/default.htm);USTPO网上专利数据库
(http://www.uspto.gov/patft/index.html)等。
(4)商业数据库
商业数据库在数据的收录范围、时间跨度、数据加工及文献内容标引、
著录质量等方面一般都优于免费数据库。他们可以分为两种类型,一类是由
各国的工业产权组织或机构建立的数据库,这些数据库的题录文摘一般可以
提供给读者免费检索和浏览,而专利的全文文献则需要付费阅读和下载。另
一类则是由商业公司提供的完全收费的商业数据库。
除了直接访问和利用上述网站和数据库之外,我们也可以利用搜索引擎
查找专利信息。
特种文献及其网上分布—标准文献
(1)什么是标准文献?
标准是对产品、工程和管理的质量、规格、程序、方法等所做的规定。
它由有关主管部门批准颁布,是从事生产、管理的一种共同依据和准则。标
准文献则是指由这些技术标准、管理标准及和在标准化过程中产生的其他具
有标准的类似文件所组成的一种特定形式的技术文献体系。
(2)标准的分类和编号
①标准的分类:按标准的适用范围,国外标准可分为国际标准、区域标
准和国家标准三级。国内标准分成国家标准、行业标准、地方标准和企业标
准四级。这四级标准的关系是,没有上级标准时,制定下级标准;发布上级
标准后,下级标准即行废止。但是实施国家或行业标准的企业,国家鼓励其
制定严于国家标准或行业标准的企业标准。按标准的成熟程度,标准文献可
分为:强制标准、推荐标准、试行标准和标准草案;按照标准化对象,又可
将标准分为技术标准、管理标准和工作标准三大类。
特种文献及其网上分布—标准文献
②标准的编号:标准有一套独特的标号体系。就国内标准而言,不同类型的标
准有不同的标准代号:强制性国家标准的代号为GB;推荐性国家标准的代号为:
GB/T。强制性行业标准代号,由行业汉语拼音字母构成。例如:电力行业标准代号
为:DL。推荐性行业标准代号为强制性行业标准代号后加“/T”。例如:推荐性医
药行业标准代号为:YY/T。强制性地方标准代号为DB,加相应的行政区域代码前两
位数字再加斜线,例如:北京市强制性地方标准代号为:DB11/。再加“T”组成推
荐性地方标准代号,例如:湖北省推荐性地方标准代号为:DB43/T。企业产品标准
代号由“企”字拼音首字母“Q”加“/”加企业代号组成。企业代号由上级主管部门
规定,可以用汉语拼音字母或阿拉伯数字或者两者兼用。“Q”与“/”之间可以加上
带圆括号的归口行业代号。例如:Q(HG)/HB为广州轮胎厂企业标准代号,HG为其归
口行业,即化工的代号。
以上标准代号、发布的顺序号(阿拉伯数字)以及发布或修订的年代号(四位阿
拉伯数字)三部分构成了标准编号(标准号)。例如:GB 18450-2001为2001年发布的
民用黑火药标准。
国外标准编号一般也由标准代号、发布的顺序号和发布的年代号三部分组成。
但不同类型的标准形式上稍有不同。目前,世界上约有近300个国际和区域性组织,
制定标准或技术规则。其中最大的是国际标准化组织(ISO)、国际电工委员会(IEC)、
国际电信联盟(ITU)。他们均为国际标准。
特种文献及其网上分布—标准文献
(3)标准的网上分布和检索
时效性对于具有一定法律效应的标准文献是至关重要的。而利用
Ineternet检索标准文献的最大优点就在于时效性强,在网上进行标准文献
查询的方式主要有以下几种:
①访问有关标准化组织或标准化主管部门的网页
②检索专门的标准服务网站或数据库
特种文献及其网上分布—政府出版物
(1)什么是政府出版物
政府出版物是指各国政府及其所属机构发表和出版,政府设立或指定的专
门机构印刷的文献。政府出版物反映了政府机构的活动,反映了官方的意志和
观点,具有一定的参考价值。
(2)政府机构网站
政府机构的网站一般都直接反映了该政府机构的职能,往往可以从中找到
其出版物的内容,以及一些相关的链接。
特种文献及其网上分布—政府出版物
(3)政府出版物的各种检索工具
以 下 是 其 中 一 部 分 : Catalog of U.S. Government
Publications(http://www.gpoaccess.gov/cgp/index.html),美国政府出版物
目录; Federal Web Locator(http://www.infoctr.edu/fwl/ ),联邦网络定
位器,是美国政府信息网页索引,为检索政府信息的首选工具;中国的政府上
网工程(http://www.gov.cn),有对全国34个省、直辖市以及港澳台的政府站点
的导航系统及检索系统。
(4)政府出版物的专业搜索引擎
政府出版物的专业搜索引擎是查找和获取政府信息的有力工具。下面是两
个著名的专业搜索引擎:
①Google(http://www.google.com/unclesam )
类似于 Yahoo的搜索引擎,比较适合于检索政府出版物。
②FIRSTGov( http://www.firstgov.gov )
一个以客户为中心的单一政府网站,是美国2万多个政府网站的统帅。
特种文献及其网上分布—政府出版物
(5)图书馆的联机公共检索目录
政府出版物,尤其是印刷型政府出版物,如果被某一图书馆或文献情报机
构收藏,一般会在其OPAC中得以反映,因此,我们可以根据已知的一些信息来
查询可能收藏政府出版物的图书馆(如中国国家图书馆、美国国会图书馆)的
OPAC系统,或直接查找图书馆的联合目录。
(6)专业数据库
目前许多国家的政府出版物经过长期的积累,已经有了相当的规模,并逐
步形成了一些专业数据库。这些数据库,有些是非赢利性质的,直接放在相应
政府网站上对所有的访问者免费服务;有些则采取会员制,仅仅对付费的用户
开放;而这些非赢利或赢利的数据库中,又有部分被一些商业数据库公司购买,
从而从另一个角度为读者提供服务。
特种文献及其网上分布—科技报告
(1)什么是科学技术报告?
科学技术报告,包括政策报告、考察报告、实验报告、技术报告以及科学
游记等,是关于科研项目或活动的正式报告或记录,它反映科学研究的过程、
阶段和结果。在内容上具有专、深、详、新等特点,涉及的学科专业面广,新
兴学科和尖端科学的研究成果往往首先在科技报告中反映。
(2)科技报告的检索工具
有关美国科技报告印刷版的的检索工具主要是以下四种:
①Government Reports Announcements & Index (GRAI,政府报告通报与
索引)
②Scientific & Techinical Aerospace Reports (STAR,宇航科技报告)
③Energy Research Abstracts (ERA,能源研究文摘)
④美国能源署技术情报中心主办Nuclear Science Abstract(NSA,核科学
文摘)
特种文献及其网上分布—政府出版物
(3)科技报告的网上分布
国 外 重 要 的 有 : 综 合 The Virtual Technical Reports
Center(http://www.lib.umd.edu/ENGIN/TechReports/VirtualTechReports.html)对互联网上的技术报告文摘和全文进行导航;美国政府报告
National Technical Information Service(NTIS , hhtp://www.ntis.gov) ;
航 空 航 天 方 面 NASA Scientific and Technical Information
Program(http://www.sti.nasa.gov/sti-pubs.html)等。
中国的科技报告有两个途径获取:一是万方数据库中查阅。二是有北京文
献服务处(http://210.79.226.16)简历的“国防科技报告题录库”。该系统同
时还提供美国政府报告文摘数据库的检索服务。
第二章 文献信息及其数字化发展
重点和难点
重点和难点
(一)本章重点:信息、文献的内含;文献的数字化形式与分类;图书的
数字化网站及数据库;图书相关信息的网上查询技巧;期刊及其数据库;期刊
信息的网上查询;特种文献的网上分布与查询;政府出版物及其检索。
(二)本章难点:信息的内含;信息与信息资源的区别;各种文献的特点
与区别;不同文献的检索技巧。
第三章
文科信息检索:核心工具解析
主要知识点
(一)文科信息检索概述
(二)中国古籍检索
(三)中文文科研究信息检索
(四)国外文科检索工具
(五)文科常用参考工具书
文科信息检索概述
文科信息检索是指人文科学和社会科学诸领域的信息检索,文科
信息资源种类繁多,类型复杂,内容纷繁,同时,文科信息需求的
个性化、多样化程度高,从而使文科信息检索具有以下特点。
文科信息检索概述—文科信息检索的特点
(1)内容方面的特点:文科信息资源思想倾向性较强,有些还带有地区或
民族的特点,需要对检索结果进行正确的判断鉴别;观点的个性化较强,内容
具有多义性、主观性,应注意信息来源的整体性,注意对检索结果进行比较分
析;学科交叉性强,检索时要注意文献的完整性,关注相关学科的文献,以免
漏检;在人文社科的学科研究中多具有一定的师承流派,检索时可通过对流派
的梳理获得较多相关资料。
(2)时间方面的特点:文科研究性信息资源半衰期长,回溯性强,更新较
慢。在研究过程中注重历史资料的积累,一些经典著作具有历久弥新的生命力。
而一些描述性信息则动态性强,时效性要求高。
(3)著录方面的特点:著录事项不甚规范。具体体现在:个体著者多,团
体著者少,而个体著者姓氏书写不严谨;题名与内容的主题概念不一定相吻合;
主题复杂,主题标引深度难以达到较高的要求;引文规范性较差,在征引古书、
非本国出版物时著录有时不完全。
(4)信息源方面的特点:从信息源的类型上看,图书是重要的形式,一些
重要著作多以专著形式发表,档案、调查报告等灰色文献也具有重要参考价值。
文科信息检索概述—文科信息检索工具体系
(1)指引型检索工具:指引型检索工具的特点是揭示文献形式和内容特征,
提供原始文献线索,让读者作进一步的查检。主要有以下三类:
①书目:书目是揭示与记录一批相关文献,并按一定次序编排而成的检索
工具。按编撰方式和时间,书目可分为古典书目和现代书目两种。现代书目按
不同的角度可进一步划分为很多种类,一种书目可能分属多种类型,而不同类
型的书目的功能有时是互补的。书目的正文是对每一个文献整体进行著录而形
成一条条记录,著录项目包括著者、题名、版次、出版地、出版者、出版年、
卷册、页数等,有的还有文献的提要或注释。提要是具有高度概括性的关于文
献内容及相关背景的介绍与评价。
书目记录可根据不同的需要采用多种编排方式。书目正文后一般附有辅助
索引以扩大检索途径。馆藏目录和联合目录除一般的书目资料外,通常还注明
资料收藏的处所。
书目的主要功用包括:从题名、著者、主题等特定角度查找相关文献;查
考某一学科或某一专题文献的出版和收藏情况:指导阅读、指引学术门径,有
利于用户了解学术源流、发现学科生长点;有助于文献收集、选择、管理、加
工、报道、统计、评价等文献工作及读者服务工作;为文献学、文化史、出版
史研究提供重要参考。
文科信息检索概述—文科信息检索工具体系
②索引:索引是将书、刊或其它文献中重要的或有意义的信息,如词语、
主题、篇目或人名、地名等事项摘录下来,按一定方式顺次编排,并注明出处
的检索工具。是对文献集合中包含的文献事项或单元知识进行记录和指引。能
比书目更微观、更深入地揭示文献内容,有利于提高文献检索的深度和效率。
索引可以根据需要编成多种类型,索引正文的结构是款目的有序编排。款
目由标目、说明语和出处构成。标目又称索引词,用来标识文献内容或形式中
的某一主要特征,如题名、著者、主题词、篇名,有些索引在标目后还用相关
词语、句子等形式来进一步说明标目内涵。每一个标目后注明其出处。内容、
专名的出处用其在原文的页码及在该页的位置来表示,篇目的出处用其登载的
报刊名称及出版的年、卷、期和所在页码来表示。款目依字顺、分类等方式编
排。独立式索引多附有辅助索引。
索引的功用有:提供文献线索;指引篇名、文句、语词与专题论述的出处;
增加检索途径 ;从篇目索引、主题索引、引文索引中,可分析某一文献的主题
内容以及关于某一学科或课题的最新观点和发展趋势;从词句索引可研究作者
写作风格,寻找特定语句出处,还可供寻章揽句、采摭辞藻。
文科信息检索概述—文科信息检索工具体系
③文摘:文摘是将文献的主要内容简要确切地加以描述,并注明出处,以
一定的方法编排的检索工具。文摘不仅提供文献的基本书目信息,还提供文献
的内容梗概。文摘是对原文的浓缩,忠实于原文,不允许加入个人评价。
文摘按摘要方式分为指示性文摘和报道性文摘。前者只指出文献探讨的对
象、目的和主要结论,起到简介作用;后者全面客观地报道原始文献的基本内
容、观点、方法、数据、结论等;按编制目的分为集萃文摘、公文文摘、、信
息文摘、学术性文摘。学术性文摘是常用的检索工具。
标准的文摘结构是款目的有序编排。每一条款目分两部分,一部分是对文
献的内在特征和外在特征的描述,另一部分是关于文献内容的概括。款目一般
按分类编排。有些文摘还附有辅助索引。
文摘的功用有:帮助用户迅速鉴别选择文献,减少利用资料和查阅资料的
盲目性;有些文摘在一定程度上可替代原文,节省阅读全文的时间;多语种文
献被摘录成一种语种的文摘时,可帮助用户克服语言障碍;提供学术动态和学
科研究进展。
以上三类检索工具若以一定格式存储在计算机存储介质中形成书目数据库,
则可进行计算机检索。较之印刷型检索工具,它的著录更详细,检索途径更多,
检索方式更灵活。有些书目数据库还可直接链接相关的电子版原文。
文科信息检索概述—文科信息检索工具体系
(2)参考型检索工具
参考型检索工具是能直接提供事实、知识、数据和观点等的检索工具。它能
直接提供问题的答案。参考型检索工具在文科信息检索中有着重要地位。具有查
考事实,提供信息,开启观念、触发灵感等诸多作用。主要可分为以下几类:
①辞典(字典、词典):辞典(字典、词典)是解释字或词的概念、意义和用法,
并按一定顺序编排的检索工具。字典以解释文字的形体、声音、意义及其用法为
主,词典则以解释词义为主,也称辞典。到了近现代,字典和词典两者无严格区
别,常混用不分,通指涉及到字词各方面的工具书。目前,许多词典已经有了多
媒体光盘版和网络版。
辞典按编纂目的分,分为语文辞典和知识性辞典。语文辞典用于查考专门一
般词语或词语的某些部分的形态、读音、意义、用法等,按收录范围与释义来分,
可分为综合性语文辞典和特种语文辞典。知识性辞典可分为专科辞典和百科辞典。
专科辞典用于查考一种或几种学科或专门领域的的术语、专名、概念等,系统地
反映专业知识、基本事实与资料。百科辞典则是汇集各学科专业词汇,对术语、
概念和事物加以概括解释的综合性工具书。有的百科辞典还兼收一般词语,如
《辞海》,既是百科辞典,又兼有语文辞典的功能。还可按语种分为单语辞典和
双语、多语辞典;按收词量,分为大型(非节略本) 辞典、中型辞典、小型辞典和
袖珍辞典等。
文科信息检索概述—文科信息检索工具体系
辞典的正文结构是词条的顺序编排。多按词目字顺编排或分类编排。内容
相关的词条设有“参见”,以拓宽知识范围,深化词条内容。多附有检字表及
辅助索引。
辞典的功用有:解决语言学习、语文阅读和语言学研究的问题;帮助特定
领域的专门学习与研究;查考特定术语、知识、事物。
②百科全书:百科全书是荟萃人类一切门类或某一门类完整的知识,概要
地加以叙述并有序编排的工具书。百科全书具有系统性、完备性、权威性、检
索性、可读性等特点。百科全书以概念和知识点作为概括对象,要提供有关的
多方位的知识。
百科全书按收录范围一般分为综合性百科全书、专业性百科全书、地域性
百科全书,综合性百科全书包罗一切学科领域的基本知识。百科全书按版式或
卷数可分为多卷本、单卷本等;按读者对象可分为专家、成人、普通读者、青
少年及儿童等不同档次。
文科信息检索概述—文科信息检索工具体系
现代百科全书正文结构是条目的顺序编排。条目由条头、释文、参考书目
组成,百科全书的条目多由各领域的知名专家学者撰写,释文系统、全面,观
点明确、客观,行文清晰、简洁。所提供的参考文献多为深入研究该条目内容
的重要的参考著述。百科全书一般还有大量的插图、照片和丰富的附录。百科
全书的编排科学,索引系统完善,并且有详尽的参见系统。
百科全书的功用有:寻检查阅特定知识;系统学习有关知识。百科全书通
过参照系统和索引系统,使相关知识有机地连接,条目后还附有参考文献,有
些百科全书还附有学习指南,为系统学习和研究特定问题提供了便利;百科全
书内容丰富,插图精美,行文流畅。可扩大视野,增长知识。
有不少百科全书推出了光盘版和网络版,集视听享受于一体的多媒体形式、
成熟的全文检索技术加上语文词典及相关网站链接,使百科全书的可浏览性、
查检快捷性、知识的丰富性就更为突出。
文科信息检索概述—文科信息检索工具体系
③年鉴 :年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资
料和重要信息,并按年度出版的连续性出版物。年鉴具有资料集中、内容准确,
重点鲜明、信息及时、查检方便、总结性强、权威性强、连续性强、统计性强
等特点,是一种信息密集的检索工具。年鉴所标年份一般与出版年一致,内容
则反映上一年度的情况。
按编辑的内容性质,年鉴可分为综合性年鉴、地区性年鉴、专题/行业性年
鉴。年鉴还可按收录资料的地域范围,分为世界年鉴、国家年鉴和地方性年鉴;
按编纂形式分为综述性年鉴和统计性年鉴。
年鉴一般分设概况、专题、专栏、专文与特稿、附录、索引等几大栏目。
年鉴的功用有:提供新颖适时的资料;提供简明事实和统计数据;逐年编
排,累积性强,具有可比性和预测性;具有非正式的索引作用,尤其是一些学
科年鉴,罗列一年来的学术观点,重要文献,注明资料来源,可指引查到原始
文献;常包含有名录和人物资料;可供浏览。
文科信息检索概述—文科信息检索工具体系
④手册:手册是汇集某一领域或某一学科的基本知识、事实性资料与统计
数据,将其浓缩整理,加以系统性编排,以便解答各种事实性问题的参考工具。
手册还有指南、必备、大全、便览、要览、必备、宝鉴等名称。
按内容范围手册分为综合性和专门性两大类。前者汇集各个或多个领域的
基本知识和参考资料,后者则是汇集某学科、专业或专题的成熟的知识和基本
资料。
手册体例多样,有的以文字叙述为主,分栏目编排,有的以词条形式编写
并顺序编排,有的以表格数据为主;有的则图文并茂。
手册信息密集,资料翔实、具体,实用性强,具有很大的参考价值。
文科信息检索概述—文科信息检索工具体系
⑤类书:类书是摘录、汇辑多种文献中的原文,按类目或按韵部编排而成
的工具书。类书征引经史子集各种文献,广采历史事实、名物制度、诗赋文章、
成语典故、骈词俪句等诸类资料,是中国古代百科全书式的文献摘编。
类书按其收录内容可分为综合性类书和专门性类书。
类书的结构是将从各种原始文献中辑录出来的资料,或“以类相从”,分
门别类地编排,或“用韵以统字,用字以系事”,将单字按韵编排。古代类书
缺乏完备的检索系统,难以适应多层次多角度的检索需求。近现代影印出版的
类书多附加了辅助索引。
类书的功用有:查考事物起源,查检史实典故渊源,查找诗词文句出处,
检索参考资料,辑录散佚残缺古书佚文,校勘考证古籍等。
⑥政书:政书是记述历代或某一朝代的典章制度的沿革及政治、经济、军
事、文化制度等方面史料的工具书。政书大体分为通记历代典章制度及其史实
的通史式政书“十通”和专记一代典章制度史实的“会典”、“会要”两类。
与类书的“述而不作”不同,政书广泛采集历史资料并加以系统地叙述,分门
别类地编排。
政书是查找历代政治、经济、军事、文化等方面法律、法令、规章的主要
参考工具。
文科信息检索概述—文科信息检索工具体系
⑦名录:名录是提供有关专名(人名、地名、机构名称)及其基本情况的资
料性检索工具。 除了印刷本外,常以数据库的形式组织。名录的类型有机构名
录、人名录、地名录、物品名录、产品名录等。名录的编排格式化、固定化,
多按专名顺序编排,专名后提供相应的简要信息。
名录实用性强,专门性强,信息简明、及时、确切,可一目了然地查找有
关专名的基本信息资料。
⑧表谱:表谱以表格或类似表格形式反映事物变化的工具书。表谱将历史
人物、事件、年代等以表格、谱系、或其它较为整齐的形式简明扼要地表现出
来,具有条理清晰、提纲挈领、文约事丰的特点。表谱的功用是用来查检时间、
事件和人物资料。
⑨图录:图录是以图形、图像表示表述事物、人物等某个方面的形象直观
的工具书,包括地图和图谱两类。图录的作用是以直观的形式记录或重现原始
材料概貌,增加形象认识。
目前,一些常用的参考工具书已开发了电子版,除了其检索功能比印刷本
更为强大快捷外,还加入多媒体、虚拟现实技术,有的还能链接相关的网络资
源。
文科信息检索概述—文科信息检索工具体系
(3)原文型检索工具
原文型检索工具是指一些既具有原始文献的阅读功能,又有检索工具的查
检功用的文献。有人称之为“边缘性工具书”。
全文数据库和电子图书是应用越来越广泛的原文型检索工具。全文数据库
提供原始文献全文,可从多种检索途径检索。全文数据库中,一般都包括有完
整的书目信息,用户可在检索结果中先查看文献的题录(或书目),及其相应的
文摘(或提要)后,再选择所需的特定文献。是书目信息与原文信息的有机结合。
电子图书有两种形式,一种是没有全文检索功能,只是相关文献按专题集中在
一套光盘之中,相当于文献汇编。另一种则可进行全文检索。
文科信息检索概述—文科信息检索技能
(1)文献检索技术:
①熟悉检索语言:检索语言是根据文献检索需要创造的人工语言,又称检
索标识。从反映文献特征的角度来看,从文献中提取出来的外在特征(如责任者、
题名、文献号、出版者、出版时间)和内容特征(如分类号、叙词、标题词和关
键词)都是检索语言,它们提供了不同的检索途径。在手工检索工具中常提供各
种辅助索引以提供各种不同的检索途径。在计算机检索系统中,则通过不同的
字段选择来规定特定的检索途径或几种检索途径的组配。
检索语言可分为自然语言检索标识和规范语言检索标识。规范化检索语言
如分类法、叙词法能够以特定的类号或语词标引所有符合检索主题概念的文献,
避免了自然语言中因同义、近义、不同词形表达及一词多义等现象带来的漏检
和误检,并且通过一定的方法揭示主题概念之间的联系,可上位类查询或参照
系统扩大检索途径,也可通过下位类查询或概念组配等方式缩小检索范围。规
范化语言需有相应的标引工具或标引规则约束,在用户构造检索标识时,同样
要遵循相应的规范。因此,应对常用的规范化检索语言有一定的了解。了解每
种检索语言的特点及其在检索效果方面的优缺点,有助于选择合适的检索途径,
构造合适的检索表达式。
文科信息检索概述—文科信息检索技能
②了解检索工具常用的排检方法:在中文手工检索工具中,常会有不同的
排检方法,除了常用的形序法中的部首法、笔划法、笔形法、笔顺法,号码法
中的四角号码法,音序法中的汉语拼音字母排列法外,其它一些排检方法已使
用很少或不再使用。
③掌握不同检索工具的结构及相应的使用方法:在使用特定检索工具时,
应注意阅读工具书的凡例,获得有关收录范围、编排体例、检索方法等方面的
指 导 。 使 用 计 算 机 检 索 系 统 时 , 应 充 分 利 用 “ help” 、 ” tip” 、 “ search
guide”、”training tutorial” 等有关帮助、指南、培训资料。
④直接浏览:除了利用检索工具进行系统检索,浏览也是文科信息检索中
不可忽视的技术。文科信息语意含义丰富,内容繁杂,因而文科信息检索的自
主性较强,浏览检索工具、经典专著、核心期刊,可有利于获得整体印象,还
可能开启灵感,触类旁通。同时,利用引文进行追溯检索,浏览相关文献,也
是文科信息检索中常用的方法。
文科信息检索概述—文科信息检索技能
(2)检索工具的选择
选择适当的检索工具,是保障检索效率的关键。文科信息检索可分为三大
类,即文献检索、事实检索和数据检索。文献检索一般查找图书、论文等文献的
线索以获取文献原文;事实检索查考诸如名词术语、人物资料、地理信息、史
实、大事、法规、条约等,可直接得出检索答案;数据检索即查统计资料、数
据等,可获得准确的数据。
在文科信息检索工具体系中,指引型检索工具(如书目、文摘、索引及书目
数据库)与原文型检索工具(如全文数据库、资料汇编),主要用于文献检索,事
实性工具书如辞典、百科全书、年鉴、图录及事实数据库等主要用于事实检索,
手册、年鉴、资料汇编及统计数据库等主要用来进行数据检索。但在实际中,
各种检索工具有交叉使用的功能,而检索需求也往往涉及多种课题,应综合考
虑,选定主要的检索工具和相关检索工具。
在文科信息检索工具体系中,工具书,尤其是参考型工具书占有相当的比
重。工具书类型复杂,出版量大,给工具书的选择造成一定的难度。这就需要
借助检索工具对书目控制与评价的文献如工具书指南、专科文献资源指南等来
了解各种检索工具的类型、意义与功能,掌握一些具有典型性的检索工具,扩
大文献知见面。
文科信息检索概述—文科信息检索技能
工具书指南是收录和评介工具书的分类提要书目,其作用是有选择地报道
重要的和优秀的工具书。
信息检索教科书收录的文献面比工具书指南窄,但理论性、方法性、系统
性强,选择的检索工具更有代表性。通常要对检索工具作出系统介绍,阐述各
种检索工具的特征、使用方法与功用,列举各种检索课题常用的和重要的检索
工具并评价其优缺点。
目前,中山图书馆正在制作中文工具书数据库,拟收录工具书12377种,估
计将覆盖现有中文工具书的80% ,采用TRS全文检索技术,可以从书名、著者、
知识分类号、知识描述词、条目名称、正文内容等途径检索,现在逐步将工具
书数字化。
对于数字资源的选择,可利用数据库指南、网络资源导航、网络资源评价
网站、搜索引擎、网址簿等,一些门户网站有专门的参考工具导航,图书馆和
文献情报机构开设的参考咨询指导网站也会链接许多参考工具网站。还可参照
相关教程,在实际检索过程中,选择哪种检索工具,首先考虑是否能满足特定
的信息需求,其次考虑其易得性、易用性、可靠性。条件允许的情况下,同类
工具书中选用权威性、客观性强的;同种工具书中选用新出版的;既有印刷本
又有电子本的,优先使用电子本。
文科信息检索概述—文科信息检索技能
(3)检索过程中的分析与推理
文科信息检索工具功能复杂,内容交叉,往往一个检索需要各种工具的综合运
用。有些是一环套一环的链锁式,有些是全面开花,殊途同归的发散式,因此,
应认真分析检索需求,设计好检索思路。利用多种检索工具、多种检索途径进
行查找,以便相互映证,使检索结果内容全面,也便于发现一些检索工具中的
谬误与疏漏。
总之,文科信息检索具有其自身的特点。要使信息检索左右逢源、得心应
手,需要知识、经验,甚至直觉。在检索之前要掌握每种核心工具的收录范围、
功能、使用方法;在检索过程中应注意传统工具书与计算机检索系统的综合利
用,检索工具与原始文献的交叉使用。要根据情况及时调整检索策略,对各阶
段的检索结果作出正确的分析。
第三章
文科信息检索:核心工具解析
主要知识点
(一)文科信息检索概述
(二)中国古籍检索
(三)中文文科研究信息检索
(四)国外文科检索工具
(五)文科常用参考工具书
中国古籍检索—古籍线索的查找
(1)历代古籍情况的检索
古籍主要指1911年前以前成书的著作,及经后人整理而成的各种本子,如
汇编本、丛书本、校释本、选注本、今译本、辑佚本等。现存古籍约10万余种。
书目是查考古籍线索的主要工具。中国古典书目主要有史志目录、官修书
目和私家书目三类。古典书目一般由序(大、小序)、书名、卷数、作者、版本、
及解题(叙录、传录或辑录),从中可窥学术源流、考内容体例、获得考证校勘
及相关背景资料,了解古代文化发展的概貌。
历代书籍的出版、收藏、流传、存亡、散佚可通过历代史志目录及官、私
书目查找。
中国古籍检索—古籍线索的查找
①史志目录
史志目录是反映某一朝代书籍情况的目录,是了解历代藏书、著述、学术、
文化状况的重要依据。史志目录是正史的组成部分, 又称艺文志、经籍志。
《汉书•艺文志》我国第一部史志目录,也是我国现存最早的一部图书目录,自
先秦至汉代中叶的古籍,基本包括在其中。《汉书•艺文志》开创了正史艺文志
的先河。自此,历代修史者相沿不绝,从汉代到清代的各种史志目录大体完备。
除了正史目录外,国史目录,如宋《中兴国史艺文志》、明万历《国史经籍志》
等,专史目录,如郑樵《通志•艺文略》、马端临《文献通考•经籍考》等亦属
于史志目录。
查找史志目录可利用:《十史艺文经籍志》(商务印书馆,1955—1959),
《二十五史补编》(开明书店二十五史刊行委员会编,1936),《艺文志二十种
综合引得》(哈佛燕京学社引得编纂处,1933年编印;1960年中华书局影印)等
工具书。
中国古籍检索—古籍线索的查找
②官、私书目
官修书目是由政府主持编辑,反映一个国家全部藏书的书目。汉以后,几
乎历代均有官修书目。现存的官修书目有:宋代《崇文总目》的清人辑本,明
代的《文渊阁书目》、清《天禄琳琅书目》、《续天禄琳琅书目》,以及体例
最完备、内容最丰富、影响最大的是《四库全书总目》。
历代私家目录众多,以明清为盛。目录内容丰富,体例多有创新,可与官
修目录和史志目录配合使用。著名的私家目录有:宋晁公武《郡斋读书志》、
元马端临《文献通考•经籍考》,明范钦《天一阁藏书目录》,清黄丕烈《百宋
一廛书录》等。查考历代古籍还可利用各地方志中的艺文志,地方文献、专题
文献书目等。
中国古籍检索—古籍线索的查找
(2)现存古籍的检索
了解古籍流传在世的情况,可利用古籍总目、丛书目录、古籍善本书目、
馆藏目录、联合目录等检索工具。
①古籍总目《四库全书总目》(中华书局,1965年影印、1983年重印)是查
考现存古籍的主要检索工具。该书又称《四库全书总目提要》,是现存最大的
一部古籍总目,清纪昀等纂修,成书于1782年。后附《四库未收书目提要(清阮
元著,傅以礼重编),并附有四角号码书名索引和著者索引及笔画检字。《钦定
四库全书总目》整理本(四库全书研究所整理;李学勤等主审,中华书局,1997)
对《四库全书》进行了现代标点,使用方便。《四库全书总目》中不能查到的
未收书、禁毁书以及该书成书以后出版的古籍,可利用《续修四库全书提要》
(王云五主持,台湾商务印书馆,1972)检索。《续修四库全书》(上海古籍出版
社,1995-2002)收书 5213种,比《四库全书》增加51%,对之进行了补选和续选,
可查《续修四库全书•总目》。对于现代出版的对古籍加工整理的各种著作及新
版古籍的查检,可利用《古籍目录》(国家出版局版本图书馆编,中华书局,
1980) 、《全国古籍新书目》(98年创刊)及中华书局、上海古籍出版社的图书
总目(包括了其出版的古籍),等。
中国古籍检索—古籍线索的查找
②丛书目录
丛书目录是查找古籍的又一重要方法。丛书目录是专门收录丛书,反映丛
书子目的目录。常用的丛书目录是《中国丛书综录》(上海图书馆编,中华书局,
1959-1962)。该书目亦为联合目录。收录全国41所主要图书馆所藏古籍丛书
2797种,包括子目38891种。1982—1883年上海古籍出版社新1版中订正了原版
的一些错误,并补录了六所图书馆的收藏情况,是查找古代丛书及其子目的一
部比较完备的检索工具。
在利用《中国丛书综录》的同时,要注意利用对其进行修正和增补的相关
目录,如:《中国丛书综录补正》(阳海清编撰,蒋孝达校订,江苏广陵古籍刻
印社,1984)、《中国丛书目录及子目索引汇编》(施廷镛主编,南京大学1982
年刊行)、2003年北京图书馆出版社出版的《中国丛书综录续编》等。
中国古籍检索—古籍线索的查找
③古籍善本书目
善本书目是专门著录古代文献善本的目录,善本是指具有历史文物性、学
术资料性、艺术代表性而又流传较少的古籍。查找现存善本的常用的善本书目
主要有:《中国古籍善本书目》(中国古籍善本书目编辑委员会编,上海古籍出
版社,1989-1998)。这是我国目前最大的一部古籍善本联合目录,全书收录全
国782处收藏单位(台湾暂缺)6万多种,13万多部善本古籍,分经、史、子、集、
丛5部出版。每一书著录书名、卷数、作者、版本,并列出收藏单位。《中国古
籍善本书目》(中国古籍善本书目编辑委员会编,上海古籍出版社,1989-1998)。
这是我国目前最大的一部古籍善本联合目录,全书收录全国782处收藏单位(台
湾暂缺)6万多种,13万多部善本古籍,分经、史、子、集、丛5部出版。每一书
著录书名、卷数、作者、版本,并列出收藏单位,等。2002年5月,文化部、财
政部决定在全国实施“中华再造善本工程”,将利用现代出版技术,复制出版
收藏于各地各机构的珍贵古籍善本。分唐宋编、金元编、明代编、清代编、少
数民族文字古籍编出版。
中国古籍检索—古籍线索的查找
④馆藏书目
民国以来各大图书馆编制的各种馆藏书目和联合目录中著录的古籍,一般
说来,如果没有意外的话,应是现存的古籍。而时间越近的书目,越能反映古
籍的收藏情况。最近出版的有:《北京图书馆普通古籍总目》(书目文献出版社,
1990-1995)、《北京图书馆古籍善本书目》(北京图书馆编,书目文献出版社,
1989)、《上海图书馆善本书目》(上海图书馆编印,1957)、《北京大学图书馆
藏善本书目》(北京大学图书馆编印,1958)、《清华大学图书馆藏书善本书目》
(清华大学图书馆编,清华大学出版社,2002)等。还可利用各大图书馆的OPAC
直接查找。
中国古籍检索—古籍线索的查找
(3)关于古籍的各种特定需求的检索
在古籍书目中,有一些具有某种特定含义,适应人们对某一特定问题进行
深入了解和研究需要的专门目录。如丛书目录、善本目录、方志目录、举要目
录、解题目录、禁毁目录、版本目录、辨伪目录、古籍拍卖目录及专科目录等。
利用它们可进行以下检索:
①古籍版本的检索
一种书在流传过程中因不同的书写或印刷的形式,以及年代、版次、字体、
装订、内容的更改等,会形成不同的版本。对古籍版本的检索可利用版本目录。
南宋初年尤袤撰的《遂初堂书目》为我国最早的版本目录。清代私撰版本目录
盛行,其中以清初钱曾《读书敏求记》最为著名。《增订四库简明目录标注》
(清邵懿辰撰,邵章续录,上海古籍出版社1979年新1版)是查找古籍版本常用
的书目。
中国古籍检索—古籍线索的查找
②古代方志的检索
方志是记载某一地区自然和社会情况的地方文献。查找某一地区有无方志,
有多少种方志,以及方志的版本及收藏情况,主要利用方志目录。《中国地方
志联合目录》(中国科学院北京天文台主编,中华书局,1985)是常用的方志目
录。《中国地方志总目提要》(金恩晖编,台北:汉美图书有限公司,1996)收
地方志8517种,亦可资参考。
查考台湾及海外的方志收藏情况可查检《中华民国台湾地区方志目录》(王
德毅主编,台湾汉学研究资料及服务中心,1985)等。
③敦煌文献的检索
19世纪以,甲骨文献、金文文献、简帛文献、敦煌文献等一批珍贵的出土
古文献相继面世。可通过相应的书目对它们进行检索。如敦煌文献的检索可利
用《敦煌劫余录》(陈垣撰,中央历史语言研究所,1931)、《敦煌遗书总目索
引》(商务印书馆编,中华书局 ,1983,新1版)《敦煌遗书最新目录》(黄永武
主编,台湾新文丰出版公司,1986,该书可作为目录与黄永武主编的140册《敦
煌宝藏》配套使用),及《敦煌遗书汉文纪年卷编年》(薄小莹编,长春出版社,
1990)等。
中国古籍检索—古籍线索的查找
④古籍书名同异的检索
异名同书与同名异书在古籍中比较普遍,可利用《古书同名异称举要》(张
雪庵编,山东人民出版社,1980)、《古籍书名辞典》(王吉根等编,学林出版
社,1992)等检索工具。
⑤伪书的检索
辨别古书的真伪可利用《古书真伪及其年代》(梁启超著,中华书局,
1955)、《古今伪书考补正》(黄云眉著,齐鲁书社,1980)、《中国伪书通考》
(邓瑞全、余冠英,黄山书社,1998)等。
⑥古代书目的检索
查找古代书目可利用《书目长编》(邵瑞彭、阎树善等,北京资料社,1928
年铅印)、《近三百年古籍目录学举要》(严佐之编,华东师范大学出版社,
1994)等书目之书目,还可利用《四库全书总目》、《中国丛书综录》、《中国
古籍善本书目》等在目录类著录的各种书目。还要注意利用各大图书馆馆藏古
籍目录中的目录类来查找。
中国古籍检索—古籍内容的检索
(1)利用古书索引检索特定事项
要查找古籍中的史实名物、成语典故、诗文词句的出处和某一具体篇目,
可利用字词索引、关键词索引、句子索引和编目索引、作者索引等。古籍索引
中具有影响较大的是哈佛燕京学社引得编纂处在1931—1950年间编辑的引得41
种、引得特刊23种,及1943-1950年出版的《巴黎大学北平汉学研究所通检丛刊》
13种。1983年以来,上海古籍出版社先后将这些引得及通检予以重印,并新编
了四角号码和汉语拼音索引,检索十分方便。
字词索引是把一部或几部书中的出现的所有字或词语都列为标目,以原书
中包含该字的句子作为说明语,并标明相应的篇章、页码,将标目顺序编排后
形成的索引。如果每一个字都列目,则称为逐字索引。如《毛诗引得》、《尚
书通检》(顾颉刚主编,书目文献出版社,1982)。
关键词索引则是有选择性地收录古籍中的人名、地名、书名、典章制度、
术语、事件等关键词语顺序编排而成的索引。既有单项编排的,如《二十五史
人名索引》(二十五史刊行委员会编,中华书局1956、1964重印),也有各项混
合编排的综合型索引,如《说苑引得》、《吕氏春秋通检》。
中国古籍检索—古籍内容的检索
句子索引把一部或若干部书籍中所有句子作为标目,标明出处,并按一定
顺序编排而成的索引。多按句子的首字笔画为序编排。如《十三经索引》(叶绍
钧编,中华书局,1983重订本)、《李白诗索引》(杭州大学中文系资料室编)等。
篇目索引和作者索引常用的有:《全上古三代秦汉三国六朝文篇名目录及
作者索引》(中华书局编,中华书局,1965)等。
(2)利用类书查找古籍原文
类书是将从各种古籍中辑录的资料有序编排,是查找辞藻典故和诗词文句
出处,查考史实和事物掌故,辑佚和校勘古籍的重要检索工具,兼有指引原书
的索引功能。查找类书可根据检索需求选择综合型类书和专门性类书。
①重要的综合性类书有:《北堂书钞》(唐虞世南编,中国书店,1989年影印)。
该书是我国现存最早的一部比较的完整的类书。《艺文类聚》(唐欧阳询等编,
中华书局,上海古籍出版社,1982重印本)。是现存最早、最完整的类书。《太
平御览》(宋李昉等编纂,中华书局, 1985年重印)。《永乐大典》明解缙等编
纂,是我国最大的一部类书。《古今图书集成》(清陈梦雷编纂,蒋廷锡校补,
巴蜀书社,1986)是中国现存最大的古代类书。
中国古籍检索—古籍内容的检索
②著名的专门性类书有:《册府元龟》(宋王钦若、杨亿等编,中华书局,
1982重印),为政事历史的专门类书。《太平广记》(宋李昉等编,中华书局,
1982重版),是查找古代“小说”研究资料的重要工具。《文苑英华》(宋李昉
等编纂,中华书局,1982年影印版,收录南朝梁末至唐五代的作品,对查找这
一时期文学作品有较大参考价值。以上三部类书与《太平御览》合称为宋初四
大书。其它专门性类书的查找可利用上海古籍出版社1992 年出版的《四库类书
丛刊》等。
(3)利用数字化资源获得古籍全文或特定内容
古籍数字化使古籍内容的检索更为快捷、便利。古籍数字化资源的形式主
要有:电子图书光盘版、网络版及相关学术研究网站等。古籍电子图书有多种
形式,有的具有检索功能,可对古籍原文中的任意字词进行全文检索或对原文
的某些事项进行检索;有的则只有阅读功能,不能进行检索;有的提供原件的
扫描图像,有的则提供其文本文件,有的提供整理本。在检索时应根据需求选
择。
在网络上还有许多的古籍资源网站和研究网站,可进行书目检索和全文检
索,有的除了提供原始文献文本外,还提供高清晰度的原件图像。有的还提供
相关研究成果、背景材料、其它相关网络资源等。
第三章
文科信息检索:核心工具解析
主要知识点
(一)文科信息检索概述
(二)中国古籍检索
(三)中文文科研究信息检索
(四)国外文科检索工具
(五)文科常用参考工具书
中文文科研究信息检索—图书的检索
(1)利用综合性书目查找近现代图书
《民国时期总书目》(北京图书馆编,书目文献出版社,1986—1996)是查
找近代图书最重要的工具书;《中国近代现代丛书目录》(上海图书馆编印,
1979)收录1902-1949年间的丛书及其所包括的图书,可利用该馆1982年编印的
《中国近现代丛书目录索引》查检子目。还可利用现代一些大的出版机构的图
书目录,如《商务印书馆图书目录》(商务印书馆,1981),《中华书局图书总
目》(中华书局,1987)收录1912-1949年出版的图书等。
中文文科研究信息检索—图书的检索
(2)利用综合性书目查找当代图书
①查找已出版的图书 :《全国总书目》和《中国国家书目》是查找建国后
出版的图书的主要检索工具。《全国总书目》,收公开出版发行或具有正式书
号的图书。1949年至1954年合订一本,1955年至1965年每年一册,1966至1969
年停编(后补编一册),1970年起按年度出版。 《中国国家书目》,北京图书馆
该书编委会主编,年度出版。有印刷本和光盘版两种形式,采取“领土—语言
原则”,收录了包括港澳台在内的全中国出版物、我国著者在国外发表的著作、
海外华侨和外籍华人的著述等。收录范围包括汉语普通图书、连续出版物、地
图、乐谱、博士论文、技术标准、非书资料、书目索引、少数民族文字图书、
盲文读物和在中国出版的外国语文献。《中国国家书目》较之于《全国总书目》
更为完备、规范。由于《全国总书目》、《中国国家书目》并不能完全地报道
我国出版的所有图书,需利用其它检索工具作为补充。
②查找将出版和正在出版的图书 ,主要利用征订书目、在版书目和新书目。
如《新华书目报》、《中国图书在版编目快报》、《全国新书目》等。
中文文科研究信息检索—图书的检索
(3)专题书籍的检索
对于各种专业或特定专题需求,除了查找综合性书目外,还应注意查找相
应的专题书目。可利用书目之书目、工具书指南查找合适的专题书目。专题书
目有回溯性书目,提要性书目和推荐性书目等多种。
①回溯性的书目收录全面,有利于系统查找,如 《中国法律图书总目》
(中国政法图书馆编,中国政法大学出版社,1991)、《中国教育书录(19911995)》( 龙华军等编著,北京师范大学出版社,1999)等。
②提要性书目有选择地评介重要图书,如《中国学术名著提要》丛书系列
(周谷城主编,复旦大学出版社,1994)、《西方学术名著提要》丛书(江西人民
出版社, 1999- )等。
③推荐书目可利用来选择优秀图书。如《大学文科指导书目》(北京大学出
版社,1991)、《中国读者理想藏书》(王余光主编,光明日报出版社,1999)等。
(4)利用电子图书光盘获得原文
电子图书光盘存储容量大,通过查找书目可直接阅读原文。对于查找常见
的经典著作较为方便。如《世界名著百部》、《中国古典名著百部》(青苹果数
据中心,北京电子出版物出版中心)等。
中文文科研究信息检索—报刊的检索
(1)近现代报刊的检索
《(1833-1949)全国中文期刊联合目录》(全国图书联合目录编辑组编,书目文
献出版社, 1981增订版)及《(1833-1949)全国中文期刊联合目录补编本》(书目文
献出版社,1994),是检索建国前我国出版的期刊情况的最为系统、完备的目录。
查找近代报刊还可利用馆藏目录。如《中文期刊目录(1881-1949)(上海图书馆编
印)、《解放前中文报纸联合目录草目》(全国图书联合目录编辑组编印,1967)等。
(2)当代报刊的检索
查找当代报刊可通过《最新中国期刊全览》(辛期等编,现代出版社,1989)、
《当代中国报纸大全》(中国社会科学院新闻研究所、首都新闻学会读者调查组编,
宁夏人民出版社,1988),及每年一本的用于当年的报刊订阅的《报刊简明目录》
等资料。
要了解各专业学科领域的中文核心期刊则查找《中文核心期刊要目总览》
(2000年版)(戴龙基、张其苏、蔡蓉华主编,北京大学出版社, 2000)。该书筛选
出1571种中文期刊,分属七大编75个类目。目前已有电子版,可从分类、刊名等途
径查找。
现代报刊的检索通过网络信息资源查找更为快捷。
中文文科研究信息检索—论文资料的检索
(1)近代报刊资料的检索
查找近代报刊登载的资料,目前没有系统的回溯性检索工具,必须通过多
种检索工具参照使用。如:《中国近代期刊篇目汇录》(1857-1918);《辛亥革
命时期期刊总目》(上海图书馆编印,1961),《国学论文索引》(中华图书馆协
会,1925-1955)等。
(2)现代论文、报刊资料的查找
①利用综合性的报刊资料索引:主要有:《全国报刊索引》、《报刊资料
索引》、《中国社会科学文献题录》、《内部资料索引》等综合性检索刊物。
还可利用其它索引作为补充,查找特定时间段内发表的报刊资料
②利用出版时间长,影响较大的单种或特定报刊索引:主要有:《人民日
报索引》(人民日报图书馆编,人民日报出版社)、《光明日报索引》(光明日报
社编辑出版)等
③利用综合性的文摘刊物检索:主要有:《新华文摘》(新华文摘社编,人
民出版社);《中国社会科学文摘》(中国社会科学杂志社编辑) 、《学位论文
摘要》;《高等学校文科学报文摘》(上海师范大学高等学校学报文摘社)等。
中文文科研究信息检索—论文资料的检索
(3)专题论文的检索
在查找专题论文时,除了利用综合性的索引外,使用相应的专题文献索引
更为便利。专题文献索引可集中某一学科或专题的文献,尤其是分散在论文集、
会议论文集中的文献需通过专题文献索引查找。专题文献索引数量庞大,可根
据需要利用工具书指南寻找合适的专题索引。还应注意专题文摘检索刊物的检
索,并利用专业年鉴、资料汇编、专题报告、综述获得专题文献线索乃至原文。
专题文摘刊物扼要地摘写文章的论点提要、重要材料,记录科研成果,反
映学术动态,积累有关数据,可简明地掌握某一问题研究的历史、现状和动向。
如《管理科学文摘》、《经济学文摘》等。专业年鉴是了解专业学术动态和重
要论文的有效渠道。专题报告具有新颖性、权威性、总揽性、前瞻性,同时有
相当丰富的文献线索,是值得参考的一种边缘性工具书。资料汇编还有以“大
系”、“汇录”、“丛刊”等为名,以图书或连续出版物的形式汇集专题资料,
同时也提供了文献线索。
查找对国外社科文献的报道,可利用《国外社会科学论文索引》(中国社会
科学院情报研究所编)或《国外社会科学论文索引数据库》等工具。
中文文科研究信息检索—论文资料的检索
(4)利用数字资源检索论文资料
数字资源检索快捷,检索途径多样,而且具备印刷本检索工具难以企及的
检索方式,功能也更丰富,因此,应尽量使用数字资源检索。但是,目前中文
文科数字资源仍不够丰富,应注意利用适当的印刷本检索工具作为补充。
①利用综合性的书目数据库和全文数据库:专用于文科论文检索的综合文
献数据库有:中国人民大学书报资料中心《复印报刊资料全文数据库》(光盘)、
《全国报刊索引数据库:社科版》(光盘)等,(其检索操作方法见教材示例)。
文科引文数据库(CSSCI、CHSSCD、TSSCI等)如:《中文社会科学引文索引》
(CSSCI),南京大学中国社会科学研究评价中心研制开发,有印刷本、光盘版,
并提供网上服务,主要从来源文献和被引文献两个方面向用户提供信息;《中
国人文社会科学引文数据库》(CHSSCD),光盘版等。其它综合性的书目数据库、
全文检索数据库有:《中国社会科学文献题录数据库》、中国期刊网《中国学
术期刊全文数据库》(网络版,光盘版)及中国期刊网题录数据库等。利用馆藏
书目数据库或联合书目数据库,如CALIS中文现刊目次库、中国国家图书馆创建
的《中国年鉴篇名数据库》等。
中文文科研究信息检索—论文资料的检索
②利用专题数据库:专题数据库是查找专题文献的直接工具,如中国社会
科学院文献中心研制的《中国经济文献数据库》,人大数据光盘系列中的《经
济学管理学论文索引光盘》、《中国法学论文题录》等。
③利用报纸、期刊全文光盘及网上报刊资源:报纸、期刊的回溯性光盘常
用的有:《人民日报图文数据光盘》、《参考消息四十年光盘》等。还可利用
网上丰富的报刊资源,如中国报刊目录(http://www.china-bk.com)。
④利用会议论文数据库、学位论文数据库等。
中文文科研究信息检索—文科信息的网上综合检索
(1)利用OPAC检索
查找图书、报刊及其他类型文献的基本信息及馆藏情况最为便利的途径是
利用本地图书馆、全国其它大型图书馆的OPAC和图书馆联盟的联合书目数据库。
中国国家图书馆、上海图书馆、北京大学图书馆、中科院文献情报中心图书馆
等大型图书馆,因其文科藏书丰富,检索命中率较高。图书馆联盟如全国图书
馆联合编目中心的“中文图书编目数据库“可查最新出版和建国以来所有中文
图书的回溯书目。Calis的联合书刊目录数据库、广东文献编目中心的书目数据
库等也值得使用。
(2)利用网上书店和出版社网站
网上书店的可供书目,除了图书外,音像出版物、电子出版物亦可其通过
书目查询。常用的网上书店书目有北京图书大厦、上海书城、当当书店等的书
目数据库。出版社网站的书目查询对于了解特定专题的文献或新书很有帮助
中文文科研究信息检索—文科信息的网上综合检索
(3)利用专题资源网站专题资源网站如中国经济信息网、国务院发展研究
中心信息网、新华社综合信息数据库、中国资讯行等,可查找丰富的经济信息、
金融信息、统计信息、新闻信息和研究报告。CALIS的重点学科专题数据库则以
各高校收集的富有学科特色的文献为基础,具有学科知识数据库的特点。
(4)利用数字图书馆
利用数字图书馆查找图书、期刊,获得书目信息乃至全文也极为便利。如中国
数字图书馆、超星图书馆、黄金书屋等读书网站。
(5)利用文科学术机构网站、学术研究网站
目前,有各种学术机构在网上提供丰富的资源。如:中国学术城
(http://xueshu.newyouth.beida-online.com) 、 社 会 科 学 在 线
(http://www.ssol.net.cn)、等。可利用网络导航或搜索引擎获得相关网站。
中文文科研究信息检索—文科专业知识的检索
要了解专业术语、专业知识及相关背景材料、专门学者和专门机构,可利用各种
综合性和专科性词典、手册、年鉴及百科全书。
查找一般的专业术语可从“辞海”等百科词典入手,释义简明。而专科性词典、手册
则注重词语的科学含义,详细解释专科领域内的语词所代表的事物和概念,并提供相
关的人物、事件、研究情况等资料。有些专科词典已具有专业百科全书的性质。
专科年鉴提供了各学科的发展进展,最新动态及相关统计资料,还是查找学术人
物、学术机构及最新出版物的重要来源,应注意使用。目前,文科各学科基本上有了
专门的年鉴。
综合性和专业性的百科全书能提供学科或知识门类概观、学科或分支学科概述、
基本理论与学说、术语、事件、学派、机构、人物、出版物等多种信息。综合性的百
科全书最为常用的是《中国大百科全书》(中国大百科全书编辑委员会编,中国大百
科全书出版社1980-1993年出版) ,《中国大百科全书》已出版电子版。《中国大百
科全书》光盘检索程序见教材。
另外,一些国外著名的综合性百科全书的中译本和专业百科全书也值得利用。如
综合性百科全书《不列颠百科全书》(国际中文版,中国大百科全书出版社,1999)、
《大美百科全书》(台湾光复书局译, 1988)等;专业百科全书如:《美学百科全书》
(李泽厚等主编,社会科学文献文献出版社1989年出版)、《中国伦理学百科全书》
(罗国杰主编,吉林人民出版社1995年出版)等。
中文文科研究信息检索—文科学者情况检索
欲了解某一学科领域专题的核心学者,了解特定学者的生平、学术经历、
学术思想与渊源、成就、著述乃至通讯地址,除了利用专业词典、手册、年鉴、
百科全书外,还可利用专门的人物资料检索工具,如人名辞典、人名录、传记
资料索引、人物研究资料、人物专刊和人物年鉴、人名数据库等。人名词典有
通代的人名辞典和断代的人名词典;除了综合性辞典外,还有专科人名辞典;
外国人物的查找可利用相应的人名词典。
各类人名索引可用来查找史籍、方志、碑传、文集、年谱、传记、人物研
究等中的人物资料。如《二十四史纪传人名索引》(张忱石、吴树平,中华书局,
1980) 、《辛亥革命以来人物传记资料索引(复旦大学历史系资料室,上海辞书
出版社,1990)等。查历代学者科考情况可利用进士题名录,如《明清进士题名
碑录索引》;查历代儒学诸家学派的资料还可利用朱熹《伊洛渊源录》、黄宗
羲《明儒学案》等;查找学者的室名、笔名、异称等则利用专门的人物别称索
引,如《历代名人室名别号辞典》(增订本)(池秀云编著,山西古籍出版社,
1998)。
中文文科研究信息检索—文科学者情况检索
查找当代学者还可利用人名录,如《中国当代名人录》(中外名人研究中心
编,上海人民出版社,1991)、《中国当代名人录》(李国强等编,香港广角镜
出版社有限公司)等。此外,还可利用人名数据库。
查找人物的工具书很多,可利用《人物工具书辞典》(李宝印、张治江等主
编,吉林科学技术出版社,1989)、《古今中外人物传记指南录•前编》(邵延淼
编著,江苏教育出版社,1990)等工具书查找。
第三章
文科信息检索:核心工具解析
主要知识点
(一)文科信息检索概述
(二)中国古籍检索
(三)中文文科研究信息检索
(四)国外文科检索工具
(五)文科常用参考工具书
国外文科检索工具
外文文科信息检索的方法与中文文科信息检索方法基本类似,只是使用的
工具不同而已。这里着重介绍一些常用的英文信息检索工具。
国外文科检索工具—国外文科检索常用索引
(1)Humanities Index, ISSN0095-5981, CSBN200B0009, 1(4), 1974-《人文
科学文献索引》(HI)检索刊物,为季刊和年度累积,其前身最早为《国际期刊论文
索引》(International Index),由美国Wilson公司出版。期刊的学术价值高,在学
术界享有一定的声望。
( 2 ) Social Science Index, ISSN0094-4920, CSBN200B0008, 1(4), 1974《社会科学文献索引》(SSI),它与《人文科学文献索引》(HI)检索刊物均为季刊和
年度累积,其前身为《国际期刊论文索引》(International Index),由美国Wilson
公司出版。
(3)Philosopher’s Index, ISSN0031-7993, CSBN110B0078, 1(4), 1967-《哲
学家索引》(PI)季刊,1967年创刊,由美国Philosopher's Information Center出
版。
(4)Education Index, ISSN0013-1385, CSBN380B0063, 1(12), 1929-《教育
文献索引》创刊于1929年,由美国H.W. Wilson Co.出版
(5)Art Index, ISSN0004-3222, CSBN480B0069, 1(4), 1929-《艺术文献索
引》(AI)季刊,创刊于1929年,由美国H.W. Wilson Co.出版。
(6)Index to Legal Periodicals, ISSN0019-4077, CSBN340B0005, 1(12),
1908-《法律期刊与图书文献索引》创刊于1908年,由美国H.W. Wilson Co.公司出
版。
国外文科检索工具—国外文科检索常用文摘
(1)Historical Abstracts, ISSN0363-2717(A) 2715(B), CSBN210B0066,
1(4), 1955-《 历 史 文 摘 》(HA) 为 双 月 刊 , 由 美 国 ABC-CLIO Information
Services出版。
(2) Psychological Abstracts, ISSN0033-2887, CSBN598B0004, 1(12),
1927-《 心 理 学 文 摘 》(PA) 创 刊 于 1927 年 , 由 美 国 心 理 学 学 会 (American
Psychological Association)出版。
( 3 ) Sociological Abstracts, ISSN0038-0202, CSBN336B0004, 1(6),
1952- 《 社 会 学 文 摘 》(SA) 双 月 刊 , 创 刊 于 1952 年 。 由 美 国 Cambridge
Scientific Abstracts公司出版
( 4 ) Statistical Theory & Method Abstracts, ISSN0039-0518,
CSBN299C0001, 1(4), 1959-《统计理论与方法文摘》(STMA)季刊,创刊于1959
年,由荷兰International Statistical Institute出版
( 5 ) International Political Science Abstracts, ISSN0020-8345,
CSBN310F0003, 1(6), 1951-《国际政治科学文摘》(IPSA)双月刊,创刊于1951
年 , 由 法 国 国 际 政 治 科 学 协 会 (International Political Science
Association, FRANCE)出版。
国外文科检索工具—国外文科检索常用文摘
( 6 ) Language & Language Behavior Abstracts, ISSN0023-8295,
CSBN410B0087, 1(4), 1967-《语言学与语言行为文摘》(LLBA)季刊,创刊于
1967年,由美国Cambridge Scientific Abstracts公司出版。
( 7)Technical Education and Training Abstracts, ISSN0040-0920,
CSBN380C0115, 1(4), 1960-《技术教育与培训文摘》季刊,创刊于1960年,由
英国Taylor & Francis Ltd.出版。
( 8 ) Abstracts of Military Bibliography, ISSN0034-5873,
CSBN360PB052, 1(4), 1967-《军事文献书目摘要》季刊,1967年创刊,由阿根
廷出版。
( 9 ) Information Science Abstracts (ISA), ISSN0020-0239,
CSBN375B0086, 1(6), 1966-《信息科学文摘》(ISA)双月刊,1966年创刊,由
美国信息科学协会责编,Documentation Abstracts, Inc.出版。
( 10 ) Library & Information Science Abstracts, ISSN0024-2179,
CSBN375C0004, 1(12), 1969-《信息科学文摘》(ISA)双月刊,1966年创刊,由
美国信息科学协会责编,Documentation Abstracts, Inc.出版。
以上索引和文摘现大多已有数据库形式,可通过光盘、联机检索系统(如DIALOG、
BRS等)或网络数据库检索。
国外文科检索工具—国外文科检索常用数据库
(1)Lexis-Nexis系统:1973年由Mead Data Central 公司建立,现已发
展为集新闻、时事、政治、环境、法律、工商业、财政、金融、税收、医学、
政府信息于一体的综合性信息检索服务系统。
(2)ProQuest系统:由美国著名的信息存储与发行商UMI公司(现名Bell &
Howell Information and Learning)开发的检索系统,内容涉及新闻、社会科
学、商业管理、金融、税务等多方面,Web版通过国际专线提供检索服务。
(3)EBSCOhost系统:是著名数据库出版商EBSCO的产品,集成了各类数据
库,涉及的主题范围有国际商务、经济学、经济管理、金融、会计、劳动人事、
银行等。
(4)Gale 数据库:是美国Gale 公司的Gale Business Resource(盖尔商
业资源)、Gale’s Ready Reference Shelf(盖尔参考数据库)、Gale Database
of Publications & Broadcast Media(盖尔出版与广播媒体数据库)等数据库。
国外文科检索工具—国外文科检索常用数据库
(5)ERIC系统:是1966年由美国教育部与国家教育图书馆共同创建在教育,
乃至社会科学领域中久负盛名的信息检索系统。
(6)OCLC的FirstSearch:共有70多个数据库,分13个主题范畴,其中有
相当部分是重要的文科信息资源。
( 7)Project Gutenberg(http://promo.net/pg/): 著名的 “ 古 腾 堡计
划”,将知识产权归属全人类公有的著作建立电子文本,可通过网络检索英美
文学名著及重要著作的全文。
另外,电子期刊全文库中,包含大量的文科信息资源,应注意使用。
国外文科检索工具
—国外文科网络信息资源集成与评估网站
(1)The Argus Clearinghouse (http://www.clearinghouse.net )
“Argus”为希腊神话中的百眼巨人,足见该网站以巨细无遗地包罗网络信息资源
为己任。于1993年建立,对各学科主题网络资源的指南有完备的描述和明确的
评价。
(2)The WWW Virtual Library (http://vlib.org)“虚拟图书馆”是一个分布
式的网络资源主题指南系统。是著名的学术性网络信息资源指南.
(3)INFOMINE( http://infomine.ucr.edu)是美国多所院校的30多个图书馆员
合作开发的综合型网上学术资源收藏。
(4)BUBL Information Service(http://bubl.ac.uk/)“BUBL信息服务”是各
种网络资源的主题指南,涵盖各学科专业领域,中心设在英国的Andersonian
Library和Strathclyde University 。
国外文科检索工具
—国外文科网络信息资源集成与评估网站
( 5 ) SOSIG
(Social
Science
Information
Gateway)
(http://www.sosig.ac.uk/)“社会科学信息入口”是社会科学信息资源搜索引
擎,是广泛收集社会科学网络信息资源并提供广泛获取重要的社会科学信息的
途径。
(6)SSRN (http:// www.ssrn.com) “社会科学研究网络”由美国Harvard、
Princeton 等大学建设、查找社会科学信息资源的重要网站。
(7)CETH (Center for Electronic Texts in the Humanities)
http://www.ceth.rutgers.edu/“ 人 文 学 电 子 文 件 中 心 ” 于 1991 年 由 美 国
Rutgers与Princeton两所大学共同建立成立,从事人文学方面电子资源的整理
工作。
(8)EDSITEment(http://edsitement.neh.gov/)“最好的人文科学网络信
息 资源”,它选择链接了来自世界各国的博物馆、图书馆、人文研究机构、大
学,乃至政府机构、民间团体、商业机构的相关信息资源。
(9)Humbul Humanities Hub(http://www.humbul.ac.uk) “人文学科中心”
是为英国人文学者和研究者检索网络资源提供便捷的入口。
此外,Yahoo 和galaxy等的分类目录中有丰富的文科网络信息资源专题目录。
应注意利用。
第三章
文科信息检索:核心工具解析
主要知识点
(一)文科信息检索概述
(二)中国古籍检索
(三)中文文科研究信息检索
(四)国外文科检索工具
(五)文科常用参考工具书
文科常用参考工具书
除前述各类检索工具及其数据库外,文科学习和研究中还有不少常用参考
工具书,教材中按辞典、百科全书、年鉴、手册等类型择要进行了介绍,可以
参阅。
互联网的出现使网络版工具书也应运而生,查找Internet上的工具书,可
以从以下几个方面入手:①直接访问工具书出版社;②利用搜索引擎;③利用
收费数据库;④注意平时积累
第三章
文科信息检索:核心工具解析
重点和难点
重点和难点
(一) 本章重点:文科信息检索的特点、检索工具及检索技能;古籍检索的
主要工具及方法;中文文科信息检索的主要工具及方法;国外文科检索的主要
工具。
(二) 本章难点: 古籍检索的思路及方法;国外文科检索工具的利用。
难点
四、本章难点:各学科科技信息检索工具的使用方法。
重点和难点
(一) 本章重点:DIALOG系统的基本情况及发展特征;DIALOG系统采用的主
要检索技术;使用DIALOG系统进行检索时的操作方法。
(二)
本章难点:DIALOG系统主要检索技术的熟练掌握。