第一章文献检索基础知识

Download Report

Transcript 第一章文献检索基础知识

青海大学图书馆 季拥政
“文献检索与利用”课程是根据教育部文
件的精神开设的一门信息教育基础课程,
旨在培养学生良好的信息素养,学习掌握
利用检索工具和从大量的文献信息资源中
获取所需知识情报的方法.其基本任务是
使学生了解文献检索的基础理论和基本知
识,各种检索工具与计算机检索系统利用
的一般方法、技术。
课程介绍:
课程类型:考查课(公共选修课)
教学对象:4年制本科生
学时:16学时
教学目的:
《文献检索与利用》旨在通过讲课和上机实习
,帮助学生掌握信息检索和利用的基本方法和
技术, 培养大学生动手实践的能力,使大学生
具有一定的科学研究和实际工作能力。
在正确的地方
使用正确的工具
和正确的方法
查找正确的内容
寻找资源
工具课
目的
利用资源
其它课程的联系:
本课程作为一门科学的方法课,与其他课程联
系密切。作为工具性课程,能使学生了解和掌
握专业课程的历史、现状及发展趋势,提高自
学能力,增强所学课程的学习深度与广度;帮
助学生在毕业设计及撰写毕业论文时获取相关
文献,提高科研能力及毕业设计和专业论文的
水平。
考核办法:
考核办法有:实习报告、课堂提问和期末考
查。
实习报告、课堂提问为平时成绩,占40%。
期末成绩占60%。
教学内容:
课 程 内 容
总学时数
讲 授
第一章 文献检索基础知识
2
2
第二章 书目数据库及参考工具书
4
2
2
第三章 文摘型数据库
4
2
2
第四章 全文数据库
4
2
2
第五章 Internet信息资源及其检索
2
2
16
10
课时总学时数
实习(习题)
6
第一章 文献检索基础知识
信息无处不在,无时不有,无人不用,今天它已成为
使用频率最高的词汇之一
信息、物质和能源已成为现代社会资源,是人类社会
的三大财富(三大支柱),
在信息社会中,信息对整个社会的发展有着神奇的“
激化”、“诱发”和“倍增”作用。在日本被称为“
第三资源”,在西方国家被称为“第二资源”。社会
上流行着这样一句名言:“谁掌握信息,谁就掌握世
界”。
也正如比尔·盖茨所说:“你怎样搜集、管理和使用
信息,将决定你的输赢”。
社会净产值=各部门投入总合+信息流量
这个公式指明信息及其流通在经济发展中所起的作用
恰如一个“倍增器”,在社会投入总合不变的情况下
,加大信息流量可以使产值翻几番或更多。
第一节 信息、文献概述
(一)信息的概念:
“信息”是一个既古老又年轻的概念,
我国古代信息一词主要出现在诗词歌赋中,
南宋李中在《碧云集暮春怀故人》一诗中写道
:“梦断美人沉信息,目穿长路倚楼台”。
1979年版的《辞海》的解释也不外是“信息即消息”。
信息作为一个严谨的科学术语始于通信科学之中,
20世纪20年代,根据通信科学与技术的发展需要,
L哈特莱于1928年发表了具有经典意义的论文—“信
息传输”(Transmisson of Information)首次提出
了信息定义,并对信息进行定量研究。
美国贝尔电话研究所的申农(C.E.Shannon)在1948
年创立《信息论》,《信息论》着眼于对信息的认识
、描述。申农认为:“信息就是用于消除随机不定性
的东西(知识)”。
哈佛大学信息政策研究中心主任A·欧廷格(Oettinger
)说:“没有物质,任何东西都不存在;没有能量,
任何事情都不会发生;没有信息,任何东西都没有意
义。”
哲学家认为:信息是人类认识世界的依据,
数学家认为:信息是一种概率,
物理学家认为:信息是"熵",
通信学认为:信息是"不定度"的描述,
今天我们所讲的信息已经成为现代科学技术的
一个基本概念,信息概念不仅具有科学性,而且还
有巨大的哲学意义。
可以说,信息是自然界和人类社会存在的客观事物,
是物质的一种存在形式或物质的一种属性,信息是客
观世界各种事物的变化和特征的反映,是客观事物之
间相互作用和联系的表现。它以物质的属性或运动状
态为内容,并且总是借助于一定的物质载体传输或贮
存。
信息的结构
Data-信息的原材料
Information-由人提供的有组织的数据
Knowledge-对信息的理解与认识
Wisdom-精炼的知识
信息的循环和增值
(二)信息的类型
1.按照信息的性质(主体的认识层次)划分
(1)语法信息:由于主体具有观察力,能够感知事物的运
动状态及其变化方式的外在形式,由此获得的信息。
(2)语义信息:由于主体有理解力,能够领悟事物的运
动状态及其变化方式的逻辑含义,由此获得 的信息。
(3)语用信息:由于主体具有明确的目的性,能够判断
事物的运动状态及其变化方式的效用,由此获得 的信
息。
2. 信息按照描述的对象来划分,可分为自然信息、
生物信息、机器信息和社会信息。
3. 信息按照所依附的载体划分,可分为文献信息、
口头信息和电子信息等。
(三)信息的特征
1.价值性
2.可传递性
3.可存贮性
4.可加工性
5.时效性
6.共享性
7.污染性
二、知识
(一)知识的概念
(二)知识的分类
1.按OECD划分 ;知识分为四大类
(4W)。即:事实知识(Know
What)、原理知识(Know Why)、
技能知识( know How)和人力知识
( Know Who)。
2.按知识形态划分:
显性知识(explicit knowledge)是指能够用严格的
数据、科学公式、公理、文字等符号表达出来,易于
存储、交流和共享的知识,通常也被称为编码型知识
(codified knowledge)。
隐性知识(tacit knowledge)是高度个性化的,难
以格式化的知识,它植根于个人的经验,存在于人的
头脑之中,用文字难以尽述,或即使详尽描述,他人
也不可能全部理解。掌握的知识
三、情报
情报在汉语中是外来语,它是20世纪初由我国留日学
生引进的。情报的概念源于古代战争,指“战时关于
敌情之报告,曰情报”。
“作为交流对象的有用知识”,是“在特定时间,特
定状态下对特定的人提供的有用知识”,“是激活了、
活化了的知识”。
情报的基本属性是知识性、传递性和效用性。
信息、知识和情报三者之间的逻辑关系为:
信息‫כ‬知识‫כ‬情报
情报
知识
信息
四、信息资源
(一)信息资源的概念:信息资源(Information
Resources)大致有两种解释:一是狭义的,认为信
息资源就是指文献资源或数据资源,或指各种媒介
和形式的信息集合,包括文字、声像、印刷品、电
子信息、数据库等。
二是广义的,认为信息资源是信息活动中各种要素
的总称。既包含了信息本身,也包括了与信息相关
的人员、设备、技术和资金等各种资源。
通俗地理解为:信息资源是人类经过加工处理,使
之有序化并大量积累后的可供利用的信息集合。
(二)信息资源的类型
信息资源从它的本质上说,是一种附加了人类劳动的
信息,也就是说,信息资源是由信息、人、符号、载
体四中标准来划分:
1.从开发程度来看,信息资源可以划分为潜在的信息
资源和现实的信息资源两大类。
现实信息资源按其载体形式又可分为体载信息资源、
实物信息资源、文献信息资源、网络信息资源等。
体载信息资源以人体为载体并能传递和为他人所识别
及利用的信息资源。按其表述方式可分为口语信息资
源和体语信息资源。口语信息资源是人们以口头语言
表达的,有的被记录下来,有的未被记录下来。被记
录下来的信息资源,包括谈话、授课、讲演、讨论、
演唱等记录信息。体语信息资源是以人的体态表达的
信息资源,包括表情、姿态、手势、舞蹈等。
2.从表述方式,信息资源可以划为口语信息资源、
体语信息资源、文献信息资源和实物信息资源。
以信息化带动工业化和推进工业现代化必须以信息
资源进行的深层次挖掘为前提。信息资源的开发和
利用是国家信息化的核心任务,
信息资源的分类
潜在的信息资源
信息资源
(按开发程度分)
口语信息资源
现实的信息资源
体语信息资源
(
按
表
述
方
式
分
)
刻写型信息资源
实物信息
资源
纸质信息资源
印刷型信息资源
文献信息资
源
缩微型信息资源
非纸质信息资源
声像型信息资源
古代信息资源
五、信息素养及信息素养教育的意义
(一)信息素养的概念
信息素养又称信息素质,最早由美国信息产业协会主
席波尔(Paul Zurkowski)于1974年提出,并概括为
“利用大量的信息工具及主要信息源使问题得到解答
的技术和技能”。
它由七种能力构成:工具型能力、资源型能力、社会
型能力、研究型能力、表达型能力、技术型能力、评
论型能力。
(二)信息素养教育的意义
1.继承和借鉴前人的成果,避免重复研究
科研人员在开始某项课题研究之前,要有针对性地掌
握和了解有关科技信息资料,充分了解本课题的历史
基础、现状与发展趋势以及国内外已达到的水平,弄
清楚他人是否进行过研究或正在研究,研究的深度与
广度,哪些问题已经解决,哪些问题没有解决。
2.信息素养是创新人才应具备的基本素质
塞缪尔·约翰逊(Samuel Johnson)说:知识分成
两类,一类是我们要掌握的学科知识,另一类是要
知道在哪儿可以找到有关知识的信息(Knowledge
is of two kinds. We know a subject ourselves, or we
know where we can find information upon it)。
3.信息素养是培养学生科研素质的基石
9.30%
思考计划
7.70%
查阅文献
科学实验
32.10%
50.90%
编写报告
4.信息素养是进行终身学习的前提条件
据美国工程教育协会统计:科技人员所具有的知识,
12.5%是在大学阶段获取的,87.5%是在工作岗位上
学习的。信息素质教育的任务就是传授给学生作为一
个终身学习者应具备的基础知识和基本技能。
有关统计资料表明,大学生毕业一年
后,其在校所学的知识大约老化15%
,五年后老化50%-70%。
提高信息素养,
将信息获取作为
终身学习的手段
5. 信息素养可以使个人知识增值
信息具有可扩充性,人们对信息的处理能力越强, 信
息扩充得就越快。检索在信息处理和增值中有重要
意义。信息的检索、利用和创造是一个循环和增值
的过程,信息在这个循环的处理过程中不断得到扩
充,它的增长是没有穷尽的。
六、文献
“文献”一词最早见于《论语·八佾》
篇中:子曰:“夏礼,吾能言之,
杞不足征也;殷礼,吾能言之,宋
不足征也。文献不足故也。足,则
吾能征之夷”。
宋代朱熹注释为:“文,典籍也;献,贤也。,将“
文”解释为“典籍” 是指历代的历史文件。“献”
训为贤,是见多识广,熟悉历史的贤者。
在国外,1905年法国人保罗·曼特勒(P·Otlel)最早
提出“文献”一词,英文名称为:Document.并为
欧美各国广泛采用。
1985年我国颁布的国家标准GB4894-85《情报与文
献工作词汇基本术语》中,将“文献”解释为“记录
知识的一切载体”
也就是说用文字、图形、符号、声频、视频等手段记
录下来的人类知识都可以称之为文献。
文献的三个基本要素是:
知识、载体和记录
现今的“文献”具有五个基本特征:(1)记录有知识
;(2)存储在载体上;(3)有记录手段;(4)能
够传播:(5)适于保存。
(二)现代科技文献的特征
1.数量巨大:
全世界每年出版的图书就多达80 万种;期刊达16万种
,其中科技期刊8 万多种,发表的论文在600 万篇以上;
公开的专利说明书多达100 万件;国际会议文献1 万
多篇;美、英、德、日等国产生的科技报告20 万件左
右。中国在线数据库总量达到169 867 个。
2.分布离散
信息的可扩散性、可替代性,反映在文献方面则表
现为其分布离散重复的现象。表现在:同一学科专业
的文献分散与其他学科文献中;许多学科专业的文
献分别涉及多门学科内容;同一篇科技文献可用不
同出版类型和载体形式、不同语种重复出版。
3.更新加快
据统计,文献失效的年限大致为:
图书10-20年,科技报告10年,学位
论文5-7年,期刊3-5年。
4.载体多样
商晚期兽甲骨文
蒋介石日记的缩微胶卷样品
声像资料
手稿 印度梵文哲学手稿
作机读型
文献载体有天然材料手工
刻写的非纸张型材料:如古
代的甲骨、玉石、青铜器
、简策到以雕版印刷,活字
帛书中国古代写在绢帛上的文书,又称缯书。
印刷型为主的人造纤维
(纸张)型材料再到现代的胶片、磁带、磁盘、光盘以
及机读数据库、网络数据库为代表的电子载体材料文
献。
图书载体形态的变化及相关事件
年 代
名
3000BC
泥版文书
2800BC
纸草纸
古埃及的纸草纸
1400BC-1100BC
甲骨文
中国商周时期将卜辞刻在龟背兽骨上,用于占卜
AD105
造纸术
东汉宦官蔡伦发明造纸术,600多年后,造纸术
传入阿伯国家
1041-1048
泥活字印刷
1445
1971
称
金属活字印刷
电子书
说
明
古代两河流域(指今天伊拉克的幼发拉底河和底
格里斯河流域)的楔形文字、泥版文书
宋朝人毕晟发明泥活字印刷术
德国人古登堡发明金属活字印刷,印出了最早的
图书《古登堡圣经》
美国人Michael Hart于1971年提出古登堡计划
(Project Gutenberg)。该系统的图书均为已超
出版权保护期限的作品,既有经典名著,又有学
术专著、字典词典、年鉴、百科全书等工具书,
涵盖多种语言。该项目最大的特色是允许全世界
的读者通过网络免费下载和阅读图书全文
一、信息源
信息源又称情报源,即人类获取知识情报的来源。信
息源按其物质载体的不同可分为三种类型.
1.人脑信息源 :是指人们通过思维、交谈、讨论、发
言、报告等形式不断沟通情况,发出并传递信息,也称
口头信息源、离散情报。
据科学家研究发现人脑的大脑皮层有150亿个神经细
胞,可存储5亿册图书的信息,达1012—1015bit,相当
于数字计算机的几万倍。
2.实物信息源:实物信息是借助物体表达的
情报信息。
3.文献信息源 :文献信息源是情报源的主体,是情报
搜集、存储、检索、利用的主要对象。
第二节 文献类型
一、文献的类型
(一)按文献的载体形式划分
1.印刷型(printed form): 即书本型,也称纸介型
(paper type)。
载体:纸张
记录手段:手写、打字、印刷和复印等
优点:便于直接阅读,使用方便
缺点:较笨重、存储密度低,不便于加工、整理和收
藏。此类型文献有:期刊、图书等
2.缩微型(micro form) :又称缩微复制品。
载体:感光材料
记录手段:缩微照相
优点:存储密度较大、体积小、便于收藏保存、便
于远距离传递
缺点:缺点是不能直接阅读,需借助缩微阅读机才能
阅读
此类型文献有:缩微胶卷、缩微胶片等
3.视听型(audio-visual form) :又称声像型或直感
资料。
载体:磁性和感光材料
记录手段:借助于特殊的机械装置(如复录机、摄像机
、录像机等)直接记录声音、图像。
优点:直观、生动
缺点:制作成本较高,需要借助于一定的设备才能阅读
此类型文献有:唱片、录音带、录像带、幻灯片、电
影片、多媒体资料等。
4.机读型(machine readable) :计算机可读型
载体:光、电、磁介质
记录手段:利用计算机进行存储
优点:存储密度高,出版周期短、易更新,传递信息
迅速,存取速度快,可以融文本、图像、声音等多媒
体信息于一体,信息共享性好、易复制,识别和提取
易于实现自动化。
1MB=1024KB ; 1GB=1024MB ;1TB=1024GB ;
1PB=1024TB ; 1EB=1024PB ;1ZB=1024EB ;
1YB=1024ZB ; 1BB = 1024 YB ;1NB = 1024 BB ;
1DB = 1024 NB 。
缺点:需借助计算机等先进技术设备才能阅读。
此类文献有:电子图书、电子期刊、网络数据库、
光盘数据库等。
(二)按文献的加工层次划分
1.一次文献(primary document)
又称原始文献,是指作者本人生产或科研成果的总
结和理论操作的原始文章。
2.二次文献(secondary document)
它是通过对一次文献的加工、提炼和浓缩而形成的。
它将大量分散、无序的信息转变成有序的、便于管理
的系统。文献被压缩成条目,也称记录(entry,
reference, citation, record),并以一定的序列组织起来,
成为可用于查找一次文献的工具。
3.三次文献(tertiary document)
是对一次文献和二次文献进行汇集、综合、分析、
详述等深度加工而形成的。
从文献检索来说,一次文献主要检索的对象,二次文献
则主要是检索的工具,三次文献主要是情报研究的成
果。
(三)按文献的出版形式划分
1.图书
图书主要指以单本方式印刷的出版物。国际标准化组
织将图书定义为“49页及49页以上构成一个书单元的
文献(不包括封面和扉页)”。
国内外出版的图书版权页上印有的国际标准书号
ISBN,是国际标准化组织(ISO)制定的图书国际编号.
如:
ISBN978-7-81082-802-4
计算机核对号
书号及版次号
出版者号
地域(国家、地理、语言)号
图书
其中,地域号有:0 (英、美、加拿大、南非等英语
区), 1(其它英语区),2(法语区),3(德语区),4(日
本),5(俄语区),7(中国),8(印度等),9(新加坡
等东南亚地区)。
2.期刊
1665年法国的《学者周刊》被视为现代期刊的源头。
期刊又称杂志,英文为Periodicals、Journal、Magazine、
Serial 。是指刊名、刊期相对固定的定期或不定期连
续性读物,每年至少出两期,每期有卷号、期号 。科
技期刊都标有国际标准刊号ISSN。
ISSN有八位数字组成,
例:ISSN1005-8214
其中:1005-821: 前七位为出版物序号
4: 最后一位为校验码。
美国《科学》杂志是国际上享有很高声誉的权威性
刊物。它于1880年有电灯的发明人、世界最著名的科
学家之一托马斯·爱迪生(Thomas Alva Edison)创办。
该杂志由美国科学促进会American Association for the
Advancement of Science,简称AAAS)出版发行。
AAAS成立于1848年,是美国历史最悠久的科学团体
之一。
英国《自然》(Nature)是世界上最早的
国际性科技期刊,也是全球科学界最有名望的科学
周刊。它是1869年在达尔文(Charles Darwin)的
支持下在英国创办的,并将自己的办刊宗旨确定为:
将科学发现的重要结果介绍给公众…,让公众尽早
知道全世界自然知识的每一个分支中取得的所有进
展。
130多年来,《自然》曾发表过的重要研究论文有:
X-射线的发现…………………………………………
1896年
电子的发现……………………………………………
1897年
中子的发现……………………………………………
1932年
核裂变的首次解释……………………………………
1939年
全息术的发明…………………………………………
1948年
DNA 的结构…………………………………………… 1953年
人造金刚石……………………………………………
1955年
脉冲星的首次观测……………………………………
1962年
板块构造(大陆漂移)的发现………………………
1963年
一个完整生物体的第一个完整的DNA 序列………… 1977年
臭氧洞的发现…………………………………………
1985年
太阳系以外第一个行星的发现………………………
1992年
克隆羊“多利”………………………………………
一个人类染色体完整序列的首次获得………………
1997年
1999年
3.科技报告(Technical Report)
也称研究报告或科学技术总结报告。是
指研究成果的正式报告或研究过程中各
个阶段进展情况的实际记录 。
在国际上最为著称的是美国的四报告,即政府部门的
PB报告,军事系统的AD报告,国家宇航局的NASA报告,
能源部的DOE报告。
4.政府出版物
政府文献(government document)是各国政府部门及其
所属机构发表的文献,包括行政性文件和科技文件两
类。其中科技文献占整个政府出版物的30%-40% 。
5.科技会议文献
科技会议文献(conference paper)是在各种学术会议、
专题研讨会上发表的论文和报告,它是最新研究成
果公布于世的一种主要方式。它是人们及时了解有
关学科领域发展状况的重要渠道。科技会议文献包
括会前文献、会间文献和会后文献。
会议一般可分为:大会(Congresses)、会议
(Conferences)、学术讨论会(Symposia)研讨会
(Scminars)、专题讨论会(Workshop)、讨论会
(Colloquia)和宣传会(Teach-ins)。
识别会议文献的主要依据有:会议名称、会址、会
期、主办单位、会议录的出版单位等。会议文献的
关键词 “Proceeding”、 “Meeting”、 “
Conference”、 “Symposium”
6.标准文献(standard)
美国人掌握标准,站在最高端;日本人掌握技术,站
在中间;中国人有的是力气,只好在底端干苦力。
美国微软公司的成功,就是最好例子。欧、美发达国
家千方百计掌握制定国际标准的主动权,也就是掌握
国际竞争的主动权。
是一种重要的科技情报来源。是经公认的权威机构批
准的标准化工作成果,它是协调统一技术所做的一种
规定,是组织现代化生产、进行科学管理的具有法律
约束作用的重要文献。
标准分为国际标准、国家标准、部颁标准、
企业标准四中。同时,根据标准的内容,标准分为基础
标准、产品标准、辅助产品标准、原材料标准、方
法标准五大类。
技术标准一般有如下项目(1)标准级别;(2)标准名称
;(3)标准号(由标准代号+序号+年代号组成);(4)标
准提出单位;(5)审批单位;(6)批准年月日;(7)实施
日期;(8)标准内容若干项。
例如:GB2672-86:标准级别是“中华人民共和国国
家标准”,标准名称是“内六角花形盘头螺钉”,标
准号是“国标(GB)2672-86”,标准提出单位(编制单位)
是“中人民共和国机械工业部”,审批单位(颁发单
位)是“国家标准局”,批准年月是“1982年1月17
日”,实施日期是“1986年10月1日”,该标准内容为
五项。
7.专利文献(patent document)
所谓专利文献主要是指专利说明书即专利申请人向政
府提交的说明新发明创造的书面文件。这是专利文献
的核心部分,通常查阅和索取的专利文献就是指专利说
明书。专利文献是专利制度的产物,它集科技,法权,经
济为一体.是现代重要的文献情报源。专利说明书是专
利文献的技术内容的主体。
一份专利说明书大致包括如下项目:
国家及国徽
专利号(这是查找专利说明书的主要依据):
题目:
发明人及其地址:
受让人或专利权所有者及其地址:
请日期(Application date):
批准日期(Patented date) :
存档号(Series NO.共专利管理机构内部使用):
分类号(Class NO. 这是查找专利说明书的主要出发点):
内容(本发明的内容特点、使用范围、发明目的以及详细图
解和结论):
专利权限(Claim):
附图(Drawing).
8.学位论文
学位论文(thesis,dissertation),是高等院校和科研单
位的学生即将结束学业时为获取某种学位而撰写的学
术论文.英国统为称Thesis.美国称为Dissertation.学位
论文分为学士论文(Bachelor dissertation).硕士论文
(Master).和博士论文(Doctor dissertation)三种.
9.产品资料
产品资料(product literature)是各家厂商为推销其
产品而印发的商业宣传品,包括产品样本、产品目录、
说明书和厂商的情况介绍等。
10.技术档案
技术档案(technical records)是指在生产建设和科技活
动中形成的、有一定工程对象的技术性文件的总称,
包括任务书、协议书、技术经济指标和审批文件、研
究计划、研究方案、技术措施、调查材料、设计计算、
数据、图纸和工艺卡等一系列文件。
二、文献检索概括
(一)文献检索的含义
所谓检索(Retrieval)是指查找、寻求、获取的意思.。
而信息检索简单的说就是信息的有序化识别和查找。
广义的信息检索包括信息的汇集、存储与查找,而狭
义的信息检索仅指有序化知识信息的检索查找。通常
人们所说的信息检索是指狭义的信息检索
(Information Search),即信息查找过程。
信息检索:是指将信息(主要指文献信息)
按一定的方式组织和存储起来,并根据用户的需
要找出相关信息的过程。
存储
信息检索
检索
检索:是指面向信息需求
而进行高度选择性的查找
过程。
原始文献
加工整理
提 问
数据库
检 索
存 储
输 出
检 索
(二)文献检索的分类
1.按其检索对象分为:
(1)文献检索:凡是以文献为检索对象的称为文献
检索。它不直接解答用户所提出的技术问题本身,只
是提供相关的文献供用户参考。
(2)数据检索:凡是以数据作为检索对象的称为数
据检索,它直接回答用户提出的技术问题,即直接
提供用户所需要的确切的数据或事实
(3)事实检索:凡是以事实为检索对象的成为事实
检索,直接查询事实性答案,提供用户所需要的确切
事实,是一种确定性检索.。
2.按其存贮内容可分为:
(1)书目检索:用户通过书目、题录、索引、文摘
等二次文献,检出有关课题的一系列文献信息线索。
(2)事实检索
(3)数值检索
(4)全文检索:即检索工具(系统)存贮的整篇文章乃至
正本图书的全部文本用户检索出整篇文献或其中的章,
节段等文字。
3.按文献存贮载体及实现查找技术手段分为
(1)手工检索
(2)计算机检索(computer-based retrieval)
第三节 检索工具及检索途径
一、检索工具的概念及功能:
检索工具是用来报道、存储和信息的具,包括传统的
二次文献印刷型。检基于计算机的光盘检索、联机检
索以及Internet的网络信息检索的检索工具。检索工
具能够提供一定的检索手段,使人们可以按照一定的
检索方法和检索途径。并通过检索工具揭示文献线索、
内容梗概及全文,节省了查找时间,使科研人员用较
少的时间和精力,及时地了解到整个科技界和某个学
科领域的概貌,发展趋势,以及最新文献的内容。
三、检索工具的类型
按著录方式划分:检索工具可以分为目录、题录、
索引和文摘、全文数据库和搜索引擎六种。
1.目录(catalog)也称书目,是最早的一种检索工具
。它是著录一批相关的文献,并按一定的次序编排而
成的一种揭示与报道文献的工具。
是对图书、期刊等单位出版物的外表特征的揭示报导
和系统化的记载,
目录的著录款目大体包括题名、著者、出版者、
出版年、页数、版本等项。
目录的种类很多,主要有以下几种目录较为重要。国
家书目,例如,《全国总书目》、《全国新书目》。
馆藏目录,联合目录,专题目录。
2.题录(Title)
是对文献外部特征的描述,由一组数据项的固定组合
形成题录型条目,题录一般以内容上独立的文献单元
,如一篇文章或书中某一部分、某一章节或整个出版
物作为其著录的基本单位。它是最简单的文献报道形
式,一般无简介或摘要。
题录通常包括:篇名、作者(或含其所在单位)和出
处(所在刊名、卷期、页数、文种等),由出处导向
原文。
3.索引
索引是一种重要的检索工具,文献有了索引,就可使
读者迅速查获隐藏在文献内容所包含的知识单元。
英语叫做Index,原义指指引,音译为引得,它又称
“索隐”。
所谓“索引”,是对一组信息集合有系统的指引
(systematic guide),一般只起指引特定信息内容
及其存贮地址的作用。
索引通常有三部分组成:
标目(heading)
说明语(modification)
存贮地址(location)
在计算机检索系统中,索引由倒排文档通过连接来
实现。
4.文摘
(1)文摘的定义:
文摘(Abstract)是系统报道、积累和检索科技文献
的主要工具。
(2)文摘的结构:文摘通常由文摘的内容和格式两部
分组成。
文摘内容:文摘是文摘性检索工具的基本单位。是检
索的直接对象,它通常由题录部分,文摘正文和文摘
员署名三部分组成。
9611071 新型刚性可移式联轴器[刊]/黄连木
(重庆建筑大学),兰海//起重运输机
械,—1996。(5)—6~7
介绍了这种新型联轴器既自位补偿联轴器的
结构特点和实验结果。该联轴器的结构形式
歼击机工作原理有别于连形联轴器,与齿型
联轴器作了比较,指出其优点。图1表2(冬
草)
96※TH2—5※5
文献的文摘型电子条目如下:
文献的文摘型电子条目如下:
(3)文摘的类型:
文摘按内容压缩程度分,可分为指示性文摘和报道性
文摘两种。
①指示性文摘(Indicative abstract):又称解题性文
摘,字数一般限制在100字左右(西文则以30个词为
限)。它实际上就是“简介”。例如,美国《工程索
引》就是指示性文摘。
②报道性文摘(Informative abstract):字数一般限
制在400—500字(西文则为200个词)。例如,我国
的《分析化学文摘》等。
5.全文数据库
全文数据库是计算机检索系统诞生后出现的一种新型
检索工具,不仅具有其他类型检索系统的检索功能,
而且还能揭示文献全貌的检索系统。满足了人们方便
、快捷地检索到原始文献信息的需求。如超星数字图
书馆、CNKI中的中国期刊全文数据库、SpringerLink
等。
6.搜索引擎
搜索引擎是因特网上最重要也是最常见、最流行的一
种信息检索工具。搜索引擎是Intemet上一个网站,也
可以是网站中的部分功能,它的主要任务是在Intemet
中主动搜索其他Web站点中的信息并对其自动索引,
其索引内容存储在可供查询的大型数据库中,当用户
在搜索框中输人检索词或检索表达式查询时,该网站
会告诉用户包括该字词信息的所有网址,并提供通向
该网址的链接。
二、检索途径
检索途径又称为检索点(access point) 、检索入口或
检索标识,指用户进行信息检索的出发点和依据,它
是由信息的内部特征和外部特征构成的。
2.分类检索
分类(classification)检索是从文献内容所属的学科类
别出发来检索文献。
目前,我国广泛使用的《中国图书馆图书分类法》就
是一种典型的体系分类语言。
现以《中国图书馆图书分类法》(简称中图法)为例,
《中图法》有五个基本部类,即马克思主义、列宁主
义、毛泽东思想;哲学;社会科学;自然科学、综合
性图书。共有22个基本大类。
图书分类的结果是使每种图书都获得一个分类号。例
如,儒家思想方面的图书归纳到B222;将有关计算机
程序语言为TP312;大型水电站为TV741。
《
中
图
法
》
分
类
表
A
B
C
D
E
F
G
H
I
J
K
N
O
P
Q
R
S
T
U
V
X
Z
马列宁主义、毛泽东思想
哲学
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言
文学
艺术
历史、地理
TB 一般工业技术
自然科学总论
TD 矿业工程
数理科学和化学
TE 石油
天文学、地球科学
TF 冶金工业
生物科学
TG 金属学、金属工艺
TH 机械、仪表工业
医药、卫生
TJ 武器工业
农业科学
TK 动力工程
工业技术
TL 原子能技术
交通运输
TM 电工技术
航空、航天
TN 无线电电子学、电信技术
环境科学
TP 自动化技术、计算机技术
综合性图书
TQ 化学工业
TS 轻工业、手工业
TU 建筑科学
TV 水利工程
2.主题检索
主题途径,即根据代表检索内容实质的主题词来查找
信息的途径。对课题内容进行分类分析,选择能表达
主题概念的语词,确定主题词、标题词、关键词和叙
词。如,美国《工程索引》中的《工程标题词表》、
我国的《汉语主题词表》、《化工汉语主题词表》、
《农业主题词表》等。
3.著者途径
对于西方作者通常也是按姓氏(family name)查找
,表达方式可将姓氏放在前,而名字(given name
)在后,形成倒叙形式,这时姓名中间往往插入一个
逗号,如:Berger, P. R. ,首先检索姓氏Berger。
已知课题相关著者姓名,便可以依著者索引迅速准确
地查到特定的资料,因此亦具有特性检索的功能。
4. 题名途径,即根据文献题名来查找文献的途径。文
献题名主要指图书名称、期刊名称、篇名、专利名称
、标准名称等。
5.号码途径,即根据文献的编号为特征进行检索查找
信息的途径。利用各种号码索引(报告号、合同号、
专利号、标准号、化学物质登记号等)来查找文献。
一般按照字母顺序或号码顺序来排列。
五、检索程序
(一)分析检索课题,明确检索目的、要求和检索的
范围
通常检索目的可分为三种:
1.科研攻关型
2.课题普查型
3.研究探索型
例如有人需要查找作为首饰用的“变色钻石”
(二)根据检索课题的要求,选择检索工具
或数据库
(三)制定检索策略
(四)确定检索途径
(五)选择检索方法
(六)获取原始文献
六、检索效果的评价
评价检索结果的标准主要是查全率和查准率,相对应
的漏检率和误检率。
评价指标:
检出相关文献量
检全率 
100%
系统中相关文献总量
检出相关文献量
检准率 
 100 %
检出文献总量
评价指标:
漏检相关文献量
漏检率 
100 %
系统中相关文献总量
误检文献量
误检率 
 100 %
检出文献总量