科技文献检索

Download Report

Transcript 科技文献检索

科技文献检索
绪 论
什么是文献?
 文献:记录知识的一切载体
 根据载体形态文献大致可以分为:
• 印刷型文献---以纸张为记录与存贮介质,以手写、打字、印刷
等为记录手段。具有便于阅读和流传等优点。
• 缩微型文献---以感光材料为存贮介质,以缩微照相为记录手段。
具有存贮密度高,体积小,传递和保存够很方便等优点。
• 声像型文献---以感光材料和磁性材料为记录介质,借助特殊的
机械装置直接记录图象信息或声音信息而生产出来的一类文献。具有直
观真切,形象生动等优点。
• 电子型文献---以磁性材料为记录介质,以键盘输入或光学字符
扫描等为记录手段,并通过计算机处理后生成的一类文献。它具有存贮
密度高,自动存取速度快,原有记录可以改变、抹去或更新等优点。
为什么要学习文献检索?
 文献资源日益庞大
• 非科技文献,每10年甚至7-8年翻一番
• 科技文献,尤其是尖端科学的文献增加速度更快,如,原子能文献
每2-3 年就翻一番,且倍增周期逐年缩短
• 据估计目前每年出版的各种类型的科技文献有1000多万篇
 出版速度加快
据国外报导,1990年全世界出版
科技文献2000印张/秒
4-5种新书/小时
新增3种刊物/小时
 载体形式多样化
文献检索需要解决的问题……
如何从信息的海洋中获取我
需要的知识?
我们被信息的海洋包围着, 但是确被知识饿死了!
面对日益增长的文献资源,
如何通过一种有效的方法,以最
少的时间与精力来获取自己所要
的信息
──这就是文献检索所要解决的
问题。
学会了文献检索有什么好处?
 对于科技人员:文献检索是科技人
员必备的基本技能
 文献检索是科学研究的先期工作
一个科研人员的时间分配表
写报告
10%
实验研究
30%
查资料
50%
查资料
计划思考
实验研究
写报告
计划思考
10%
学会了文献检索有什么好处?
对于一般大众
 文献检索是知识更新的手段
• 通过文献检索获取学术动态
• 通过文献检索寻找未知问题的答案
 是能力的培养
• 提高自学的能力
• 文献检索课的一个重要目标就是培养学生的信息意识
“学而不思则罔,思而不学则殆”
----孔子
只读书不思考,即使读了很多书还
是于事无补,不会有什么用处;而离开
了读书,研究将无法进行,必然一无所
成。
自1984年国家教育部发出《关于在高等学
校开设“文献检索与利用”课的通知》以来,
全国各类高校都普遍开设了这门课程。
课程内容





文献及概念
检索语言及检索词表
信息资源的类型
计算机检索方法及技巧
典型数据库介绍及使用:
 Ei,INSPEC,SCI,PQDD,CSA(ISTP,NTIS)
 机检实习
 参考工具书介绍
课程安排
 教学方式
• 实习
• 讲课
 考核方式:
• 实习作业:30%
• 开卷考试:70%
第一章 文献检索的基本概念

第一节 文献的基本概念
• 1.1文献的类型
1.按出版类型划分文献可以分为:
1)图书(books):
国际上通常把48页以上,不定期出版的印刷
品称为图书。我国国家标准对图书的定义是:
“以印刷方式单本刊行的出版物。”
特 点 : 带有总结性、成熟定型;
出版周期长,信息传递慢;
传授知识,而不是报道最新信息。
图书一般分为两类:
阅读型:教科书、专著等
工具型: 字典、百科全书、年鉴、手册
全世界每年出版的图书有70万种之多,其中科技图书占
1/5~1/4
国际标准书号(ISBN)
(International Standard Book Number)
每一种正式出版的图书的唯一标识代码
例如: 信息检索原理与方法教程》,赵岩碧主编,化学工业出版社,2005
年3月出版。其ISBN号为:
ISBN 7-5025-6431-4
(旧号)
ISBN 978-7-5025-6431-5 (2007年后出版图书采用的新号)
第一段:978是由国际物品编码(EAN·UCC)系统专门提供给国际ISBN管理系统的产
品标识编码。
第二段:7 语区号,代表国家、地区、语种
如1-英,2-法,3-德,4-日,7-中
第三段:5025 出版商代号,由国家或地区ISBN中心分配;
第四段:6431 出版图书号,由出版商按出版顺序所给
第五段:校验位
网上的电子图书




超星数字图书馆
方正APABI数字图书馆
TPI英语模拟练习
SPRINGER电子丛书:SPRINGER出版的20种世界知名科技丛书,
包括计算机、物理、化学、生物、数学、地球科学、信息科学等。
2)期刊(journal , periodical)
 是指定期或不定期出版的连续出版物,出版周期最
长不超过一年。它采用固定的名称和统一的版式外
形,有卷期号或年月顺序号,每期内容不重复。
 同图书相比,它具有:
•
•
•
•
•
出版周期短
反映新成果及时
内容新颖
信息量大
品种多等特点
 据统计:大约有68%的科技信息来自期刊论文。科
技期刊的利用率最高,约占科技文献的84%,因而
科技期刊被称为最重要的科技信息源。
ISSN 号
正式出版的期刊有ISSN代码,即国际标
准连续性出版物编号
如,ISSN1001--8867为《中国图书馆学
报》的国际标准编号
核心期刊的鉴定
 《中文核心期刊目录总览》(2004版)可以到503
查阅印刷版
 《国外科学技术核心期刊总览》(2004版)
 各单位认同的核心期刊不尽相同,还应向单
位相关主管部门询问单位认同的核心期刊
 查询是否为核心期刊,可到网上核定。
http://web.asnc.edu.cn/kjc/zwhxqk2004.h
tm
• 中文
网上的电子期刊
1.中国期刊全文数据库
2.维普全文电子期刊
3.人大报刊资料
4.万方数字化期刊
5.大连理工大学研究生网络学刊 6.龙源期刊网
• 英文:
1.Elsevier
2.Kluwer
3. IEL
4. EBSCO
5. Springer Link
6. John Wiley
等等,更多期刊信息详见 图书馆主页-电子期刊-更多
会列出图书馆购买的所有电子期刊数据库,点击每一种期刊数
据库,都有对该数据库的介绍。
3)科技报告(report)
科技报告是与政府部门签有合同的科研项目的报告,是
科技工作者围绕某一专题从事研究所取得的科技成果的总结,
或是研究过程每一阶段进展情况的实际记录。
特点:
• 反映的是新兴科学和尖端科学的研究成果,能代表一个国家的研究
水平。
• 在形式上通常是一个报告单独成册,且注有研究机构名称和统一编
号。
• 在内容上它叙述详尽具体,数据完整可靠,技术专深全面,可直接
借鉴。
• 在发表速度上它快于期刊。
• 保密或控制发行 。
 目前,美、英、德、日等国每年产生的科技报告达20万件
左右,其中美国占80%,美国政府的AD、PB、NASA、
DOE四大报告在国际上最为著名。
科技报告分布
 检索科技报告的数据库:
• NTIS (美国《政府报告通报与索引》 的网络版,
主要检索美国政府的四大报告,不提供全文。)
 网上提供的免费的科技报告的全文
• http://www.lib.tsinghua.edu.cn/NEW/home612.h
tm (里面列出了一些可以免费检索科技报告的网
站)
4)会议文献(conferences 、
proceedings)
是指在各种学术会议上发表的论文、报告、讲演等
文献,并经编辑整理后的正式出版物。
学术会议历来是人们交流研究成果的重要场所。目
前全世界每年大约要召开数千个学术会议。会议种类繁多,
有大会、会议、学术讨论会、研讨会、讲习会、座谈会等。
由此产生了大量的会议文献。
会议文献是传播科技信息的重要渠道,许多新的发
现或发明往往最先披露于会议或会议文献中。一些定期举
行的学术讨论会往往成为对前一时期研究成果的一次大检
阅。而且,某些会议文献常常不在公开出版物上发表。
特点:
•
•
学术性很强,代表了某一学科或专业领域的最新研究成果及国内
外的水平发展趋势;
内容上与期刊、研究报告、图书等有一定的交叉重复。
网上检索会议文献的数据库
• 中文
 万方数据库 《中国学术会议论文全文数据库》主要收录
1998年以来国家级学会、协会、研究会组织召开的全国性学
术会议论文
 CNKI中国重要会议论文全文数据库收录我国2000
年以来国家二级以上学会、协会、高等院校、科研
院所、学术机构等单位的论文集,年更新约10万篇
论文。
• 英文
 WOSP 数据库包含将ISTP(科学技术会议录索引)和
ISSHP(社会科学及人文科学会议录索引)
全文。
系统本身不提供
 IEL美国的电气和电子工程师学会(IEEE)与英国的电机工程师学
会(IEE)共同推出的全文数据库。提供1988年以来两个学会的期刊
150多种、标准1350多种、会议文献5150多种
5)专利文献(patent)
 主要指专利说明书。它是实行专利制度的国家在受理专利申
请时,发明人所提交的书面文件。 在说明书中叙述该发明的
目的、用途、技术特征、效果、采用的原理方法,以及权利
要求等。
 专利说明书对发明描述比较具体,技术上比较新颖、可靠、
实用,并且融技术、经济、和法律信息于一体。
 除专利说明书外,专利文献还包括专利公报、专利文摘等。
它是一切从事研究开发活动和经济活动的人们必须参考的技
术资料。各种技术发明绝大部分都反映在专利文献中,只有
极少数例外。利用专利文献有助于科技人员借鉴国际先进技
术,避免重复劳动。
网上检索专利文献的数据库
商业数据:
• Derwent Innovations Index(世界专利索引) 收录来自全
球40多个专利机构(涵盖100多个国家)的一千多万条基本发明专利,
还同时提供了直接到专利全文电子版的连接。
免费资源:
• 国家知识产权局 http://www.sipo.gov.cn/ 可免费检索和下载中
国专利文献全文
• 万方数据库 中的专利技术类数据库,可检索从1985年至今授理的专
利。不提供全文。
• 欧洲专利局 http://ep.espacenet.com欧洲专利和世界专利的免费
检索,可下载PDF格式的全文!
• 美国专利与商标局 http://www.uspto.gov/patft/提供免费专利检
索
• Canadian Patent Database http://patents1.ic.gc.ca/introe.html可以检索七十五年来的150万篇加拿大专利,部分专利有全文
扫描图像。
•
6)技术标准(standard)
 是为产品质量标准化、产品规格化和系列化、零部件通用化
而制订的技术规定、规范和准则。
 一个国家的标准反映着这个国家的经济政策、技术水平、加
工工艺及标准化水平,它是一种重要的技术信息来源。
 技术标准的制订工作一般是由主管部门完成的。标准的新陈
代谢十分频繁,随着技术水平的不断提高,标准也需不断补
充、修改,国际经济贸易的发展又促使标准日趋国际化,因
而标准文献体现了本技术领域的发展水平,科技人员可以从
中获取大量有价值的信息。
 标准文献的特点是:具有独立完整性和法律约束性。
标准的种类
 标准按内容可分为:
(1)基础标准
准
(2)产品标准
(3)方法标
 按范围分:
(1)国际标准 (2)地区标准 (3)国家
标准 (4)专业标准 (5)企业标准
 按成熟程度分:
(1)正式标准 (2)试行标准
标准 (4)标准草案
(3)推荐
标准文献分布
 印刷版: ××室
 电子版:
• 万方数据库 中的《中国国家标准全文》数据库,
可检索中国的国家标准(GB)、各行业标准、
地方标准,可下载全文。
• 万方数据库 科技信息模块中的中外标准类数据
库,提供多种标准的检索,不提供全文下载。
• 中国标准服务网 http://www.cssn.net.cn/ 可免费
检索标准文献,不免费提供标准全文。
7)政府出版物(publications)
 指政府部门及其所属的专门机构发表出版的
配合政府工作的行政性文件和科技文献。如:
政策法规、决议指示、统计数据等。
 具有正式性和权威性的特点,对了解各国的
科技政策和科技发展状况具有独特的参考价
值。
8)学位论文(dissertation)
 是高等院校的研究生和本科生在获取博士、
硕士、学士等学位时必须提交的学位论文。
 它带有一定的学术性和独创性,内容较系统、
完整和详细,有一定的参考价值。
 由于学位论文是非卖品,故一般不出版,只
能提供复制件。
网上学位论文数据库
 国外:
 PQDD 收录了全世界1000多所著名大学理工科博、硕士学位论文,
可以下载1997年以来的学位论文的前24页全文。
 PQDD Full Text由教育部CALIS文理中心和工程中心组织各高校
联合采购ProQuest公司(原UMI公司)的国外学位论文,每个参
加成员馆每年购买约200篇学位论文全文,集团内所有的学位论
文共享,全文库收录的年限从2001年开始。
 国内
 万方学位论文中国科技信息研究所提供,并委托万方数据加工建
库 ,首次推出最近3年的论文全文10万多篇,并年增全文3万篇。
 CNKI 中国优秀博硕士研究生学位论文数据库
 大连理工大学研究生学位论文数据库 可检索1998年以来我校博
硕士研究生论文,不久以后就可以提供全文下载服务。
 CALIS全国高校学位论文文摘数据库 可检索211高校研究生学位
论文的题录文摘信息。
9)产品样本(products , samples)
 (说明书)是各国厂商或经销商为推销其产
品而发行的商业宣传品,是对定型产品的性
能、原理、用途、使用方法、操作规程、产
品规格、维修方法和价格等方面的说明。往
往配有外观照片、结构图,直观性强,技术
成熟可靠,是创造发明和产品设计时的重要
参考文献,是进行商品竞争的必经之路。缺
点是收集比较困难,不易分类管理和流通借
阅。
10)技术档案(files)



指生产建设、科技部门和企事业单位针对具
体的工程或项目形成的技术文件、设计图纸、
图表、照片等各种原始记录原件及复制件。
包括任务书、协议书、技术指标、审批文件、
研究计划、研究方案、试验记录等。
它是生产领域、科学实践中用以积累经验、
吸取教训和提高质量的重要文献。
技术档案具有保密和内部使用的特点,一般
不易获取,但它是一种重要的信息来源。
其他类型
 除以上10种主要文献类型之外,还有报纸、
新闻稿、手稿、地图、乐谱等。
 10种类型文献中,除图书和期刊分别作为两
种独立的类型外,其它8种均列入特种文献
资料类。
 10种文献类型中最重要的信息源是期刊、会
议论文和专利
文献类型
原始文献
图书
会
议
文
献
科
技
报
告
特种文献
专
利
文
献
学
位
论
文
期刊
政
府
出
版
物
标
准
其
它
从信息流看各种类型文献内容的不同
 信息流是如何产生的?
 从某一新闻事件入手,看看由该事件引起的
信息资料是如何演变的。
事情发生了......
1989年3月25日Exxon Valdex油轮漏油事
件,虽然发生在遥远的Alaska,但是几乎在
事件发生的同时,消息就出现在电视、广播、
报纸和Internet news services等各种资讯媒
体。
最原始的资讯(initial information)
 新闻报道
 资讯的焦点是:who, what, where, and
when
 无法关注的是:why
 特色是:即时的消息,概括性的报道
几周以后......
 杂志中陆续刊载相关报道。
 如Exxon Valdex油轮漏油事件:
• Church, George J.,"The big spill" (Exxon
Valdez oil spill in Alaska) Time v133, n15
(April 10, 1989):38.
• Barinaga, Marcia, "Fisheries first to suffer."
( Alaska oil spill) Nature v338, n6216 (April 13,
1989):533.
杂志(Magazines):
 读者:社会大众(knowledgeable layperson)
 范围:通俗话题;最新的事物
 作者:专业的记者;不一定是该领域的专家;
诗人、小说家、评论家
 时间:新颖(一星期到几个月內的议题或事件)
 篇幅:250 - 5,000字
 內容:仍然较强调报道:who、what、where、when、
和why;一般性的讨论;编者的意见;图表;照片;广
告。通常不提供资料来源和参考文献。
 观点:反映编者或是杂志的立场。
六个月以后......
 学术性期刊开始刊载相关主题的文章。
• 学者专家陆续召开相关的学术会议,会议上所发
表的文章陆续在期刊上发表,或者是发行会议论
文集。
期刊中有关Exxon Valdex油轮漏油事件的文章
"Alaskan oil spill: legal fallout." Trial v25,
n10 (Oct, 1989):26-33.
"Enhanced removal of Exxon Valdez spilled oil
from Alaskan gravel by amicrobiol
surfactant." Bio-Technology,v8,n.3
(1990) 228-230.
期刊(Journals)和会议论文(Conference Papers):
读者:学者、专家、学生(就是大家啰!!)
范围:研究结果,通常是理论性的、学术性的
作者:该领域的专家;常是具有博士学位的学者
时间:新颖(六个月到三年內的研究主题或议题)
篇幅:>2,500-10,000字
內容:详尽的推演;统计分析;图表;通常附有
参考文献
观点:理想上是要保持客观和中立;包含大量的
专有名词和专业术语,外行人不太容易了解;
通常是由专业学会所赞助
两年后......
有关该主题或事件的书籍陆续出版。有些
主题,可能不用等到两年就有书籍出版;有
些可能得等到十年后才会有专门的图书出版;
到底得等多久呢,那就得由市场需求、作者
和出版社而定了。
有关Exxon Valdex油轮漏油事件的图书
例如:
Exxon Valdex油轮漏油事件:
The Economics of a Disaster : the Exxon
Valdez Oil Spill /1995
Sea Otter Symposium: proceedings of a
symposium to evaluate the response effort on
behalf of sea otters after the Exxon Valdez
oil spill into Prince William Sound,
Anchorage, Alaska, 17-19 April 1990/1991.
图书(Books):
 读者:从一般大众到学者专家,当然包括学生
 范围:有关某一主题的深入介绍;或是汇编多篇学者
专家所撰写有关某一主题的文章




作者:学者;专家
时间:不一定(两年以上)
篇幅:150頁以上
內容:一般性的探讨或是深入的分析,通常附有完整
的参考书目
 观点:完全取决于作者;可能是由专业学会所
出版或是赞助
十年后......
经过了十年左右,对该议题或事件之认识
与知识,都已成定论,然后就会被收录在百
科全书(encylopedias)、手冊(handbooks)、
统计汇编(statistical compilations)等参
考资源中。
Exxon Valdex油轮漏油事件在百科全书中的记载
 When Technology Fails : Significant
Technological Disasters, Accidents,and
Failures of the Twentieth Century/1994
 Encyclopedia of Environmental Studies/1991
 World Book Encyclopedia/ 1997
参考资源(Reference Sources)






读者:从一般大众到学者专家,当然包括学生
范围:事实性的资讯;概览、摘要性的资讯
作者:学者;专家
时间:通常得四至十年才会出现在百科全书中
篇幅:
內容:相关知识的系统性介绍,包括背景,来龙去
脉;可能涵盖原始资料、统计、指南、书目等
 观点:应是客观、中立的;可能是由专业学会所出
版或是赞助
网络资源......
 www 在资讯流中扮演的是什么样的角色?
 据说每3秒钟,就有一个新的网站成立!
因特网上有关Exxon Valdex油轮漏油事件的信息
 International Tankers Owners
Pollution Federation, Ltd.
网络资源(WWW Resources):
 读者:一般大众;从儿童到资深公民(senior citizens);门外汉;学
者;任何人
 范围:热门话题;个人资讯;最新时事;政府资讯;研究;学术资讯;
笑话和游戏;还有.....
 作者:全宇宙;你、我、他;任何人;专业记者;小朋友;青少年;一
般大众;学者和研究人員;诗人和小说家;评论家;狂热份子;广告人;
大学生...(数不尽,道不完)
 时间:超时空;现在、过去、未来;新知旧闻;活的(持续更新)、死的
(没有更新)
 篇幅:高兴就好
 內容:什么都可以;一般性讨论;编者的意见;图表;照片(吓死人不
用负责);广告;统计分析;深入分析;事实;小说;流言(说谎不用缴
税)......想要什么,就有什么
 观点:各凭良心;可能反映编者或是网站架設者的立场;更可能是客观、
中立的;可能是学者的专业判断;也可能是完全没有根据的个人主观看
法;谁知道啊????
资讯资源总整理......
事件的报道
(文献与扩散)
电视/广播/Internet
news services
时间轴
秒/分
如何找
Web Search Tools;
TV News Indexes
报纸(印刷式)
天
报纸索引
杂志(印刷式)
周
期刊索引
期刊(印刷与电子)
图书
参考资源,如百科全书、
手冊(印刷与电子)
6个月+
2年+
10年左右
期刊索引;书目
图书馆目录(OPAC)
图书馆目录(OPAC);
书目
科技文献资源总整理
下面通过示意图,看看随着科学研究项目
的深入所产生的各种文献信息源。
实验室笔记
书目之书目
情报
利用
文献指南
百科全书
专 著
评 论
教科书
手 册
表 格
名 录
词 典
二次
替代
知识
综合
研究
发展
通 讯
非正式
交流
三年
期刊
论文
预印本
学术
会议
研究
报告
论 文
简 讯
快 讯
发明 专利文献
保护
一年
二年
替代
备忘录
初步
交流
时间0
知识
重组
书 目
文 摘
索 引
日 记
预印本
会议录
科技报告
学位论文
图1-5情报演变示意
查找资料的诀窍
找资料前,先想想看,你所关心的研究主
题位于资讯流的那一点上,再利用适当的参
考工具,必能事半功倍,快速找到适用的资
料。
2.按加工层次划分,文献可以分为:




一次文献
二次文献
三次文献
零次文献
1)一次文献:
 一次文献就是原始文献,是指作者以本人的
研究成果为基本素材而创作或撰写的文献,
不管创作时是否参考或引用了他人的著作,
也不管该文献以何种物质形式出现,均属一
次文献。大部分期刊上发表的文章和在科技
会议上发表的论文均属一次文献。如:专著、
报刊论文、研究报告、会议文献、学位论文、
专利说明书等。
2)二次文献
 二次文献也称二级文献,它是将大量分散、零乱、无序的一
次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科
学体系加以编排存储,使之系统化,以便于检索利用。其主
要类型有目录、索引等,如《中文科技资料目录》、《中国
科技期刊数据库》等。
 二次文献具有明显的汇集性、系统性和可检索性,它汇集的
不是一次文献本身,而是某个特定范围的一次文献线索。
 它的重要性在于使查找一次文献所花费的时间大大减少,二
次文献是查新工作中检索文献所利用的主要工具。
3)三次文献
 三次文献是科技人员在利用二次文献的基础上,对
一次文献进行广泛深入的分析综合后得到的产物。
 包括:综述、年鉴、词典、手册、百科全书、教科
书、评论、述评、进展、动态、指南等等。
 三次文献一般是由专家写成,水平较高,专业性强。
可供人们了解某一学科或专题的进展,了解其过去、
现在和预测未来的发展趋势。
4)零次文献
 是形成一次文献之前的信息,是没有正式发
表文献,如实验记录、手稿、原始录音、原
始录像、谈话记录等。
 零次文献本身是非出版物,是一种特殊形式
的信息源,它往往通过会议口头交流的形式
获得,信息比较新,而又不能通过检索工具
获得。
3.按载体形式,文献可以分为:
• 印刷型文献
• 缩微型文献
• 声像型文献
• 电子型文献
4.按相对利用率划分 文献可以分为:



可分为核心文献、相关文献和边缘文献。
确定所需学科国内外核心期刊的常用工具有
《中文核心期刊要目总览》、《国外科学
技术核心期刊总览》
各单位认同的核心期刊不尽相同,还应向单
位相关主管部门询问单位认同的核心期刊
第二节 检索的基本概念
2.1什么是信息检索
 广义:信息检索(information retrieval)是
指将信息按一定的方式组织和存储起来,并
根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索
(information storage and retrieval)
 狭义:仅指该过程的后半部分,即从信息集
合中找出所需信息的过程,相当于人们所说
的信息查询(information search)
2.2 根据检索手段的不同,信息检索
可分为:
1.
2.
3.
4.
手工检索
光盘检索
联机检索
网络检索(网络检索是信息检索的发展方向)
2.3 根据检索对象形式的不同,信息
检索又可分为:
1.
2.
3.
文献型信息检索(document retrieval):是以文献(包
括题录、文摘和全文)为检索对象的检索。凡是查找某
一主题、时代、地区、著者、文种的有关文献,以及回
答这些文献的出处和收藏处所等,都属于文献型信息检
索的范畴。完成文献型信息检索主要借助于各种书目型
数据库和全文数据库等。
数值型信息检索(data retrieval):是以数值或数据为
对象的一种检索,包括某一数据、公式、图表,以及某
一物质的化学分子式等。完成数据型信息检索主要借助
于各种数值数据库和统计数据库。
事实型信息检索(fact retrieval):是以某一客观事实
为检索对象,查找某一事物发生的时间、地点及过程的
检索,其检索结果主要是客观事实或为说明事实而提供
的相关资料。如:2001年7月通过的奥运会主办城市的
结果与过程。完成事实型检索主要借助于各种指南数据
库和全文数据库。
2.4
检索语言
标引员与检索员之间的约定语言
提供检索所需的文献特征
检索语言可分为两大类:
分类法
主题法
检索语言-概念
标引
在对文献进行组织管理的过程中给文献
赋予检索标识的过程。
给予分类号的过程称为分类标引;
给予主题词标识的过程称为主题词标
引。
检索标识
用来描述文献特征的情报检索符号,
检索标识的种类见图
著者
反映文献外部特征
检索标识
检
索
标
识
种
类
出版社
出版时间
其他
分类号
反映文献内容特征
检索标识
检索标识种类
分类语言
关键词 自然语言 主
题
人
主题词 单元词
词
工
语
标题词
语
言
叙词
言
检索语言-分类法
按学科门类区分图书,用分类号来表达文献主题内容,
以分类表作为文献分类标引的工具。
典型的如:
 杜威十进分类法
(Deway Decimal
Classification  Related
Index, DDC)




中国图书馆分类法(中图法)
中国科学院图书馆图书分类法(科图法)
国际十进分类法
美国国会图书馆分类法
检索语言-分类法-DDC
杜威十进分类法(DDC)
 总纲门纲目子目…
现以技术科学类目为例,来说明其
类目展开情况:
技术科学
工程学
机械工程
工程热力学

.3 电力工程
.31 电力的发生

.38 电子及电力通讯工程
600
620
621
.0
. 384
. 3841
无线电通讯工程
无线电原理
检索语言-分类法-中图法
将图书分为社会科学、自然科学、综合三
大类。 类目展开之式如图3-2。
检索标识即分类号,由字母和数字组成
采用等级列举表达从属关系
• 上位类目与下位类目的关系:
上位类目一定包含各个下位类目,
下位类目一定带有上位类目的属性。
• 分类号越长,表示的学科范围越窄。
.
为了清楚醒目, 通常分类号的第三位数字后,隔以 ,
如F279.712,TQ032.4
马哲
列学
社会科学
自然科学
A B C D E F G H J I K
马 哲社 政 军 经 文 语 艺 文 历
列 学会 治 事 济 教 言 术 学 史
、
、
主 科 、
科
地
义 学 法
学
理
、 总 律
、
毛 论
体
泽
育
东
思
想
TB TD TE TF TG TH TJ
一 矿 石 冶金 机 武
般 业 油 金属 械 器
工 工
工学 、 工
业 程
业
仪 业
技
表
术
图3 -1
N O
自数
然理
科化
学
总
论
P
地天
球文
科学
学、
Q R S T U V X
生 医 农工 交 航 环
物 药 业业 通 空 境
科 、 科技 运 、 科
学 卫 学术 输 航 学
天
生
TN
学无
、线
电电
讯、
技电
中 图 法 展 开术图子
TK
动
力
工
程
TL
原
子
能
技
术
TM
电
工
技
术
TP
自
动
化
计
算
TQ
化
学
工
业
TS
轻
工
业
、
手
工
业
TU
建
筑
科
学
综
合
Z
综
合
性
图
书
TV
水
利
工
程
检索语言-分类法-中图法
O 数理化 ……………………… … 一级类目
O1 数学 ……………………… … 二级类目
……
O3 力学 ……………………… … 二级类目
O31 理论力学 ……………… … 三级类目
O311 运动学 ……………… … 四级类目
.1 质点运动……… … … 五级类目
……
O4 物理学 ………………… … 二级类目
检索语言-分类法
主要特点就是按学科专业性质集中图书
•
•
•
•
区分不同性质的图书
集中性质相同的图书
性质相近的放在相近的位置
按照远近亲疏的关系把图书组成为一
个有条理的体系
• 提供从学科分类查找图书的途径。
中图法-索书号(call number)
 索书号又称为排架号
 反映了某种图书在整个图书组织中的排
列次序和在书库中的具体位置(架位)
 组成:分类号+书次号
分类号:按学科分类图书
书次号:同类书的排列
书次号的两种取法:
 种次号:按图书到馆的先后顺序给予号
码。
• 缺点:会使同一著者的同一类著作排放
在不同位置
著者号:按著者名称(代码)来区分同一
分类号下的不同文献
中图法-图书的排架顺序
按索书号排架
 先顺序分类号:
 如果分类号相同再顺序书次号
在题名、丛书
名中同时检索
分类法特点1
历史悠久,它为文献资料的分类、目录组织及查找等起
了很大作用。从检索角度讲分类法具有以下几个特点:
 易于族性检索
 按学科分类检索体系反映了事物的隶属关系、派生关系。族性检
索采用检索词的上位词及概念的外延进行检索,以扩大检索范围。
但在从属关系不清楚的情况下,要查找某一特定内容的命题,则
难以入手。
 不直观
 标识符是用号码来表示具体类目的含义,由编制者人为规定。只
有知道所要查找的文献的类号才有可能找到所需要的文献。
分类法特点2
 编制要求、项目设置相对稳定
 造成分类法的发展往往落后于科学的发展,
 新概念、新事物不易找到合适的类目 。
 学科间互相交叉和渗透,出现各种分支学科及边缘学科,
使一个概念在多个类目下出现,不同的标引人员会给出不
同的类号,造成漏检。
 由于分类具有上述三种不利因素,产生了某些
检索上的困难,由此而促使另一种情报检索语
言--主题语言的出现。
主题语言
 以自然语言为基础
 用表达概念的词来提示文献的内容
 标识符是文字。
• 如直接使用“金属陶瓷”、“感光材料”、“载重汽
车”进行标引。
 按主题词的字顺编排
• 查找方便、直观
• 不受学科从属关系的约束
• 能较好地满足特性检索的要求
主题法与分类法比较-检索标识不同
• 分类法
 检索标识--人为定义的
• 标引文献时,把语言文字所构成的概念转换成号码
• 检索时,检索者要在号码中找出相当于文字形式的概
念。
• 主题法
 检索标识--借用自然语言中表达概念的词,直
观易记,便于掌握。
例-聚丙烯纤维的生产工艺
例:查找聚丙烯纤维的生产工艺的文献
• 分类法:
 首先找到所属的分类号TQ346.2
 才能查到相关文献。
• 主题法:
 一篇聚丙烯纤维生产工艺的文献
 标引时,直接用主题词“聚丙烯纤维”及“工艺”
标引。
 检索时,只需直接用“聚丙烯纤维”与“工艺”二
个主题词组配检索,就能查到相关文献。
检索标识符的排列方法不同
 主题法
•
•
•
•
检索标识符按主题词的字顺排列
不受体系约束
增补新词方便
能及时反映学科的发展
 分类法
• 检索标识符按类号的逻辑次序排列,即按学科体系
排列,
• 其体系固定,
• 难以增补新概念
• 迟后于学科发展。
揭示事物的角度不同
 主题法
• 着眼于特定事物
• 以某一特定事物为中心,揭示与它相关的部分或全部
问题
• 有利于特性检索。
 分类法
• 学科体系为主
• 研究事物属于什么学科、以及它与其他事物间的相互
关系
• 利于族性检索。
对文献的集中与分散的角度不同
 主题法
• 同一主题的文献集中在一个标题下
• 同一学科的文献分散在不同的标题中
 分类法
• 同一学科的文献集中在一个类目下
• 同一主题的文献分散在不同的类目中
 特别因学科发展而引起的相互渗透,使有些文献
很难放在一个学科内。
例-化学分析
 主题法
• 在“化学分析”这一主题下,集中了所有
“化学分析”的文献,
 分类法
• “化学分析”这一主题的文献被分散在各学
科中,如在“金属学”“分析化学”“农业
化学” “原子能技术”……等学科领域中都
可能有“化学分析”文献。
对于专指的主题的揭示不同
 主题法
• 采用概念的组配或概念的提级来表达主题。
 分类法
• 不能组配标引
• 对专指的主题概念只能提级标引表达
例-标引有关“聚丙烯纤维”方面的文
献
主题概念--聚丙烯纤维
 分类法
• 只能标到分类号“TQ 346.2”
• 而关于聚丙烯纤维的各个研究方面无法细分
 需表达其各个研究方面时,只能提级仍以TQ 346.2标引。
 主题法
• 可采用“聚丙烯纤维”与“工艺”,“加工成型”
“性质测试”“聚合”等词组配以获得更专指的概
念。
 主题词字顺排列,所以前后主题词之间往往
是孤立的,不能表示学科体系的从属关系、
不能 显示 前 后词 之 间的 内 容上的联系 。 例
“双联开关”这个主题词在主题词表中存在,
但该词的前一词是“双联炼钢”,后一个词
是“双列杂交”。这三个彼此相邻的词在内
容上是毫无联系的。这种排列法相对于分类
法 讲 , 其 族 性 检 索 就 差 一 些 了 。
主题词法与分类法的比较
主题词法
分类法
检索功能 侧重于特性检 侧 重 于 族 性
索
检索
检索标识 主题词-文字 分 类 号 - 数
符号
码符号
排列方式 字顺排列
等级排列
主题词-种类




关键词
单元词
标题词
叙词
主题词种类-关键词(keyword)
 直接来源于从文献篇名、正文和文摘
 为具有实际意义的词语
• 禁用词(stop-term)如冠词,介词,副词等
除外
 关键词法属自然语言
主题词种类-关键词-问题
 同义词标引--引起漏检
• 主题检索体系是按主题词字顺排列的,而用
于标引的关键词呈现出多种字面形式-同义
词时,将使同一主题的文献分散到不同的字
顺位置,使查全率受到影响。
例:飞机 Airplane
Aircraft
Planes
主题词种类-关键词
 多义词标引--引起误检
多义词 cell  电池
两个完全不同的概念
 细胞
检索词 cell 查找细胞方面的文献
结果: 电池、细胞两方面的文献
同时被检出
主题词的规范化
为了避免上述现象,采用规范化的词
进行标引。
规范化,即词和概念一一对应,一个
词表达一个概念
规范化主题词-单元词
 词义已是单元概念不可再分
 规范词
例:单元词-汽车,温度表,电动机
非单元词-载重汽车  载重工具
 汽车
规范化主题词-标题词
 一组固定组配的规范化主题词
 组配:是指将两个或多个主题概念,按一定的规
则复合起来,以表达一个更专指的主题概念
 标题词有两级:
主标题词:表示事物、概念
副标题词:限定修饰主标题词,说明主
标题所涉及的方面
例:计算机科学-发展趋势
规范化主题词-标题词
主标题词除用单个名词或动名词外, 还
有下列三种形式:
正叙式
倒叙式
并列式
主标题词-正叙式
正叙式:直接采用事物的名称、现象、方法或
过程等词
COMPUTER PROGRAMMING
LANGUAGES
(计算机程序语言)
ELECTRIC POWER SYSTEMS(电力系统)
ELECTRON GUNS(电子枪)
IMAGE PROCESSING(图像处理)
MATERIALS SCIENCE(材料科学)
主标题词-倒叙式
倒叙式:将事物的名称放在前,后加修饰性的
词说明其范围。
COMPUTER,ANALOG(模拟计算机)
COMPUTER, DIGITAL(数字计算机)
OSCILLATORS,MICROWAVE(微波振荡器)
主标题词-并列式
并列式:将各自独立但又有某些联系的事物
或概念并列起来
如:PATENTS AND INVENTION
(专利与发明)
ROCKET AND MISSILES
(火箭与导弹)
SILICON AND ALLOYS
(硅和硅合金)
标题词与关键词、单元词的不同
表达主题概念:
关键词和单元词——用单个词
标题词——用一对词,而且这一对词的组配关系是
固定的
规范化主题词-叙词
 是指表示单元概念的规范化词语
 来源: 单元词+先组词
• 先组词是以“ 适当先组”的原理,把在一定
学科领域中,经常出现的组合词选作先组词,
以减少查找时不必要的组配
 如: 活性的(active)+ 碳(carbon)
 活性碳(active carbon)
碎裂(fragmentation)+弹药
(ammunition) 杀伤弹药
(fragmentation ammunition )
主题标引
 赋予二次文献检索标识-主题词
 主题标引的步骤:
分析文献内容  形成主题概念 
标引主题词 将标引主题词按字顺排列 
使论述同一主题内容的文献集中在一起
主题标引
通常,一篇文献所要表达的主题概念
或要涉及的问题不止一个,所以与分类
号不同,标引一篇文献的主题词通常不
止一个。
例:图书《工程材料的断裂与疲劳》
涉及主题概念:
工程材料、断裂、疲劳
主题标引
标引主题词:工程材料、断裂、疲劳
这样从这三个主题词中的任何一个入手,
都可以查到这本书
主题词表
分类表  图书分类的依据
主题词表  对文献进行主题标引的依据
单元词表、标题表、叙词表
下面对叙词表进行简单介绍
在叙词法中,文献的主题概念可以用多个叙词
表示,因此可以形成任意合乎逻辑的组配和众多
的检索途径。很适用于计算机情报检索。
第三节 计算机检索
3.1 计算机检索的发展历程
1. 脱机检索
2. 联机检索
3. 国际联机检索
4. 单机光盘检索
5. 光盘网络检索
6. Web信息资源检索
1.脱机检索(50年代末~60年代中期 )
 这时是计算机检索的原始时期,计算机由电子管组成,主要
存储介质是磁带、磁鼓,只能进行简单的检索。(第一台计算
机诞生于1946年,美国的宾夕法尼亚州)
 专业检索人员定期批量处理用户的情报要求
 用户不能立刻获得检索结果
 检索结果为题名,作者,文摘等。
 在脱机检索阶段,计算机主要进行文献目录、索引、文摘等
前处理工作。
2.联机检索(60年代末~70年代初)
 1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”
人-机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末
到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT
系统、MEDLINE系统都是从这个时期发展起来的。
 多个检索终端,通过通讯线路与联机检索系统中央计算机(主机)联接
 利用分时技术,使多个用户可同时与主机以“对话”方式进行检索
 用户可随时浏览检索结果
 由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到
地区的限制
3.国际联机检索(70年代中期-)
 卫星通讯技术的出现,使得联机检索系统打破了地域限制。
 而数据库生产的迅速发展及微机大量的涌现,更使得国际联
机检索蓬勃发展。
 用户利用终端设备,通过国际卫星通讯网与世界各地的大型
计算机情报检索系统中央计算机直接进行“ 人-机对话”,
查找世界各国的情报文献资料。
 联机检索系统进入发展的黄金时期。
国际联机检索的贡献
 方便和加速了世界情报资源的交流与利用
• 过去千里迢迢不能找到看到的情报资料,现在利用国际
联机情报检索终端,只用几分钟就可以从几年到几十年
几万种期刊中查到
 实现了人类情报资源的共享。
 优点:信息量大、快速、方便
数据库内容更新快
4.单机光盘检索(80年代--)
 CD-ROM技术促使计算机检索成本迅速下降
(一张光盘可存贮600〔MB〕兆字节机读数
据、成本价格便宜,而一张DVD光盘的容量
最少可达4.7G)
 光盘检索系统--普通的微机上配备光盘驱
动器及光盘数据库及检索软件
5.光盘网络检索(90年代-)

以太网技术的出现推动了网络版光盘数据库的出现。

光盘网络是一种计算机网络,如图书馆局域网

实现多用户光盘资源共享
例如:美国“化学文摘”(CA)从1987-1991年的五年累积
索引(含文摘)光盘数据库共6张,价值40.5万元。
6. Web信息资源检索(90年代末-)
 进入90年代后,随着网络技术的发展,尤其是互联网的迅猛
发展,使计算机检索进入一个崭新的时期。
 检索方法更简单,检索结果更全面
 经过40多年的发展,从早期的书目信息到后来的全文本信息,
到今天的网络与多媒体信息,网络信息资源已成为现代社会
不可缺少的资源财富。其处理技术从简单的字段与关键词检
索到全文检索,再到今天成为网络主流的超文本与多媒体处
理。 处理技术的演进与发展,一方面使网络信息资源的内容
从单一的书目到图文并茂的多媒体,更富有吸引力和使用价
值;另一方面,超文本的广泛利用改变传统的信息组织的线
性方法,使电子资源的组织更接近于“自然”,大大方便了
用户的使用,使电资源的利用变得非常容易,用户不需要太
多的检索知识与技术。
3.2现代计算机网络检索数据库的种类
1.按访问方式网络数据库可分为:
① 光盘局域网数据库。
② 传统的联机数据库。拨号,专线,费用昂贵。
③ 异军突起的Internet网络数据库。内容最丰富,
包括图书馆的馆藏目录、数字图书馆、专业数
据库、电子图书、电子期刊,搜索引擎……
2.
按是否收费网络数据库可分为:
① 商业数据库:内容系统、丰富、全面。图书馆通过购买
获得的都是商业数据库,如:Ei Village、《中国期刊网
全文数据库》。
② 免费数据库:逊于商业数据库。一般是由政府部门开发,
提供相关信息;或是暂未成熟收费的商业数据库。
如:美国能源部的官方网站,www.osti.gov 提供免费的
DOE报告全文检索和下载;
再如:http://www.sipo.gov.cn/ 国家知识产权局
的官方网站,可免费检索专利(带专利全文),
并提供知识产权方面的信息。
e-书时空,www.eshunet.com 提供大量电子图书供读者
免费下载。
3.按提供的内容网络信息资源可分为:
①
②
③
④
⑤
⑥
⑦
参考型数据库。指引用户到另一信息源以获得原文或其他细节的一
类数据库。包括各种书目数据库和引文数据库。这种数据库具有参
考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文
期刊数据库……
全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消
息全文库、法律法规全文库、博硕论文全文库等。
事实型数据库。直接提供事实或数值的数据库。如:万方的企业产
品数据库、彼得森大学指南等。
电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之
家、超星数字图书馆、各种数字图书馆等。
电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化
期刊,中国期刊网全文数据库,science online等
电子报纸。如:人民日报的网络版。
其它类型。如电子公告版(bbs),网络论坛、新闻等,
第四节 计算机检索的技术
可以参照Dialog 在线训练网站:
http://training.dialog.com/sem_info/ontap_pw.html
以Ei为例,检索前先输入“b 208”打开Ei数据库,然后再输
入检索指令
浙江大学图书馆关于Dialog检索的课件:
http://libweb.zju.edu.cn/aduser/service/lesson/Teach/Searc
hYan/Ch5/CH5.htm
4.1常用的检索方式
 命令检索(command search)
• 使用特定的操作命令来实施检索
• 灵活快捷迅速地进行检索
?S CS=(general (w) electric (f) Portland)
 菜单检索(menu search)
• 方便,易掌握,称“easy-to-use”检索
• 多用于光盘检索和web检索
4.2 布尔逻辑检索
 是当今检索理论中最成熟的理论之一,也是
构造检索表达式最基本、最简单的匹配模式。
布尔逻辑检索是通过布尔逻辑算符来实现的,
这些运算符能把一些具有简单概念的检索词
(或检索项)组配成为一个具有复杂概念的
检索式,用以表达用户的检索要求。
 逻辑运算符有三种:与、或、非
1. 逻辑与:一般用and或 *表示
 是一种用于交叉概念和限定关系的组配
 它可以缩小减缩范围,有利于提高查准率
 凡是用AND的检索式,AND两侧的检索词必
须同时出现在同一条记录中,该记录才算命
中
如:
? S AU=CHENG, GENGDONG AND
PY=1997:1998
?s Solar*Energy
2.逻辑或:一般用or或 +表示,少数数据库用 | 表示
 是一种用于并列关系的组配
 它可以扩大检索范围,防止漏检,有利于提高查全
率
 凡是用OR的检索式,OR两侧的检索词只要有一个
在一条记录中出现,该记录就算命中
如:
? S (AU=QIU, DAHONG OR AU=QIU, D.H. OR AU=QIU,
D H OR OR AU=QIU, DA-HONG OR AU=DAHONG,
QIU) AND CS=DALIAN
?s www + internet + network
3.逻辑非:一般用not或-表示,少数数据库用#或/表示
 是一种排斥关系的组配
 用来从原来的检索范围中排除不需要的概念或影响
检索结果的概念,有利于提高查全率
 凡是用NOT的检索式,NOT前面的检索词必须在记
录中出现而后面的检索词一定不能出现,该记录才
算命中
如:
? S OPTICAL NOT FIBER
?s Energy-Nuclear
Web of Science 中的逻辑运算举例
NOT
输入检索式
Semiconductor
nanometer nanoparticle nanofilm
Composite composites
Prepare preparation synthesize synthesis
 Semiconduct* and nano* and composite* and
(prepar* or synthes*)
选择文
献类型
优先顺序
 逻辑运算符的优先顺序为NOT、AND、OR
 如果要改变运算顺序需要用“()”
如:
A AND (B OR C)
逻辑“与”的缺点
 逻辑“与”只要求两个检索词必须同时出现在同一
篇文献中,而没有限定算符两侧检索词之间的位置
关系,有时难免造成误检。
 例如:查找“细菌对染料破坏”方面的文献
检索词:细菌、破坏、染料
采用逻辑“与”组配:细菌 and 破坏 and 染料
检索结果:命中同时用这三个词标引的文献
• 有“细菌对染料的破坏”方面的文献
• 也会有“染料对细菌的破坏”方面的文献
 要排除后一部分的文献,就需用位置算符限定词与词之间的位置
关系。
4.3位置运算符
 又称邻接算符(adjacent operators),适用于两个检索词以
指定间隔距离或者指定的顺序出现的场合。跟AND运算符
类似,但比AND运算符功能更具体。比如:通过
“communication AND satellite”进行检索时,命中的文献
可能既含有“communication satellite”,又含有“satellite
communication”;也可能含有“communication devices for
satellite” “communication links without satellite”等等。显然
其中有些记录与课题要求毫无关系。位置运算符可以用于
改进AND运算符的这种不足之处,因此,它们可以看成是
特殊功能的AND运算符。
 按照两个检索词出现的顺序和距离,可以有多种位置运算
符,而且对于同一功能的运算符,不同的检索系统可能有
不同的表达方式,也有的检索系统不支持位置运算符,检
索之前应该先看看数据库的帮助信息。
 常用位置运算符有(w)、(n)、(s)、(f)
1. (W)
 (W)算符中的W含义为“With”。
• 词序不许颠倒
• 两词之间不许插词,只允许出现空格或连字符号
 (W)算符还可以使用其简略形式--()
例如:
?S CD(W)ROM 将命中 CD ROM 或 CD-ROM
?S solar ( ) energy 检出 solar energy
?S CD (W) ROM / de, id
2. (nW)
 (nW)算符中的W 含义为“Word”
• 它允许两词中间可以插入0-n个其他词,包括系
统禁用词
• 词序不变
例如:
?communication (2W) satellite
将检索出含有communication satellite、
communication via satellite、communication on
the satellite的记录。
3. (N)
 (N)算符中的N含义为“Near”
• 词序可以颠倒
• 两词之间不许插词,只允许出现空格或连字符号
例:
?S cross (N) section
可检出 cross section 和 section cross
4. (nN)
 (nN)是(N)算符的变形
• 检索词之间允许插入0-n个词,包括系统禁用词
• 词序可以颠倒
例如:
?cotton (2N) processing
可检出cotton processing、processing of cotton、
processing of Egyptian cotton
5. (S)
 (S)算符中的S含义为“Sentence”
• 词序可以颠倒
• 两词必须出现在同一句子(子字段)中
(在EI的AB字段中为在两个句号之间同时出现,在
DE字段中为在两个分号之间同时出现)
tio2 same nano* same composite* same (prepar* or synthes*)
6. (F)
 (F)算符中的F含义为“Field”
• 两词必须出现在同一字段中
• 词序不限
例如:
? pollution (F) control
可检出control and management of industrial
pollution
(F)与and的区别
 (F)邻近算符指定两个检索词在同一个字段
中出现,而AND布尔逻辑组配中的两个检索
词会出现在不同的字段中
 此外同位置运算符相比,AND可以连接两个
以上的检索词,还可以两个以上的检索集合
进行组配。
例如:
au=cheng, gengdong AND cs=dalian AND
py=1998或 s1 and s2 and s3
4.4 截词算符
 截词算符就是使计算机保留检索词中的相同词干
部分,允许检索词可有一定范围的变化,这种功
能可减少输入步骤,简化检索程序,扩大检索范
围,从而节省机时,降低费用,提高查全率。不
同的数据库有不同的截词符,DIALOG系统用
“?”,ORBIT系统用“+”,此外还有的系统用
“$”或“*”
 截词有前方一致、后方一致、中间一致和中间屏
蔽四种形式。
 截词是计算机检索中常用的方法,尤其是英语的
单词词尾变化较多,为避免漏检经常要使用前方
一致的截词检索。
1.前方一致
 也叫后截断,将截词符置于一个字符串的后面,以
表示其后的有限或无限个字符的检索。
• 无限截词
如:
? Physic?
可检出physic、physical、physican、physicalism
• 截断两个字符
如:? physic??
可检出physic、physical、physican 中间有一个
• 截断一个字符
如:? textile? ?
可检出textitle、textitles
空格
2.后方一致(支持的检索系统较少,EI光盘不支持)
 也叫前截断,将截断符置于一个字符串的前
面,以表示其前的无限个字符的检索。
 均为无限截词。
如:? ?polymer
可检出polymer、copolymer、homopolymer
3.中间截断
 也叫中间屏蔽
如:
? defen?e
可检出defence、defense
? fib??s
可检出fibers和fibres
 Web Of Science平台:
Lap*roscop*
可检索到
Laparoscopic, Laproscopic,Laparoscopy
CSA平台:
截断任意个字符
patent* 可检索到patent, patents, patentable;
h*ophilia 可检索到haemophilia, hemophilia;
? 截断一个字符,在单词中最多可使用三个 ?,
wom?n
可检到woman, women;
fib??
可检到 fiber, fibre;
*
人大复印报刊资料全文书库:
! : 两词(字)之间允许隔零个至多个字,最多允许出九个“?”
例:旅游!!企业 可检索到 “旅游企业”、“旅游服务企业”、“旅
游重点企业”等
? : 两词(字)之间允许隔几个字,相隔字的个数等于出现?的个
数,最多允许出九个“?”
例:旅游??企业 可检索到 “旅游服务企业”、“旅游重点企业”等
4.中间一致(支持的检索系统较少,EI光盘不支持)
 词头词尾都可变化
如:
? ?wave?
可检出wave、waves、microwave
4.5检索限定




字段限定
时间范围限定
分类限定
语种限定等
1.字段限定
 字段限定也是调整检索策略的一种重要手段。多数检索系
统对不指定字段的检索词通常在所有字段(all field)或所
有基本字段中进行检索。如果想指定在文献的题目等特定
字段中检索,就需要使用字段限制。字段限制适用于在已
有一定数量输出记录的基础上,通过指定字段的方法,减
少输出篇数,提高检索的查准率。
• 例如:
? OPTICAL NOT FIBER
在EI98光盘中有14799条记录。
• 字段限制的优先级要比逻辑运算符的优先级高
• 要把OPTICAL NOT FIBER限制在题名字段就要输入:
• ? (OPTICAL NOT FIBER)/TI
2.Ei光盘中常用的基本索引字段
/TI
/AB
/DE
/ID
Title
篇名
Abstract
文摘
Descriptor 规范词
Identifiers 自由词
基本索引字段检索
 在Ei光盘中基本索引字段用后缀方式表示
如:
? Polymer/ti,ab
? Information (w) society /ti
? nondestructive(w)(testing or examination) /ti,ab,de,id
3. Ei光盘中常见的辅助索引字段
代码
AU=
CS=
CT=
解释
Author(著者)
Corporate Source(机构)
Conference Title(会名)
JN=
DT=
LA=
PY=
Journal Name(刊名)
Document Type(文献类型)
Language(语种)
Publication Year(出版年)
辅助索引字段检索
 在Ei光盘中辅助索引字段用前缀方式表示
如:
? LA=English
查找原文为英文的文献。
? PY=1993:1994
查找1993年至1994年间发表的文献。
复杂检索式的构造:
((ct or comput?(1w)tomography)
and (solid(s)rocket? or propellant?)
and (nondestruct? or ndt or nde or ndi ))
/de,id,ti,ab,1990-2000
检索1990年至2000年以来CT用于固体火箭无损检
测方面的文献, 在规范词、自由词、篇名及文摘
字段中检索。
第五节 计算机检索的常用方法
5.1 直接法(常用法)

直接法是指直接利用检索工具(系统)检索文献信息的方法,
这是文献检索中最常用的一种方法。它又分为顺查法、倒查
法和抽查法。
1. 顺查法
顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献
信息检索的方法。这种方法能收集到某一课题的系统文献,它适用
于较大课题的文献检索。例如,已知某课题的起始年代,现在需要
了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向
近期查找。
2. 倒查法
倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进
行文献检索的方法。此法的重点是放在近期文献上。使用这种方法
可以最快地获得最新资料。
3. 抽查法
抽查法是指针对项目的特点,选择有关该项目的文献信息最可能
出现或最多出现的时间段,利用检索工具进行重点检索的方法。
5.2 追溯法(引文法)
 追溯法是指利用已经掌握的文献末尾所列的
参考文献,进行逐一地追溯查找“引文”的
一种最简便的扩大信息来源的方法。它还可
以从查到的“引文”中再追溯查找“引文”,
像滚雪球一样,依据文献间的引用关系,获
得越来越多的内容相关文献。
 缺点:查全率、查准率较低,易误检漏检
追溯法—原始文献
追溯法—原始文献所附的参考文献
5.3 综合法
 综合法又称为循环法,它是把上述两种方法加以
综合运用的方法。综合法既要利用检索工具进行
常规检索,又要利用文献后所附参考文献进行追
溯检索,分期分段地交替使用这两种方法。即先
利用检索工具(系统)检到一批文献,再以这些
文献末尾的参考目录为线索进行查找,如此循环
进行,直到满足要求时为止。
 综合法兼有常用法和追溯法的优点,可以查得较
为全面而准确的文献,是实际中采用较多的方法。
第六节
计算机检索的步骤
 确定检索目标
 选择数据库
 编制检索提问式
 上机检索
 整理检索结果并对检索效率进行评
价
1确定检索目标

要进行信息检索,首先必须确定信息检索的目标,即对信
息用户的需求进行具体的分析,这种分析应主要包括以下
内容:
1. 明确检索的目的
明确用户是要查新、查参考资料还是查询论文被收录或
引用情况等,以便对检索的查准、查全和时间范围的指标要
求有一个大致的了解,从而制定出符合情况的检索策略。
2. 课题分析
对课题内容进行分析,找出核心概念和隐含概念,排除
无关的概念,明确概念之间相互的逻辑关系。
课题分析--直接从项目名称中确定检索概念
例 1 : 项 目 “ 聚 乙 烯 的 合 成 ( synthesis of
polyethylene) ”
 主 要 概 念 : 聚 乙 烯 、 合 成 ( synthesis 、
polyethylene )
 检索式:
• 聚乙烯 and 合成
• Synthesis and polyethylene
课题分析--找出隐含概念
例2:项目“灌溉用的橡塑多孔管”
Rubber-Plastic Porous Pipe For Irrigation
• 橡塑多孔管也称为橡塑渗灌管,其主要原料为橡胶粉(由
废旧轮胎制得)和塑料(如粉状聚乙烯)。隐含概念:橡胶、
塑料
• 该产品主要用于农林、园艺等方面的灌溉。
 主要概念:橡胶、塑料、多孔管、灌溉
 检索式:(橡胶 or 塑料 or橡塑) and 多孔管 and 灌
溉
课题分析--泛指概念具体化
例3:项目“唐山综合防灾的研究”
 由于唐山是一个城市,因此该项目实际上是“城市综合防
灾的研究”。
 该项目针对的主要灾害是地震、洪水和火灾,
 所采用的研究手段是决策支持系统和专家系统。
• 防灾 地震、洪水、火灾
• 研究决策支持系统、专家系统
 主要概念:城市、地震、洪水、火灾 、决策支
持系统、 专家系统
 检索式:城市 and (地震 or 洪水 or 火灾)and
(决策支持系统 or 专家系统)
排除重复无关的概念
 可避免漏检,节省检索费用。
例4:项目“河豚毒素的液相色谱分析”
 从项目名称上看,其主要概念为
 “河豚毒素”、“液相色谱”和“分析”,但由于液
相色谱本身就是一种分析方法,它隐含了“分析”这
一概念
 主要概念: 河豚毒素、液相色谱
 检索式:河豚毒素 and 液相色谱
2.选用合适数据库
 根据检索目标分析所确定的检索目的、涉及的学科
范围和信息类型,选择合适的数据库。
 具体选择过程中还应考虑数据库的类型(参考、全
文还是电子期刊)、内容(专利、标准、会议)、
收录的数据学科范围、数据库的更新周期,收录文
献的语种等因素。
 例如,要查新就要选择收录文献最全,更新周期快
的数据库;要看全文就要选用全文数据库或电子期
刊;要查标准或专利就要选择标准库或专利库。
3.使用适当的检索语言,构造检索表
达式
 分析各个检索词之间的位置关系和逻辑组配
关系
 分析检索词应该限定在哪个字段中检索(是
在所有基本索引中检索还是限定在分类、主
题、自由词、文摘还是其他辅助索引字段中
检索?)
4.上机检索
 上机检索是用户的实际操作过程,检索策略输入检
索系统后,系统响应的检索结果通常很难一次就能
满足课题的要求,例如,有时输出的篇数太多,而
且不相关的文献所占的比例很大,而有时输出的文
献数量太少,甚至为零。因此在检索的过程中用户
需要不断地根据检索结果对检索策略进行调整和修
改,包括检索词的重新选取以及检索提问式的重新
构造,经过反复的检索最终获得比较满意的检索结
果。
(1)输出篇数过多时
此时多数是由误检造成的,原因主要有以下几点:
1)没有对检索词进行限制。包括字段限制,时间限
制,分类限制等。
2)主题概念不够具体或具有多义性导致误检。例如,
仅使用mathematics进行检索结果很多,就需要
整检索策略,将概念具体化。
如:mathematics and economic
再如,检索世界贸易组织仅输入“WTO”,系统可能会检
索出“World Tourism Organization”(世界旅游组织)
3) 对所选的检索词截词截得过短。例如, 使用
math? 将有太多的检索结果。
(2)输出篇数过少时
此时多数是由漏检造成的,原因可能有以下几点:
1)选用了不规范的主题词或某些产品的俗称、商品
名作为检索词。
例如,没有使用学名“马铃薯”而使用了俗名“土豆”
又如,没有使用“表面活性济”而使用了商品名称“迪恩
普”,都会造成漏检。
2)同义词没有充分考虑。
例如,“检索物理化学”,没有考虑到“物理有机化学”,
“物化”等同义词,导致漏检。
3)上位概念或下位概念没有完整运用。
例如,“燃料”是上位概念,下位概念可以有“固体燃
料”、“液体燃料”、“气体燃料”,甚至还有“煤”、
“油”、“煤气”、“天然气”等,这些概念在检索
“燃料”时都应该加以考虑。
5.整理检索结果并对检索效率进行评价
 对检索结果进行整理,包括存盘、打印
 若是参考型数据库要想获取原文还必须记录
文献的来源信息,如:题名,作者,来源期
刊的刊名,年、卷、期、起止页等。
衡量检索效果的指标
检索出的相关文献量
查全率R=
(recall ratio)
数据库中的全部相关文献
x100%
检索出的相关文献量
查准率P=
(precision ratio)
检出的文献总量
x100%
最理想的检索结果是查全率和查准率都达到100%。
R100%表示数据库中收录的全部相关文献都被检索出来
P100%表示检索出来的文献全部都是相关文献
但事实上,检索中有许多因素使这个指标很难达到。
C.W.Cleverdon(英)进行
Granfield试验,得出
查全率R与查准率P曲线。
R
R-P之间存在着互逆关系
 A点
A
检索词数量多,泛指性强,
查全率较高但查准率却非常低
C
B点
D
检索词专指性较强,查准率就高
查全率因此降低
 C,D两点
两种极端的折衷。
查全率一般在60%--70%
查准率一般在40%--50%
B
0
查全率R与查准率P的关系曲线
无论怎样调整检索策略和改进系
统效率,都无法使P和R同时接近100%。
P
第七节 信息检索与毕业论文写作
毕业设计(论文)的基本教学目的是培养学生综合运用所
学的基础理论、专业知识和基本技能,提高分析与解决实际问
题的能力。毕业设计(论文)应从以下几方面培养学生的能力:
1.调查研究、查阅、获取、分析、综合文献资料的能力。
2.方案论证、分析比较的能力。
3.设计、计算、绘图与标准规范的正确选择的能力。
4.本专业常用手段、设备的应用及相关实验数据的获取及分析
处理能力。
5.外文阅读能力,计算机应用能力。
6.撰写设计说明书或论文报告的能力。
7.语言表达、思辩能力,阐述观点准确、清楚回答问题的能力。
毕业设计(论文)要按照各专业《毕业设计(论文)教学
大纲》要求进行,毕业设计(论文)的时间按培养计划执行。
毕业论文写作与信息检索的关系
文献检索是科学研究的先期工作
• 开题(了解前人对该问题的见解,避免走弯路)
• 科学研究具有继承性(利用和借鉴已有的知识)
“我之所以比别人看得更远,是因为站在巨人的肩膀上”
——牛顿
文献信息资料是学习和研究工作的基础,没有文
献信息资料就无法进行学习和研究,各个学习和研
究工作都将根据我们搜集到的文献信息资料来开展。
信息资源越丰富、越适应需要,学习和研究工作成
功的可能性就越大。这种可能性离不开对某学科过
去的研究成果、研究背景进行资料的搜集、分析和
利用,这对于较好完成学术论文有重大意义。
论文与参考文献的关系
参考文献是论文写作中的重要一环,带
着问题读文献或杂志上的论文,不但注意学
习学术内容,同时也注意学习选题方法、格
式、标准的套话、起承转合的语言和方式,
参考文献的写法,字体的运用等等。
在论文中明确给出参考文献的出处,既代
表着对前人成果的继承,也代表了对他人研
究成果的尊崇,是科学研究中应培养的正确
的科学态度和做人准则。
参考文献的作用
参考文献,附在论文结论之后,一般是公开发
表的资料。
作用有四:
1. 指明作者引用他人观点的研究成果的出处;
2. 便于读者据此进行追踪查阅原文,进行广泛深入
的探讨;
3. 反映作者对本课题研究的深度和广度。
4. 体现出作者严肃的科学态度,所写论文真实的科
学依据,也反映作者对前人的科研成果的尊重。
资料准备的原则
(1)全面
这个全面不是无限度的,一定限定在课题范围以内,与
选题有关的资料无论是事实、数据、观点、精彩论述等都
要系统收集,越多越细越好。另外还要遵循够用为原则的
标准,是建立在广泛收集基础上的够用原则,使用时要加
以精选。可以收集各种类型的文献,包括网络上的信息。
(2)真实准确
就是要做到确有其事,实事求是。在收集资料时,一方
面要查找原著,不能从引用者那里引用;另一方面,在找
到资料时记录一定要准确。
 一般论文引用的参考文献数为10~15条,综述应超过
20条
哪些类型的文献可以参考?
 按出版类型划分文献可以分为:
图书、期刊、报纸、会议文献、科技报告、
学位论文、政府出版物、专利、标准、产品资料、
科技档案
这些文献常见的载体类型有印刷版和电子版(电子
版按访问方式分:收费、免费)
获取全文的途径
1.直接找全文数据库
2.到图书馆(可以是大学图书馆、也可以是其他你能
够使用的图书馆,如市图书馆、省图书馆、国家图
书馆、各高校图书馆)借阅印刷版全文
3.到网上找免费资源,如专利、法律法规、新闻、一
些电子期刊和科技报告等。国家科技图书文献中心
(http://www.nstl.gov.cn/index.html)
4.发动同学。让同学利用他周围的资源检索,将全文
mail给你。
5.给作者写信,表明希望拜读的心愿,让作者给你提
供全文。
6.馆际互借。(有偿服务)
根据作者E-mail地址,向作者索要原文
Dear Mr./Mrs.: ________(Author name)
I am a graduate student of Harbin Medical University in China. I
major in "________"(您的专业). Recently, I found one of your
articles, titled "__________" (Title)in Medline. I found it may help me
achieve my goals in this research field. This would make a really
positive contribution to my work. I would like to be able to read the full
text of this article. The abstract makes the article sound very interesting.
I know there is usually a fee required to obtain the full article from
Medline; however, as a student, my only income is a small scholarship
which is about U S $30.00 per month. I wonder if you would consider
sending me the full text by Email. Perhaps you would consider this as
an act of friendship between our two countries.
Thank you for your kind consideration of this request.
Sincerely: ___________(your name)
My Email address is: ____________________ (your email)
Date:Month/day/year
如何引用文献
1、引用标注应完整、准确地显示被引作品的相
关信息
作者、题名、书刊名出版地、出版时间、
卷期、页次等。
2、对已有文献任何形式的引用,都必须注明出
处
3、原则上不采用间接引用方式
在学术研究中,转引在原则上是被禁止的。如无
法获得原作而要引用,必须明确注明“转引”,否
则为学术伦理规范所不容的“伪引”。(南大一教
授为标榜自己引《文明的冲突》出自外文原刊而非
中译本,想当然地在引文中将出处《外交》写成
diplomat(应为Foreign Affairs),结果被斥为“伪
引”,身败名裂,当众检讨了事。 )
4、引用以必要、适当为限
1986文化部《图书、期刊版权保护试行条例实施
细则》的数量限制:一般作品不超过被引用作品的
十分之一;引用他人作品的总量,不得超过本人作
品篇幅的十分之一。
5、引用不得改变或歪曲被引内容的原貌、原义
6、引文应做到不伪引,不烂引、尽量不自引
7、引用原则上使用最新版本
8、引用网络资源必须注意其"动态性"
出处包括网址和发布、更新或获取时间。
9.避免抄袭
• 抄袭就意味着剽窃,剽窃就意味着犯罪。为避免
抄袭,在利用资料时就一定要注意。对直接引语,
要逐字逐句抄写,并注明出处。对于间接引用,
应避免用作者原话要用自己的语言重新组织。,
参考文献标注法
 必须与主管部门、出版社、或与发表文章的期刊的规定
相符合。大多数出版社和杂志社都采用标准著录
规范的参考文献格式
 根据 GB 3469规定,以单字母方式标识以下各种参考
文献类型
参考文献类型
专著
论文集
报纸文章
期刊文章
学位论文
报告
标准
专利
文献类型标识
M
C
N
J
D
R
S
P
 对于专著、论文集中的析出文献,其文献类型标识建
议采用单字母“A”;
 对于其他未说明的文献类型,建议采用单字母“Z”。
 对于数据库 (database) 、计算机程序 (computer
program) 及电子公告 (electronic bulletin board)等电
子文献类型的参考文献,建议以下列双字母作为标识:
电子参考文献类型
电子文献类型标识
数据库
DB
计算机程序
CP
电子公告
EB

对于非纸张型载体的电子文献,当被引用为参考文献时需
要在参考文献类型标识中同时标明 其载体类型 。本规范建
议采用双字母表示电子文献载体类型:
磁带(magnetic tape)——MT,磁盘(disk)——DK,
光盘(CD-ROM)——CD,联机网络(online)——OL,
并以下列格式表示包括了文献载体类型的参考文献类型标识:
[文献类型标识/
[DB/OL]——联机网上数据库(database online)
[DB/MT]——磁带数据库(database on magnetic tape)
[M/CD] ——光盘图书(monograph on CD-ROM)
[CP/DK]——磁盘软件(computer program on disk)
[J/OL] ——网上期刊(serial online)
[EB/OL]——网上电子公告(electronic bulletin board online)
以纸张为载体的传统文献在引作参考文献时不必注明其载
体类型。
参考文献著录格式及示例 1
1
专著著录格式
[序号]著者.书名[M].版本(第一版不写).出版地:出版者,出版年.起止页码
例:
[1]孙家广,杨长青.计算机图形学[M].北京:清华大学出版社,1995.26~28
[2]Skolink M I. Radar handbook[M]. New York: McGraw-Hill, 1990
2 期刊著录格式
[序号]作者.题名[J].刊名,出版年份,卷号(期号):起止页码
例:
[3]李旭东,宗光华,毕树生,等.生物工程微操作机器人视觉系统的研究[J].北京
航空航天大学学报,2002,28(3):249~252
3
论文集著录格式
[序号]作者.题名[A].见(英文用In):主编.论文集名[C].出版地:出版者,出版年.起止页码
例:
[4]张佐光,张晓宏,仲伟虹,等.多相混杂纤维复合材料拉伸行为分析[A].见:
张为民编.第九届全国复合材料学术会议论文集(下册)[C].北京:世界图书出版公
司,1996.410~416
[5]Odoni A R. The flow management problem in air traffic control[A]. In: Odoni
A R, Szego G,eds. Flow Control of Congested Networks[C]. Berlin: SpringerVerlag,1987.269~298
参考文献著录格式及示例 2
4
学位论文著录格式
[序号]作者.题名[D].保存地点:保存单位,年
例:
[6]金 宏.导航系统的精度及容错性能的研究[D].北京:
北京航空航天大学自动控制系,1998
5
科技报告著录格式
[序号]作者.题名[R].报告题名及编号,出版年
例:
[7]Kyungmoon Nho. Automatic landing system design
using fuzzy logic[R].AIAA-98-4484,1998
6 国际或国家标准著录格式
[序号]标准编号,标准名称[S]
例:
[8]GB/T 16159-1996,汉语拼音正词法基本规则[S]
参考文献著录格式及示例 3
7
专利著录格式
[序号]专利所有者.专利题名[P].专利国别:专利号,出
版日期
例:
[9]姜锡洲.一种温热外敷药制备方案[P].中国专
利:881056073,1989-07-06
8 电子文献著录格式
[序号]作者.题名[电子文献/载体类型标识].电子文献的出处或可获得地址,
发表或更新日期/引用日期
例:
[10]王明亮.关于中国学术期刊标准化数据系统工程的进
展[EB/OL]. http://www.cajcd.edu.cn/pub/wm1.txt/9808102.html,1998-08-16/1998-10-04
说明:
1、参考文献应是公开出版物,按在论著中出现的先后
用阿拉伯数字连续排序.
2、 参考文献中外国人名书写时一律姓前,名后,姓
用全称,名可缩写为首字母(大写),不加缩写点,
如:
[2]Skolink M I. Radar handbook[M]. New York: McGraw-Hill, 1990
3、参考文献中作者为3人或少于3人应全部列出,3人
以上只列出前3人,后加“等”或“ et al”, 如:
[3]李旭东,宗光华,毕树生,等.生物工程微操作机器人视觉系统的研究
[J].北京航空航天大学学报,2002,28(3):249~252
毕业设计(论文)格式与相关标准
《西安财经学院大学生毕业设计(论文)工作管
理办法》
《2009届本科毕业论文模版》
 相关标准:
《科学技术报告、学位论文和学术论文的编
写格式》
GB/T 7713-1987
《文后参考文献著录规则》
GB/T
7714-1987