网络科技信息检索方法与技巧

Download Report

Transcript 网络科技信息检索方法与技巧

网络科技信息
检索方法与技巧
武汉大学信息服务中心
李云华

德国柏林图书馆门前有这样一段话:这里是知
识的宝库, 你若掌握了它的钥匙,这里的全
部知识都是属于你的。
这里的“钥匙”即是信息检索的方法。

于科研工作者,信息检索能力:

有助于节约时间, 提高科研效率。
有利于减少课题的重复研究,提高科研成功率。
是获取新知识的捷径。


内容要点
 网络资源介绍
 数据库检索方式
 数据库检索的基本方法和技巧
 免费科技信息资源的获取
网络资源的优点
 资源丰富
 查询方便
 快捷
 低成本
网络资源的不足



质量良莠不齐(注意鉴别)
首选:gov(政府类)、edu(教育类)、
org(非赢利组织)、 ac(学术类)
次选:com(商业)、 net(网络)
信息庞杂无序(需要掌握一定的检索方法和
技巧)
时效性(注意更新时间)
!!!

Internet上可以免费利用的信息非常丰富,但
它不能替代图书馆订购的专业数据库。
图
书
馆
数
据
库
专业性、学术性强
整理有序
可信
可靠
准确
内容要点
 网络资源介绍
 数据库检索方式
 数据库检索的基本方法和技巧
 免费科技信息资源的获取
简单检索、高级检索、专家检索
Wiley数据库—简单检索
Wiley数据库—高级检索
Wiley数据库—出版物浏览
Wiley数据库—学科浏览
Springer数据库各种检索方式
Elsevier数据库各种检索方式
数据库检索的基本方法和技巧

数据库检索的基本方法


字段限定检索
布尔逻辑检索
截词检索
位置检索
短语检索

数据库检索的技巧

检索策略的制定
检索策略的调整




字段限定检索
字段限定检索可限制检索词在数据库内查找范围
使用字段限定检索时应注意:
1.用字段限定检索对检出文献数量和相关程度有极大影响。
例如:在全文 、文摘、关键词、题名字段中检索 ,则从左到
右检索 范围缩小,检索出文献的数量也随之减少,但检索出文献与
课题的相关性提高。
2.各数据库基本检索字段标识符号不完全相同,所以在使用前必须参考
各数据库的使用说明。
中、外文数据库常用检索字段列表
西文数据库常用字段
中文数据库常用字段
字段名称
字段代码
Abstracts
AB
文摘
Author
AU
作者
Corporate Source/Affiliation
Source/Address
CS/AF
机构名称
Subject/Topic
DE
主题词
Document Type
DT
文献类型
Full-text
FT
全文
ISSN / ISBN
ISSN / ISBN
国际标准连续出版物号/
书号
Journal Name/Source Title/Publication
Title
JN/ST
期刊名称
Keyword
KW
关键词
Language
LA
语种
Publication Year
PY
出版年
Title
TI
题名
Elsevier 数据库的字段
布尔逻辑检索
 与:AND ( * 、 All of These Words、并含 等)
例:A AND B
含义:检出的记录中A和B必须同时存在
 或:OR ( + 、l、 Any of These Words、或含 等)
例:A OR B
含义:检出的记录中A存在或B存在,也可同时存在
 非:NOT ( — 、AND NOT、 None of These Words 、不含 等)
例:A NOT B
含义:检出的记录中包含A但不包括B。
(排除无关记录)
布尔逻辑关系
逻辑“与”:缩小检索范围,提高查准率。
 逻辑“或”:扩大检索范围,提高查全率。
 逻辑“非”:缩小检索范围,提高准确性。
 布尔逻辑算符的优先级:
()>NOT>AND>OR

布尔逻辑检索在课题检索中的应用

课题1:查找干旱(水分胁迫、干旱胁迫、水分亏缺)对
水稻基因表达的影响。
检索式: (干旱 OR 水分胁迫 OR 干旱胁迫 OR 水分
亏缺)AND 水稻 AND 基因表达

课题2:发育调控基因DAD1、SCARECROW、DDM1、LHP1的表
达活性研究
检索式:(DAD1 OR SCARECROW OR DDM1 OR LHP1) AND
activity
截词检索

在检索外文数据库时,常遇到一个词有多种形
态,如单复数,动词、名词、形容词等词性的
不同,英美拼法不同等。如果检索时遗漏了某
些形式,将会造成漏检,影响查全率,但是如
果将这些词全部列出,会很繁琐,增加检索时
间和费用。

截词检索:是指在检索标志中保留相同部分,
用相应的截词符代替可变化部分,计算机会将
所有含有相同部分标志的记录全部检索出来。
截词检索

常用截词符号:
*
*
?
通常代表任意一个或多个字符
? 通常代表一个字符

截词检索可以减少检索词的输入量、扩大检索
范围,提高查全率。
截词检索——后截断

在检索字符串后方截断有限或无限的字符。
如: Econom*
可检出Economy、 Economics 、
Economist, Economize……
Economical、
截词检索——前截断

在检索字符串前方截断有限或无限的字符。
如:*chemistry
可检出:microchemistry(微量化学),
macrochemistry(常量化学)
……

目前较少使用
截词检索——中间截断

在检索词中间嵌入截断符号,允许检索词中间有若
干形式的变化。主要解决一些英美拼写不同,单复
数形式不同的词的输入。
如:输入wom
*
n
输入defen * e
defense
可检出: woman、women
可检出: defence、
使用截词检索注意事项

截词运算符(?*)在不同数据库中表示的含义
不同。

所截词根不能太短,否则会输出许多无关文献。
位置检索

表达各个检索词之间的顺序与相对位置关系。
如:“GPS在铁路桥中的应用”,可用Using
of GPS in Railway Bridge也可用Using of
GPS in Bridge of Railway来表达

常用的位置算符有:W、nW、N、nN、F、SAME

位置算符通常只出现在英文数据库中
位置检索 —— W
nW
W—WITH的缩写
W:两词相邻,中间不可插词,但两词间可有
标点符号、连字符或空格。词序不变 。
例:输入potential (W) energy
可检出 potential energy、 potential-energy、
potential,energy
nW:两词之间允许插入0-n个词,词序不变。
例:输入 sequence
可检出sequence
sequence
sequence
2w analysis
RNA analysis
DNA analysis
Amino Acid analysis
……
位置检索 —— N
nN
N—NEAR的缩写
N:两词相邻,中间不可插词,但两词间可有一个标点、连
字符或空格。词序可以变化。
例:输入database (N) management
可检出 database management 或 management database
nN:两词中间可插入0~n个词,词序可以变化。
例:输入environment (2N) protection
可检出 environment protection
protection of the environment
protection of water environment
protection of forest environment
……
位置检索 —— SAME/sentence
SAME:同句检索,即两词出现在同一自然句中。词序及两个
检索词之间的词量不受限制。
例如:输入environmental SAME protection
可检出environmental justice and health
protection
试试SAME在Web of knowledge数据库中的应用
短语检索(词组检索)
将一个专业词组或短语用双引号“ ”括起来
作为一个独立运算单元,进行严格匹配。可
以提高检索的精确度。
例:“Global Positioning System”
(全球定位系统)
各种检索算符的灵活应用
 课题:在SCIE数据库中查找“发育调
控基因的表达活性研究”
发育调控基因:developmentally regulated
genes 、 functional gene 、 expressed
genes
表达活性:activity、activities、active、
activated、activation、、、、、、
 检索式:(“developmentally
regulated genes” OR
“functional gene” OR
“expressed genes”) AND activ*
数据库检索的基本方法和技巧

数据库检索的基本方法


字段限定检索
布尔逻辑检索
截词检索
位置检索
短语检索

数据库检索的技巧

检索策略的制定
检索策略的调整




检索策略的制定
 分析检索主题,根据检索要求确定检索词
 根据学科选择数据库(注意数据库所收录文献的学科、文
献类型、回溯年代、语种、更新频率等 )
 选择检索字段(您所输入的检索词出现的位置,如:篇名、
作者、摘要、作者单位等)
 限定检索条件(如年代、学科、文献类型、语种等)
 正确应用各种检索算符
 根据检索结果对上面的检索步骤进行调整
分析主题注意
有些课题的实质性内容往往很难从课题名称上
反映出来,需要从中提取隐含概念,另外有些
检索词已含有的概念,在选词时应予以排除。
例:
课题名称
涉及概念

垃圾的处理
垃圾 处理 回收 再生
内弹道高温高
压高密度的气
体状态方程
玻璃纤维增强
石膏制品
内弹道 状态方程
玻璃纤维 石膏
检索词的选取原则及注意事项
 优先选用规范化主题词和专业术语,兼顾自由词;
如:海绵
自由词表述:海绵
规范化主题词表述:聚氨酯泡沫塑料
 注意词的全称、简称及缩写;
如:WTO(World Trade Organization)
检索词的选取原则及注意事项
 注意外来词的译写变化
Markov
马尔柯夫 (引自词表)
马尔可夫 (引自辞海)
马尔科夫 (用户提供)
马尔克夫
检索词的选取原则及注意事项
 必要时应向上位类或下位类词扩检
课题:苯胺的烷基化反应催化剂研究
原检索式:苯胺*烷基化*催化剂
上位词——烷基化
下位词——甲基化
乙基化
修订后检索式:
苯胺*(烷基化+甲基化+乙基化)*催化剂
检索词的选取原则及注意事项

灵活使用同义词、近义词、相关词等

同义词:布鲁氏菌病(地中海热、马尔他热、波状热 、传染
性流产……)

同一概念的几种表达方式,如化学分析有 chemical analysis,
analytical chemistry,chemical determination,
composition measurement等。

同一名词的单数、复数 、动词、动名词、过去分词形式等,
如生产有 product,production,producing,produce,
productive等,词根相同时,可用截词符解决( product*)。

植物和动物名,其英文和拉丁名均要选用。
检索词的选取原则及注意事项

避免选用对课题检索意义不大的检索词:如
“分析”、“研究”、“应用”、“方法”、
“发展”、“开发” 、“设计”、“展望”、
“影响”、“制造”、“提炼”等一些高频词。
检索词的翻译

全国科学技术名词审定委员会的科技名词
词典
http://www.cnctst.gov.cn/

利用中国期刊网翻译助手
http://dict.cnki.net/
科技名词词典
翻译助手
选择数据库
根据检索目的,选择不同类型的数据库
 对某一问题做大致的了解(可选相关学科的全文库)
 了解某一专题的最新研究动态及发展趋势(可选更新
速度快的全文库)
 对某一课题做全面的调查研究,了解该课题的整个发
展过程(可选收录时间跨度长的文摘题录型数据库)
 对某一课题做深入的研究,并在此基础上提出创新的
观点(可选相关学科的权威的文摘题录型数据库)
数据库检索的基本方法和技巧

数据库检索的基本方法


字段限定检索
布尔逻辑检索
截词检索
位置检索
短语检索

数据库检索的技巧

检索策略的制定
检索结果的评价
检索策略的调整





检索结果的评价

在得到检索结果后,可能会出现以下两
种让人不太满意的情况:
检索结果过少,漏掉了相关文献
检索结果过多,很多文献不相关
检索策略的调整——扩大检索范围
检索结果过少,漏掉了相关文献
放宽检索要求,提高检全率:





放宽检索范围:学科领域、时间、文章类型,关键词出现的字段
等;
将描述检索主题的词想全,包括同义词、近义词、缩写形式、上
位词;
使用单词的单数检索,可以检索到大多数单词单数、复数和所有
格,不规则单词除外;
如:city 可以检索出 city cities city’s cities’
减少用“AND”或“NOT”算符联结,增加用“OR”联结检索词;
采用截词检索、模糊检索等;
检索策略的调整——缩小检索范围
检索结果过多,很多文献不相关
进一步限定检索,提高检准率:
 严格限定检索范围:学科领域、时间、文章类型,关
键词出现的字段等;
 选择与检索主题密切相关的词和专业术语;
 避免使用过于宽泛的词汇;
 使用词组检索或位置检索;
 在检索结果的基础上进行二次检索;
 增加用“AND”或“NOT”算符联结
课题:
最新的关于药物上瘾治疗方法的研究
检索词:
Drug addiction(药物上瘾), therapy(治疗)
检索结果太少了?
 放宽检索范围:时间放宽、不限定学科领域、检索词可以
出现在文章任何字段。
 增加同义词:drug addiction的同义词drug dependence
therapy的同义词treatment
 使用截词符:如addict*可以检索出addict, addiction,
addicting…
 ……
内容要点
 网络资源介绍
 数据库检索方式
 数据库检索的基本方法和技巧
 免费网络科技信息资源的获取
 Google、Google学术搜索
 Scirus科技搜索引擎
 开放资源
Google
www.google.com .hk

Google学术搜索
http://scholar.google. com .hk

Google高级检索技巧






与(空格)、或(OR/I) 、非(-)
搜索整个短语和句子,用双引号“ ”
可对搜索的网站进行限制
可限定命中文件的类型(常用文件类型有doc、
pdf、ppt、xls、、、、、、)
将搜索结果限制为特定的域类型(例
如 .edu、.org 或 .gov)
限制搜索的关键字出现在网页的位置
。。。。。。
Google高级搜索
Google 学术搜索( Google Scholar )
 Google推出,专门搜索学术文章。
 预印本
 搜索结果中列出文章被引用次数。
 支持逻辑组配检索
例:外来入侵植物对土壤微生物群落影响
在搜索栏中输入:
(“Exotic invasive plants” OR “Exotic
invasive plants” OR “alien invasive
plants”) AND “Microbial community”
Google 学术搜索主页
Google 学术高级搜索
中文搜索引擎指南http://www.sowang.com
内容要点
 网络资源介绍
 数据库检索方式
 数据库检索的基本方法和技巧
 免费科技信息资源的获取
 Google、Google学术搜索
 Scirus科技信息搜索引擎
 开放资源
Scirus

2001年,Elsevier 和挪威搜索引擎公司合作开
发,专门面向科学家和科研人员的学术信息检
索工具

信息源包括:



文献类型:论文、专利、技术报告、预印本、
新闻等
以自然科学为主,也有部分社科资源。
http://www.scirus.com/
Scirus主页
Scirus高级检索
开放获取资源





免费数据库
高校或科研机构网站
专业网站(特别是学会、协会网站)
专业核心期刊网站
网络学科信息门户(subject portal)
。。。。。。
我馆整理的开放获取资源
李云华
[email protected]