数据库检索的方法和技巧

Download Report

Transcript 数据库检索的方法和技巧

数据库检索的方法和技巧
图书馆
张彦洁
主 要 内 容
•
•
•
•
•
•
•
一 什么是数据库
二 什么是检索
三 检索技术
四 检索方法
五 检索技巧
六 各数据库的特点
七 几点体会
共性
个性
一 什么是数据库:
•
以同一组织方式将相关数据组织在一
起,并存放在计算机存储器上的,能够为多
个用户所共享的一组相关数据的组合。
•
形象地说就是“数据仓库”。
我馆数据库按文献类型划分:
期刊论文数据库
学位论文数据库
综合事实数据库
电子图书数据库
多媒体数据库
中国期刊全文
ScienceDirect
SpringerLink
数学评论期刊全文库
人大复印资料
EBSCO教育心理数据库
AIP & APS期刊全文数据库
IOP期刊全文、 国道特色数据库
中国优秀博士学位论文
河北师范大学学位论文
中国优秀硕士学位论文
万方资源系统
国研网
中宏数据库
北大法律
LexiseNexise学术大全
读秀学术搜索
超星电子图书
方正电子图书
美星外文图书
中国基本古籍全文库
网上报告厅
清华在线
超星名师讲堂
新东方网络课堂
我馆数据库按学科划分:
综合学科
自然与工程技术
人文与社会科学
中国期刊全文
ScienceDirect
人大复印资料
中国博士学位论文
SpringerLink
国研网
中国优秀硕士论文
AIP &APS物理期刊
中宏数据库
河北师大学位论文
数学评论期刊全文
北大法律
万方资源系统
IOP物理期刊
LexisNexis学术大全
读秀学术搜索
国道特色数据库
EBSCO教育心理
超星电子图书
万方资源系统
中国基本古籍
方正电子图书
美星外文电子图书
万方资源系统
二 什么是检索:
•
检索是文献组织者与检索用户依据文
献的内容特征(主题词、关键词、标题、
分类号等)和外部特征(著者、单位、出
版社及出版时间等)作相关性匹配的过程。
•
检索的本质:匹配
三 检索技术
•
•
•
•
•
•
检索技术:是指在计算机检索系统中,利
用计算机的信息处理能力为用户提供的各种词
处理或字处理的方法,各种运算能力,以方便
用户使用检索系统,以提高检索效率。
常用检索技术是多数检索系统具备的手段。
主要有:
1 布尔逻辑运算
2 截词检索
3 字段限制检索
4 其他
检索技术:布尔逻辑检索
• 布尔逻辑运算:
是将不同的检索词组配起来的主要方
法。适用于所有的数据库。
常用的逻辑运算有三种:
逻辑与
逻辑或
逻辑非
检索技术:布尔逻辑检索
• 逻辑“与”(用AND表示):
检索式“A and B”:表示文献中同时包含检索词A和
检索词B的文献才是命中文献。
若A=语文,B=教学,则A and B =语文教学
是检索词之间的相交关系运算,一般用于检索过程
中增加不同的检索词,以减少文献命中的数量,提高文
献命中的准确性。
检索技术:布尔逻辑检索
逻辑“或”(用OR表示):
检索式“A or B”:表示包含检索词A的文献,或者包
含检索词B的文献,或者同时包含检索词A和B的文献为
命中文献。
若A=语文,B=教学,则A or B =语文+教学+语文教学
是检索词之间的并列关系的运算,一般用于相同概
念的不同词,如同义词、相关词等,以增加文献命中的
数量,不遗漏相关文献。
检索技术:布尔逻辑检索
• 逻辑“非”(用NOT表示):
检索式“A not B”:表示包含检索词A,同时不包含
检索词B的文献为命中文献。
若A=语文,B=教学,则A not B =语文-教学
用于在某一记录集合中排除含有某一概念的记录。
检索技术:截词检索
•
在西文单词中经常会遇到词的不同变
化,为了保证不漏检,可采用截词的方法
处理检索词。
•
不同的检索系统所采用的截词符有所
不同,同一检索系统也会有变化。
检索技术:截词检索
• 外文数据库常用截词符:
• *(星号):取代单词中的任意个(0,1,2…)字母。
• 如:
Transplant
transplant*
Transplanted
Transplanting…
• ?(问号):取代单词中的1个字母。
• 如:
wom?n
Woman
women
检索技术:截词检索
国研网通配符:
!:表示0或1个任意字符,
?:表示1个任意字符。
例如:
想查找“股票”与“期货”中间包
含1-2个字的内容。
关键词为:股票!?期货
检索技术:字段限制检索
•
字段限制,即在文献的指定字段中查
找所包含的检索词。
•
字段限制的方法有两种:
• 1 在检索表单中选择相应的字段
• 2 采用字段名
检索技术:其他
•
•
位置检索:表达检索词出现时的位置关系。
相关性检索:按相关性顺序排列检索结果。
• 跨库检索:在一个检索平台上一次性完成对
多个数据库的检索。
• 引文检索:通过文献的引证关系显示文献之间
的内在联系。
四 检索方法
•
•
•
•
•
•
•
•
1 浏览
2 初级检索
3 高级检索
4 专家检索
5 自然语言检索
6 二次检索
7 跨库检索
8 个性化设置
原则:求简
检索方法
• 浏览 :通过导航逐步缩小范围,最后检索出某
一知识单元中的文章。通过浏览,可对某一学
科或专题有一个宏观的、全面的了解。
•
1 按学科分类浏览
•
2 按题名浏览
•
检索方法
• 初级检索或基本检索:
• simple search、 quick search、easy
search、basic search
关键词指的是题名、文摘、全文
•
等中出现的任意词汇,是系统默
通常只有一个检索框,提供很少的检
认的主要途径。
索项,不使用或很少使用组配算符。
• 优点:方便、快捷。
• 缺点:不能同时满足多种检索条件,检索
精度较低。
检索方法
• 高级检索:
• Guided Search、Power Search 、Advanced Search
•
提供较多的检索字段,并可运用逻辑
运算进行多字段组合检索。
• 优点:可一次满足多种检索条件,得到较
准确的检索结果,即检索精度较高。
检索方法
• 专家检索 (Expert Search):
•
又称命令检索或专业检索,是针对具
备一定检索技能的用户提供的检索方法。
• 优点:有最大的自由度,可编制复杂的检
索式,作任意字段的逻辑运算与词间运算
等各种操作,以达到最佳的检索效果。
• 缺点:需熟悉系统的各种操作规则,否则
无法达到预期的效果。不适宜初学者。
检索方法
• 自然语言检索(natural language search):
•
指的是用户可以直接输入一句话进行
检索,就像对人谈话一样。
• 优点:可随意输入检索词
• 缺点:检索效果不理想
自然语言检索
输入一个问题,一句话,或几个描述性的词,若是词组用引号引起。
但检索效果不是很精确。
Use Natural Language for the following search tasks:
1.Researching conceptual issues rather than highly specific topics
查找概念性的问题,而不是很专门的问题。
2.Researching complex issues when you don‘t know what words to use
查找复杂问题,但又不知道用什么词
检索方法
• 二次检索:
•
也叫“在结果中检索”,即在一次检
索的基础上,再次输入检索词,使检索结
果更精炼、准确。
•
通过“初级检索+二次检索”的方式,
也可得到满意的检索结果。
检索方法
• 跨库检索(寻呼式服务):
•
用户能够在一个界面下一次性完成对
几个数据库的统 一检索。
•
检索方法
锦上添花
• 个性化定制
个性分定制是指在特定的数据库系统中,
根据用户的需求和检索目标设定需求内容、
表达形式,从而选取待定的系统服务。
检索方法
• 个性化定制:
大多数外文数据库具有个性化定制功能,一
些中文数据为也有此功能。总得来说,外文数据
库比中文数据库做得好。
外文数据库
Elsevier SD、EBSCO、SpringerLink
中文数据库
中国期刊网、读秀学术搜索
检索方法:个性化定制
•
数据库的个性化定制涉及许多方面,不同数据库的定
制功能和方法也不同。以Elsevier SD为例:
•1 提示功能:自动将最新信息传送给用户。
期刊提示:当关注的期刊有新的一期时,会有E-mail提示。
检索提示:当有新的文章满足检索需求时,会有E-mail提示。
主题提示:当关注的主题有新的文章时,会有E-mail提示。
引文提示:当某篇文章被新的文章引用时,会有E-mail提示。
2 个性化主页
操作历史、快速链接
检索技巧
• 1 检索工具分析
• 2 检索课题分析
• 3 检索途径的综合应用
• 4 检索的修正
检索技巧
• 1 检索工具分析:
每一个检索工具都有其特定的文献信息收
录范围、检索途径与方法,检索工具的选择对
检索词的确定以及检索提问式的编制起主导作
用。
文献收录范围是检索工具的最基本特点,
其出版时间和所概括的内容范围是否包括检索
课题的内容以及质量和权威性如何,是在使用
检索工具前必须了解的基础知识。
检索技巧
• 2 检索课题分析:
•
明确检索目的
• (1)目的:参考国内外同行的经验和研究成果启发研究思路,
分析研究课题
以解决在科学研究或生产过程中遇到的难题。
要求:检出某一主题或某一方面相关度高的文献,
即要求查准率高,不一定要求文献数量大。
(2)目的:立项、开题、项目申请、申请专利、撰写综述等等
(1)分析课题的主题范围、所属学科性质,以明确检索的学科范围。
需了解课题研究现状,全面掌握相关文献。
掌握与课题有关的基本知识、名词术语以及技术领域。
要求:全面系统地检索某一主题范围内的文献信息,
(2)分析课题的已知条件,如涉及哪些关键词、是否有特定的期刊、
即要求查全率高,需多种检索工具作互补。
对哪些作者的研究成果感兴趣。
(3)目的:掌握最新的科研动态,密切跟踪国内外最新的研究成果,
(3)分析课题的主题内容,找出课题需要解决的关键,形成反映
关注同行的研究进展。
课题中心的主题概念,拟出相应的检索词。
要求:检索新颖、及时的文献信息,应选择更新快的检索系统。
检索技巧
• 3 检索途径的综合应用:
•
检索途径的选择要从检索要求、已知条件
和检索工具的结构等几个方面综合考虑。
• (1)外部特征检索途径
• (2)内容特征检索途径
•已知文献的外部特征线索,如作者姓名、期刊名称、
•机构名称等。需求目标已很明确,检索结果的针对性很强。
•
使用较多的是从课题的内容入手,通过题名途径、
•关键词途径、主题词途径、分类途径,甚至是文献
•的全文,检索与课题相关的文献。
检索技巧
• 若文献量太多:
1 改变检索词:
• 4•检索的修正:
•
选用专指度高的检索词
• 从三个方面分析检索结果
•
增加检索词…
• (1)检出的文献是否符合课题的内容范围。
•
2 严格限制条件
•
3 改变检索途径
• (2)检出的文献量。
• 若文献量太少:
• (3)检出文献的时效与类型。
•
1 改变检索词:
•
选用专指度低的检索词
•
减少检索词的数量
•
使用通配符进行截词检索…
•
2 放宽限制条件
•
3 改变检索途径
六 各数据库的特点:中国期刊网
•
•
•
•
•
1 综合利用“镜像”、“包库”和各专业数
据库。
2 引文检索效果不好,可利用“参考文献”
总体评价:
途径来检索某人或某文献的被引情况。
一个最受欢迎的老朋友,
3全文
检索结果数量按下列检索项递减:
主题
摘要
篇名
尽管优缺点并存。
(主题词:摘要+篇名+关键词)
4 不支持迅雷等加速下载工具。
5 经常会有一些莫明其妙的检索结果,如
“关键词”检索。
各数据库的特点:读秀学术搜索
• 1 潜在价值:利用其“全文检索”,可用于查
找图书的被引用情况,当然需一一鄄别。
• 2 文献传递:每种书一周仅允许一个人传递,
可先利用试读功能看一下目录,择重要部分先
传。
总体评价:
点击
• 3 个人数字图书馆:整合各种数字资源于一个
一个最受欢迎的新朋友。
平台。
各数据库的特点:人大复印资料全文库
• (1)主要用于检索文献的被转情况。
• (2)对于检索高质量文献,已不具备太
多意义,因期刊网已可以对文献来源进行
限制。
总体评价:
受冷落的、过时的明星!
各数据库的特点:中国基本古籍库
• (1)查找诗词典故出处,比百度优越许
多。
• (2)注意检索词前不要出现空格。
作者栏输入
总体评价:
了一个空格
高贵而严谨,
一次只接待10位来访者。
各数据库的特点:国研网和中宏
• 国研网:
通配符检索
• 中宏数据库:
合并显示功能、 经济词典注释功能
• 共性:内容广泛,文献质量高,更新及时,检索方便。
• 不同:
• 1 内容:国研网在宏观经济、金融领域内容更全、更细致。中宏
数据库在产业领域和政策法规方面栏目更多,研究更深入。
• 2 来源:国研网以自主研究成果为主,中宏只有一部分是自主研
究成果,比例远低于国研网。
• 3 数据格式:国研网统计数据的表单格式很丰富,既有直接的网页
表格形式,也有Excel格式。中宏数据全部为Excel格式。
两者结合使用
各数据库的特点:
• 北大法律信息网:
法条联想、法律法规信息注释
• 美星外文数字图书馆:
以经典文学作品为主
各数据库的特点:外文数据库
• 1 注意其年代:
Elsevier:最早回溯至1823年
Ebsco:心理学可回溯至1887年
LexisNexis:收录的案例最早可以追溯到1789年
• 2 除用于专业检索外,还可用于语言学习,如
LexisNexis 、EBSCO。
• 3 个性化定制功能做得好。
七 几点体会
• 1 检索是一门科学,也是一门艺术。
所谓科学,是指其有特定的规律。
所谓艺术,是指其灵活多变性,即突
破常规的意外收获,这是检索过程中的一
个亮点。
检索无一定之规。
体会
• 2 我认为,检索更是一门技术。
正像欧阳修《卖油翁》里的那个射手,
当他对自己的射箭技术沾沾自喜的时候,
卖油老头一语道破天机。所以,大家对数
据库不要有畏惧感。需要是最好的老师。
“无他,
但手熟尔。”
体会
• 3 对数据库的探索是无穷的。
• 数据库不是静止的,而是不断发展的。
•
一方面,是指检索技术和检索方法;
•
另一方面,更指内容,其内容的丰富
性足以令人不停地探求下去。如果我们对
数据库的内涵有了更深入的了解,无论在
宣传还是使用上都会更上层楼。
体会
• 4 学科馆员的最大优势是专业知识。
•
只有具备了深厚的专业知识,检索词才会
提炼得准确而全面。对检索结果的价值判断,也
需要专业知识做支撑 。
•
具备深厚的专业知识可以避免两种情况:。
检索了无用的资料
遗漏了有用的资料
体会
• 5 责任感是第一位的。
•
掌握检索方法和技巧虽重要,但更重
要的是责任感。技术不过如此,而细心和
耐心则是对工作的最大付出和考验。
•
职业性地付出诚实的劳动,是学科馆
员工作的基本要求。
点滴体会,仅供参考。
如有问题,下来商讨。
谢谢大家!再见!