Transcript Document

第六讲:
中文期刊全文数据库检索
[email protected]
本讲主要内容
1.
2.
3.
4.
5.
6.
7.
数据库检索通用技术与方法
信息检索七准则
中国期刊全文数据库(CNKI)检索
中文科技期刊数据库(维普)检索
万方数据库期刊检索
检索平台中的中文期刊论文检索
中文引文数据库
2
2013
1. 数据库检索通用技术与方法

恒变



信息环境-----日新月异
数据库的检索界面、检索功能、版本形式经常会有
变化
不变


基本技术与基本原理
方法或技巧
3
2013
1.1 信息检索技术与发展

当前信息检索是基于文本的




可检索字段信息以文本的形式存储在数据库(数据
集合)中
即使是多媒体数据库,也是抽象特征进行文本化或
说字符化
基于文本的匹配技术是信息检索的核心
随着信息技术的发展,以后还会有基于颜色、
声音、气味、质量等等的检索。
4
2013
1.2 认识数据库与数据库检索
数据库是存储在一起的相关数据(信息)的集
合
 数据库是信息检索的主要对象,比如针对网络
信息资源的搜索引擎(谷歌、百度、雅虎)就
是一个数据库,文献信息检索领域的数据库非
常多。

5
2013
数据库检索


匹配技术:有哪些匹配规则?
数据库检索是一个多步骤的过程


数据库的检索也是一个知识的探索与发现的过程,别人
没法替代


扩检、缩减、检索词的选择与逻辑组配
检索、浏览、判断、调整策略、再检索
花点时间,了解数据库特点的必要性






涵盖学科或主题范围
文献类型(出版形式、内容层次)
收录年限,收录对象
数据量(记录数)
文种
全文获取
2013
1.3 数据库检索常见问题
1.
2.
3.
4.
5.
6.
7.
对信息检索有畏惧心理
不理解信息检索过程或原理,无法做到触类旁
通。
不知道选择什么样的数据库检索,到哪里检索
不知道如何选择恰当的检索词
在文摘索引数据库中想下载全文
仅仅用一个词检索(不会利用逻辑组配)
在外文数据库中输入中文词检索
7
2013
数据库检索常见问题(续)
8.
9.
10.
11.
12.
信息环境意识不强,在网络中搜索一个数据库
就进行检索
用整个论文(或课程)题名在题名项中检索
检索结果太多(不会用限定和组配)
检索结果太少(课题分析不够;检索词选取)
检索结果的处理(排序、下载、阅读器、复制
)
说说看,各位还有哪些问题?
8
2013
1.4 数据库检索通用技术与方法
1.4.1布尔逻辑检索技术
1.4.2 截词检索技术
1.4.3 模糊检索方法
1.4.4 精确检索方法
1.4.5 限定检索方法
9
2013
1.4.1 布尔逻辑检索技术

并且【逻辑与】



或者【逻辑或】



表示当两个词都出现在检索项中的时,这样的文献才被检索出
来。
是缩检的方法
表示只要其中一个词出现在检索项中,这样的文献就能检索出
来。
是扩检的方法
去除【逻辑非】



表示从已经检索的结果中去除含有该检索词的文献。
即检索出的文献包前面的检索词,但不包含去除的词。
是缩检的方法
10
2013
例:网络信息资源评价研究综述

网络信息、信息资源、网络信息资源、选择、
利用、评价



(网络信息 OR 信息资源)AND 评价 NOT 检索
工具
(网络信息 OR 信息资源)AND (选择 OR 利用
OR 评价 )
如何对应于数据库的检索?

技巧:每一次检索解决一个问题,即搜索到一个方
面的信息资源。比如:
网络信息资源 AND 选择
 网络信息资源 AND 利用
 网络信息资源 AND 评价

11
2013
1.4.2 截词检索技术
截词包括后截、中截、前截等。用?作为截词符(有些
系统用*),主要包括下列情形:
 截词符?
中截一字符,后截断n个字符
 如 wom?n
可以检索出: woman, women
 如 coumput?
可以检索出Compute, Computer, Computing,
computable

12
2013
?? 后、中截二字符
如:transplant??
可以检索出:transplant、transplanted、
transplanter

???后、中截三字符
如: comput???
可以检索出:compute;computer;computing

13
2013
通配符,无限截断
[%] [?][*]
 后方一致(前截断):
“%国庆” 将检索出所有字段为张国庆、欧阳
国庆、国庆等的记录。
前方一致(后截断) :
如:“信息检索% ”将检索出信息检索原来、信
息检索技术等的记录。

14
2013

截词检索是扩检(即扩大检索结果)
15
2013
1.4.3 模糊检索方法

模糊检索


系统根据检索词自动拆分成更小的单元词
如“网络信息资源”模糊检索,相当于用:

网络信息资源 OR 网络信息 OR 信息资源 OR 网络
OR 信息 OR 资源
模糊检索是一些数据库(检索系统)的默认检
索模式。
 当检索结果较少或检索不到信息时,可以选择
模糊检索。
 模糊检索是扩检(即扩大检索结果)

16
2013
1.4.4 精确检索方法
与模糊检索相对应,检索词不能拆分开
 精确检索是缩检(即缩小检索结果)

17
2013
1.4.5 限制检索

针对特定年代、特定类别、特
定检索点等作限制,包括前缀
限制符和后缀限制符。
前缀限制符例如:
AU= 限查特定作者
JN= 限查特定刊名
LA= 限查特定语种
PN= 限查特定专利号
PY= 限查特定年代
18
2013
如在谷歌和百度搜索引擎中的
检索特定的文献类型:
“报告 filetype:pdf ”
检索指定网址内的信息:
“报告 site:www.google.com”
以后会看到一些数据库通常都有年代/类型
等的选择

19
2013

限制检索是缩检(即缩小检索结果)
20
2013
2.信息检索七准则
1)
2)
3)
4)
5)
6)
7)
你得到什么检索结果,取决于你怎么提问(即主题概
念分析)
去信息应该在的地方检索 (即选择数据库)
向你的检索结果提问 ―― 信息可能是真的,但内容
仍然会有错的(检索结果的判断,内容的选取)
检索是一个多步骤的过程(扩检、缩检)
检索结果必须符合需求(检索结果的选择)
咨询图书馆员(获得帮助)
信息本身是无意义的,只有人提问之后才有价值(撰
写论文吧,让信息增值)
信息检索准则编译自:
http://www.infotoday.com/searcher/jan02/block.htm
21
2013
3.中国期刊全文数据库(CNKI)检索
相关知识:
 什么是CNKI?


CNKI发展历程:


中国知识基础设施工程,China national
knowledge infrastructure简称CNKI。
学术期刊光盘中国期刊网 (中国知网)中国知识
资源总库
中国知识资源总库


内容:从期刊论文到博士硕士论文、会议论文,从
报纸、年鉴到字典、辞典、百科全书、医学图谱,
从多媒体教学素材库到专业知识仓库。
多个子库的集成服务
22
2013
3.1 简介

CNKI即中国基础设施工程(National Knowledge
Infrastructure,CNKI),也称为中国知网。为了针
对不同的用户团体进行销售,数据库既有细分专门的
数据库,也有整合的数据库检索形式,其产品形式和
名称与经常变动(其核心产品变化不大)。比如中国
学术文献网络出版总库系列数据库有:










中国期刊全文数据库(中国学术期刊网络出版总库)
中国博士学位论文全文数据库
中国优秀硕士学位论文全文数据库
中国重要报纸全文数据库
中国重要会议论文全文数据库
中国专利数据库
中国标准数据库
中国成果数据库
中国年鉴网络出版总库
……
23
2013
中国期刊全文数据库





内容: 以学术、技术、政策指导、高等科普及教育类
期刊为主,内容覆盖自然科学、工程技术、农业、哲
学、医学、人文社会科学等各个领域。截至2012年10
月,收录国内学术期刊 7900多种,
收录年限:其中创刊至1993年3500余种,1994年至
今7700余种,全文文献总量3500多万篇。
资源特色: 核心期刊收录率96%;特色期刊(如农业
、中医药等)收录率100%;独家或唯一授权期刊共
2300余种,约占我国学术期刊总量的34%。
产品形式:WEB版(网上包库)、镜像站版、光盘版
、流量计费。
更新频率



网上包库:每日更新5000~7000篇,
各镜像站:一般不会每日更新
专辑光盘:每月更新,专题光盘:年度更新。
24
2013
CNKI中国期刊论文全文数据库

有多种产品形式和多种名称,但都指的同一个
数据库。




中国期刊论文全文数据库
中国学术期刊网络出版总库
中国期刊全文数据库
中国知网(期刊检索)
2013
进入“学术总库检索平台”,再选择“中国期刊网络出版总库”
26
2013
进入检索界面—熟悉检索界面(网络版)
27
2013
年限限定很
有必要
检索途径
逻辑关系
检索词记录
增加检索途径和
逻辑组配
另一个词,
可为空
相关词
精确检索
网络版无效
28
2013
园区入口点击链接二或本校图书馆点击园区镜像
29
2013
3.3 检索—以镜像站为例子
检索方式:提供了快速检索、标准建设、专业
检索等多种检索方式,并可在检索结果中进行
二次检索。同时还设有期刊导航、学科内容分
类导航等多项个性化检索方式。用户还可不需
要输入具体的检索词即可按分类和期刊名称字
顺等方式查找所需期刊,并可链接浏览全文。
 检索途径:关键词、题名、刊名、作者、第一
作者、文摘、来源、基金、全文、参考文献、
主题。
 检索系统:支持布尔逻辑检索和限定检索,提
供了学科范围和年代的限定。
 全文下载:支持CAJ和PDF文件。

30
2013
镜像站版界面
检索词记录
相关词
增加检索途径和
逻辑组配
31
2013
检索策略一:一个词检索
选择篇名检索途径
采用默认的
无限定检索
学科领域范围限定
相似词与此间
关系辅助选词
32
2013
检索结果分析与调整检索策略:一

问题



检索结果太多:22384条,这么多的信息量是无法
都看完的,也不知道哪些信息适合自己
检索结果出现误差:比如出现了“管理信息”,而
且“信息”和“管理”竟然分开了,这些都不是检
索需求的初衷。
调整检索策略—缩小检索



限定检索年限:根据文献老化规律,一般选择5~
10年内的文献比较合适。
让数据库帮助自己选择高质量的文献:选择核心期
刊
按照原意检索:选择精确检索模式。(在网络版中
,精确检索无效)
33
2013
检索策略二:一个词检索+限定检索+精确检索
34
2013
检索结果分析与调整检索策略:二

问题



尽管检索结果数量大幅减少(513条),但要阅读
这样多的文献也是比较麻烦的事情。
经过阅读检索结果标题,发现我是想检索有关“医
药信息管理”方面的文献,好多不是与医药相关的
。
再次调整检索策略—缩小检索

增加一个检索词“医药”,逻辑组配选择“并且”
。
35
2013
检索策略二:二个词检索+限定检索+精确检索
36
2013
检索结果分析与调整检索策略:三

问题


检索结果为0!,缩减的太厉害了,看来要扩展检
索了!
再次调整检索策略—扩展检索


增加检索学科领域:医药卫生
文献质量档次降低:全部期刊(不仅仅是只要核心
期刊的论文了)
37
2013
OK!,可以看论文全文了!
点击篇名进入论文详
细信息与下载页面
38
2013
检索项/检索途径对应内容
39
2013
4 《中文科技期刊数据库》

维普资讯


收录了中国境内历年出版的中文期刊 12000 余种,全文3000
余万篇,引文4000 余万条,
多种产品形式、多种名称



维普网
 网络版
 全部产品,搜索引擎化服务
《中文科技期刊数据库》
 镜像站版
 经典应用
维普期刊资源整合服务平台
 镜像站版
 引文数据、学科计量分析
 《中国科学引文数据库》(CSCD)
2013
5 万方数据—期刊论文
期刊论文库:收录自1998年以来国内出版的各
类期刊7千余种,其中核心期刊2800余种,论
文总数量近2千万篇,每年约增加200多万篇,
每周两次更新。
 多种版本



镜像站
网络版
2013
6 检索平台中的中文期刊论文检索

谷歌学术搜索


宁波市数字图书馆



http://www.nbsti.net/
维普、CNKI、医学与医药领域期刊
超星百链云(超星学术搜索)


http://www.nbdl.gov.cn/
宁波市科技文献检索服务中心


http://scholar.google.com/
http://www.blyun.com/
CNKI学术搜索

http://scholar.cnki.net/
2013
7 中文引文数据库
引文数据库,是将各种参考文献按照一定规则
记录下来,集合而成的规范的数据集。
 中文引文数据库


《中文社会科学引文索引》 (CSSCI)


http://cssci.nju.edu.cn/
《中国科学引文数据库》(CSCD)

http://sdb.csdl.ac.cn/search_sou.jsp
2013
其它
博看期刊(杂志)
 包库链接:



www.bookan.com.cn/nbdxyqlib
镜像链接:

http://bkqk.nlic.net.cn
2013