Transcript 1. 网络搜索引擎
学术文献的检索与获取
北京大学图书馆 赵飞
前言
数字化时代里,不断发展
的技术与设备可以轻松地
让图书与文献等学术资源
与信息就在你的身边。
然而面对海量的学术资源,
如何快速和准确地找到真
正需要的文献,以及如何
才能合理有效地管理与利
用这些资源便成为了不能
不去了解的重要知识。
主要内容
1
搜索引擎的使用
2
在线百科资源
3
专业数据库与全文的获取
4
学位论文撰写规范
搜索引擎的使用
1. 网络搜索引擎
• 什么是搜索引擎(Search Engine)
– 搜索引擎是指通过网络搜索软件或网站登陆等方式,将互联网上
大量网站的页面收集到本地,经过加工处理而建库,从而能够对
用户提出的各种查询作出响应,提供用户所需的信息。
– 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索
引数据库→在索引数据库中搜索排序。
– 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的
网页索引数据库。
– 搜索引擎常常是用户利用网上资源的第一途径。
1. 网络搜索引擎
关于Google
PageRank算法
• 由两个斯坦福大学博士生Larry Page与Sergey Brin于
1998年9月发明。
• 约搜索30亿张网页,包括35个国家和地区的语言的资源。
• 已占有全球搜索市场的80%。Google 在中国的搜索市场
的市场份额原先也已突破30%,目前已不足16%。
• Google于2010年退出中国,搜索将经过审查过滤。
1. 网络搜索引擎
• www.google.com
• scholar.google.com
Google搜索引擎
Google学术搜索
1. 网络搜索引擎
Google的进入
• 无论是www.google.com还是www.google.cn ,都会被跳转
至www.google.com.hk
• Tips: 如何才能打开原生的英文主页?
– www.google.com/ncr (No Country Redirection)
1. 网络搜索引擎
检索技巧
• 搜索不区分大小写
– [Peking University] 与 [peking university]
• 使用一对方括号 [ ] 表示一个搜索查询
– [ 北京大学 ] 与 [北京] [大学]
• 标点符号(包括 @#$%^&*()=+[]\)以及其他特殊字符)都会被忽略
– 特殊情况:见后
• 搜索引擎会推测人们的行为
– 查询 [ for better or for worse ] 被视为一本非常著名的连环漫画。
–
查询 [ 34 * 87 ] 会显示计算器结果。
1. 网络搜索引擎
• 不能忽略的标点
– 热门查询词中的标点具有特殊含义,例如 [ C++ ] 或 [ C# ]
– 美元符号 ($) 用于表示价格。 [ 尼康 400 ] 和 [ 尼康 $400 ] 。
– 连字符 - (- 后面无空格而前面有空格的情况属于例外)
– 下划线符号 _ ,例如 [ quick_sort ]。
1. 网络搜索引擎
• 词组搜索 (“”)
– 严格按照该词组的形式查找结果,例如“北京大学”。
– Google搜索自动采用同义词,例如查询 北京大学 会同时查找 北
大。但用“北京大学”查到的是只有北京大学的结果。
– 可以用于搜索被默认忽略的词:如"china or india"
• 精确搜索 (+)
– 在搜索字词前边加一个加号 +(+号后面无空格,+号前留一空
格)。
– 使用“+”将Google忽略的常用字词和字符包含在查询字词中。
例如,对红与黑的搜索:red +and black
1. 网络搜索引擎
• 补全搜索字词 (*)
– 查询 [北京*大学] :北京大学/北京科技大学/北京师范大学
– * 操作符只能代表整个单词或中文汉字,不能代表单词的一部分。
• OR 操作符
– “OR”必须全部是大写形式。
– 符号 | 可以代替 OR。
– [北京大学 2010 OR 2011] :包含其中任意一个年份的搜索结果;
[北京大学 2010 2011] :显示同时包含两个年份的网页。
1. 网络搜索引擎
如何在特定的网站中搜索
• “site”表示搜索结果局限于某个具体网站或者网站频道。
– 搜索字词 site:域名。
– 例如,要查找哲学系的毕业论文相关信息,可以采用以下方法:
• 毕业论文 site:www.phil.pku.edu.cn
– site后的冒号为英文字符,而且,冒号后不能有空格,否则,
“site:”将被作为一个搜索的关键字。
– 网站域名不能有“http://”前缀,也不能有任何“/”的目录后
缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名
/频道名”方式。
1. 网络搜索引擎
1. 网络搜索引擎
如何搜索文件而不是网页
• “filetype: ”在某一类文件中查找信息。
– Google能检索微软的Office文档如.xls、.ppt、.doc,.rtf,
WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,
ShockWave的.swf文档(Flash动画)等。
– 检索词 filetype:文件类型
• 如:modal logic filetype:pdf
1. 网络搜索引擎
限定搜索文件类
型将在检索文献
全文时非常有用
1. 网络搜索引擎
URL链接与网页标题搜索
• inurl/allinurl,intitle/allintitle :搜索的关键字包含在URL
链接(网页标题)中
– “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字
则出现在链接中或者网页文档中。例如:“inurl:pdf logic”
– 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”
进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格
处理。
– 如搜索:allinurl:"cgi-bin" phf +com
• 也可用于检索全文
1. 网络搜索引擎
搜索结果说明
• 网页快照
该网页最后一次编入索引时的版本。
• 即时预览
点击搜索结果旁的放大镜图标 即可在点击结果前预览对
应的网页。
网页快照
即时预览
1. 网络搜索引擎
高级检索与检索设置
• 所有上述功能均可在高级检索中实现和进行组合。
检索结果界
面的右上角
1. 网络搜索引擎
Google学术搜索
• 来自学术著作出版商、专业性社团、预印本、各大学及其
他学术组织的经同行评论的文章、论文、图书、摘要和文
章。
• 滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不
同版本以及被其它文章的引用次数。
• 搜索出来的结果没有按照权威度(譬如影响因子、引用次
数)依次排列,在中国搜索出来的,前几条记录可能为书
籍。
1. 网络搜索引擎
学术搜索的检索技巧
• 从标题出发的搜索
– 精确查找:输入加引号的论文标题:“A History of the China
Sea”。
• Google 学术搜索会自动查找此论文以及提及此论文的其他论文。
– 一般直接输入题目,会将最匹配的结果放在前面。
1. 网络搜索引擎
• 从作者出发的搜索
– 搜索 [friedman regression] (弗里德曼 回归) 会返回以
“regression”为主题的,由名为“Friedman”的人撰写的文章。
• 输入加引号的姓名:["jh friedman"],搜索某位作者。
– 如果某个词既是人名也是普通名词,使用"作者:"操作符。 "作者:"和
搜索字词之间不能有空格。
• [作者:flowers] (人名弗劳尔,也是花的意思) 会返回由名为
"Flowers"的人撰写的文章,而 [flowers -作者:flowers] 会返回关于花
的文章,而忽略由名为"Flowers"的人撰写的文章。
– 作者全名加引号,来进一步缩小搜索范围。尽量使用首字母而不要
使用全名。
• 要查找 Donald E. Knuth(唐纳德·E. 克努特),可以尝试 [作者:"d
knuth"]、[作者:"de knuth"]或[作者:"donald e knuth"]。
1. 网络搜索引擎
利用作者限定,还
可以实现更多搜索
例如:搜索研究
毛泽东的文献
1. 网络搜索引擎
学术搜索的高级搜索
• 出版物限制
– 只返回来自特定出版物、针对特定字词的搜索结果。
• 日期限制
– 在寻找某一特定领域的最新刊物时,可能会比较实用。
• 信息可能不完整甚至不准确;例如,许多预印本没有介绍文章
是在哪里(甚至是否)最终出版,有些网站资源没有标注出版
日期。
• 一本杂志名称可能会用多种方式进行拼写(例如:Journal of
Biological Chemistry(《生化杂志》)经常被简写为 J Biol
Chem)
1. 网络搜索引擎
检索限定条件
刊物、时间限定
1. 网络搜索引擎
学术搜索的结果页面
• 被引用次数:不同于SCI的被引次数,两者覆盖文献范围
不一样。点击可查看施引文献。
• 相关文章:与这篇文章相似的其他文章
• 所有版本:有这篇文章的不同的数据库或网站,有可能某
个网站就可以下载全文。
• 更多:可以检索书目信息、查看全文的途径等。
• 图书馆链接:通过未名学术搜索或指定图书馆检索系统检
索这篇文献。
1. 网络搜索引擎
在图书馆检索系
统中检索
被引用情况
被引用情况
所有版本
1. 网络搜索引擎
巧用学术搜索的设置
• 文献信息的导出功能:支持多种参考文献格式的导出,方
便日常的管理和论文中的引用生成。
• 语言设置:有目的性地搜索某种语言的文章。
• 图书馆连接设置:可以便捷地搜索图书馆是否已有该篇文
献的全文。
不要忽视这里
1. 网络搜索引擎
选择所需的格式
勾选北大图书馆的连接
1. 网络搜索引擎
便捷的文献信息定制功能
• 文献引用信息的跟踪定制
– 定制某篇文献的最新引用文献信息,推送到设定的邮箱中。
• 检索的跟踪定制
– 定制符合某一检索式的最新文章信息,推送到设定的邮箱中。
1. 网络搜索引擎
检索的跟踪定制
1. 网络搜索引擎
首先点击被引链接
在引用文献界面点击创建Alert
文献引用信息的跟踪定制
1. 网络搜索引擎
学术搜索的更多功能
• 统计分析功能
– 以出版物为单位,按h5指数列出较为突出的刊物。
• h5 指数是指在过去整整 5 年中所发表文章的 h 指数。h 指在
2007-2011 年间发表的 h 篇文章每篇至少都被引用过 h 次的最大值。
也可检索某领域情况
可直接点击查看
整体情况
1. 网络搜索引擎
• 个人研究成果主页
– 由个人建立,自动按个人信息抓取相符的文献。
– 可手工进行添加和筛选。
– 提供部分统计功能。
统计数据
关注他
高频次合作者
成果列表
1. 网络搜索引擎
使用Google获取全文的Tips
• 一般直接用学术搜索即可,但有可能学术搜索搜不到,而
google却可以搜到。
• 查看所有版本获取更多途径。
• 推荐使用英文版。
1. 网络搜索引擎
Google Books
• Google Books是一款提供了全文检索的图书搜索产品,
不仅搜索图书的摘要,而且可以对图书全文内容进行搜索。
• 此服务于2004年10月在法兰克福书展发布,命名为
Google Print。
• 微软在2006年开发了一个类似的计划,名叫Live Search
Books。它持续进行了一段时间,直到2008年5月该计划
才被取消,所有的数据现已存在Internet Archive。
• 包含大量扫描获取的全文,但是版权问题存在争议。
• http://books.google.com/
1. 网络搜索引擎
1. 网络搜索引擎
Google Trends
• Google 趋势可让您比较世界各地的人们对您的首选主题的关
注程度。
• 您最多可输入五个主题,然后观察人们在各个时段内通过
Google 搜索这些主题的频率。
• Google 趋势还可显示您的主题在 Google 新闻报道中出现的
频率,以及最常搜索这些主题的人们所在的地区。
• Google 趋势会分析部分 Google 网页搜索结果,计算人们在
各个时段通过 Google 使用您输入的字词执行搜索的次数,并
与同期执行的搜索总次数进行比较。
• 通过热门趋势,可以查看不同时间搜索量上升最快的搜索内容
(http://www.google.com/trends/hottrends)
1. 网络搜索引擎
www.google.com/trends
1. 网络搜索引擎
• 可以很明显的看到这一天焦点事件成为人们搜索的主要
热点
1. 网络搜索引擎
Google Books Ngram Viewer
• 查看词组在全世界历年出版的图书中出现的频率。
• http://books.google.com/ngrams
1. 网络搜索引擎
必应Bing
• 必应(Bing,中国大陆译作必应,台湾译作缤纷)是微
软公司推出的用以取代Live Search的搜索引擎。由微软
CEO史蒂夫·鲍尔默于2009年5月28日在《华尔街日报》
于圣迭戈举办的“All Things D”公布,2009年6月3日
正式在世界范围内发布。内测代号为Kumo,其后才被命
名为Bing。
• 中文版目前依然为beta版
• www.bing.com
1. 网络搜索引擎
英文版非Beta
嵌入社交网络
更多搜索提示
1. 网络搜索引擎
微软学术搜索
• 对文献信息进行了部分人工整理。
• 提供了多方面的统计数据。
• 提供了针对科研人员、科研领域等的主题页面
• http://academic.research.microsoft.com/
1. 网络搜索引擎
很有特色的微软学术搜索
提供了多种可视化科研评
估与分析功能
1. 网络搜索引擎
针对模态逻辑领域的统计
关键词聚类分析
相关文献信息
1. 网络搜索引擎
合作与引用关系图
针对科研人员的统计
1. 网络搜索引擎
• 合作关系图(合作越多距离越近)
1. 网络搜索引擎
• 探索两个作者间的合作关系网
1. 网络搜索引擎
• 引用关系图(引用次数越多距离越近)
1. 网络搜索引擎
学科和年代的限定
• 机构比较(发表和引用情况)
1. 网络搜索引擎
其他一些搜索引擎
• 典型的元搜索引擎MetaCrawler
– www.MetaCrawler.com
• 学术搜索引擎SCIRUS
– www.scirus.com
• 百度中文搜索引擎
在线百科资源
2. 在线百科资源
集大成者-维基百科Wikipedia
• www.wikipedia.org
首页下方还有维
基的其他项目
2. 在线百科资源
维基百科的成立
• 维基百科最初是Nupedia的附属计划之一,Nupedia是一个制
作自由百科全书的计划,现在已经停止运作。Nupedia有一个
严谨的同行评审系统,且需要专业资格的使用者才能做出贡献,
但条目的撰写进度却十分缓慢。在2000年时,Nupedia创办
人吉米·威尔士(Jimmy Wales)和员工拉里·桑格(Larry
Sanger)讨论著要如何让Nupedia成为更开放、完整的计划。
许多人建议使用wiki可以让一般大众贡献内容,因此Nupedia
的第一个wiki在同年的1月10日上线。
• 许多的编辑者和评审员拒绝让一个wiki网站加入Nupedia计划
中,因此新的计划在1月15日(现在称为维基百科日)改用
“Wikipedia”作为名称,并使用属于自己的网域
─wikipedia.com。带宽和服务器由威尔士赞助,由维基媒体
基金会负责维持。
2. 在线百科资源
维基名称的由来
• 沃德·坎宁安(Ward Cunningham)于1995年3月25日
成立了第一个wiki:WikiWikiWeb,用来补充他自己经
营的软件设计模式网站。他发明了wiki这个名字以及相关
概念,并且实现了第一个wiki引擎。坎宁安说自己是根据
檀香山的Wiki Wiki公共汽车取名的。这是他到檀香山学
会的第一个夏威夷语。
2. 在线百科资源
维基的理念
• Wiki是一种在网络上开放、可供多人协同创作的超文本
系统。
• 使用wiki系统的网站称为wiki网站,wiki网站允许任何造
访它的人快速轻易地添加、删除、编辑所有的内容,而且
通常都不用登录,因此特别适合团队合作的写作方式。例
如:维基解密 WikiLeaks
• Wiki的内容也可能有误,因为用户必定会加上不正确的
数据。
2. 在线百科资源
• 截至2011年5月时,维基百科条目数第一的英语维基百科
已有350万条条目,而全球所有276种语言的独立运作版
本共突破1700万条条目,总登记用户也超越2650万人,
而总编辑次数更是超越10亿次。
2. 在线百科资源
• 在词条的解释中,一些术语也有自己的词条,可以直
接点击跳转查看,方便理解。
• 标为红色的是未编辑的词条,可以去进行添加,但未
必会被采用
2. 在线百科资源
词条间的便捷跳转方便
更快地了解相关知识
2. 在线百科资源
• 右边的工具栏可以选择基于
不同语言的维基百科
• 不同语言并非简单的翻译,
而是由不同地区或国家的人
自行编辑,各有其特色
• 维基百科会用标识来标出非
常优秀的或是比较有特色的
语言版本
2. 在线百科资源
• 例如模态逻辑的词条,维基百科推荐的优秀版本为
德文版本
2. 在线百科资源
• 中文优秀条目:自然演绎
2. 在线百科资源
• 相关词条下边的参考文献等信息很可能成为你
搜集相关文献的起点
2. 在线百科资源
Wiki books 和维基文库
• www.wikibooks.org
于2003年7月10日开放。此计划收集自由的教科书,目
录或其他用户自己编辑的书。
• www.wikisource.org
现在维基文库上主要存放各种遵循GNU自由文档协议证
书的文件以及兼容这个协议的原始文件,还有公有领域、
无版权或者版权已经过期的原始文献,例如古代的诗歌、
文章、法律文本等等。这个项目于2003年11月4日开始
启动
2. 在线百科资源
• Wikibooks 举例:LaTeX
2. 在线百科资源
• 维基文库的中文部分
2. 在线百科资源
其他百科网站
• 百度百科
– baike.baidu.com
• 互动百科
– www.hudong.com
• 大英百科全书在线
– www.britannica.com 图书馆购买
• Stanford Encyclopedia of Philosophy
– plato.stanford.edu
2. 在线百科资源
2. 在线百科资源
在线文库
• 百度文库
– wenku.baidu.com
• 新浪爱问 共享资源
– ishare.iask.sina.com.cn/
• 豆丁网
– www.docin.com/
各种注册、积分、
贡献值
专业数据库与全文的获取
3. 专业数据库
全文数据库
• 电子期刊
– 现刊:EBSCO的ASP、ProQuest的ABI、Wiley等
– 过刊:JSTOR
– 中文:中国期刊网、万方、维普
• 电子图书
– 中文:读秀、方正Apabi
– 英文:MyiLibrary、Netlibrary
• 学位论文
– 中文:北大论文、期刊网、万方
– 英文:PQDT、WorldCatDissertations、NDLTD、EthOS等
3. 专业数据库
最常用的:电子期刊数据库
• 中文电子期刊
– 中国期刊网(CNKI 中国知网)
– 万方数据库
– 维普数据库
•
常用
英文
现刊
Elsevier—Science Direct
SpringerLink
EBSCO
Wiley Online Library
西文电子期刊
Taylor & Francis
– 现刊
– 过刊
Oxford University Press
Cambridge Journals Online
常用
英文
回溯
JSTOR
PAO
NSTL外文回溯期刊全文数据库
3. 专业数据库
3. 专业数据库
• 电子期刊数据库中大多都提供了关键词检索和按期刊卷期
浏览的功能,及部分订阅功能,收录的期刊各有侧重。
• 图书馆未名学术搜索可以实现文章级别的检索。
• 从期刊角度查找文献及全文推荐利用图书馆主页中的电子
期刊检索页面进行检索(能够更为准确的全文拥有情况)
3. 专业数据库
• 其检索结果不仅列出了包含该种刊物的全部图书馆已购买
数据库,同时也会标注所购数据年份。
• 点击蓝色链接就可以直接连接到相应数据库中该期刊的浏
览界面。
3. 专业数据库
旧版主页
旧版主页的期刊导航比较直观
3. 专业数据库
常用逻辑学期刊导航表
• 详细列出常用逻辑学期刊的馆藏情况
– 包含全文的数据库
– 收录年份
– 期刊入口链接
3. 专业数据库
数据库
Springer LINK--德国施普林格(Springer-Verlag)电子期刊及丛书
JSTOR--西文过刊全文库
Kluwer Online--800种电子期刊镜像服务网站
Academic Source Premier--学术期刊集成全文数据库(EBSCO)
Academic Research Library--学术期刊图书馆数据库(ProQuest)
Elsevier Science--学术期刊数据库
Oxford University Press(OUP)--牛津大学出版社电子期刊
John Wiley--电子期刊数据库
Periodicals Archive Online(PAO)--典藏人文社科全文期刊库
ACM Digital Library--美国计算机协会电子期刊、会议录
Business Source Premier--商业资源电子文献数据库(EBSCO)
Cambridge Journals Online(CUP)--剑桥大学出版社电子期刊
Literature Resource Center--文学资源中心(Gale)
万方数据资源系统的全文数字化期刊
中国期刊网期刊全文数据库
中文科技期刊数据库(维普全文电子期刊)
哪些期刊数据库对你来说更重要
常用逻辑期刊数
14
11
11
9
8
6
5
4
4
2
1
1
1
1
1
1
3. 专业数据库
学位论文数据库
• PQDT和北京大学学位论文库
• WorldCatDissertations数据库
– 收集了OCLC WorldCat中所有的博硕士论文和已出版的以OCLC
成员编目的论文为基础的资料,涉及所有学科。从数据库高级检
索的“互联网资源”中,可获得近20% 约100多万篇的全文论文,
可免费下载。
• NDLTD
– 全称是Networked Digital Library of Theses and
Dissertations,是由美国国家自然科学基金支持的一个网上学位
论文共建共享项目,为用户提供免费的学位论文文摘,还有部分
可获取的免费学位论文全文。
• EthOS
– 一个免费的在线查找英国学位论文的站点,目前参加的有英国的
100多个机构。需国际网网关
3. 专业数据库
引文数据库
• 什么是引文?
– 引用与被引
– 参考文献
3. 专业数据库
• 引文索引数据库
– 收录论文的参考文献并索引
– Dr. Garfield 1955年在 Science 发表论文,提出将引文索引作为
一种新的文献检索与分类工具, 将一篇文献作为检索字段从而跟
踪一项科学研究的发展过程。
3. 专业数据库
• 通过施引文献和被引文献之间的关系,就可以揭示科学研
究的进程、发展等信息
3. 专业数据库
查看一篇微博的被引情况
• 用微博来打个比方:
对这篇微薄的一次引用
一篇微博转发的历程
3. 专业数据库
引文数据库的功能
• 发现谁在引用某项研究,它是如何支持相关研究的
• 快速和全面的搜集某个主题、领域的文献信息
• 跟踪同行及你关注的科研人员的最新研究动态
• 探索一个想法、概念由最初提出至今的发展及应用
• 科研统计和评估,如论文被引情况、期刊影响力等
3. 专业数据库
最为著名的引文数据库:WOS
• Web of Science是获取全球学术信息的重要数据库
– 收录了10,000多种世界权威的、高影响力的学术期刊和超过11万
个国际会议的学术论文集
– 内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文
等领域。其中图书馆购买了的数据库有:
Science Citation Index Expanded(SCI-EXPANDED)-1899-至今
Social Sciences Citation Index(SSCI)-1983-至今
Arts & Humanities Citation Index(A&HCL)-1983-至今
Conference Proceedings Citation Index-Science(CPCI-S)-1996-至
今
• Conference Proceedings Citation Index-Social Science &
Humanities(CPCI-SSH)-1996-至今
•
•
•
•
注意:Web of Science 的数据库均不是全文数据库。
3. 专业数据库
• SCI数据库概况
– Science Citation Index(科学引文索引),数据回溯到1900年,
北大正式购买的数据范围是1899年至今
– 涵自然科学、工程技术、生物医学等所有科技领域
• SSCI数据库概况
– Social Science Citation Index(社会科学引文索引),目前北大正
式购买的数据范围是1983年至今
– SSCI收录2400多种社会科学期刊,同时也收录SCI Expanded当
中涉及社会科学研究的论文
• A&HCI数据库概况
– Arts&Humanities Citation Index(艺术与人文科学引文索引),
目前北大正式购买的数据范围是1983年至今
– A&HCI完整地收录了25个学科的1165种期刊,包括ISI各个数据
库中有关艺术与人文科学方面的论文
3. 专业数据库
• CPCI-S及CPCI-SSH数据库概况
– CPCI-S ━ Conference Proceedings Citation Index Science(科学技术会议录引文索引)
– CPCI-SSH ━ Conference Proceedings Citation Index –
Social Science&Humanities(人文社科会议录引文索引)
– 收录科技及人文领域以图书、报告、期刊论文等形式出版的各种
会议文献,每年收录12,000多个会议的内容
– 但只收录含会议论文全文的会议文献
– 北大正式购买的数据范围是1996年至今
3. 专业数据库
利用WOS检索和挑选论文
• 利用聚类功能挑选Review论文
– 快速了解某一领域的研究进展和关键人物、文献
• 利用被引排序寻找高引论文
– 较高的被引数量代表着影响力与重要程度
• 利用年代限定和排序关注最新研究进展
– 根据不同学科的特点,关注较有意义的年代范围
3. 专业数据库
WOS的文献信息统计分析功能
• 科研立项 OR 开题报告 OR 论文投稿
– 分析论文出版年、研究机构、研究人员等
– 分析领域内会议、期刊等
分析统计功能
3. 专业数据库
可以选择各个
字段进行聚类
作者
会议名称
国家/地区
文献类型
编者
基金资助机构
授权号
团体作者
机构
语种
出版年
来源出版物
学科类别
WOS主题分类
排序方式选择
3. 专业数据库
逐年收录列表
当针对某个人或某个
机构等进行检索时,
检索结果的引文报告
将对分析很有帮助
逐年引用列表
引文统计信息
高被引文献信息
3. 专业数据库
文献引用关系图
单击节点可以聚
焦该文献,双击
可显示文献细节
所参考文献
后续引用文献
3. 专业数据库
WOS的文献信息跟踪定制
• 最新文献的跟踪
– 针对检索式的定制
– 对保存的检索式进行定时自动检索,并将新增结果发送至定制邮箱
– 可用于跟踪所关心主题的相关研究,及时了解最新的发展和成果,
而无需手动去检索。
• 最新引用的跟踪
– 针对引文的定制
– 对选定文献的引文进行跟踪,如有新的引用则通过邮件予以提醒。
– 可用于个人研究的后续发展,或所关注重要论文的后续研究成果等。
3. 专业数据库
检索Tips
专业数据库
综合性
IDEA从何而来
大量阅读文献
学科最新进展
研究论文
综述
全文
文摘
外文
中文
3. 专业数据库
• 如何开始检索?
–
–
–
–
关键词(主题词)
从该领域知名学者、知名研究机构出发
从该领域权威期刊出发
从该领域经典著作或论文文献出发(引证信息)
• 如果检索结果太多怎么办?
– 二次检索
• 由大方向向小专题逐步选出更相关的文献
– 补充检索条件(精确检索)
• 通过补充时间、作者、期刊等条件来缩小范围
– 结果聚类(分类)
• 通过文献类型、主题等分类来缩小范围
– 结果排序(最新、影响力最大)
• 通过排序来选出最值得关注和阅读的文献
3. 专业数据库
利用WOS获取更多线索和信息
• 通过聚类和统计分析功能获得该领域研究情况信息
– 相关基金
– 相关期刊
– 年代分布
– 作者、机构
– 研究方向、涉及学科
• 通过文献页面的相关信息来拓展思路
– 参考文献、引用文献
– 共引文献(相同基础上的研究成果)
3. 专业数据库
用于评价期刊的JCR
• Journal Citation Reports 为美国科学情报研究所(ISI)出版的
网络版期刊引用报告,包含两个部分:
– 1) JCR Science Edition (自然科学版): 涵盖5,900多种科学技术期刊
– 2) JCR Social Science Edition (社会科学版): 涵盖1,700多种社会、
人文科学期刊
• JCR的特色
– 综合性、多学科的期刊分析与评价报告,它客观统计了WOS收录期刊
所刊载论文的数量、论文参考文献的数量、论文被引次数等原始数据,
并应用文献计量学原理,计算反映期刊质量和影响的定量指标(如影
响因子、特征因子等)。
• JCR常用词语解释及重要指数计算方法:
– http://www.lib.tsinghua.edu.cn/service/SCIcenter/sciimpac.html
3. 专业数据库
• 影响因子( Impact Factor , IF)
注意:对刊不对文
– 1972年由E·加菲尔德提出的,是一个国际上通行的期刊评价指标。
它不仅是一种测度期刊有用性和显示度的指标,而且也是测度期
刊的学术水平,乃至论文质量的重要指标。
– 影响因子为一个相对统计量,即某期刊前两年发表的论文在统计
当年的被引用总次数除以该期刊在前两年内发表的论文总数。
Nature的2010年IF计算
被引用次数
发表文章
2009年
28610
866
2008年
35114
899
合计
63724
1765
IF:63724/1765=36.104
3. 专业数据库
• 举例:逻辑学领域期刊
3. 专业数据库
用于科研评估的ESI
• 引文排名(Citation Rankings)
– 科学家Scientists(取排名前1%);
– 研究机构Institutions(取排名前1%);
– 国家/地区Countries/Territories(取排名前50%);
– 期刊Journals(取排名前50%)
3. 专业数据库
• 高被引论文(Most Cited Papers)
– 10年来的高被引文章(Highly Cited Papers (last 10 years)):
• 发表于十年内各领域中被引用次数前1%的文章。
• 单一学科或者综合所有学科的高被引的论文(BY FIELD);
• 或某一科学家、某一研究机构、国家/地区或者期刊的高被引文章(BY
NAME);
• 或通过检索创建相关高被引文章列表(BY SEARCHING)。
– 近两年来高被引的文章(Hot Papers (last 2 years)):
• 发表于两年内最近两个月被引用次数为各领域前0.1%的文章
3. 专业数据库
• 引文分析(Citation Analysis)
– 基线数值(Baselines)
• 为引文统计数据提供了比较分析的依据。
• 进入BASELINES MENU。
– 平均引文率(BY AVERAGES):按照10年间各年进行统计,表示各学科中
每年发表论文的篇均被引次数;
– 百分比(BY PERCENTILES):每年发表的论文达到某个百分点基准应被引
用的次数;
– 排名(BY FIELD RANKINGS):显示某个学科中的论文总数和引文总数。
– 研究前沿(Research Fronts)
• 按照共引关系聚类高被引论文,用以了解新的突破可能出现的领域以
及科学家之间的非正式交流的关系。
• 可以进一步按学科(BY FIELD) 浏览,或查看指定的主题(BY NAME) 。
3. 专业数据库
中文引文数据库
• 中国科学引文数据库(简称CSCD)
– 创建于1989年,收录我国数学、物理、化学、天文学、地学、生
物学、农林科学、医药卫生、工程技术、环境科学和管理科学等领
域出版的中英文科技核心期刊和优秀期刊千余种,目前已积累从
1989 年到现在的论文记录300 万条,引文记录近 1700万条。
• 中文社会科学引文索引数据库(简称CSSCI )
– 是由南京大学中国社会科学研究评价中心开发研制的引文数据库,
用来检索中文人文社会科学领域的论文收录和被引用情况。
• 期刊网、万方、维普等全文数据库也提供一部分的引文信
息
3. 专业数据库
Open Access数据库
• High Wire
– HighWire Press是全球最大的提供免费全文的学术文献出版商,
于1995年由美国斯坦福大学图书馆创立。文章总数已达
6,633,317篇,其中2,097,186篇文章可免费获得全文,这些数据
仍在不断增加。其收录的期刊覆盖了生命科学、医学、物理学、
社会科学。
• Open Access学术资源一站式服务平台
– 中国教育图书进出口公司用近4年时间开发出了《SOCOLAR:
Open Access资源一站式检索服务平台》,该平台收录了大量
Open Access期刊、Open Access机构仓储等学术资源,并向最
终用户提供一站式文章级检索和全文链接服务。
3. 专业数据库
3. 专业数据库
E-print 预印本数据库
• ArXiv.org
– arXiv.org是一个收录科学文献预印本的在线数据库,目前包含了
超过70万篇文章,并且以每个月5000篇的速度增长着。目前,
这个数据库包含:数 学,物理,计算机,非线性科学,定量生物
学,定量财务以及统计学几大分类。其最重要的特点就是“开放
式获取”,每个人都可以免费地访问全文数据。
– arXiv 原先是由物理学家保罗·金斯巴格在1991年建立的网站,本
意在收集物理学的论文预印本,随后括及天文、数学等其它领域。
金斯巴格因为这个网站获得了2002年的麦克阿瑟奖。
– arXiv 原先挂在洛斯阿拉莫斯国家实验室,是故早期被称为
“LANL 预印本数据库”。目前的 arXiv 落脚于康乃尔大学,并
在全球各地设有镜像站点。网站在1999年改名为 arXiv.org 。
3. 专业数据库
全文检索
3. 专业数据库
哲学领域数据库
• Philpapers.org 英文哲学论文数据库
– 由David Bourget和David Chalmers主持的哲学网站。
– 各专业领域收录文献数量:
• Metaphysics and Epistemology (87,340)
• Value Theory (128,761)
• Science, Logic, and Mathematics (81,953)
• History of Western Philosophy (97,091)
• Philosophical Traditions (20,952)
• Philosophy, Misc (1,109)
• Other Academic Areas (21,257)
3. 专业数据库
按专业浏览
按期刊浏览
还有网站发起的
调查
收集的哲学领域
研究文献
3. 专业数据库
科研活动信息
职位信息
3. 专业数据库
逻辑学领域数据库
• DBLP
– 数字书目索引与图书馆项目(Digital Bibliography & Library
Project,简称DBLP)
– 提供了计算机领域科学文献的搜索服务,它只储存这些文献的相
关元数据,如标题,作者,发表日期等。
– 最早的DBLP只包含数据库系统和逻辑编程相关方面的文章,所
以DBLP之前也可以是DataBase systems and Logic
Programming的缩写。随着更多的其他计算机领域的内容的加
入,发展成今天的DBLP。DBLP项目由德国特里尔大学的
Michael Ley负责开发和维护。
– 和一般流行的情况不同,DBLP并没有使用数据库而是使用XML
存储元数据。几乎每天都有专人手工输入,进行更新。
– http://dblp.uni-trier.de/
3. 专业数据库
多种搜索引擎
也有全文
3. 专业数据库
其他学术信息网站
• Arnetminer.org
– Arnetminer是一个以研究者为中心的学术社会网络分析与挖掘系
统,由清华大学计算机科学与技术系知识工程研究室唐杰博士
(http://keg.cs.tsinghua.edu.cn/jietang/)等人员研发完成。
– 该系统已搜集了上百万研究者信息,自动挖掘出研究者之间的师
生关系、合作者关系;提供多个以研究者为中心的社会网络分析
与挖掘功能,包括专家发现、专家页面自动生成、学术网络图搜
索、课程搜索、热点话题发现等。
3. 专业数据库
针对科研人员进行
信息的收集和分析
3. 专业数据库
小结:全文的获取
• 首选期刊导航
– 准确,有保障
• Google和Google Scholar
– 限定文件类型
– 查看更多版本
• OA和免费数据库
• 检索纸本资源
– 弥补数据库中的滞后期和缺失
• 馆际互借服务(文献传递)或是找同学和老师帮忙
– 会有费用,但有优惠期和一些优惠政策,请关注图书馆主页上消息
• 向作者请求(或搜索作者博客或个人网站)
3. 专业数据库
• 向作者请求
-
发送Email请求(最好不要太直接,描述你的研究和对这篇文章的迫切
需求等;可以尝试第一作者而非通讯作者)
3. 专业数据库
• 向作者请求
-
个人主页、Blog或网站
3. 专业数据库
图书馆电子资源使用Tips
• 图书馆购买的所有电子资源都是限定在校园网IP范围,使
用校园网直通车、搜狗浏览器自动代理打开的时候经常不
能访问。
3. 专业数据库
• 大部分数据库都是走专线,不需要国际流量,只需要登录
校园网网关
• 北大电子资源使用详见每个数据库后的“相关说明”内的
链接。
• 在校园网内,按“相关说明”进入数据库了,但看全文还
要用户名和密码?
– 有的数据库只购买部分年代,所以访问之前(或之后)年代的全文
需要输入用户名和密码,这种情况以期刊数据库为多。如:
Elsevier、Springer、John Wiley等
• 不要滥用资源—正常阅读速度
电子资源使用遇到问题可以
随时联系图书馆咨询部
学位论文撰写规范
4. 学位论文撰写规范
学位论文的基本要求
• 学位论文的主要组成部分
– 封面
– 版权声明
– 中文摘要、关键词
– 英文摘要
– 目录(插图和附表目录)
– 正文
– 注释、参考文献
– 附录
– 致谢
– 原创性声明与使用授权说明
4. 学位论文撰写规范
学位论文的各部分要求
• 封面
– 校徽、校名
– 学位名称
– 论文题目(副标题)
– 姓名
– 学号
– 院系
– 专业(研究方向)
– 导师姓名
– 论文完成时间
4. 学位论文撰写规范
• 摘要、关键词
– 内容摘要要求在3000字以内,硕士论文一般在500-1000字,用
于简要说明本论文的目的、内容、方法、成果和结论,要突出论
文的创新之处。
– 在摘要的最下方另起一行,注明关键词,一般要求3-5个。
– 英文摘要在中文摘要之后,此部分包括英文的论文题目、英文作
者姓名、英文专业名称、英文导师姓名、英文摘要和英文关键词。
– 英文专业名称用括弧括起置于英文姓名之后,研究生姓名下面一
行写导师姓名。
4. 学位论文撰写规范
• 目录
– 目录一般列至二级标题,标号格式通常没有明确要求,可用可以
用“章、节”;“一、(一)”;“1、1.1”等形式。
– 学位论文提交系统中要求目录的页码要与正文的章节以及附录的
内容相符合,正文页码应从第1页开始,正文以前的部分(不包
括封面)请用罗马字母(I,II,...)编页。
混搭风格
Tips:
1. 用Word可以方便地自动生成目录
2. 巧用Word中分节符来解决页码问题
4. 学位论文撰写规范
• 注释、参考文献
– 注释可采用脚注或尾注的方式,按照本学科国内外通行的范式,
逐一注明本文引用或参考、借用的资料数据出处及他人的研究成
果和观点。
– 参考文献按不同学科论文的引用规范,列于文末(通篇正文之
后)。外文用原文,不必译成中文。
– 不同学科不同学位对参考文献的数量也有不成文的一些要求。
– 参考文献格式要参考本学科惯例。
Tips:
1. Word中可以手动插入引用
2. 利用文献管理软件从繁琐的参考文献编
辑中解放自己
4. 学位论文撰写规范
国家标准
• 中华人民共和国国家标准GB 7714-87 “文后参考文献
著录规则”(目前用的较多)
• 中华人民共和国国家标准GB/T 7714-2005 “文后参考
文献著录规则”(用于替代上面那个,但还有待普及)
4. 学位论文撰写规范
如何找到学位论文要求
• 学校的博硕士学位论文规范
– 可在研究生院中查找,也可Google得之
• 院系主页中搜寻学位论文规范
– 有些院系有本科生论文要求
• 在北京大学学位论文库中找模板
– 仅限研究生论文
• 向师兄师姐求科普、求模板
– 万能、靠谱
4. 学位论文撰写规范
• 搜索关键词:
– 北京大学学位授予工作细则
– 北京大学研究生学位论文的基本要求与书写格式(2005年6月修订)
– 北京大学研究生学位论文的基本要求与书写格式(2007年6月修订)
– 北京大学学位论文原创性声明和使用授权说明
期待大家的
提问与交流!
北京大学图书馆 赵飞
Email:[email protected]