1. 网络搜索引擎

Download Report

Transcript 1. 网络搜索引擎

学术文献的检索与获取
北京大学图书馆 赵飞
前言
数字化时代里,不断发展
的技术与设备可以轻松地
让图书与文献等学术资源
与信息就在你的身边。
然而面对海量的学术资源,
如何快速和准确地找到真
正需要的文献,以及如何
才能合理有效地管理与利
用这些资源便成为了不能
不去了解的重要知识。
主要内容
1
搜索引擎的使用
2
在线百科资源
3
专业数据库与全文的获取
4
学位论文撰写规范
搜索引擎的使用
1. 网络搜索引擎
• 什么是搜索引擎(Search Engine)
– 搜索引擎是指通过网络搜索软件或网站登陆等方式,将互联网上
大量网站的页面收集到本地,经过加工处理而建库,从而能够对
用户提出的各种查询作出响应,提供用户所需的信息。
– 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索
引数据库→在索引数据库中搜索排序。
– 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的
网页索引数据库。
– 搜索引擎常常是用户利用网上资源的第一途径。
1. 网络搜索引擎

关于Google
PageRank算法
• 由两个斯坦福大学博士生Larry Page与Sergey Brin于
1998年9月发明。
• 约搜索30亿张网页,包括35个国家和地区的语言的资源。
• 已占有全球搜索市场的80%。Google 在中国的搜索市场
的市场份额原先也已突破30%,目前已不足16%。
• Google于2010年退出中国,搜索将经过审查过滤。
1. 网络搜索引擎
• www.google.com
• scholar.google.com
Google搜索引擎
Google学术搜索
1. 网络搜索引擎
 Google的进入
• 无论是www.google.com还是www.google.cn ,都会被跳转
至www.google.com.hk
• Tips: 如何才能打开原生的英文主页?
– www.google.com/ncr (No Country Redirection)
1. 网络搜索引擎
检索技巧
• 搜索不区分大小写
– [Peking University] 与 [peking university]
• 使用一对方括号 [ ] 表示一个搜索查询
– [ 北京大学 ] 与 [北京] [大学]
• 标点符号(包括 @#$%^&*()=+[]\)以及其他特殊字符)都会被忽略
– 特殊情况:见后
• 搜索引擎会推测人们的行为
– 查询 [ for better or for worse ] 被视为一本非常著名的连环漫画。
–
查询 [ 34 * 87 ] 会显示计算器结果。
1. 网络搜索引擎
• 不能忽略的标点
– 热门查询词中的标点具有特殊含义,例如 [ C++ ] 或 [ C# ]
– 美元符号 ($) 用于表示价格。 [ 尼康 400 ] 和 [ 尼康 $400 ] 。
– 连字符 - (- 后面无空格而前面有空格的情况属于例外)
– 下划线符号 _ ,例如 [ quick_sort ]。
1. 网络搜索引擎
• 词组搜索 (“”)
– 严格按照该词组的形式查找结果,例如“北京大学”。
– Google搜索自动采用同义词,例如查询 北京大学 会同时查找 北
大。但用“北京大学”查到的是只有北京大学的结果。
– 可以用于搜索被默认忽略的词:如"china or india"
• 精确搜索 (+)
– 在搜索字词前边加一个加号 +(+号后面无空格,+号前留一空
格)。
– 使用“+”将Google忽略的常用字词和字符包含在查询字词中。
例如,对红与黑的搜索:red +and black
1. 网络搜索引擎
• 补全搜索字词 (*)
– 查询 [北京*大学] :北京大学/北京科技大学/北京师范大学
– * 操作符只能代表整个单词或中文汉字,不能代表单词的一部分。
• OR 操作符
– “OR”必须全部是大写形式。
– 符号 | 可以代替 OR。
– [北京大学 2010 OR 2011] :包含其中任意一个年份的搜索结果;
[北京大学 2010 2011] :显示同时包含两个年份的网页。
1. 网络搜索引擎
 如何在特定的网站中搜索
• “site”表示搜索结果局限于某个具体网站或者网站频道。
– 搜索字词 site:域名。
– 例如,要查找哲学系的毕业论文相关信息,可以采用以下方法:
• 毕业论文 site:www.phil.pku.edu.cn
– site后的冒号为英文字符,而且,冒号后不能有空格,否则,
“site:”将被作为一个搜索的关键字。
– 网站域名不能有“http://”前缀,也不能有任何“/”的目录后
缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名
/频道名”方式。
1. 网络搜索引擎
1. 网络搜索引擎
 如何搜索文件而不是网页
• “filetype: ”在某一类文件中查找信息。
– Google能检索微软的Office文档如.xls、.ppt、.doc,.rtf,
WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,
ShockWave的.swf文档(Flash动画)等。
– 检索词 filetype:文件类型
• 如:modal logic filetype:pdf
1. 网络搜索引擎
 限定搜索文件类
型将在检索文献
全文时非常有用
1. 网络搜索引擎
 URL链接与网页标题搜索
• inurl/allinurl,intitle/allintitle :搜索的关键字包含在URL
链接(网页标题)中
– “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字
则出现在链接中或者网页文档中。例如:“inurl:pdf logic”
– 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”
进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格
处理。
– 如搜索:allinurl:"cgi-bin" phf +com
• 也可用于检索全文
1. 网络搜索引擎
搜索结果说明
• 网页快照
该网页最后一次编入索引时的版本。
• 即时预览
点击搜索结果旁的放大镜图标 即可在点击结果前预览对
应的网页。
网页快照
即时预览
1. 网络搜索引擎
 高级检索与检索设置
• 所有上述功能均可在高级检索中实现和进行组合。
检索结果界
面的右上角
1. 网络搜索引擎
 Google学术搜索
• 来自学术著作出版商、专业性社团、预印本、各大学及其
他学术组织的经同行评论的文章、论文、图书、摘要和文
章。
• 滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不
同版本以及被其它文章的引用次数。
• 搜索出来的结果没有按照权威度(譬如影响因子、引用次
数)依次排列,在中国搜索出来的,前几条记录可能为书
籍。
1. 网络搜索引擎
学术搜索的检索技巧
• 从标题出发的搜索
– 精确查找:输入加引号的论文标题:“A History of the China
Sea”。
• Google 学术搜索会自动查找此论文以及提及此论文的其他论文。
– 一般直接输入题目,会将最匹配的结果放在前面。
1. 网络搜索引擎
• 从作者出发的搜索
– 搜索 [friedman regression] (弗里德曼 回归) 会返回以
“regression”为主题的,由名为“Friedman”的人撰写的文章。
• 输入加引号的姓名:["jh friedman"],搜索某位作者。
– 如果某个词既是人名也是普通名词,使用"作者:"操作符。 "作者:"和
搜索字词之间不能有空格。
• [作者:flowers] (人名弗劳尔,也是花的意思) 会返回由名为
"Flowers"的人撰写的文章,而 [flowers -作者:flowers] 会返回关于花
的文章,而忽略由名为"Flowers"的人撰写的文章。
– 作者全名加引号,来进一步缩小搜索范围。尽量使用首字母而不要
使用全名。
• 要查找 Donald E. Knuth(唐纳德·E. 克努特),可以尝试 [作者:"d
knuth"]、[作者:"de knuth"]或[作者:"donald e knuth"]。
1. 网络搜索引擎
利用作者限定,还
可以实现更多搜索
例如:搜索研究
毛泽东的文献
1. 网络搜索引擎
学术搜索的高级搜索
• 出版物限制
– 只返回来自特定出版物、针对特定字词的搜索结果。
• 日期限制
– 在寻找某一特定领域的最新刊物时,可能会比较实用。
• 信息可能不完整甚至不准确;例如,许多预印本没有介绍文章
是在哪里(甚至是否)最终出版,有些网站资源没有标注出版
日期。
• 一本杂志名称可能会用多种方式进行拼写(例如:Journal of
Biological Chemistry(《生化杂志》)经常被简写为 J Biol
Chem)
1. 网络搜索引擎
检索限定条件
刊物、时间限定
1. 网络搜索引擎
学术搜索的结果页面
• 被引用次数:不同于SCI的被引次数,两者覆盖文献范围
不一样。点击可查看施引文献。
• 相关文章:与这篇文章相似的其他文章
• 所有版本:有这篇文章的不同的数据库或网站,有可能某
个网站就可以下载全文。
• 更多:可以检索书目信息、查看全文的途径等。
• 图书馆链接:通过未名学术搜索或指定图书馆检索系统检
索这篇文献。
1. 网络搜索引擎
在图书馆检索系
统中检索
被引用情况
被引用情况
所有版本
1. 网络搜索引擎
巧用学术搜索的设置
• 文献信息的导出功能:支持多种参考文献格式的导出,方
便日常的管理和论文中的引用生成。
• 语言设置:有目的性地搜索某种语言的文章。
• 图书馆连接设置:可以便捷地搜索图书馆是否已有该篇文
献的全文。
不要忽视这里
1. 网络搜索引擎
选择所需的格式
勾选北大图书馆的连接
1. 网络搜索引擎
便捷的文献信息定制功能
• 文献引用信息的跟踪定制
– 定制某篇文献的最新引用文献信息,推送到设定的邮箱中。
• 检索的跟踪定制
– 定制符合某一检索式的最新文章信息,推送到设定的邮箱中。
1. 网络搜索引擎
检索的跟踪定制
1. 网络搜索引擎
首先点击被引链接
在引用文献界面点击创建Alert
文献引用信息的跟踪定制
1. 网络搜索引擎
学术搜索的更多功能
• 统计分析功能
– 以出版物为单位,按h5指数列出较为突出的刊物。
• h5 指数是指在过去整整 5 年中所发表文章的 h 指数。h 指在
2007-2011 年间发表的 h 篇文章每篇至少都被引用过 h 次的最大值。
也可检索某领域情况
可直接点击查看
整体情况
1. 网络搜索引擎
• 个人研究成果主页
– 由个人建立,自动按个人信息抓取相符的文献。
– 可手工进行添加和筛选。
– 提供部分统计功能。
统计数据
关注他
高频次合作者
成果列表
1. 网络搜索引擎
使用Google获取全文的Tips
• 一般直接用学术搜索即可,但有可能学术搜索搜不到,而
google却可以搜到。
• 查看所有版本获取更多途径。
• 推荐使用英文版。
1. 网络搜索引擎
Google Books
• Google Books是一款提供了全文检索的图书搜索产品,
不仅搜索图书的摘要,而且可以对图书全文内容进行搜索。
• 此服务于2004年10月在法兰克福书展发布,命名为
Google Print。
• 微软在2006年开发了一个类似的计划,名叫Live Search
Books。它持续进行了一段时间,直到2008年5月该计划
才被取消,所有的数据现已存在Internet Archive。
• 包含大量扫描获取的全文,但是版权问题存在争议。
• http://books.google.com/
1. 网络搜索引擎
1. 网络搜索引擎
Google Trends
• Google 趋势可让您比较世界各地的人们对您的首选主题的关
注程度。
• 您最多可输入五个主题,然后观察人们在各个时段内通过
Google 搜索这些主题的频率。
• Google 趋势还可显示您的主题在 Google 新闻报道中出现的
频率,以及最常搜索这些主题的人们所在的地区。
• Google 趋势会分析部分 Google 网页搜索结果,计算人们在
各个时段通过 Google 使用您输入的字词执行搜索的次数,并
与同期执行的搜索总次数进行比较。
• 通过热门趋势,可以查看不同时间搜索量上升最快的搜索内容
(http://www.google.com/trends/hottrends)
1. 网络搜索引擎
www.google.com/trends
1. 网络搜索引擎
• 可以很明显的看到这一天焦点事件成为人们搜索的主要
热点
1. 网络搜索引擎
Google Books Ngram Viewer
• 查看词组在全世界历年出版的图书中出现的频率。
• http://books.google.com/ngrams
1. 网络搜索引擎
必应Bing
• 必应(Bing,中国大陆译作必应,台湾译作缤纷)是微
软公司推出的用以取代Live Search的搜索引擎。由微软
CEO史蒂夫·鲍尔默于2009年5月28日在《华尔街日报》
于圣迭戈举办的“All Things D”公布,2009年6月3日
正式在世界范围内发布。内测代号为Kumo,其后才被命
名为Bing。
• 中文版目前依然为beta版
• www.bing.com
1. 网络搜索引擎
英文版非Beta
嵌入社交网络
更多搜索提示
1. 网络搜索引擎
微软学术搜索
• 对文献信息进行了部分人工整理。
• 提供了多方面的统计数据。
• 提供了针对科研人员、科研领域等的主题页面
• http://academic.research.microsoft.com/
1. 网络搜索引擎
很有特色的微软学术搜索
提供了多种可视化科研评
估与分析功能
1. 网络搜索引擎
针对模态逻辑领域的统计
关键词聚类分析
相关文献信息
1. 网络搜索引擎
合作与引用关系图
针对科研人员的统计
1. 网络搜索引擎
• 合作关系图(合作越多距离越近)
1. 网络搜索引擎
• 探索两个作者间的合作关系网
1. 网络搜索引擎
• 引用关系图(引用次数越多距离越近)
1. 网络搜索引擎
学科和年代的限定
• 机构比较(发表和引用情况)
1. 网络搜索引擎
其他一些搜索引擎
• 典型的元搜索引擎MetaCrawler
– www.MetaCrawler.com
• 学术搜索引擎SCIRUS
– www.scirus.com
• 百度中文搜索引擎
在线百科资源
2. 在线百科资源
集大成者-维基百科Wikipedia
• www.wikipedia.org
首页下方还有维
基的其他项目
2. 在线百科资源
维基百科的成立
• 维基百科最初是Nupedia的附属计划之一,Nupedia是一个制
作自由百科全书的计划,现在已经停止运作。Nupedia有一个
严谨的同行评审系统,且需要专业资格的使用者才能做出贡献,
但条目的撰写进度却十分缓慢。在2000年时,Nupedia创办
人吉米·威尔士(Jimmy Wales)和员工拉里·桑格(Larry
Sanger)讨论著要如何让Nupedia成为更开放、完整的计划。
许多人建议使用wiki可以让一般大众贡献内容,因此Nupedia
的第一个wiki在同年的1月10日上线。
• 许多的编辑者和评审员拒绝让一个wiki网站加入Nupedia计划
中,因此新的计划在1月15日(现在称为维基百科日)改用
“Wikipedia”作为名称,并使用属于自己的网域
─wikipedia.com。带宽和服务器由威尔士赞助,由维基媒体
基金会负责维持。
2. 在线百科资源
维基名称的由来
• 沃德·坎宁安(Ward Cunningham)于1995年3月25日
成立了第一个wiki:WikiWikiWeb,用来补充他自己经
营的软件设计模式网站。他发明了wiki这个名字以及相关
概念,并且实现了第一个wiki引擎。坎宁安说自己是根据
檀香山的Wiki Wiki公共汽车取名的。这是他到檀香山学
会的第一个夏威夷语。
2. 在线百科资源
维基的理念
• Wiki是一种在网络上开放、可供多人协同创作的超文本
系统。
• 使用wiki系统的网站称为wiki网站,wiki网站允许任何造
访它的人快速轻易地添加、删除、编辑所有的内容,而且
通常都不用登录,因此特别适合团队合作的写作方式。例
如:维基解密 WikiLeaks
• Wiki的内容也可能有误,因为用户必定会加上不正确的
数据。
2. 在线百科资源
• 截至2011年5月时,维基百科条目数第一的英语维基百科
已有350万条条目,而全球所有276种语言的独立运作版
本共突破1700万条条目,总登记用户也超越2650万人,
而总编辑次数更是超越10亿次。
2. 在线百科资源
• 在词条的解释中,一些术语也有自己的词条,可以直
接点击跳转查看,方便理解。
• 标为红色的是未编辑的词条,可以去进行添加,但未
必会被采用
2. 在线百科资源
词条间的便捷跳转方便
更快地了解相关知识
2. 在线百科资源
• 右边的工具栏可以选择基于
不同语言的维基百科
• 不同语言并非简单的翻译,
而是由不同地区或国家的人
自行编辑,各有其特色
• 维基百科会用标识来标出非
常优秀的或是比较有特色的
语言版本
2. 在线百科资源
• 例如模态逻辑的词条,维基百科推荐的优秀版本为
德文版本
2. 在线百科资源
• 中文优秀条目:自然演绎
2. 在线百科资源
• 相关词条下边的参考文献等信息很可能成为你
搜集相关文献的起点
2. 在线百科资源
Wiki books 和维基文库
• www.wikibooks.org
于2003年7月10日开放。此计划收集自由的教科书,目
录或其他用户自己编辑的书。
• www.wikisource.org
现在维基文库上主要存放各种遵循GNU自由文档协议证
书的文件以及兼容这个协议的原始文件,还有公有领域、
无版权或者版权已经过期的原始文献,例如古代的诗歌、
文章、法律文本等等。这个项目于2003年11月4日开始
启动
2. 在线百科资源
• Wikibooks 举例:LaTeX
2. 在线百科资源
• 维基文库的中文部分
2. 在线百科资源
其他百科网站
• 百度百科
– baike.baidu.com
• 互动百科
– www.hudong.com
• 大英百科全书在线
– www.britannica.com 图书馆购买
• Stanford Encyclopedia of Philosophy
– plato.stanford.edu
2. 在线百科资源
2. 在线百科资源
在线文库
• 百度文库
– wenku.baidu.com
• 新浪爱问 共享资源
– ishare.iask.sina.com.cn/
• 豆丁网
– www.docin.com/
各种注册、积分、
贡献值
专业数据库与全文的获取
3. 专业数据库
全文数据库
• 电子期刊
– 现刊:EBSCO的ASP、ProQuest的ABI、Wiley等
– 过刊:JSTOR
– 中文:中国期刊网、万方、维普
• 电子图书
– 中文:读秀、方正Apabi
– 英文:MyiLibrary、Netlibrary
• 学位论文
– 中文:北大论文、期刊网、万方
– 英文:PQDT、WorldCatDissertations、NDLTD、EthOS等
3. 专业数据库
最常用的:电子期刊数据库
• 中文电子期刊
– 中国期刊网(CNKI 中国知网)
– 万方数据库
– 维普数据库
•
常用
英文
现刊
Elsevier—Science Direct
SpringerLink
EBSCO
Wiley Online Library
西文电子期刊
Taylor & Francis
– 现刊
– 过刊
Oxford University Press
Cambridge Journals Online
常用
英文
回溯
JSTOR
PAO
NSTL外文回溯期刊全文数据库
3. 专业数据库
3. 专业数据库
• 电子期刊数据库中大多都提供了关键词检索和按期刊卷期
浏览的功能,及部分订阅功能,收录的期刊各有侧重。
• 图书馆未名学术搜索可以实现文章级别的检索。
• 从期刊角度查找文献及全文推荐利用图书馆主页中的电子
期刊检索页面进行检索(能够更为准确的全文拥有情况)
3. 专业数据库
• 其检索结果不仅列出了包含该种刊物的全部图书馆已购买
数据库,同时也会标注所购数据年份。
• 点击蓝色链接就可以直接连接到相应数据库中该期刊的浏
览界面。
3. 专业数据库
旧版主页
旧版主页的期刊导航比较直观
3. 专业数据库
常用逻辑学期刊导航表
• 详细列出常用逻辑学期刊的馆藏情况
– 包含全文的数据库
– 收录年份
– 期刊入口链接
3. 专业数据库
数据库
Springer LINK--德国施普林格(Springer-Verlag)电子期刊及丛书
JSTOR--西文过刊全文库
Kluwer Online--800种电子期刊镜像服务网站
Academic Source Premier--学术期刊集成全文数据库(EBSCO)
Academic Research Library--学术期刊图书馆数据库(ProQuest)
Elsevier Science--学术期刊数据库
Oxford University Press(OUP)--牛津大学出版社电子期刊
John Wiley--电子期刊数据库
Periodicals Archive Online(PAO)--典藏人文社科全文期刊库
ACM Digital Library--美国计算机协会电子期刊、会议录
Business Source Premier--商业资源电子文献数据库(EBSCO)
Cambridge Journals Online(CUP)--剑桥大学出版社电子期刊
Literature Resource Center--文学资源中心(Gale)
万方数据资源系统的全文数字化期刊
中国期刊网期刊全文数据库
中文科技期刊数据库(维普全文电子期刊)
哪些期刊数据库对你来说更重要
常用逻辑期刊数
14
11
11
9
8
6
5
4
4
2
1
1
1
1
1
1
3. 专业数据库
学位论文数据库
• PQDT和北京大学学位论文库
• WorldCatDissertations数据库
– 收集了OCLC WorldCat中所有的博硕士论文和已出版的以OCLC
成员编目的论文为基础的资料,涉及所有学科。从数据库高级检
索的“互联网资源”中,可获得近20% 约100多万篇的全文论文,
可免费下载。
• NDLTD
– 全称是Networked Digital Library of Theses and
Dissertations,是由美国国家自然科学基金支持的一个网上学位
论文共建共享项目,为用户提供免费的学位论文文摘,还有部分
可获取的免费学位论文全文。
• EthOS
– 一个免费的在线查找英国学位论文的站点,目前参加的有英国的
100多个机构。需国际网网关
3. 专业数据库
引文数据库
• 什么是引文?
– 引用与被引
– 参考文献
3. 专业数据库
• 引文索引数据库
– 收录论文的参考文献并索引
– Dr. Garfield 1955年在 Science 发表论文,提出将引文索引作为
一种新的文献检索与分类工具, 将一篇文献作为检索字段从而跟
踪一项科学研究的发展过程。
3. 专业数据库
• 通过施引文献和被引文献之间的关系,就可以揭示科学研
究的进程、发展等信息
3. 专业数据库
查看一篇微博的被引情况
• 用微博来打个比方:
对这篇微薄的一次引用
一篇微博转发的历程
3. 专业数据库
引文数据库的功能
• 发现谁在引用某项研究,它是如何支持相关研究的
• 快速和全面的搜集某个主题、领域的文献信息
• 跟踪同行及你关注的科研人员的最新研究动态
• 探索一个想法、概念由最初提出至今的发展及应用
• 科研统计和评估,如论文被引情况、期刊影响力等
3. 专业数据库
最为著名的引文数据库:WOS
• Web of Science是获取全球学术信息的重要数据库
– 收录了10,000多种世界权威的、高影响力的学术期刊和超过11万
个国际会议的学术论文集
– 内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文
等领域。其中图书馆购买了的数据库有:
Science Citation Index Expanded(SCI-EXPANDED)-1899-至今
Social Sciences Citation Index(SSCI)-1983-至今
Arts & Humanities Citation Index(A&HCL)-1983-至今
Conference Proceedings Citation Index-Science(CPCI-S)-1996-至
今
• Conference Proceedings Citation Index-Social Science &
Humanities(CPCI-SSH)-1996-至今
•
•
•
•
注意:Web of Science 的数据库均不是全文数据库。
3. 专业数据库
• SCI数据库概况
– Science Citation Index(科学引文索引),数据回溯到1900年,
北大正式购买的数据范围是1899年至今
– 涵自然科学、工程技术、生物医学等所有科技领域
• SSCI数据库概况
– Social Science Citation Index(社会科学引文索引),目前北大正
式购买的数据范围是1983年至今
– SSCI收录2400多种社会科学期刊,同时也收录SCI Expanded当
中涉及社会科学研究的论文
• A&HCI数据库概况
– Arts&Humanities Citation Index(艺术与人文科学引文索引),
目前北大正式购买的数据范围是1983年至今
– A&HCI完整地收录了25个学科的1165种期刊,包括ISI各个数据
库中有关艺术与人文科学方面的论文
3. 专业数据库
• CPCI-S及CPCI-SSH数据库概况
– CPCI-S ━ Conference Proceedings Citation Index Science(科学技术会议录引文索引)
– CPCI-SSH ━ Conference Proceedings Citation Index –
Social Science&Humanities(人文社科会议录引文索引)
– 收录科技及人文领域以图书、报告、期刊论文等形式出版的各种
会议文献,每年收录12,000多个会议的内容
– 但只收录含会议论文全文的会议文献
– 北大正式购买的数据范围是1996年至今
3. 专业数据库
利用WOS检索和挑选论文
• 利用聚类功能挑选Review论文
– 快速了解某一领域的研究进展和关键人物、文献
• 利用被引排序寻找高引论文
– 较高的被引数量代表着影响力与重要程度
• 利用年代限定和排序关注最新研究进展
– 根据不同学科的特点,关注较有意义的年代范围
3. 专业数据库
WOS的文献信息统计分析功能
• 科研立项 OR 开题报告 OR 论文投稿
– 分析论文出版年、研究机构、研究人员等
– 分析领域内会议、期刊等
分析统计功能
3. 专业数据库
可以选择各个
字段进行聚类
作者
会议名称
国家/地区
文献类型
编者
基金资助机构
授权号
团体作者
机构
语种
出版年
来源出版物
学科类别
WOS主题分类
排序方式选择
3. 专业数据库
逐年收录列表
当针对某个人或某个
机构等进行检索时,
检索结果的引文报告
将对分析很有帮助
逐年引用列表
引文统计信息
高被引文献信息
3. 专业数据库
文献引用关系图
单击节点可以聚
焦该文献,双击
可显示文献细节
所参考文献
后续引用文献
3. 专业数据库
WOS的文献信息跟踪定制
• 最新文献的跟踪
– 针对检索式的定制
– 对保存的检索式进行定时自动检索,并将新增结果发送至定制邮箱
– 可用于跟踪所关心主题的相关研究,及时了解最新的发展和成果,
而无需手动去检索。
• 最新引用的跟踪
– 针对引文的定制
– 对选定文献的引文进行跟踪,如有新的引用则通过邮件予以提醒。
– 可用于个人研究的后续发展,或所关注重要论文的后续研究成果等。
3. 专业数据库
检索Tips
专业数据库
综合性
 IDEA从何而来
 大量阅读文献
 学科最新进展
研究论文
综述
全文
文摘
外文
中文
3. 专业数据库
• 如何开始检索?
–
–
–
–
关键词(主题词)
从该领域知名学者、知名研究机构出发
从该领域权威期刊出发
从该领域经典著作或论文文献出发(引证信息)
• 如果检索结果太多怎么办?
– 二次检索
• 由大方向向小专题逐步选出更相关的文献
– 补充检索条件(精确检索)
• 通过补充时间、作者、期刊等条件来缩小范围
– 结果聚类(分类)
• 通过文献类型、主题等分类来缩小范围
– 结果排序(最新、影响力最大)
• 通过排序来选出最值得关注和阅读的文献
3. 专业数据库
利用WOS获取更多线索和信息
• 通过聚类和统计分析功能获得该领域研究情况信息
– 相关基金
– 相关期刊
– 年代分布
– 作者、机构
– 研究方向、涉及学科
• 通过文献页面的相关信息来拓展思路
– 参考文献、引用文献
– 共引文献(相同基础上的研究成果)
3. 专业数据库
用于评价期刊的JCR
• Journal Citation Reports 为美国科学情报研究所(ISI)出版的
网络版期刊引用报告,包含两个部分:
– 1) JCR Science Edition (自然科学版): 涵盖5,900多种科学技术期刊
– 2) JCR Social Science Edition (社会科学版): 涵盖1,700多种社会、
人文科学期刊
• JCR的特色
– 综合性、多学科的期刊分析与评价报告,它客观统计了WOS收录期刊
所刊载论文的数量、论文参考文献的数量、论文被引次数等原始数据,
并应用文献计量学原理,计算反映期刊质量和影响的定量指标(如影
响因子、特征因子等)。
• JCR常用词语解释及重要指数计算方法:
– http://www.lib.tsinghua.edu.cn/service/SCIcenter/sciimpac.html
3. 专业数据库
• 影响因子( Impact Factor , IF)
注意:对刊不对文
– 1972年由E·加菲尔德提出的,是一个国际上通行的期刊评价指标。
它不仅是一种测度期刊有用性和显示度的指标,而且也是测度期
刊的学术水平,乃至论文质量的重要指标。
– 影响因子为一个相对统计量,即某期刊前两年发表的论文在统计
当年的被引用总次数除以该期刊在前两年内发表的论文总数。
Nature的2010年IF计算
被引用次数
发表文章
2009年
28610
866
2008年
35114
899
合计
63724
1765
IF:63724/1765=36.104
3. 专业数据库
• 举例:逻辑学领域期刊
3. 专业数据库
用于科研评估的ESI
• 引文排名(Citation Rankings)
– 科学家Scientists(取排名前1%);
– 研究机构Institutions(取排名前1%);
– 国家/地区Countries/Territories(取排名前50%);
– 期刊Journals(取排名前50%)
3. 专业数据库
• 高被引论文(Most Cited Papers)
– 10年来的高被引文章(Highly Cited Papers (last 10 years)):
• 发表于十年内各领域中被引用次数前1%的文章。
• 单一学科或者综合所有学科的高被引的论文(BY FIELD);
• 或某一科学家、某一研究机构、国家/地区或者期刊的高被引文章(BY
NAME);
• 或通过检索创建相关高被引文章列表(BY SEARCHING)。
– 近两年来高被引的文章(Hot Papers (last 2 years)):
• 发表于两年内最近两个月被引用次数为各领域前0.1%的文章
3. 专业数据库
• 引文分析(Citation Analysis)
– 基线数值(Baselines)
• 为引文统计数据提供了比较分析的依据。
• 进入BASELINES MENU。
– 平均引文率(BY AVERAGES):按照10年间各年进行统计,表示各学科中
每年发表论文的篇均被引次数;
– 百分比(BY PERCENTILES):每年发表的论文达到某个百分点基准应被引
用的次数;
– 排名(BY FIELD RANKINGS):显示某个学科中的论文总数和引文总数。
– 研究前沿(Research Fronts)
• 按照共引关系聚类高被引论文,用以了解新的突破可能出现的领域以
及科学家之间的非正式交流的关系。
• 可以进一步按学科(BY FIELD) 浏览,或查看指定的主题(BY NAME) 。
3. 专业数据库
中文引文数据库
• 中国科学引文数据库(简称CSCD)
– 创建于1989年,收录我国数学、物理、化学、天文学、地学、生
物学、农林科学、医药卫生、工程技术、环境科学和管理科学等领
域出版的中英文科技核心期刊和优秀期刊千余种,目前已积累从
1989 年到现在的论文记录300 万条,引文记录近 1700万条。
• 中文社会科学引文索引数据库(简称CSSCI )
– 是由南京大学中国社会科学研究评价中心开发研制的引文数据库,
用来检索中文人文社会科学领域的论文收录和被引用情况。
• 期刊网、万方、维普等全文数据库也提供一部分的引文信
息
3. 专业数据库
Open Access数据库
• High Wire
– HighWire Press是全球最大的提供免费全文的学术文献出版商,
于1995年由美国斯坦福大学图书馆创立。文章总数已达
6,633,317篇,其中2,097,186篇文章可免费获得全文,这些数据
仍在不断增加。其收录的期刊覆盖了生命科学、医学、物理学、
社会科学。
• Open Access学术资源一站式服务平台
– 中国教育图书进出口公司用近4年时间开发出了《SOCOLAR:
Open Access资源一站式检索服务平台》,该平台收录了大量
Open Access期刊、Open Access机构仓储等学术资源,并向最
终用户提供一站式文章级检索和全文链接服务。
3. 专业数据库
3. 专业数据库
E-print 预印本数据库
• ArXiv.org
– arXiv.org是一个收录科学文献预印本的在线数据库,目前包含了
超过70万篇文章,并且以每个月5000篇的速度增长着。目前,
这个数据库包含:数 学,物理,计算机,非线性科学,定量生物
学,定量财务以及统计学几大分类。其最重要的特点就是“开放
式获取”,每个人都可以免费地访问全文数据。
– arXiv 原先是由物理学家保罗·金斯巴格在1991年建立的网站,本
意在收集物理学的论文预印本,随后括及天文、数学等其它领域。
金斯巴格因为这个网站获得了2002年的麦克阿瑟奖。
– arXiv 原先挂在洛斯阿拉莫斯国家实验室,是故早期被称为
“LANL 预印本数据库”。目前的 arXiv 落脚于康乃尔大学,并
在全球各地设有镜像站点。网站在1999年改名为 arXiv.org 。
3. 专业数据库
全文检索
3. 专业数据库
哲学领域数据库
• Philpapers.org 英文哲学论文数据库
– 由David Bourget和David Chalmers主持的哲学网站。
– 各专业领域收录文献数量:
• Metaphysics and Epistemology (87,340)
• Value Theory (128,761)
• Science, Logic, and Mathematics (81,953)
• History of Western Philosophy (97,091)
• Philosophical Traditions (20,952)
• Philosophy, Misc (1,109)
• Other Academic Areas (21,257)
3. 专业数据库
按专业浏览
按期刊浏览
还有网站发起的
调查
收集的哲学领域
研究文献
3. 专业数据库
科研活动信息
职位信息
3. 专业数据库
逻辑学领域数据库
• DBLP
– 数字书目索引与图书馆项目(Digital Bibliography & Library
Project,简称DBLP)
– 提供了计算机领域科学文献的搜索服务,它只储存这些文献的相
关元数据,如标题,作者,发表日期等。
– 最早的DBLP只包含数据库系统和逻辑编程相关方面的文章,所
以DBLP之前也可以是DataBase systems and Logic
Programming的缩写。随着更多的其他计算机领域的内容的加
入,发展成今天的DBLP。DBLP项目由德国特里尔大学的
Michael Ley负责开发和维护。
– 和一般流行的情况不同,DBLP并没有使用数据库而是使用XML
存储元数据。几乎每天都有专人手工输入,进行更新。
– http://dblp.uni-trier.de/
3. 专业数据库
多种搜索引擎
也有全文
3. 专业数据库
其他学术信息网站
• Arnetminer.org
– Arnetminer是一个以研究者为中心的学术社会网络分析与挖掘系
统,由清华大学计算机科学与技术系知识工程研究室唐杰博士
(http://keg.cs.tsinghua.edu.cn/jietang/)等人员研发完成。
– 该系统已搜集了上百万研究者信息,自动挖掘出研究者之间的师
生关系、合作者关系;提供多个以研究者为中心的社会网络分析
与挖掘功能,包括专家发现、专家页面自动生成、学术网络图搜
索、课程搜索、热点话题发现等。
3. 专业数据库
针对科研人员进行
信息的收集和分析
3. 专业数据库
小结:全文的获取
• 首选期刊导航
– 准确,有保障
• Google和Google Scholar
– 限定文件类型
– 查看更多版本
• OA和免费数据库
• 检索纸本资源
– 弥补数据库中的滞后期和缺失
• 馆际互借服务(文献传递)或是找同学和老师帮忙
– 会有费用,但有优惠期和一些优惠政策,请关注图书馆主页上消息
• 向作者请求(或搜索作者博客或个人网站)
3. 专业数据库
• 向作者请求
-
发送Email请求(最好不要太直接,描述你的研究和对这篇文章的迫切
需求等;可以尝试第一作者而非通讯作者)
3. 专业数据库
• 向作者请求
-
个人主页、Blog或网站
3. 专业数据库
图书馆电子资源使用Tips
• 图书馆购买的所有电子资源都是限定在校园网IP范围,使
用校园网直通车、搜狗浏览器自动代理打开的时候经常不
能访问。
3. 专业数据库
• 大部分数据库都是走专线,不需要国际流量,只需要登录
校园网网关
• 北大电子资源使用详见每个数据库后的“相关说明”内的
链接。
• 在校园网内,按“相关说明”进入数据库了,但看全文还
要用户名和密码?
– 有的数据库只购买部分年代,所以访问之前(或之后)年代的全文
需要输入用户名和密码,这种情况以期刊数据库为多。如:
Elsevier、Springer、John Wiley等
• 不要滥用资源—正常阅读速度
电子资源使用遇到问题可以
随时联系图书馆咨询部
学位论文撰写规范
4. 学位论文撰写规范
学位论文的基本要求
• 学位论文的主要组成部分
– 封面
– 版权声明
– 中文摘要、关键词
– 英文摘要
– 目录(插图和附表目录)
– 正文
– 注释、参考文献
– 附录
– 致谢
– 原创性声明与使用授权说明
4. 学位论文撰写规范
学位论文的各部分要求
• 封面
– 校徽、校名
– 学位名称
– 论文题目(副标题)
– 姓名
– 学号
– 院系
– 专业(研究方向)
– 导师姓名
– 论文完成时间
4. 学位论文撰写规范
• 摘要、关键词
– 内容摘要要求在3000字以内,硕士论文一般在500-1000字,用
于简要说明本论文的目的、内容、方法、成果和结论,要突出论
文的创新之处。
– 在摘要的最下方另起一行,注明关键词,一般要求3-5个。
– 英文摘要在中文摘要之后,此部分包括英文的论文题目、英文作
者姓名、英文专业名称、英文导师姓名、英文摘要和英文关键词。
– 英文专业名称用括弧括起置于英文姓名之后,研究生姓名下面一
行写导师姓名。
4. 学位论文撰写规范
• 目录
– 目录一般列至二级标题,标号格式通常没有明确要求,可用可以
用“章、节”;“一、(一)”;“1、1.1”等形式。
– 学位论文提交系统中要求目录的页码要与正文的章节以及附录的
内容相符合,正文页码应从第1页开始,正文以前的部分(不包
括封面)请用罗马字母(I,II,...)编页。
混搭风格
Tips:
1. 用Word可以方便地自动生成目录
2. 巧用Word中分节符来解决页码问题
4. 学位论文撰写规范
• 注释、参考文献
– 注释可采用脚注或尾注的方式,按照本学科国内外通行的范式,
逐一注明本文引用或参考、借用的资料数据出处及他人的研究成
果和观点。
– 参考文献按不同学科论文的引用规范,列于文末(通篇正文之
后)。外文用原文,不必译成中文。
– 不同学科不同学位对参考文献的数量也有不成文的一些要求。
– 参考文献格式要参考本学科惯例。
Tips:
1. Word中可以手动插入引用
2. 利用文献管理软件从繁琐的参考文献编
辑中解放自己
4. 学位论文撰写规范
国家标准
• 中华人民共和国国家标准GB 7714-87 “文后参考文献
著录规则”(目前用的较多)
• 中华人民共和国国家标准GB/T 7714-2005 “文后参考
文献著录规则”(用于替代上面那个,但还有待普及)
4. 学位论文撰写规范
如何找到学位论文要求
• 学校的博硕士学位论文规范
– 可在研究生院中查找,也可Google得之
• 院系主页中搜寻学位论文规范
– 有些院系有本科生论文要求
• 在北京大学学位论文库中找模板
– 仅限研究生论文
• 向师兄师姐求科普、求模板
– 万能、靠谱
4. 学位论文撰写规范
• 搜索关键词:
– 北京大学学位授予工作细则
– 北京大学研究生学位论文的基本要求与书写格式(2005年6月修订)
– 北京大学研究生学位论文的基本要求与书写格式(2007年6月修订)
– 北京大学学位论文原创性声明和使用授权说明
期待大家的
提问与交流!
北京大学图书馆 赵飞
Email:[email protected]