Transcript Slide 1

建立和维护香港
科技大学的机构
学术成果存储库
Diana Chan
参考咨询部主任
香港科技大学图书馆
2005年11月
图书馆和网络资源技术研讨会
2005年, 厦门大学
报告提纲
1.
2.
3.
4.
5.
6.
开放使用和机构学术成果存储库(IR)
香港科技大学IR项目
软件选择
计划与政策
内容搜集的策略
挑战及问题
2
香港科技大学简介
 成立于1991年
 4 个学院 (SSCI,
SENG, SBM, HSS)
 450名教员, 5,500 名
本科生, 2,800名研究
生
 在全球前200位大学
中排名第42位(数据
来自时代杂志高等教
育增刊2004)
 图书馆: 22名馆员, 75
名其它员工
3
1. 开放使用与机构学术成果存储库
 技术和社会发展趋势导致开放使用的兴起
 开放使用的成果
 什么是机构学术成果存储库?
 为什么要建立机构学术成果存储库?
4
技术发展趋势
 通过FTP 和网络(HTTP)分享文档越来越容易
 使研究人员能够在有特定主题、基于网络的开放文档存储库
中“出版”他们的研究成果(工作论文、预印本等),以便
于更快、更广泛的传播
 由学者或机构公布文摘和全文
 Social Science Research Network (SSRN)
 IDEAS – 经济学方面的工作论文
 这些资源的成功收集使开放的文档储存(OAI)得以实现, 这一
项目促进了作者的自我存档和文档共享通用标准的实施
 主要成果: 用于元数据收集的开放的文档存储协议(OAIPMH)
5
社会发展趋势
“连续出版物危机”
期刊数量不断增长
+
价格上涨
+
图书馆预算缩减
= 市场失调
(自从19世纪80年代)
Source ARL Statistics: Monographs and Serials Costs in ARL Libraries, 1986-2003
6
开放使用之示例
 学术出版和学术资源联盟(SPARC)
 得到研究图书馆协会(Association of Research Libraries)的支持
 被很多不同种类的社会组织认可,如: Assoc. of American Universities,
Assoc. of Universities and Colleges of Canada, Australian ViceChancellors Committee, etc.
 成立于1997年,目的是纠正学术出版领域的市场失调
 “促进竞争并支持开放使用,以解决高额且不
断增加的期刊费用的问题”
7
开放使用的成果 之一
开放使用期刊
 经审核的或同行评审的期刊
 Emerging Infectious
Diseases
 Journal of Machine
Learning Research
更多内容,请访问开放使用期刊指南(DOAJ)
8
开放使用的成果之一: OAIster
 在一个可检索的界面中可获得来自536 家学术机构的公开存档内容
 590万篇文档:来自开放使用期刊的文章、 工作论文、 讨论文章和会议
论文、 学位论文
+机构学术成果存储库包括以上全部及更多内容
9
开放使用的成果之一:
机构学术成果存储库(IR)
 两个开放信息资源系统的出现推动了IR的发展:
 Eprints (U of Southampton)
 DSpace (MIT)
 一些IR范例
 Australian National University Eprint Repository
 eScholarship Repository (加州大学)
 CalTech CODA
 Institutional Archives Registry (截止2005年10月5日有
468家)
10
什么是机构成果存储库(IR)?
 “一个采集并保存单一或多个大学团体的知识成
果的数字化存储库”
-
摘自 “The case for institutional repositories: a SPARC position
paper” ,由Raym Crow撰写.
<http://www.arl.org/sparc/IR/ir.html>
11
为什么要建立机构成果存储库?
 布达佩斯开放使用项目
http://www.soros.org/openaccess/index.shtml
 推荐两种策略:
1. 在开放的电子文档存储库中进行自我存档
2. 开放使用期刊
12
双重开放使用策略
 BOAI-2 (“gold”): 在合适的开放使用期刊上出版文
章
 BOAI-1 (“green”): 或者,在一份合适的收费使用
期刊上出版文章,同时将其自我存档
13
必须满足两种条件
 作者赋予所有的使用者免费的访问权限以及复制、
使用、分发、传播和展示的许可
 其文章的一个完整版本至少在一个在线存储系统
中存档
- 摘自柏林宣言
14
为什么在香港科技大学建立IR?
 为了永久保存香港科技大学的学术成果
 为了使香港科技大学的学术成果能够得以用免费
且通用的数字格式来进行使用和传播
 以支持国际间的开放使用的努力
如果整个社会不能广泛地、方便地获取知识,那
么知识传播的任务仅仅完成了一半
- 摘自柏林宣言
15
2. 香港科技大学的机构成果存储库

以数字格式收集、传
播和保存香港科技大
学的学术成果

使用DSpace 软件,
OAI-PMH 标准, 支持
中文显示

很容易被互联网搜索
引擎和索引工具找到
http://library.ust.hk/repository/
16
文档总数
收藏
数量
百分比%
会议论文
579
26
工作论文, 技术报告, 研究报告,
预印本
534
25
期刊文章
493
23
博士论文
394
18
专利
58
3
专题报告
56
2
书籍章节
37
2
其它
8
1
总数
2,159 (包括100 截至2005年10月5
份副本)
日
17
各部门提供的文档占收藏的比例
(截至2005年10月5日)
HSS&SOSC
6%
OTHER
12%
COMP
21%
SBM
13%
ELEC
13%
OTHER SCI
9%
PHY
5%
MATH
6%
OTHER ENG
8%
MECH
7%
18
香港科技大学机构成果存储库主页
19
按学术机构和收藏内容进行浏览
20
香港科技大学IR中涵盖的学术机构
 Accounting
 Advanced Engineering
Materials Facility
 Applied Technology Center
 Atmospheric, Marine and
Coastal Environment Program
 Biochemistry Biology
 Center for Enhanced Learning
and Teaching
 Centre for Display Research
 Chemical Engineering
 Chemistry
 Civil Engineering
 Computer Science
 Economics
 Electrical and Electronic
Engineering
 Finance
 Humanities
 Industrial Engineering and
Engineering Management
 Information and System
Management
 Institute of Nano Science and
Technology
 Language Center
 Library
 Management of Organizations
 Marketing
 Mathematics
 Mechanical Engineering
 Physics
 Social Science
21
按作者查找文章
kwok y
22
23
IR 记录示例
点击以查
看全文
24
PDF 格式的全文
25
在IR中进行检索
填入关键词并进行检索
26
27
提交文章
输入您在校内
的用户名和密
码。
28
填写表格,点击页面
底部的“Submit” 按
纽
29
30
您将收到一份确认电子邮
件
31
访问数据
32
3. 软件的选择
 2004年7/8月,发表  我们遵从了CalTech的模
关于IR系统和功能要
式, 采用开放资源软件来
求的图书馆技术报告
建立IR, 并使用OAI-PMH
界面
 我们评估了 2个IR系统:
EPrints 和 DSpace
33
DSpace
 由麻省理工学院图书馆和惠普公司
共同开发
 开放资源软件
 在我们的系统评估期间(2002年12
月底), 在 Sourceforge 上发表
 以 Java语言写成, 使用了
PostgreSQL数据库、Lucene 搜索引
擎和Tomcat web servlet
container
34
DSpace
 在2003年我们选择使用DSpace 。原因是:
DSpace 是在EPrints 的经验基础之上开发的。
EPrints 是第一个也是当时使用最广泛的开放资
源IR软件
EPrints不能完全支持Unicode, 也不是基于
Java和servlet制作而成的
EPrints和DSpace 都是开放资源软件, 能完全
满足我们的功能要求, 并且符合最先进的图书
馆标准
35
香港科技大学IR
目前的概况
截至2005年10月5日
主页:
IR 软件:
系统软件:
http://repository.ust.hk/
DSpace 版本 1.2.1
Fedora Core 2 Linux; Tomcat 5.0.28;
JDK1.4.2_05
服务器:
Intel Pentium4 2.4GHz, 2GB RAM
内容:
2,059个文档来自40个学术机构
使用情况:
2005年9月, 这些文档被访问了5,792次
36
主要特色
数据结构
文档提交表格
添加文档资料表格
多语言支持(中文、日文、韩文)
提供OAI(数据库跨库搜索引擎)数据
SRW/U界面
37
数据结构
 文档类型
 期刊文章、学位论文等
 文档格式
 以PDF文档为主; 兼有 PowerPoint文档
 DSpace 数据模式
 学术机构 (及其分支机构)
 收藏
 文档资料
 元数据
 集中传送的编码信息流
 HKUST的做法: 文档资料按以下进行整理
 部门 (如:学术机构)
 然后按文档类型 (如:不同的收藏汇集)
38
文档提交表格
教员不愿意自己提交
DSpace的文档提交和工作流程耗时太长
需要一种简单且毫不费力地提交的表格 – 作为
提交文档的快速媒介
使用Perl语言写成
所提交的数据存储在DSpace的 “Simple
Archive Format”(简单存档格式)中
39
添加文档资料表格
这是本地开发的一个 JSP应用, 目的是让图书
馆工作人员将文档资料添加到DSpace 中
允许工作人员:
创建全新文档资料
在教员提交的文档资料中增加元数据信息后
再添加到DSpace 中
40
41
多语言支持(中文、日文、韩文)
 CJK (中文、日文、韩文) 支持
 DSpace支持Unicode
 问题 - Lucene搜索引擎无法检索CJK字符
使用CJKTokenizer 取代DSpace’s Tokenizer从而 解
决了这个问题 – 但是有一个很有趣的副作用
 问题- 带CJK字符的查询URL不能准确编码
通过设置 Tomcat URIEncoding=“UTF-8”,解决
了这个问题
42
43
44
提供OAI(数据库跨库搜索引擎)数据
DSpace符合OAI标准
这意味着 OAI跨库搜索能够很容易地收集来自
不同IR(包括香港科技大学)的(Dublin Core格式)
元数据, 为其增值的索引/搜索服务
例如: OAIster
到香港科技大学IR的OAI途径:
http://repository.ust.hk/dspace-oai/request?
45
http://repository.ust.hk/dspace-oai/request?verb=GetRecord& ... 1783.1/1805
46
SRW/U界面
网页(或通过URL)的检索和提取
保持了Z39.50协议的核心功能, 但采用了Web
服务的形式
这意味着检索服务的提供者能够对各种IR发布
一种检索, 并在他们自己的GUI界面上展示检索
结果
香港科技大学IR的SRW/U界面
采用OCLC的SRW/U软件
URL: http://repository.ust.hk/SRW/
47
一个含XSLT转换的SRW/U检索的结果
48
增强DSpace的功能
文档提交表格
CJK 检索问题
下标和上标的问题
显示的文档数量
访问数据
前20名下载最多的文章
推荐一个文档链接
教员、工作人员链接
49
4. 计划与政策
 特别工作组 – 软件, 范围, 政策, 数据库结构, 问题,
行动计划
 信息服务委员会 – 出版的指导方针, 出版社政策,
数据格式, 教员关注的问题
 图书馆管理委员会 – 问题, 争议, 最终决定, 策略
50
工作团队 – 学科馆员
正确版本
数据输入人
员
Samson Soong博士
和学科馆员
与教员
联系
为文档编
写索引
检查出版物
列表
错
误
版
本
收集文档
正确版本
校验文档
版本
确定出版社
政策
51
工作团队 – 数据输入人员
核实文档并转换成
PDF 格式
使用提交表格
输入元数据
设置PDF文档的安全性和性质。
为预印本添加标记
最后审核
将文档添加到存储库中
校对
52
53
不同出版物的指导方针
类型
版权
采取的行动
图书章节
图书
会议论文
会议录
美国标准
出版社
需要许可
出版社, 50 年
需要许可
作者
可以存档
出版社
需要许可
公共部门
作者
可以将美国标准存档
工作论文, 技术报告
作者
可以存档
专题报告
标准
作者
可以存档
发行机构
无
54
SHERPA 对出版社政策的总结
55
期刊文章的指导方针
出版社政策
不确定
有
所有
项目
是
是
是
询问出
版社
否
是
是
是
询问出
版社
否
询问教
职员
询问教
职员
是
询问出
版社
无存
档
出版社 预先审
核
版本
过后审核 两者都
提交前审核
的版本
否
是
是
提交后审核
的版本
否
是
出版社版本
否
是
目前可获得
的版本
56
出版社政策指南
 了解出版社在版权和自我存档方面的政策
(SHERPA/RoMEO , Stevan Harnad和出版社的
网站)
 自建表格,以供参考
 打印出版社的版权声明和发表的日期
 理解他们希望获得答谢或名誉认可的要求
57
认可出版社的所有权
 在每个记录的版权栏:
APS 版权声明:
"[Journal title] © copyright (year) American
Physical Society. The Journal's web site is
located at http://....."
58
59
其它政策
撤回
替代版本
与用户组的合作
权限控制
索引
权利与认可
60
5. 搜集内容的策略
我们的逻辑
如何按文档类型进行搜集?
如何使用不同的渠道?
持续增长
61
策略的逻辑基础
 研究成果是大学的知识产权
 将产生大量的文章
 版权和自我存档权是我们关注的要点
 Ascertain出版社政策
 从作者和出版社那儿获得许可
 选择那些较易获得的出版物和较易访问的资源
 发布在网络上的内容
 来自出版社已允许出版的版本
62
如何按文档类型进行搜集?
1.
2.
3.
4.
5.
6.
7.
工作论文, 技术报告, 研究报告
会议论文
会议报告
学位论文
图书章节
同行评审的期刊文章
开放使用的期刊文章
63
学术性文献的来源
图书馆馆藏
研究人员
网络
学术性文献
出版社
期刊
64
版权与自我存档权的比较
可存档
有版权的
期刊文章, 图书章节, 会议录, 学
位论文, 专题报告
无版权的
工作论文, 技术报告
大学所有
作者许可
作者许可
部门许可
作者所有
作者许可
出版社所有
不可存档
出版社及
作者许可
选定的项目需要获得作者和出版
社的许可
65
期刊文章
期刊文章
检查作者的存档权
是,预先审核或
过后审核的版本
无或不清楚
询问出版社
是,出版社
版本
从网络获得
询问作者
存入IR
66
如何使用不同的渠道?
1. 自我提交
2. 从网页上获取 (院系, 教员, 研究中心)
3. 图书馆馆藏
 会议录
 学位论文
 学校档案
4. 从信息源获取(数据库, 电子期刊, 开放使用的出
版物)
5. 出版社
6. 与教员, 院系,研究中心进行联系
7. 公共关系
67
电子论文确认表
学生同意:
我在此给予香港科技大学图书馆以数字格式存储
我的学位论文的非独家权利,并使之可通过互联
网等方式免费获得
签名:
日期:
68
出版社政策: Emerald
Emerald的版权原则
Emerald希望在作者不需放弃使用自己文章的权利的情况
下, 获得其出版的文章的版权. 作者不需获得许可即能再使
用他们自己撰写的文章. 身为作者你不必获得我们的许可,
即可在为我们撰写的另一篇文章时、自己的网页上或其它
情况下使用你撰写文章的部分或全文
http://ninetta.emeraldinsight.com/pdfs/jarform.pdf
69
收藏内容增长过程中的转折点
1800
83个研究中心
1600
No. of Documents
1400
79个大学存档
1200
50篇IOP文章
1000
142篇会议论文
获得出版许可的35篇文章
800
96篇CS文章
600
110篇论文+ 211篇工作论文
400
53个专利
来自于教职员网页的116篇文章
200
105个CS技术报告
0
May
2003
Jul
Sep
Nov
Jan
2004
Mar
May
July
Sep
70
保持香港科技大学
机构学术成果存储库的持续性
 如何使向IR提交成为出版过程的一个部分?
获得教职员的许可以保存由RGC资助的文章
利用OCGA 研究成果报告流程, 在报告表中添
加一个确认框以确认同意将其存储在IR中–在
2005年夏天收到论文超过100篇
71
6. 教员面临的挑战
 对开放使用鲜有所知
 关注版权问题
 对自我提交文档不感兴趣
 不愿意商谈有关非独家版权或自我存档权事宜
 不愿意提供(经预先或过后审核的)正确文档资料
 他们的学术成果中只有少数能被存储
72
一位教员保留自我存档权的例子
73
机构面临的挑战
需要作出承诺,以将所有研究成果储存到
学术成果存储库中
需要为向开放使用期刊提交文章的教员提
供财力支持
需要为图书馆的存档工作提供财力支持
74
出版社面临的挑战
 在SHERPA项目中,截至2004年11月,107家出
版社中的73家(68%)允许某种形式的存档
 很多出版社没有相关政策 (如: Camford,
Genetic Society of America)
 很多出版社的相关政策很模糊
 需要在与出版社签订的许可协议中包含自我存
档条款
75
图书馆面临的挑战
 为大学的学术研究的自我存档提供支持
 促进推广IR
 对用户和教员进行关于IR的教育
 展示IR
 寻找支持者和合作伙伴
 寻求机构的承诺与支持
 收集文档
 使文档的自我提交成为教员出版报告系统的一
个部分
76
图书馆员面临的挑战
 系统评估
 制定及理解政策
 内部及出版社政策
 内容收集
 支持自我存档




教育
咨询
预先获得的收益
公共关系
 使用帮助
77
参考文献及其它资源

Chan, Diana L.H. (2004) “Managing the challenges : acquiring content for the HKUST Institutional Repository” International conference
on developing digital institutional repositories : experiences and challenges, Hong Kong, December 9-10, 2004, California Institute of
Technology Libraries and the Hong Kong University of Science and Technology Library, available at http://hdl.handle.net/1783.1/1973
(accessed September 24, 2005)

Chan, Diana L.H. (2004) “Strategies for acquiring content : experiences at HKUST” International conference on developing digital
institutional repositories : experiences and challenges, Hong Kong, December 9-10 2004, California Institute of Technology Libraries and
the Hong Kong University of Science and Technology Library, available at: http://hdl.handle.net/1783.1/1974 (accessed September 24,
2005)

Chan, Diana L. H., Kwok, Catherine S. Y., Yip, Stephen K. F. (2005) “Changing roles of reference librarians : the case of HKUST
Institutional Repository.” Reference Services Review, Vol. 33, No. 3, pp.268-282, available at http://hdl.handle.net/1783.1/2039 (accessed
September 24, 2005)

Crow, Raym. (2002) “SPARC Institutional repository checklist and resource guide” The Scholarly Publishing & Academic Resources
Coalition, November.

Crow, Raym. (2002) “The case for institutional repositories: a SPARC position paper”, available at
http://www.arl.org/sparc/IR/ir.html (accessed September 24, 2005)

Gibbons, Susan. (2004) “Establishing an institutional repository” Library Technology Reports, July/August, Vol. 40 No. 4, pp. 5-67.

Lam, Ki-Tat. (2004) “DSpace in action: implementing the HKUST Institutional Repository system“ International Conference on Developing
Digital Institutional Repositories : Experiences and Challenges, Hong Kong, December 9-10, 2004, California Institute of Technology
Libraries and the Hong Kong University of Science and Technology Library, available at http://hdl.handle.net/1783.1/2023 (accessed
September 24, 2005)

Special issue on reference librarians and institutional repositories (2005). Reference Services Review, vol. 33, no.3. pp. 259-346.
78