共享省数图光盘资源所需的网络条件及补充解决方案

Download Report

Transcript 共享省数图光盘资源所需的网络条件及补充解决方案

湖北省独立学院图书馆应用技术交流研讨会
华中科技大学武昌分校 2010.11
共享省数图光盘资源所需的网络
条件及补充解决方案
武汉大学图书馆
夏正伟
www.hbdlib.edu.cn
大 纲
• 一、湖北省高校数字图书馆项目介绍
• 二、省数图网络架构、速度测试与接入要求
• 三、随书光盘服务及本地二级系统建设
www.hbdlib.edu.cn
1.1 项目基本情况
• 建设目标
– 依托现代网络条件和技术,以全省各高校图书馆的文献为基
础,合理布局,分工协调,建立纸本馆藏文献和网上电子文
献相结合的文献资源体系和网上公共服务体系,为全省所有
高校的师生提供服务,使我省高校教学科研的文献保障有明
显的改善,促进我省高校办学水平和办学质量的提高
• 建设内容
– 文献资源系统
– 网上公共服务平台
www.hbdlib.edu.cn
1.2 技术路线
• 建立两个数据中心,网络和设备冗余互备,用户
无缝使用
• 门户应用遵循CALIS标准,尽可能使用CALIS的相
关应用软件
• 以省内多数图书馆的需求为发展目标,实用为主,
适当先进
www.hbdlib.edu.cn
数据中心网络架构
CERNET华中地区中心
100M
30M
1G
1G
30M
1G
教育网数据中心
www.hbdlib.edu.cn
公共网数据中心
省高校数图网上公共服务平台拓扑图
www.hbdlib.edu.cn
湖北省高校数字图书馆门户系统框架
统一认证(IP)
湖北省高校数字图书馆门户
统计系统
远程授权访问系统
联合书目
检索
统一检索
资源调度
元数据、
联合目录
中外文期
刊论文
其它电子
资源
www.hbdlib.edu.cn
文献传递
全文
数据
参考咨
询
文摘
索引
资源导
航
馆藏
书目
区域文
献共享
系统
1.3 网络文献资源共享
•购买了4个中文数据库的全省高校使用权,建立了省数图基础性的数字化文献
资源系统
–电子期刊:8000多种中文刊 (维普,每年约90万元,需要付费才能使用)
http://vip.hbdlib.cn
–电子图书:72万册 (超星42万册、中国数字图书馆30万册,180万元,先期
另有各校投资300万)
http://cx.hbdlib.cn http://idl.hbdlib.cn
–学位论文:80多万篇 (万方学位论文库,2000-2008年,200万元)
http://wf.hbdlib.cn
www.hbdlib.edu.cn
1.3 网络文献资源共享
• 区域随书光盘存储共享系统
– 现有2.1万张随书光盘(5T容量)实现存储共享使用
– 各校仅需在馆藏书目检索系统(OPAC)中安装
插件并保证该服务器可以访问外网即可实现随书光
盘的共享使用
– 随书光盘的加工由18个学科中心馆承担
www.hbdlib.edu.cn
1.3 网络文献资源共享
加工中心3….
加工中心2
加工中心1
教育网用户
教育网用户
中心服务器(教育网)
用于数据同步
中心服务器(电信)
电信用户
电信用户
www.hbdlib.edu.cn
1.4 服务与应用共享
• 服务共享
– 统一检索
– 中文电子资源元数据仓储
– 文献传递
– 虚拟参考咨询
– 资源调度
– 资源导航
www.hbdlib.edu.cn
湖北省高校数字图书馆门户图片
www.hbdlib.edu.cn
湖北省高校数字图书馆建设方案及实施
外文期刊论文-统一检索33种数据库
www.hbdlib.edu.cn
中文期刊论文与馆藏书目检索
– 中文期刊论文:可以统一检索11种中文数据库(包括中国
知网、万方数据、重庆维普及CSSCI等)的目次数据
– 图书:可以统一检索十五个图书馆(包括武大、华科大、湖
大、华师、理工大、地大、华农、财政大、民大、武科大、武
工院、湖工大、湖中医、武科院、武体)的馆藏书目数据
www.hbdlib.edu.cn
HBDLIB文献传递网(示意图)
CALIS
文献传
递网络
中心成
员馆1
数据中心
中心成
共享版
中心成
员馆N…
成员馆1……
员馆2
成员馆n
学科中
心馆
SAS版
www.hbdlib.edu.cn
文献传递系统SAS版-18个学科中心馆
www.hbdlib.edu.cn
中文电子资源元数据仓储系统
• 包括数据量:超过1亿条记录
• 包括文献类型:期刊、电子书、学位论
文、会议论文、专利、成果、标准、法
规、企业名录、百科、词典、网络资源
、网页
• 为学搜索地址:http://so.hbdlib.cn
www.hbdlib.edu.cn
元数据仓储整合服务-一站式检索
• 1.电子书整合(超星、中数图)
• 2.学位论文整合(万方学位论文)
• 3.期刊整合(期刊网、维普和万方)
• 4.文献传递(CALIS)
• 5.Web 2.0相关
• 6.个人知识管理(PKM)
www.hbdlib.edu.cn
分词检索
www.hbdlib.edu.cn
类Google的智能提示
www.hbdlib.edu.cn
排序与分组
www.hbdlib.edu.cn
电子图书整合使用
www.hbdlib.edu.cn
学术研究趋势分析
www.hbdlib.edu.cn
学位论文直接下载
www.hbdlib.edu.cn
不一样的学术检索体验
• 学术搜索核心
• 排序算法
• 结果分组显示
• 分词特性
• 检索词高亮
• 相关相似
• 自动提示
www.hbdlib.edu.cn
1.4 服务与应用共享
应用共享:易瑞远程访问系统
–省数图投入80多万为全省120多所高校图书馆买断易瑞远
程访问系统
–湖北省各高校图书馆可免费安装一套服务于本校读者
–该系统可实现各高校用户利用任何上网方式,在任何地点
,只要有网络连接的地方就可以访问图书馆购买的网络电子
资源及省数图提供的资源及服务
www.hbdlib.edu.cn
1.5 人力资源共享
• QQ群
– 技术群:59045954
– 光盘加工群:73211355
– 联合目录群:55173241
– 咨询馆员群:85912445
• 论坛
– 工作论坛:http://techforum.hbdlib.cn
• 会议
– 定期举办分地区、分类型的培训
– 定期举办各种形式的研讨会
www.hbdlib.edu.cn
2.1 网络互联需求分析
1、项目实施前的网络测试及调查:2007年6月,对部分成员
馆所在学校的网络接入情况进行了调查,并进行了速度测试。
调查内容:所在学校网络带宽、IP地址情况等
测试方式:HTTP方式下载服务器文件的速度
测试节点:武汉大学图书馆服务器(位于教育网)
测试结果:收到30个馆的测试结果,其中17家教育网用户的
平均访问速度为4129KB/s,13家电信网用户的平均访问速度为
19KB/S
www.hbdlib.edu.cn
实施前访问速度分析
电信网接
入, 13
4500.00
4000.00
3500.00
4129.22
教育网接入
电信网接入
3000.00
教育网接
2500.00
入, 17
2000.00
测试页面
1500.00
1000.00
500.00
教育网平均访问速度
教育网与电信网用户比例
19.04
0.00
电信网平均访问速度
教育网与电信网的访问速度对比
www.hbdlib.edu.cn
2、网络速度测试结果表明:
成员馆所在高校接入教育网、电信网的均占有一定的比例。
教育网用户访问教育网速度较快,但电信网访问教育网很慢
,之间存在性能瓶颈。
部分院校网络接入情况复杂,存在多出口。
网络测试的结果对网络互联方案的制定和实施具有重要的
指导意义
www.hbdlib.edu.cn
3、网络互联项目实施需求:
实现两数据中心的直连和与教育网CERNET、电信网
CHINANET的连接;
实现用户的智能分流:保证成员馆用户对湖北省高校数字
图书馆网站的快速、高效访问;将来自教育网访问的用户
分流到数据中心的教育网出口,将来自电信网的用户分流
到数据中心的电信网出口;并可根据访问量的大小,支持
多链路、多服务器间的负载均衡;提供全局统一的快速访问
入口(URL)。
www.hbdlib.edu.cn
2.2 数据中心网络架构
设立教育网数据中心(华中科技大学)和公共网数据中
心(武汉大学)
网络互联方案:
• 租用光缆,实现两数据中心之间的光纤直连(距离
15KM),带宽为1G×2
• 两个数据中心通过光纤连接到CERNET华中地区中心
,带宽为100M×1
• 两个数据中心分别和CHINANET(中国电信)互联,
带宽为30M×2
www.hbdlib.edu.cn
CERNET华中地区中心
100M
30M
1G
1G
30M
1G
教育网数据中心
www.hbdlib.edu.cn
公共网数据中心
2.3 智能用户调度的实现
多链路负载均衡+智能DNS服务+多服务器负载均衡
•多链路负载均衡:根据湖北高校的实际情况,数据中心接入来自不
同ISP的双Internet链路,并实现链路间的负载均衡和故障切换。
•智能DNS服务:根据用户来源及网络链路、服务器的状况,将用户
定向到最合适的站点,在内容分发网络(CDN)服务中应用广泛。
•多服务器负载均衡:将访问量大、一台服务器无法满足需求的应用
部署在多台服务器上,并设置一定的均衡策略,提高服务能力,实
现高可用性。
www.hbdlib.edu.cn
2.4 用户访问速度评估
第二次网络测试的结果,平均速度750KB/s
www.hbdlib.edu.cn
2.5 成员馆访问速度测试方法
使用常规的网络测试命令:ping、traceroute
优点:系统内置,结果能直接反映问题
缺点:
较多的网络屏蔽了ICMP协议和路由跟踪功能
命令较复杂,需要较专业的网络专业知识
www.hbdlib.edu.cn
2.5 成员馆访问速度测试方法
• 使用httpwatch进行协议分析
• 优点:对Web网站的访问速度进行可视化分析
• 缺点: 需要专业的网络知识
www.hbdlib.edu.cn
2.5 成员馆访问速度测试方法
• 我们设计了直观的速度测试页面
• 使用者无需专业知识,打开页面就可以完成测
试
• 访问地址为
http://speedtest.hbdlib.cn/speed-test/
www.hbdlib.edu.cn
2.5 成员馆访问速度测试方法
www.hbdlib.edu.cn
2.5 成员馆访问速度测试方法
• 测试结果可以直观反映所在馆访问省数图的性能
• 解决访问慢的思路:
• 本馆或本校网络出口是否拥堵
• 本地的DNS设置是否正确
www.hbdlib.edu.cn
2.6 成员馆网络接入建议
• 学校建有校园网,校园网的内部带宽不小于100M,校园网
络必须有教育网或公共网出口,教育网的出口带宽不小于
100M,公共网出口带宽不小于20M。
• 学校图书馆通过校园网使用省高校数字图书馆,若图书馆
暂未与校园网连接或校园网暂未开通的学校,可通过在图
书馆安装公共网专线接入来访问省高校数字图书馆,图书
馆单独接入公共网出口带宽要求不小于10M。
www.hbdlib.edu.cn
3.1 省数图随书光盘系统基本情况
 目前湖北省数字图书馆光盘共享项目已经完
成一期项目建设
 系统共收录了书目3.7万多条
 可以提供服务的光盘文件25800多个
 系统累计访问量超过200万
www.hbdlib.edu.cn
3.1 省数图随书光盘系统基本情况
 系统通过三台服务器提供服务
一台资源加工服务器
二台资源镜像服务器
通过负载均衡技术,全省用户直接访问
这三台服务器上的资源
www.hbdlib.edu.cn
3.1 省数图随书光盘系统基本情况
系统架构图
www.hbdlib.edu.cn
3.2 现状与存在问题
 读者和加工单位分离。目前大部分光盘加工由部分学
校承担,大部分使用单位不承担光盘加工任务。导致
需求和加工有脱节
 各资源参建馆直接将资源上传至中心加工服务器
 镜像服务器定时从加工服务器同步书目光光盘信息
 三台服务器同时为全文用户服务
 各使用单位统一通过OPAC系统接入本系统
www.hbdlib.edu.cn
3.2 现状与存在问题
 一、由于网路问题,部分学校的访问中心
平台资源是的速度和效率受到限制。
 二、资源使用单位不一定是资源加工单位,
部分特色资源不能第一时间上线提供服务。
 二、由于资源集中在省中心,全省用户直
接访问中心服务器,中心服务器的性能和
网络压力比较大
www.hbdlib.edu.cn
3.3 解决思路
 要解决如上的几个问题,可以通过二级服
务点的建设,来完善各项功能
选择几个学校作为二级服务点,在本地直
接部署光盘加工和发布系统。
在二级服务器点直接加工和存储资源
有条件的馆在满足本地服务的情况下可以
选择的和省中心互联,为其他馆提供服务。
www.hbdlib.edu.cn
3.4 方案达成的目标
• 实现资源的本地存储,本地化服务器,提高
本校特色光盘的加工和服务器效率
• 分摊省中心大容量资源的存储压力
• 有条件和省中心实现资源共享
• 能够有效地加工本地特色光盘资源,且加工
和访问速度可以得到保证。
www.hbdlib.edu.cn
3.5 二级服务点架构
www.hbdlib.edu.cn
3.5 二级服务点架构
• 在二级服务器点部署一套非书资料系统
• 在二级服务器点直接加工书目和光盘
• 二级服务器点可为本单位的用户直接提
供服务,也可以选择性地为全省其他用
户提供服务。
www.hbdlib.edu.cn
3.6 二级服务器点和省中心的关系
www.hbdlib.edu.cn
3.7 二级服务器点和省中心的关系
• 二级服务器点是独立的一套随书光盘加工和发布系
统
• 有条件的学校可以作为省中心的资源分中心加入光
盘共享网络
• 部署二级服务器点的学校可以访问本地系统和省中
心的光盘资源
www.hbdlib.edu.cn
3.7 二级服务器点和省中心的关系
•
省中心的用户可以访问省中心及部分
开放共享的二级服务器点的光盘资源
• 通过入口控制及IP控制实现有版权访问
www.hbdlib.edu.cn
3.8 二级站点配置建议
软件费用:本地随书光盘服务器系统,软件许可需1万
元。
硬件建议配置:
• 1、服务器+低端存储(IPSAN、SATA盘柜)
• 2、兼容机方案:1~2台PC机,挂大容量硬盘(5-6
块1T或者2T的SATA硬盘,做Raid)。
• 内存 8G以上
www.hbdlib.edu.cn
提问与交流
• 如有问题,可向我提问,欢迎交流。
• 谢谢大家!
www.hbdlib.edu.cn