Web协同系统

Download Report

Transcript Web协同系统

Web Integration
李春旺
2011春
Web Integration
1 Web整合概述
2 基于M/W的整合系统
3 基于SOA的整合系统
4 Web整合发展趋势
5 Web整合实例
1.1Web整合理论
 什么是Web整合
研究如何利用相关技术和标准对Web上分散的、异构的资
源、服务、系统进行集成,形成一个效率更高的数字服务
体系,以便实现广泛的资源共享,推进个性化、一站式信
息服务。
 Web整合类型
数据整合(Data integration)
内容整合 (Content integration)
信息整合(Information integration)
应用整合 (Application integration)
业务过程整合(Business process integration)
Web整合分类
 二分法 (信息整合、功能整合)
(1)信息整合

通过对大量异构的、自治的外部信息源进行收集、组
织,屏蔽数据源的差异性,以统一的界面或方式为用
户提供服务。分数据整合、知识整合。
Web资源
搜索引擎
中央库
用户查询
Web整合分类
 二分法
(2)功能整合

集成多种分布式Web事务、过程、应用,为本地系统
开发所用,实现Web功能共享与互操作。
Web整合分类
 四分法
(1)信息整合(Information integration)
 指信息的物理集成或逻辑集成
 通过这种集成,参与整合的应用系统可以对
所有的相关数据进行操作,而不管这些数据
是否受这些应用系统的直接控制。
Web整合分类
 四分法
(2)门户整合(Portals integration)

最表层的整合,它把潜在的、不同的应用系统聚合到
Web上的一个单一入口点。
Web整合分类
 四分法
(3)业务过程整合(Business-process integration)

对组织内部和跨组织应用的业务过程进行整合,
Web Services及相关技术提供支持。
(4)应用整合(Application integration)

使从事相似或互补工作的不同应用系统彼此通信,
实 现 互 操 作 , 一 般 侧 重 于 数 据 转 换 ( data
transformation ) 和 消 息 对 列 管 理 ( message
queuing)
Web整合分类
1.2Web整合系统
 信息技术演变
——Steve Jones.Toward an Acceptable Definition of Service.IEEE
Software,2005:22(3)
从中间件到SOA


基于中间件的Web集成系统始于20世纪90年代中期:
核心技术:CORBA、COM等

基于远程过程调用的分布式计算

基于消息传递的分布式计算
进入21世纪,基于Web Service技术的SOA(ServiceOriented Architecture)
核心技术:XML、SOAP、WSDL、UDDI
信息服务领域相关系统


DSpace、Fedora开始支持Web Service;
CiteSeer.EU目标是建立可伸缩(scalability)、分散式
(decentralize)服务体系。
–
shrink-to-fit、enlarge-to-cope
Web整合系统分布状况
国家
美国
德国
英国
意大利
法国
瑞士
西班牙
爱尔兰
新加坡
瑞典
加拿大
奥地利
希腊
巴西
系统数量
142
21
16
10
7
3
2
2
2
1
1
1
1
1
百分比
67.6%
10%
7.6%
4.8%
3.3%
1.4%
0.9%
0.9%
0.9%
0.5%
0.5%
0.5%
0.5%
0.5%
瑞士苏黎世大学整理出的
176个Web整合系统

美国是Web整合系统研究领域
的主要力量,占到67.6%之多;

其次是德国、英国、意大利、
法国、瑞士等欧盟国家,他们
已成为Web整合系统研发团体
中十分重要的力量;

加拿大、奥地利、希腊等国家
也逐步投入力量开展对Web整
合系统的研究 。
主要协议

资源集成方面


资源检索方面


SOAP
用户界面整合方面


LADP、Z39.50/SRU
应用整合方面


OAI、 RSS、OpenURL
JSR168 、WRSP、JSR268
数据描述方面

XML、JSON
数据整合模式
 GAV(global-as-view)
全局视图:采用统一模式
对各个具体数据源进行描
述,各数据源模式均为统
一模式之子模式,适用于
数据源稳定的系统。
优点是操作简单,缺点是
新增数据源会对全局模式
产生影响。
数据整合模式
 LAV(local-as-View)
本地视图:以本地数据源
模式为中心,全局模式是
由本地模式生成的,用户
操作通过全局模式到数据
源模式转换实现。
适用于全局模式稳定的系
统,缺点是处理较为复杂。
数据整合模式

GLAV
(global-local-as-view)
全局-本地映射视图:定义全
局模式与数据源模式之间的语
义映射,在与本地数据源模式
无关的情况下灵活地定义全局
模式。
数据整合模式
 BAV(both-as-view)
双向视图:建立全局模式与本
地模式之间转换规则,从而既
能从本地模式中抽取全局模式
的定义,也能从全局模式中抽
取本地模式的定义。
实现技术较为复杂
。
物理层
直接与要整合的信息或数据打
交道,包括Wrapper(封装器)
和Mediator(协调器)以及物化
视图库(Materialized View
Store)
Web整合系统架构
Web整合系统架构
逻辑层:
建立数据源描述模式(Source
Schema)与Wrapper对应关系、
物化视图模式(Materialized View
Schema)和查询模式(Query
Schema)对应 关系。
Web整合系统架构
概念层:
描述应用语义,它由数据源模型
(Source Model)、企业模型
(Enterprise Model)以及查询模型
(Query Model)构成 。
Web整合系统架构
元层:
包括所有与整合系统有关的元
数据集合,以及描述整合系统
的元语言 。
相关研究
 相关学术会议
IIWeb(Workshop on Information Integration on the
Web)
 美国亚利桑那州大学发起,涉及信息抽取、信息集成、
数据挖掘、资源描述、机器学习、本体、系统架构等
领域 。
IIWAS (International Conference on Information
Integration and Web-based Application & Services)
 主要领域包括:
–
–
–
–
模式及数据整合(Schema and Data Integration)
分布式组件结构(Distributed Component Architectures)
元数据管理(Metadata Management)
整合系统结构(Integration Architectures)等 。
相关研究
 主要研究机构
加州大学信息科学学院Information




封装和建模(Wrapping and Modeling)
记录联接(Record Linkage)
数据整合(Data Integration)
计划执行(Plan Execution)等。
柏林洪堡大学Information

Integration Group
鉴别整合对象、多数据对象整合方法、整合结果可视化。
信息共享与整合研究组Information

Integration Research Group
Sharing & Integration Group
NASA下属的一个科研机构,探讨从异构数据源整合大量不同
类型航空数据的方法。主要项目:
– DIAMS(Distributed Intelligent Agents for Information
Management and Sharing)
– ADIP(Aviation Data Integration Project)
WEB整合系统
1 Web整合系统概述
2 基于M/W的整合系统
2.1信息整合系统演变
2.2信息整合系统架构 – M/W
2.3关键技术
2.4主要项目研究及发展趋势
3 基于SOA的整合系统
4 Web整合发展趋势
5整合实例
2.1信息整合系统演变
1 面向学科导航服务的Web信息整合
2 面向集中检索服务的Web信息整合
3 面向分布式服务的Web信息整合
4 面向个性化服务的Web信息整合
面向学科导航服务的Web信息整合
 Internet信息整合
- IPL(Internet Public Library)
 Michigan大学信息学院.
InfoMine
 本地信息 + Internet信息
阿拉莫斯实验室
GoogleScholar
面向集中检索服务的Web信息整合
 裸数据整合
 把多个本地数字化资源、授权分布式资源
合并到一个数据仓库中。
 最成功的应用是Dialog,它整合了数百个数
据库。
子库
合并
子库
中央库
检索
服务
用户
面向集中检索服务的Web信息整合
 基于OAI(Open Archives Initiative)元数据整合
数据提供者
服务提供者
用
户
集成
检索
界面
集中库
OAI收获
数据提供者
•Michigan大学OAIster已采集一千多个数据库的数千万条文
档数据。
•科学搜索引擎Scirus,Elsvier创建,利用OAI技术采集来自ArXiv、
CogPrints等电子文献、预印本信息。
Auckland大学全球开放存取资源导航系统
中科院IR系统
中科院IR
所IR
所IR
所IR
所IR
面向集中检索服务的Web信息整合
 基于RSS(Really Simple Syndication)的信息整合
Web网站
Web网站
Web网站
RSS feed
RSS feed
RSS feed
RSS聚合器
RSS整合资源
用户
新闻引擎NewsIsFree http://www.newsisfree.com/)
面向集中检索服务的Web信息整合

基于搜索引擎的浅层Web信息整合
General Crawlers
Focused Crawlers

基于主题采集的深层Web信息整合
斯坦福大学的HiWE
BrightPlanet公司的DQM
德国比勒费尔德大学BASE
面向分布式服务的Web信息整合

基于中间件的整合 (如EJB、COM、CORBA )
标准的协议和接口
分布计算,提供网络、硬件、操作系统透明性
满足大量应用的需要
能运行于多种硬件和操作系统平台
分布式资源
分布式资源
中间件
用户
分布式资源
面向分布式服务的Web信息整合

基于SOA(Service-Oriented Architecture )的服务整合
用户
用户
用户
服务组合
服务组合
服务组合
服务代理
SOAP接口
SOAP接口
SOAP接口
Web服务提供者
Web服务提供者
Web服务提供者
服务
服务
服务
服务
服务
服务
服务
服务
服务
面向分布式服务的Web信息整合
 SOA整合实例——基于SOA的期刊平台
稿件编辑管理
系统
期刊排版
系统
期刊发行
系统
期刊在线服务
系统
应用层
代理层
服务调度管理
编辑类
Service
排版类
Service
发布类
Service
服务层
资源
资源
资源
资源层
面向分布式服务的Web信息整合
 基于网格的静态整合
采用网格技术能较好地实现对虚拟机及异
构资源系统的协调管理与负载平衡,提高
整合系统的性能,增加可靠性与易用性;
整合在网格系统中注册的资源 ;
支持大规模数据资源的整合。
面向分布式服务的Web信息整合
 基于P2P的动态整合
采用P2P实现动态整合,系统具有强大的扩展性。
挪威大学Hao Ding等人提出了一种元数据整合方案,通过
扩展OAI-MHP使其适应P2P网络,利用领域Ontology实现
元数据之间的转换映射,最终实现在不同Peer社区集成异
构的元数据。
英国Edinburgh大学提出了一个网格+P2P的解决方案,即
在网格的数据层和计算层中采用P2P组织结构,在实现资
源动态集成、灵活扩展的同时,提高系统的负载平衡和容
错能力 。
面向个性化服务的Web信息整合
 语义整合
Semantic Web
Linked Data
 知识整合
信息抽取
知识发现与知识组合等
2.2Web信息整合系统模型
(1) 集中式整合模型
实际应用
实现原理
用户交互
查询请求
整合系统
Integration System
整合后资源
分散资源
2.2Web信息整合系统模型
(2) 分散式整合模型
2.3Web信息整合策略
(1)实体化整合策略
—数据仓库
整合系统
中央资源
复制
本地资源
2.3Web信息整合策略
(2)虚拟整合(virtual integration)
—门户导航
整合系统
资源导航体系
Navigation
…
…
…
…
…
…
…
…
本地资源
Local resource
2.4Web整合系统架构
协调器则为用户提供一个统一查
询界面,通过查询执行引擎
(Query Execute Engine)实现
封装器实现对异构资源的连接、
对多个分布式资源的检索,并对
查询以及将结果信息封装成公共
从Wrapper或其他Mediator中获
数据模型(Common Data Model,
取的查询结果信息进行整合处理,
CDM)
以统一方式呈现给用户
用户
提问
应答
协调器(Mediator)
封装器
(Wrapper)
封装器
(Wrapper)
封装器
(Wrapper)
协调器
分布式资源
分布式资源
分布式资源
其他资源
2.5Web整合关键技术
1、资源描述技术
2、资源检索技术
3、资源选择技术
4、信息抽取技术
5、结果呈现技术
资源描述技术

资源描述
指从资源库中抽取元数据、建立语言模型,用以描述资
源库中所包含的文献内容及形式特征,为信息整合提供
数据模型支持。

描述方式
人工方式制定规则并描述资源
自动化方式发现资源,并获取相关内容,建立描述体系

描述技术
提问取样技术:通过随机取样算法建立资源描述模型;
调焦提问探测技术:在提问取样基础上探测主题类别;
基于STARTS协议的资源建模技术等:对数据源属性、
内容描述。
资源选择技术

资源选择
借助一定方法选择出与用户查询提问相关度高、包含较多相关信
息的那部分资源作为检索对象,以提高检索效率。

资源选择机制
基于资源相关度排序的选择机制


比较资源描述信息与用户提问相关度确定选择策略;
主要方法有:GlOSS 、CVV 、CORI
基于相关文献分布情况的资源选择机制


提问取样基础上,分析各资源相关文献分布状况,作为选择依据。
主要方法:ReDDE
基于效用的资源选择机制

通过计算检索质量、花费时间等成本决定如何选择资源。

DTF
基于主题聚类的资源选择机制

根据描述信息建立数据库类目层次关系,作为选择依据。

聚类语言模型 ……
资源检索技术

查询重写技术
将查询式的全
局模式转换为
本地模式

查询优化技术
找出代价最小
的或较小的查
询计划
信息抽取技术


从来自不同网络、不同操作平台、不同数据库抽取
用户所需要的事实或数据。
信息抽取是构建封装器(Wrapper)的核心技术,
它使封装器的自动构建与维护成为可能。
 类型
命名实体识别
多语种实体识别
模板元素抽取
参照抽取
模板关系抽取
情节模板构建
信息呈现技术




分类
聚类
可视化
……
2.5 相关系统
1.PICSEL
巴黎大学开发的分布、
异构Web资源整合
系统。
PICSEL在用户和信息
源之间定义中间
件,即信息服务
器,负责整合各
种相关Web资源,
使用户感觉像是
在一个集中的、
同构系统中操作。
2.5 相关系统
2. Ariadne
由美国南加州大学开发,
基于中间件技术的
半结构化网络资源
系统。
核心内容是资源、分装
器创建模块、提问
计划模块。领域模
型是一个领域本体。
利用中间件
创建中间件
开发者
资源建模及
封装器创建
网页
领域模型
及封装器
用户
提
返
问
回
提问
计划
2.5 相关系统
3. Havasu
StatMiner
数据挖掘覆盖范围
以及重复统计
智能信息整合技术项目组
(Enabling Technologies for
Intelligent Information
Integration)开发的一个采
用虚拟集成方式的跨库检索
系统。
探测提问
学习的统
计数据
StatMiner模块负责建立资
源的描述信息
Multi-R
多对象的查询优化器
Multi-R模块基于相关统计
信息、算法对查询进行优
化,生成整合计划。
数据源提取
带注释的计划
调度程序
用户提问
执行器
Indra监视
器
检索结果
中间机制
WEB整合系统
1.Web整合系统概述
2基于M/W的整合系统
3基于SOA的整合系统
3.1SOA整合理论
3.2SOA整合技术
3.3SOA整合系统模型
3.4相关项目及研究进展
4Web整合发展趋势
5整合实例
3.1 SOA整合理论
背景需求
 Internet环境为Web整合提出新的挑战
Internet环境存在大量异构系统,基于传统
组 件 ( 如 .NET Remoting 、 EJB 、 COM 、
CORBA等)集成面临挑战;
Internet的复杂性造成应用系统稳定性差,频
繁的服务调用将会造成系统的不可用;
Internet上的系统版本及升级信息无法互相知
晓,采用传统的二进制消息传递方式必然造
成系统间兼容性障碍。
3.1SOA整合理论
背景需求
 存在多种类型的Web整合需求
支 持 对 遗 留 系 统 的 应 用 集 成 ( Application
integration)
支持终端用户界面集成(Integration at the enduser interface)
支持业务过程集成(Process integration)
支持信息集成(Information integration)
支持对新计算模式的集成
未来Web应用模式
?
做
什
么
?
怎
么
做
未来Web系统整合模式
现在
将来
各个应用
各个服务
孤岛式应用
一组服务
什么是SOA (Service-Oriented Architecture )

OASIS(Organization for the
Information Systems)定义
Advancement of Structured
SOA是一种抽象的企业架构。普通企业架构面向一个企业内部的
业务整合,SOA则实现企业之间业务的重组,它可以对多个系统
组件进行集成,共同构成一个新的、注册可用的服务,支持不同
企业用户的重用。

W3C的定义
SOA是一种框架类型,其目标是实现交互系统之间的松散耦合,
一个服务是由服务提供者实现的工作单元,有统一接口,支持服
务消费者的调用,服务间消息描述遵循统一规范,并支持服务扩
展与版本兼容。

BEA的定义
SOA为一组在网络中相互异步通信、松散耦合的服务集合,这些可
以重用的服务被精确定义,并具有平台无关性,从而掩盖了IT环
境的底层技术复杂性。
SOA与分布式计算

两种分布式计算模式
基于RPC的模式



客户端调用的是服务器提供的细粒度功能过程,客户端与服
务器之间需要建立是紧耦合关系,一端发生变化,另一端必
须做对应调整;
开发人员需要处理底层网络通信细节及服务器定位等问题;
通常采取同步通信方式,缺少灵活性。
基于消息传递的模式


通过定义消息机制进行平台无关的数据交流,并基于数据通
信来进行分布式系统的集成,通常采取异步通信方式实现松
耦合。
支持多通讯协议、语言、应用程序、硬件和软件平台。
SOA主要采取消息传递模式。
SOA与中间件

SOA是从中间件发展而来
中间件是SOA早期实现技术,目前,XML、SOAP、Web Service构
成了SOA新的实现技术,未来还会出现新的技术。

中间件
中间件封装了底层通信协议,使开发者从复杂的底层技术细节中
解放出来,从而专注于业务逻辑的优化。
中间件采用私有信息交换格式,不同中间件之间不能直接集成。

Web Service
松耦合的系统间关系
粗粒度集成对象
无状态的服务设计
统一的服务接口规范
SOA数据模型
Service是由特定功能控件及
其接口规范、约束条件与访问
政策等构成的一种信息对象,
支持服务消费者调用。
Visibility指服务提供者与服
务消费者之间彼此可见。
服务交互性(Interaction)指
服务提供者与消费者在服务执
行环境(Execution Context)
中的信息交换。
现实效果(Real World Effect)是实现现实世界中的特定功能。
服务描述(Service Description) 是开放调用基础。
政策(Policy)与约定(Contract)指服务消费者与服务提供者
共同遵循的相关声明。
SOA数据模型
3.2基于SOA的Web整合对象
 服务
OASIS将服务作为SOA系统整
合对象。
 服务粒度
Middleware将应用系统中的服务
分为四个粒度级别,由细到粗分
别是:
控件(Component)服务(如
数据库读写操作)
业务(Business)服务
工作流(Workflow)服务
应用(Application)服务
3.3基于SOA的Web整合系统架构
表示层,支持粗粒度服务嵌
入,Portlet、Widget
业务过程层,根据用户业
务过程,建立表示
层工作流与服务层
服务之间映射
服务层,将控件按一定规
则进行组合、包装、
描述,输出具有标
准接口的服务
控件层,构建一个控件容
器,装载具有不同
操作功能的控件
操作系统层,包括对已经
存在的系统和应用
的集成
3.4基于SOA的Web整合技术
SOA标准协议栈
3.4基于SOA的Web整合技术
 SOA运行时架构
3.5基于SOA的Web功能整合模型
 基于SOA的功能整合
整合对象不是数据而是实现特定操作的功
能模块,它有特定数据支持,运行结果可
能是用户需要的最终信息,也可能是中间
信息。
类型
①
②
③
④
应用整合
终端用户界面整合
过程整合
对遗留系统的整合等
3.5.1应用整合
 应用整合是程序到程序(Program-toProgram)的交互。
 把一个或多个应用系统集成到另外一个系统
中,实现功能集成、分布式互操作等目标。
 整合对象主要是粗粒度级别的服务,如功能
比较复杂且完整的应用系统。
3.5.1应用整合
Internet
Peer
Message
Internet
Web整合基础平
台
Message

Message
Peer
Message
Web整合基础平台
应用整合模式的核心内容,又称企业服务总线
(Enterprise Service Bus,ESB),它处于被整合
应用系统中间,并建立与各个应用节点之间的消
息通信机制。
3.5.1应用整合

WSMX(Web Service Execution Environment)
是W3C提出的一个语义Web服务模型,包括定义执行语义、开发系统
架构、设计系统组件、定义接口规范、研究不同领域的语义整合条
件等,支持自动化Web服务发现、选择、协调、调用及互操作。

WSMX概念模型、WSMO(Web Service Modeling Ontology)参考模型
3.5.1应用整合

SOA中间件模型,台湾学者提出,以实现配置服务
序列、服务对客户端的透明化处理、支持服务的自
动发现与自动更换。
3.5.1应用整合
L2L(library-to-library)
爱尔兰大学学者提出,把
数字图书馆互操作协议,
如Z39.50、DIENST、OAI、
SDLIP、ELP等集成到
WSMX中,实现异构数字
图书馆系统间的互操作。
3.5.2终端用户界面整合
 目标
支持从程序到用户的交互(Program-to-Human)
 方法
在用户或者管理员控制下,在表示层抽象化接口、
标准化消息以及聚合独立信息源。
宿主组件环境被抽象成容器,它提供已知服务集。
客户端容器支持技术包括Servlet/JSP、用于页面排
序的 Struts、用于高级页面组合的JavaServer Face
(JSF) 、 合 并 在 同 一 页 面 上 的 Portlet 以 及 Ajax 、
Widget等。
3.5.2终端用户界面整合-Portlet架构
3.5.2终端用户界面整合–Portlet架构

Portlet是一种面向表示层的Web组件,其运行环境被称为
是Portlet容器,Web客户端通过请求/应答方式实现与Portlet
的交互。

Portlet 产 生 的 应 答 信 息 遵 循 某 种 标 识 语 言 ( 如 HTML,
XHTML, WML),它可以和其他信息片段一起构成一个
完整的文档,这样,用户界面集成变成信息内容加呈现方
式的定制。

标准
Portlet基本组件规范
 JSR168 (Java Specification Requests)
远程Portlet调用规范:
 WSRP(Web Services for Remote Portlet)
3.5.2终端用户界面整合
面向数据的服务和面向表示的服务比较
Portlet组成
属性配置
标题区域
内容区域
一篇学术期刊论文
一个网页URL
一个图书目录
一个RSS
……
配
置
最小化 最大化
关闭
3.5.2终端用户界面整合 – 门户应用
 uPortal
http://www.jasig.org/uportal
JA-SIG (Java in Administration Special Interest Group)开发的开放源门户
软件。
采用Java、XML、JSP、J2EE技术, 全面支持JSR168、
WSRP规范。
芝加哥大学
3.5.2终端用户界面整合 – 门户应用
 Liferay
http://www.liferay.com/home/index.jsp
Liferay是由美国Liferay公司开发的开源门
户软件,在许多大型组织和机构得到了广
泛的应用。
 国家科学图书馆iLibrary
http://ilibrary.las.ac.cn/
3.5.2终端用户界面整合 – 门户应用
 Liferay – 国家科学图书馆所级平台
3.5.2终端用户界面整合 – 门户应用
 其他门户系统
 WWPortlet
 http://wwPortlet.sourceforge.net/index.html
 Pluto
 http://Portals.apache.org/pluto/
 Jetspeed
 http://jakarta.apache.org/jetspeed/
 ……
3.5.3过程整合
 过程整合
Web应用通常面对复杂的、有序的、具
有相关约束条件的业务过程,需要按
一定的业务逻辑将无状态的服务编排
成工作流,称过程整合,又称服务合
成(Service Composition)。
过程整合服务
 可以是企业内部自有的,
 也可能是远程的、第三方合作伙伴共享的。
3.5.3过程整合
 概念模型
3.5.3过程整合
 工作流模型
Web服务合成引擎
服务提供者A
服务A1
服务A2
服务提供者B
服务B1
服务B2
服务提供者C
服务C1
服务C2
服务A1
WSDL
服务B2
WSDL
服务C1
WSDL
工作流定义
3.5.3过程整合
 服务合成方法
BPEL

使用业务流程执行语言(Business Process Execution
Language,BPEL)将服务定义为业务流程,或者将它
们表示为业务状态机 ,利用流程编排引擎 实现服务调
用与编排。
OWL-S

利用OWL-S构建服务描述,支持服务的自动发现、调
用、组合、互操作等。
其他方法



线性过程组合法(Algebraic Process Composition)
Petri Nets
模型检验及有限状态机法(Model Checking and FiniteState Machines)
3.5.4对遗留系统的整合
 遗留系统
已经存在的系统常常包容了较大的价值,在
进行新的业务集成时,企业不希望立即将这
些系统扔掉,而希望能将其集成到新系统上,
或者支持遗留系统以增量式方式逐渐迁移到
新系统中。
很多系统集成失败的原因是完全舍弃遗留系
统,造成开发工作复杂性高、投入大、没有
可行的时间表。
对遗留系统的整合操作步骤

获取、分析遗留系统源代码
通过代码分析,判断是否值得进行集成。
如果事务规则很有价值而实现上又不困难,则重开发更好。
如果原媒体方法有较高经济价值,则选择集成。

对遗留系统代码进行包装
根据XML、WSDL、SOAP等规范,从遗留系统中抽取规则及
代码,生成组件,主要工作是将实体转换成方法、将输入
数据转换成XML元素。

为遗留系统发布标准的Web服务接口
通过SOAP消息机制将服务WSDL发送给用户客户端 。
WEB整合系统
1.Web整合系统概述
2基于M/W的整合系统
3基于SOA的整合系统
4Web整合发展趋势
5整合实例
SOA Trends
交换协议规范从SOAP到REST;
数据交换从XML到JSON;
基于Ajax的用户界面开发;
Web服务向个人科研平台、桌面工具、个人信息环境嵌入;
可视化、可伸缩、因需选择、快速构建是SOA一个目标;
基于Widgets技术,支持用户可视化构建自己的应用软件;
为用户提供个人信息集成工具,如Google Mashup Editor、
IBM的QEDWiki等;
全球SOA均衡管理。
——Dion Hinchcliffe.Eleven Emerging Ideas for SOA Architects in
2007.http://hinchcliffe.org/archive/2007/01/20/12675.aspx
基于P2P的Web整合系统
 PSOA(P2P Based SOA)
挪威大学Hao Ding等人提出:
采用Web Service技术支持服务调用由细粒度向粗粒
度转变;
采用P2P架构支持动态集成;
采用Ontology技术增加Web Service发现、调用中的
语义推理能力。
基于P2P的Web整合系统

BRICKS (Building Resources for Integrated Cultural Knowledge Services)
欧盟第6框架工程(The 6th Framework Programme)子项
目。采取SOA架构和P2P方法,设计开发一个开放的、分
散的、面向用户、面向服务的信息服务基础架构,重用已
存在的通信渠道和已有系统资源,实现对各类文化遗产及
教育机构、科研社区、企业、个人等异构资源与服务集成。
用户应用和界面
一般性服务
核心服务
用
户
管
理
认
证
与
授
权
检
索
与
浏
览
知
识
产
权
保
护
内
容
管
理
元
数
据
管
理
帐
号
管
理
服
务
组
合
SOAP
网络层(TCP/IP, UDP)
基础性服务
服
服
务
务
注
索
册
引
发
现
P2P
分
散
式
存
储
基于Grid的Web整合系统

Grid正在从计算网格(computational Grid)、数据
网格(Data Grid)走向信息网格(Information
Grid)、知识网格(Knowledge Grid),并最终走
向服务网格(Service Grid)。
服务网格
知识网格
信息网格
数据网格
计算网格
基于Grid的Web整合系统
 DILIGENT(A
testbed DIgital Library Infrastructure on Grid
ENabled Technology)
欧盟研究项目,通过集成Grid技术、DL技术,在EGEE(Enabling
Grids for E-sciencE)之上,增加开放服务及动态更新机制,增加
信息资源访问服务,增加数字图书馆基本功能(search、
annotation、personalisation、visualisation等),建立新型的数字
图书馆平台,支持对已经存在的第三方应用系统的集成,支持面
向特定团体、项目组信息需求的虚拟数字图书馆动态构建 。
基于语义的Web整合系统
 从Syntactic Web到Semantic Web
基于WSDL的Web服务实现Syntactic描述,
在Web服务能力分析及服务功能发现等方
面无法实现语义层面上的匹配计算。
Semantic Service不再简单地描述每个服
务的输入/输出参数及调用端口,而是利
用Ontology等工具描述服务中的语义信息,
揭示服务主题及其关系,从而提高服务宣
传、发布、发现、调用等过程的语义理解
能力。
基于语义的Web整合系统
RCal (RETSINA calendar agent)
美国卡耐基梅隆大学(CMU) 开发一个分布式约
会安排代理系统。
它采用DAML-S作为服务语义描述机制,使用多
个分布式本体,包括:日历本体、朋友本体、
DC本体等,同时建立一些对概念进行翻译或转
换的服务。
当RCal遇到一个自身本体中没有的概念时, 就会
通过DAML-S 描述自动地发现并选取恰当的翻译
服务来执行,进而完成从未知概念到已有概念的
转换。
基于语义的Web整合系统
 从Semantic Web到Pragmatic Web
Semantic Web可以定义静态语义
Pragmatic Web可以感知上下文环境的语
义,是泛在智能服务研究的主要内容。
基于语义的Web整合系统
 OSOA
英国伦敦帝国学院研究人员提出的一个基于Ontology
的SOA架构,底层遵循Web Service规范,采用
Ontology技术增强SOA中的服务语义,并包容即插即
用设备和服务,实现以人为中心、上下文敏感、目标
驱动的服务组合与互操作 。
由于OSOA具有面向服务、平台无关、语言中立、基
于XML消息机制、传输独立等特点,从而保证系统具
有良好的互操作性、可扩展性、可伸缩性、可组合性。
OSOA的目标


从语法匹配(Syntactic Match)
转向语义匹配(Semantic Match)

实现服务政策匹配(Policy Match)。
WEB整合系统
1.Web整合系统概述
2基于M/W的整合系统
3基于SOA的整合系统
4Web整合发展趋势
5整合实例
5.1NSTL集成检索系统
5.2The European Library
5.3Mashup
5.1 NSTL 集成检索系统
科技部研究项目
“科技信息资源与服务集成揭示系统建设 ”
目标之一
对国家图书馆、国家科学图书馆、北京大
学图书馆、国家科技信息中心等多家图书
馆遗留服务系统进行统一封装,建立基于
Web Service的跨机构集成检索系统。
5.1 NSTL 集成检索系统
 利用Axis开发Web Service
Axis起源于IBM的SOAP4J,是Apache SOAP的第三代产品,提供创
建服务器端、客户端和SOAP操作的基本框架。
 axis.jar, wsdl.jar, saaj.jar, jaxrpc.jar等
Axis有如下特性
 是一个独立的SOAP服务器
 是一个嵌入Servlet引擎(例如Tomcat)的服务器
 使用基于事件的SAX解析机制
 支持用户灵活定制扩展
 支持WSDL
客户端
SOAP
服务器
客户端代码示例
{
String endpoint="http://localhost:8080/axis/SayHello.jws?wsdl";
//指定调用web服务的url地址。
org.apache.axis.client.Service service=new org.apache.axis.client.Service();
//建立请求服务框架实例。
org.apache.axis.client.Call call=(org.apache.axis.client.Call)service.createCall();
//从框架中生成一个调用实例。
//org.apache.axis.client.Call实现了JAX-RPCs javax.xml.rpc.Call接口
call.setTargetEndpointAddress(new javax.net.URL(endpoint));
call.setOperationName(new java.xml.namespace.QName
("http://www.edu-edu.com.cn/luopc/ws", "echoString"));//指定调用函数
String result=(String)call.invoke(new Object[]{"hello!"});
//返回调用结果
}
5.1 NSTL 集成检索系统
Web Service定义操作对象
Explain
 用于返回Web服务中有关元数据、数据库、子库
等关系的定义和说明;
GetList
 提交检索请求,获取元数据检索结果记录列表 ;
GetDetail
 获取详细记录 。
查看WSDL实例
5.1 NSTL 集成检索系统
基于axis开发Web service接口
安装axis工具包
开发服务器端接口程序
部署Web service
生成Web服务的客户端调用程序——
NSTL集成检索系统
5.1 NSTL 集成检索系统
SOAP
CSDL联合目录服
务系统
SOAP
国家图书馆
期刊目录系统
SOAP
JUDDI
SOAP
SOAP
集成检索系统
CALIS联合目录
服务系统
国家工程图书馆
期刊目录系统
5.2 The European Library
5.2 The European Library
5.3 从Integration到Mashup
开放集成
开放标准: SOAP/REST
开放数据:Linked Opend Data
开放源码
开放服务
支持草根网络用户参与Web整合
简单的服务调用
 例如SRU接口:
http://sru.las.ac.cn/SRW/services/DEIS?version=1.1&operatio
n=searchRetrieve&query=dc.title=nano
查看
课外阅读文献
1.
2.
Reference Model for Service Oriented Architecture 1.0, 2 August 2006.
http://www.oasis-open.org/committees/download.php/19679/soa-rmcs.pdf
The 11th International Conference on Information Integration and Web
Based Applications & Services (iiWAS2009), December 14-16, 2009,
Kuala Lumpur, Malaysia
http://www.iiwas.org/conferences/iiwas2009/
Questions?