04-OWL-2015.ppt

Download Report

Transcript 04-OWL-2015.ppt

OWL
饶国政
天津大学 计算机学院
2015-03-26
[email protected]
本体概念:
范畴
提出时间/提出人
客观存在的一个系统的解释和说明,客观现实的一个抽象本
质
哲学
1991/Neches等
计算机
定义
1993/Gruber
给出构成相关领域词汇的基本术语和关系,以及利用这些术
语和关系构成的规定这些词汇外延的规则的定义
概念模型的明确的规范说明
1997/Borst
共享概念模型的形式化规范说明
1998/Studer
共享概念模型的明确的形式化规范说明
Ontology的四层含义:
•概念模型(cerptualization)
通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示
的含义独立于具体的环境状态
•明确(explicit)
所使用的概念及使用这些概念的约束都有明确的定义
•形式化(formal)
Ontology是计算机可读的。
•共享(share)
Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对
的是团体而不是个体。
Ontology的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领
域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之
间相互关系的明确定义。
本体的种类:
Top-level Ontology
Domain Ontology
Task Ontology
Application Ontology
Ontology描述语言:
RDF(Resource Description Framework ):
数据模型:节点和节点之间带有标记的连接弧组成
资源:
– 我们可以认为资源是一个对象,一个任何我们要谈论的事物:地点,
人,旅馆…
– 每个资源有一个URI:统一资源标识符
并不一定是一个可访问的资源
可以是一个URL(统一资源定位符),或其他种类的唯一标识符
Ontology描述语言:
RDF(Resource Description Framework ):
属性:
– 一类特殊的资源
– 用来描述资源之间的关系:written by;age
– 同样用URI来标识
陈述:
– 声明资源的属性
– 是一个对象,属性,值的三元组(即一个资源,一个属性,一个值)
Ontology描述语言:
• RDF(Resource Description Framework ):
陈述:
David Billington is the owner of the Web page http://www.cit.gu.edu.au/_db
三元组形式 :
( “David Billington”, http://www.mydomain.org/site-owner,
http://www.cit.gu.edu.au/_db ).
基于图的表示方法:
带有标签节点与弧的有向图,弧从资源(陈述的主体)指向值(陈述的客
体)。在人工智能领域中这种图形被称作语义网
Ontology描述语言:
RDF/RDFS的局限性:
– 属性的范围:不能声明只适用于某些类的范围
约束
– 类的不相交:RDFS只能陈述子类关系。
– 类的布尔组合:我们希望用并、补、交来链接
其他类构造新的类
– 基数约束:希望对一个属性可能或者至少取多
少值设置约束
– 属性的特殊特征:需指出一个属性是传递的,
唯一的或是另外一个属性的反属性
Ontology描述语言:
子语言
描述
例子
OWL Lite
用于提供给那些只需要一个分类层次和简单的属性约束的用户。 支持基数(cardinality),只允许基数为0或1。
OWL DL
支持那些需要在推理系统上进行最大程度表达的用户,这里的
推理系统能够保证计算完全性(computational complete
ness,即所有地结论都能够保证被计算出来)和可决定
性(decidability,即所有的计算都在有限的时间内完
成)。它包括了OWL语言的所有约束,但是可以被仅仅
置于特定的约束下。
当一个类可以是多个类的一个子类时,它被约
束不能是另外一个类的实例。
OWL Full
支持那些需要在没有计算保证的语法自由的RDF上进行最大程
度表达的用户。它允许在一个Ontology在预定义的(RD
F、OWL)词汇表上增加词汇,从而任何推理软件均不
能支持OWL FULL的所有feature。
一个类可以被同时表达为许多个体的一个集合
以及这个集合中的一个个体。
本体描述语言
• OWL Lite
• OWL DL
• OWL Full
OWL Full
OWL DL
OWL Lite
本体描述语言
Owl Lite原语:
equivalentClass
equivalentProperty
sameIndividualAs
differentFrom
allDifferent
小汽车-轿车
领导是-上级是
张三-聪聪
捷达-桑塔纳
intersectionOf
一汽汽车-大众汽车
本体描述语言
• Owl Lite属性描述:
inverseOf
TransitiveProperty
孩子是-双亲是
SymmetricProperty
后代是
FunctionalProperty
朋友是
InverseFunctionalProperty
出生于
身份证号是
本体描述语言
• Owl Lite属性限制
allValuesFrom
someValuesFrom
后代是 -人
minCardinality
成果是
maxCardinality
cardinality
孩子是
母亲是
工作是
描述逻辑的定义
描述逻辑(Description Logic)是基于对象的知
识表示的形式化,也叫概念表示语言或术语逻辑。
它吸取了KL-ONE的主要思想,是一阶谓词逻辑的
一个可判定子集。
 源于语义网络和KL-ONE
 是一阶逻辑FOL的一个可判定的子集
 建立在概念和关系(Role)之上
总能保
 概念解释为对象的集合
证推理
 关系解释为对象之间的二元关系
算法的
终止
 具有合适定义的语义(基于逻辑)
描述逻辑发展历史
一阶逻辑:
•
Mary is a female:
female(Mary)
•
John is a male:
male(John)
•
Everybody is male or female: x: male(x) V female(x)
简单的推理:
•
¬ (male(Mary))
x: male(x) → ¬ female(x)
: p V q = p → ¬q
x: female(x) → ¬ male(x)
: p → ¬q = q → ¬p
female(Mary) → ¬ male(Mary)
: if x = Mary
描述逻辑发展历史
语义网络是心理学家Quillian在1968年提出的用
以刻画人脑联想行为的一个显式的心理学模型。它
用语义概念(结点)与概念间的语义关联性(结点
间的连线)来描述一个系统的静态组成,有着很强
的描述能力。
语义网络使用带标签的弧连接的节点集合来表
示信息,节点表示对象,概念或是事件;弧表示节
点之间的关系。
描述逻辑发展历史
框架是把某一特殊事件或对象的所有知
识存储在一起的一种复杂的数据结构。为了
表示生活和工作中相对固定的情况,1975年,
Minsky提出了基于框架的表示方法。它包含
过去定义的内在关系的说明信息和过程信息,
依靠它们可以利用以前获得的知识来解释新
的数据。
描述逻辑的体系结构
一个描述逻辑系统包括四个基本的组成部分:
(1)表示概念和关系的构造集;
(2)Tbox术语集(概念术语的断言集合);
(3)Abox断言集(个体的断言集合);
(4)Tbox和Abox上的推理机制。
不同的描述逻辑系统的表示能力与推理机制由
于对这四个组成部分的不同选择而不同。
描述逻辑的体系结构
概念和关系
 概念——解释为一个领域的子集
示例:学生,已婚者:
{x| Student(x) },{x| Married(x) }
 关系——解释为指该领域上的二元关系(笛卡尔
乘积)
示例:朋友,爱人:
{<x,y> | Friend(x,y) } ,{<x,y> | Loves(x,y) }
描述逻辑的体系结构
描述逻辑的知识库K=<T, A>,T即Tbox,A即
Abox。
Tbox
Tbox包含内涵知识,描述概念的一般性质。由于
概念之间存在包含关系,Tbox知识形成类似格的结
构,这种数学结构是由包含关系决定的,与具体实
现无关;
Abox
Abox包含外延知识(又称断言知识),描述论域
中的特定个体。
描述逻辑的体系结构
描述逻辑的体系结构
TBox语言
定义: 引入概念的名称
A C, A  C
Father Man has  child .Human
Human  Animal Biped
包含:声明包含关系的公理
CD
has  deg ree.Masters  has  deg ree.Bachelors
描述逻辑的体系结构
ABox语言
 概念断言——表示一个对象是否属于某个概念
a:C
John : Man has  child .Female
 关系断言——表示两个对象是否满足一定的关系
 a, b : R
 John, Mary : has  child
描述逻辑的体系结构
解释I是知识库K的模型,当且仅当I是K中每个断言的模
型。若一个知识库K有一个模型,则称K是可满足的。若断言
σ对于K的每个模型都是满足的,则称K逻辑蕴含σ,记为K╞
σ。对概念C,若K有一个模型I 使得CI ≠ ,则称C是可满足
的。
描述逻辑依据提供的构造算子,在简单的概念和关系上
构造出复杂的概念和关系。描述逻辑至少包含以下构造算子:
交(∧),并(∨),非(),存在量词()和全称量词
()。这种最基本的描述逻辑称为ALC。
描述逻辑的体系结构
描述逻辑中的算子
描述逻辑的体系结构
描述逻辑中的其他算子
描述逻辑中的推理
一致性(consistency)
可满足性(satisfiability)
包含检测(subsumption)
实例检测(instance checking)
描述逻辑中的推理
检测C关于Tbox T是否协调,即检测是否有T的
解释I使得C≠空集;检测知识库<T, A>是否协调即检
测是否有<T, A>的解释I存在。
检验一个概念的可满足性,实际上就是看是否有
解释使得这个概念成立。对一个概念C,如果存在
一个解释I使得CI是非空的,则称概念C是可满足的,
否则是不可满足的。
示例:
Male∩Female ,Student∩Worker
描述逻辑中的推理
实例检测即检测属于某个概念的所有实例
的集合。在知识库中检测实例,即检测CI 包
含于DI 是否在所有的解释中成立;在Tbox中
检测,即检测CI 包含于DI 是否在Tbox T中的
所有解释中成立。
最终,包含问题的检测与可满足性问题的
检测是一致的,都可以转化成可满足性的检
测。
描述逻辑中的推理
描述逻辑的重要特征是其具有很强表达能力的
同时又具有可判定性,它能保证推理过程总能停止
并返回正确结果。描述逻辑中的可满足性问题是可
判定的,其它推理问题基本上可以归结为可满足性
问题,可满足性问题是描述逻辑推理的主要问题。
描述逻辑中的推理问题其计算复杂性一般是多项式
时间的。但通常由于构造的不同,其复杂性也有一
定的差异。Schmidt和Smolka首先发现了用于描述
逻辑ALC的Tableau算法,该算法能在多项式时间内
判定ALC概念的可满足性问题。
描述逻辑的特点
描述逻辑具有以下特点:
(1)它有清晰的模型-理论机制,具有很强
的表达能力;
(2)适合于通过概念分类学来表示应用领域;
(3)提供了可判定的推理服务,能保证推理
算法总能停止,并返回正确的结果。
描述逻辑相关研究
 描述逻辑的基础研究
描述逻辑中的基础研究包括构造算子、表示和推
理的基本问题,如可满足性、包含检测、一致性、
可判定性等。一般都在最基本的ALC的基础上在扩
展一些构造算子,如数量约束、逆关系、特征函数、
关系的复合、TBox和Abox上的推理问题、包含检
测算法等,以及Tableau算法的扩展、复杂性及优化
策略等。
OWL DL 语法及其解释
OWL DL公理与事实:
开放世界语义对本体构建的影响
• 封闭世界假定(Closed World Assumption, CWA):
如果我们在知识库中推不出P或P的否定,就把P
的否定加入知识库
• 开放世界假定(Open World Assumption,OWA)
• 本体构建中采用OWA:web是开放的,相关知识可
能分布在Web上的不同场所
开放世界语义对本体构建的影响
• 唯一名假设(Unique Name Assumption,UNA)
– 即名字不同的两个实例是不同的
– OWL不采用UNA
– 解决方法:owl:differentFrom,owl:ALLDifferent
• 分离:定义类时候,要显示声明两个类是分离的
(OWL:disjointWith),如果不声明,推出一个
个体同时是两个类的实例,则不矛盾
• 实例识别:OWA的一个效果是对用构词owl:
maxCardinality和owl:allValuesForm定义的类无
法判定一个实例是否属于这个类
开放世界语义对本体构建的影响
解决方案:
封闭公理(Closure Axioms):
• 用allValuesFrom约束封闭someValuesFrom约束,
使得属性的值只能是allValuesFrom约束中的类型
• 用基数约束(cardinality = n) 封闭 allValuesFrom约
束,使得属性的取值个数固定
OWL 对数据类型的支持:
• Owl将论域划分为抽象域(Abstract
domain),和有型域(Concrete domain)
即XML Schema的数据类型
• Owl推理机只需处理抽象域的推理,而利用
外部机制支持对数据类型相关的处理
• 和抽象域不同,owl对有型域处理是基于唯
一名假设和封闭假设的
OWL推理
语义网的目标是机器“思维”
推理可处理的问题:
• 设计和维护本体:
– 可以通过推理来检查类的一致性和计算类的层次。
– 这对于大型本体及多作者本体来说,推理显得尤为重
要
• 整合本体:通过推理可以断言本体间的关系
– 通过推理可以断言本体间的关系,计算整合后本体中
类的层次和进行一致性检测
OWL推理
• 推理可处理的问题:
– 查询类和实例:
•
•
•
•
依照本体确定实例集是否一致;
确定个体是否为本体类的实例;
根据查询表达式检索个体
检查一个类是否包含另一个类等等
• 以上这些都可简化为一致性检测,Racer可
达到效果
OWL推理
• 我们所需要推理功能:
– 在给定的知识中获得隐含的知识
– 即把隐含在显示定义和声明中的知识通过一种
处理机制提取出来
– 我们使用jena来达到这种推理效果
– 合理的制定公理,约束条件,和规则:
• 盲目的获得隐含的知识对建立和使用本体帮助不大
• 只有先分析清楚本体推理的应用需求,才能有效组
织推理机制
Jena中的推理:
• Jena是java RDF 的API
• 提供功能:
– RDF写操作
– RDF读操作
– 操纵模型
– 查询模型
– 持久化
– 推理
Jena中的推理:
•
•
•
•
•
•
Jena提供的推理机:
Transitive reasoner
RDFS rule reasoner
OWL, OWL Mini, OWL Micro Reasoners
DAML micro reaso
Generic rule reasoner
Jena中的推理:
• 推理机制
谢谢