Resource Description Framework (RDF)

Download Report

Transcript Resource Description Framework (RDF)

Semantic Web의 개요와 활용방안
2004년 5월
동아대학교 경영정보과학부
차례
I.
시맨틱 웹의 개요
II. 시맨틱 웹의 구조와 활용
III. 결론
2
I.
시맨틱 웹의 개요
현재의 웹
시맨틱 웹의 등장배경
시맨틱 웹의 탄생
시맨틱 웹의 정의
컴퓨터가 이해할 수 있는 의미?
웹의 진화방향
HTML vs Semantic Web
3
현재의 웹
개요
?
• 사용자의 클릭을 통한 웹 네비게이션
• 검색 엔진을 이용한 정보소재 파악
• HTML을 사용하여 작성한 수많은 자료들은 정보를 잘
포장하여, 웹을 보는 “사람”이 읽고 작업하기 편하도록
만들어짐
4
Semantic Web의 등장배경
개요
사람뿐만 아니라 자동화된 프로그램, 즉 “기계”(Agent)가 사람을 대신하여 웹 상
의 정보를 읽고 작업하고 나아가 이를 가공하여 새로운 정보를 만들어 낼 수 있
도록 한다
전제조건: Agent를 실현하기 위해서는 웹 상의 정보가 사람 눈이 아니라 컴퓨터
프로그램이 이해하기 쉬운 “의미” 즉 Semantic을 가지고 있어야 한다.
※ 스프레드 시트로 전달된 자
료가 다른 정보 형태로 손쉽게
변환되거나 처리될 수 있다.
[그림] Fax vs. Spread Sheet Program
5
Semantic Web의 탄생
개요
인터넷의 역사
• 1989 Tim Berners-Lee에 의해 창시
• 1991년 일반에 공개
• 1994년 10월 Tim Berners-Lee의 주도로 MIT와 공동으로 W3C 설립
웹의 다음 단계의 발전…?!
"The Semantic Web is an extension of the current web in which information is
given well-defined meaning, better enabling computers and people to work in
cooperation."
Tim Berners-Lee, James Hendler, Ora Lassila
The Semantic Web, Scientific American, May 2001
6
Semantic Web 정의

개요
“ 컴퓨터가 정보의 의미를 이해하고 의미를
조작할 수 있는 웹 ”



웹에서 정보 리소스(URI)들 사이의 연관성을
잘 표현해 준다면 웹에서 의미처리가 가능
이것은 마치 관계형 DB에서 Relation을 정의
하는 것과 같음
데이터
연관성
정보
에이전트 추론
지식
7
컴퓨터가 이해할 수 있는 의미?


개요
문서의 각 부분을 컴퓨터가 이해할 수 있는 형
식으로 기술(description)
사용 예
고속철도를 이용하여 1박2일의 관광을 할 수 있는
장소 중 가장 저렴한 관광 여행상품은 무엇인가?
고속철도
1박2일
가장 저렴한
Agent
Agent
관광상품
Agent
8
웹의 진화 방향
개요
신뢰할 수 있는 웹 자원들
Proof, 로직,
온토롤지 언어
RDF
XML
HTML
HTTP
Shared terms/terminology
Machine-Machine communication
스스로 표현된 문서들
현재의 웹 기반
웹의 진화방향 (자료: 팀 버너스리, 네이쳐,2001)
9
HTML vs Semantic Web


개요
HTML : 보여주기 위한 웹  사람의 관점
Semantic Web : 컴퓨터가 의미를 이해할 수
있는 웹  컴퓨터(프로그램,에이전트)의 관점
문서의 의미
문서의 내용
문서의 구조
-비구조화
HTML
XML
문서의 스타일
-구조화
-준구조화
문서의 구성요소
10
II. 시맨틱 웹의 구조 요소와 활용
시맨틱 웹의 구성, 자원서술
XML RDF 예제, 지식 서술
RDF Spec 및 예제
Ontology에 대하여
Ontology 계층과 다른 계층과의 관계도
Ontology에 대한 프로젝트, 통합운용
전자상거래에 대한 시맨틱 웹의 활용
11
Semantic Web의 구성
시맨틱 웹의 요소
Resource Description
Framework
Semantic
Web
Ontology
Technique
Agent
Program
12
계층적 구조
시맨틱 웹의 요소
시맨틱 웹의 구조 (자료: 팀 버너스리, 네이쳐,2001)
13
Semantic Web 기술요소

시맨틱 웹의 요소
자원서술 : 메타데이터
데이터의 형식에 대한 내용
 정보검색의 향상
 누구든 자유롭게 어휘의 사용을 정의
 예: 도서관의 목록카드와 같은 양식, 프로파일 등


지식 표현(Knowledge Representation)
인공지능의 핵심분야 중 하나
 정보 리소스간의 의미적 연관성
 시맨틱 웹의 상호운용성

14
자원서술
시맨틱 웹의 요소
• 메타데이터: 일반적으로 “데이터를 위한 데이터”라고 정의
• 의미 부여를 위해서는 데이터뿐만 아니라 데이터에 대한 추론을 규정하는 규칙의 표현이 필요
• 시맨틱 웹에서 제시한 해결책은 웹에 수록된 정보를 기술하기 위해 메타데이터를 사용
• 구현: XML(eXtensible Markup Language) + RDF(Resource Description Framework)
XML
RDF
임의의 문서구조를 지정할 수 있음.
문서의 의미를 해석하는 역할을 하
지는 않음
문서의 의미를 지정하는 역할.
RDF에서는 표현하고자 하는 대상
을 *URI를 이용하여 정의.
*
URI(Unifrom Resource Identifier): The generic set of all names/addresses that are short strings that refer to resources.
URL(Unifrom Resource Locator): An informal term (no longer used in technical specifications) associated with popular URI
schemes: http, ftp, mailto, etc.
15
XML, RDF 예제
시맨틱 웹의 요소
<?XML version=“1.0”>
<employees>
List of persons in company:
<person name=“John”>
<phone>47782></phone>
On leave for 2001.
</person>
</employee>
http://www.w3.org
created by
http://www.w3.org
XML 표현 예
name
phone
A directed labeled graph representation
항목이 3개 있는 RDF description
Object
Attribute
http://www.w3.org
Created_by
#anonymous_resource name
#anonymous_resource phone
Value
#anonymous_resource
“John”
47782
인용
Michel Klein, XML, RDF, and Relatives,
IEEE Intelligent System, 2001
16
계층적 구조(1) - XML

HTML을 대체하는 차세대 웹 언어이다?




시맨틱 웹의 요소
Similar to HTML but different
HTML은 메타언어가 아닌 메타언어를 통해
만들어진 애플리케이션
XML은 현재 가장 보편적인 메타데이터 언어
XML의 한계

컴퓨터가 이해할 수 없다?
17
계층적 구조(2) - RDF



시맨틱 웹의 요소
Resource Description Framework
Is a declarative language and provides a
standard way for using XML to represent
metadata in the form of statements
about properties and relationships of
items (a Web address) on the Web.
A foundation for processing metadata.

Provides interoperability between
applications that exchange machineunderstandable information on the Web.
18
계층적 구조(2) - RDF
시맨틱 웹의 요소
메타데이터 기술과 교환을 위한 프레임워크
 메타데이터의 상호운용성




메타데이터의 상호운용성 지원
기계가 이해할 수 있는 메타데이터의 의미정의
풀 텍스트 검색보다 자원탐색에서 향상된 정확
성 실현
19
시맨틱 웹의 요소
RDF Spec과 예제
20
Simple Explanation of Concepts
시맨틱 웹의 요소
<RDF
xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<Description about="http://www.w3.org/Press/99Folio.pdf">
<dc:title>The W3C Folio 1999</dc:title>
<dc:creator>W3C Communications Team</dc:creator>
<dc:date>1999-03-10</dc:date>
<dc:subject>Web development, World Wide Web
Consortium, Interoperability of the Web
</dc:subject>
</Description>
</RDF>
21
Basic RDF

Basic RDF Model


시맨틱 웹의 요소
Examples
Basic RDF Syntax



Basic Serialization Syntax
Basic Abbreviated Syntax
Schemas and Namespaces
22
Basic RDF Model



시맨틱 웹의 요소
Resources
Properties
Statements
23
Resources


시맨틱 웹의 요소
Can be anything provided that it has a Web
address.
Can be anything that has a URI; the
extensibility of URIs allows the introduction of
identifiers for any entity imaginable.
24
Properties


시맨틱 웹의 요소
A property is a specific aspect, characteristic,
attribute, or relation used to describe a
resource.
Each property has a specific meaning, defines
its permitted values, the types of resources it
can describe, and its relationship with other
properties.
25
Statements

RDF Statement


시맨틱 웹의 요소
A specific resource (subject) together with
a named property (predicate) plus the value
(object) of that property.
The object of a statement (the property
value)


Can be another resource specified by a URI
Can be a simple string
26
RDF Model
시맨틱 웹의 요소
Renato Iannella, 1998.9
RDF Description
Property
Property
Type
Value
URI
Resource
27
RDF Model…
시맨틱 웹의 요소
Eric Miller, 1998
RDF Description
Resource 1
Property
Type3
Property
Type1
Resource 2
Property
Atomic
Type4
Value
Property
Type2
Resource 3
Atomic
Value
28
RDF Example 1

시맨틱 웹의 요소
Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila.
주어 (Subject/Resource)
http://www.w3.org/Home/Lassila
술어 (Predicate/Property)
Creator
목적어 (Object/literal)
“Ora Lassila”
http://www.w3.org/Home/Lassila
Creator
“Ora Lassila”
Simple node and arc diagram
29
RDF Example 2

시맨틱 웹의 요소
http://www.w3.org/Home/Lassila has creator something
and something has name Ora Lassila and email
[email protected]
http://www.w3.org/Home/Lassila
Property with structured value
Creator
Name
Ora Lassila
Email
lassila @w3.org
30
RDF Example 3
•
시맨틱 웹의 요소
The individual reffered to by employee id 85740 is named Ora
Lassila and has the email address [email protected]. The resource
http://www.w3.org/Home/Lassila was created by this
individual.
http://www.w3.org/Home/Lassila
Structured value with identifier
Creator
http://www.w3.org/sttaffid/85740
Name
Ora Lassila
Email
lassila @w3.org
31
Basic RDF Serialization Syntax
시맨틱 웹의 요소















[1] RDF ::= ['<rdf:RDF>'] description* ['</rdf:RDF>']
[2] description ::= '<rdf:Description' idAboutAttr? '>' propertyElt*
'</rdf:Description>'
[3] idAboutAttr ::= idAttr | aboutAttr
[4] aboutAttr ::= 'about="' URI-reference '"'
[5] idAttr ::= 'ID="' IDsymbol '"'
[6] propertyElt ::= '<' propName '>' value '</' propName '>' | '<'
propName resourceAttr '/>'
[7] propName ::= Qname
[8] value ::= description | string
[9] resourceAttr ::= 'resource="' URI-reference '"'
[10] Qname ::= [ NSprefix ':' ] name
[11] URI-reference ::= string, interpreted per [URI]
[12] IDsymbol ::= (any legal XML name symbol)
[13] name ::= (any legal XML name symbol)
[14] NSprefix ::= (any legal XML namespace prefix)
[15] string ::= (any XML text, with "<", ">", and "&" escaped)
32
Using Default Namespace Syntax
시맨틱 웹의 요소

Ora Lassila is the creator of the resource
http://www.w3.org/Home/Lassila.
<?xml version="1.0"?>
<RDF
xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://description.org/schema/">
<Description about="http://www.w3.org/Home/Lassila">
<s:Creator>Ora Lassila</s:Creator>
</Description>
</RDF>
33
Abbreviated Syntax
시맨틱 웹의 요소
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://description.org/schema/">
<rdf:Description about=“http://www.w3.org/Home/Lassila”>
<s:Creator>Ora Lassila</s:Creator>
순서화 문법
</rdf:Description>
</rdf:RDF>
<rdf:RDF>
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://description.org/schema/">
<rdf:Description about=“http://www.w3.org/Home/Lassila”
단축형 문법
s:Creator=“Ora Lassila” />
</rdf:RDF>
34
RDF Schema

시맨틱 웹의 요소
Provides a framework in which
independent communities can develop
vocabularies that suit their specific
needs and share vocabularies with other
communities.
35
RDF Schema
시맨틱 웹의 요소
RDF Data Model이 자원 간의 관계를 ERD와 같이 간략하게
기술하기 위한 목적이었다면, RDF Schema는 Data Model과
Syntax를 이용하여 각 속성들의 특성을 정의하기 위한 메커니
즘을 제공함.
 XML DTD와 XML Schema가 XML 문서 구조에 대해 제한하는
기능을 하는 것이었다면, RDF Schema는 RDF Data Model에
의해 선언된 구문을 해석하여 정보를 제공하는 역할을 하는 일
종의 사전과 같은 기능을 하는 것으로, RDF 구문에서 사용되
는 용어에 대해 정의하고, 그들에게 특정한 의미를 부여하는
역할을 함.
 Schema는 Property 이용에 있어서 용어를 정의하고 제한하는
기능을 하기 때문에, 같은 용어가 다른 의미로 쓰이는 중복성
을 막기위해 XML의 Namespace 기법을 이용함.

36
Classes and Properties
시맨틱 웹의 요소
<Classes and Resources as Sets and Elements>
37
Classes and Properties
시맨틱 웹의 요소
<Class Hierarchy for the RDF Schema>
38
지식 표현
시맨틱 웹의 요소
• 문서들이 단순한 디스플레이만을 위해 사용되어서는 안 됨
• 데이터간의 연관관계가 잘 정의되어 있어야 함
• 다양한 응용영역에서 자동화되고 통합화된 데이터의 공유가 필요
• 구현: Ontology
철학
온톨로지: 존재의 본질과 유형에 관한 이론
시맨틱 웹
온톨로지: 특정 주제에 과한 지식용어들의 집합으로서 이들 용어뿐만 아니라 용어들
간의 의미적 연결관계와 간단한 추론 규칙을 포함
출처: 강상수, 한양대학교 지능시스템 연구실,
http://islab.hanyang.ac.kr/~sgkang/
39
계층적 구조(3) - Ontology
시맨틱 웹의 요소
논리적 추론을 위한 기술
 지식표현을 위한 담당

40
Ontology 에 대하여
시맨틱 웹의 요소
• 철학분야에 국한되어 사용되었으나 근래에 컴퓨터공학 분야에 적용되어 널리 사용
• 특히 지식공학, 지식 표현, 데이터베이스 디자인, 정보 모델링, 정보 통합/관리/조직, 에이전트 기반
시스템 등에서 널리 사용
• 인공지능(AI) 학문에 있어서 Ontology는 "개념화의 명세(specification of a conceptualization)"로
정의
.
• Ontology 는 "engineering artifact"로 어떤 사실을 기술하기 위해 필요한 object(객체)의 집합인
"vocabulary(universe of discourse)"와 객체들간의 관계인 relation과 function들의 집합으로 이루
어짐
• 온토로지는 객체의 집합과 객체들간의 관계의 정의에 의해 어떤 사실이나 상태를 표현하고자 하는 지
식 표현 기법
출처: 강상수, 한양대학교 지능시스템 연구실,
http://islab.hanyang.ac.kr/~sgkang/
41
Ontology의 계층과 다른 계층과의
시맨틱 웹의 요소
관계도
heuristic
engine
Search
Proof
Rules
Logic
Rules
Data
Data
Data
Ontologies
42
Ontology에 대한 프로젝트
*OIL
시맨틱 웹의 요소
***
DAML+OIL
• Product of the **On-to-Knowledge
Project
• Semantic markup language based
on OIL
• Standard for the definition and
exchange of Ontology
• Previous version of the ontology
language DAML-ONT.
• It allows the definition of classes,
relationships, and the possibility of
doing inference well.
• Similar to OIL
• RDF schema extension
*OIL: An Ontology Infrastructure for the Semantic Web. Web based ontology language.
**On-to-Knowledge: European Project that has goal of developing method and tools that allow to exploit the
potential of ontologies in the field of knowledge management. http://www.ontoknowledge.org
***DAML(DARPA(미국방성고등계획연구국) Agent Markup Language): DARPA program similar in some ways to
the On-To-Knowledge project. The main goal of DAML is the developing of language and tools to facilitate the
implementation of the Semantic Web. http://www.daml.org
43
DAML+OIL: an Ontology Language
for the Semantic Web
DAML+OIL Design Objectives

Well designed




Well defined



Intuitive to (human) users
Adequate expressive power
Support machine understanding/reasoning
Clearly specified syntax (obviously)
Formal semantics (equally important)
Extend existing web standards

DAML+OIL is built on top of RDF(S)
45
Why Build on RDF

Provides basic ontological primitives




Classes and relations (properties)
Class (and property) hierarchy
Can exploit existing RDF infrastructure
Provides mechanism for using ontologies


RDF triples assert facts about resources
Use vocabulary from DAML+OIL ontologies
46
The Cake!
DAML+OIL
DC
XHTML
HTML
SMIL
RDF(S)
XML
PICS
Why RDF Is Not Enough

Expressive inadequacy
Only range/domain constraints (on properties)
 No properties of properties (unique, transitive,
inverse etc.)
 No equivalence, disjointness, coverings etc.
 No necessary and sufficient conditions (for class
membership)


Poorly (un) defined semantics
48
How DAML+OIL Builds ON RDFS

Extends expressive power





Constraints (restrictions) on properties of
classes (existential/universal/cardinality)
Boolean combinations of classes and
restrictions
Equivalence, disjointness, coverings
Necessary and sufficient conditions
Constraints on properties
49
How DAML+OIL Builds ON RDFS

Provides well defined semantics



Meaning of DAML+OIL statements is
formally specified
Both model theoretic and axiomatic
specifications provided
Allows for machine understanding and
automated reasoning
50
DAML+OIL  RDF



DAML+OIL ontology is a set of RDF
statements
DAML+OIL defines semantics for
certain statements
Does NOT restrict what can be said


Ontology can include arbitrary RDF
But no semantics for non-DAML+OIL
statements
51
Well Designed(?)

Intuitive to (human) users


Adequate expressive power


Supports common ontological idioms
Extends RDF in several directions
Support for machine
understanding/reasoning
Designed to be “implementable”
 No features for which it is difficult or impossible to
define clear semantics (e.g., defaults)
 Decidable and (empirically) tractable reasoning

52
Why Automated Reasoning?

Semantic web requires machine
understanding (of resource descriptions)


Reasoning is integral to understanding
Supports design and use of ontologies
Checking class consistency (e.g., Skyscraper)
 Checking/deriving subClassOf hierarchy
 Particularly useful when ontologies are large,
multi-authored and rapidly evolving
 Also useful when integrating/sharing ontologies
Does not tell us how to deal with inconsistencies
 But we should be able to determine when they
exist


53
통합운용
시맨틱 웹의 활용
• 웹의 발전 = 분산환경의 발전
• 에이전트 시스템: 분산환경과 자율적 기능을 전제
• 따라서 에이전트 기술은 웹 기반 소프트웨어 시스템 개발
기간을 단축시키고 웹 환경에 적응하고 새로운 다양한 수
요의 확장을 포용하는 소프트웨어 시스템 개발의 필수요소
가 되고 있음.
• 에이전트 기술과 시맨틱 웹의 상호보완적 상승작용을 통
한 에이전트 기술의 활성화와 시맨틱 웹의 실현이 이루어
질 것으로 예상.
54
전자상거래에 대한 시맨틱 웹의 활
용
시맨틱 웹의 활용
• 전자상거래 프레임워크나 전자 카탈로그 또는 상품 분류 코드는 XML
을 기반으로 하고 있으며 기본적으로 시맨틱 웹에서 추구하는 온톨로지
연구목표와 유사한 목표를 가지고 있음
• 상품으로 대변되는 “개념”들의 체계적 정리가 전자 상거래에도 필요
함.
Ex. ISO/IEC 13520:2000 Topic Maps
• 전자상거래는 정의상 거래 당사자간의 상호 작용이 있게 된다. 웹 상
에 존재하는 거래 당사자에 관련된 다양한 정보를 전자상거래에 이용하
는 것이 필수적임
Ex. Web data mining
• 시맨틱 웹에서는 이러한 data mining이 에이전트에 의하여 자연스럽게
이루어질 수 있게 되어 거래자의 편리성이 대폭 증대되고, 이에 따라 거
래의 실현 가능성도 함께 증대되어 전자상거래 e-비즈니스가 획기적으로
증대될 가능성을 제공한다.
출처: 이재호, 양정진
시맨틱 웹: 차세대 지능형 웹 기술
55