슬라이드 1 - POSTECH CSE DPNM (Distributed Processing

Download Report

Transcript 슬라이드 1 - POSTECH CSE DPNM (Distributed Processing

Distributed System Assignment #6
Research new Technology
Semantic Web
Min Kyung Hwang
in SSLab,. POSTECH
Contents
Motivation
Overview of Semantic Web
Technology
Topic Maps
RDF
RDF Application
Semantic Web Services
Real World Cases
Conclusion
Reference
2
Motivation-Current Web
현재 web의 한계성
정보의 증가 : 방대한 양, 다양한 종류
• 텍스트 문서, 이미지, 멀티미디어자료, 응용프로그램, voice 등.
인간 중심의 정보 보여주기가 목적 (presentation)
• 문서와 자료를 인간이 이해하기 쉬운 형태로 표현하는 것이 중요
• 컴퓨터가 정보를 이해하고 가공하기 어렵다.
검색 엔진에 의존하는 정보검색
• 대부분이 사용자가 원하는 정보를 제공하지 못한다.
• 원인 : 다중적인 의미, 잘못된 단어조합, 사용자 선호도를 구분하지
못함
“Semantic Web”
정보를 컴퓨터에 의해 재가공하여 사용자가 쉽게 원하는 정보를
활용할 수 있도록 하는 새로운 패러다임
3
Overview of Semantic Web
What is Semantic Web?
World-Wide-Web의 창시자 Tim Berners-Lee에 의해 창안된 차세
대 Web 기술
"The Semantic Web is an extension of the current web in which
information is given well-defined meaning, better enabling
computers and people to work in cooperation."
-- Tim Berners-Lee, James
컴퓨터가 이해할 수 있는 web
•
•
•
•
contents에 구조화된 부가정보(metadata) 추가
풍부한 탐색 및 검색, 데이터 통합, 자동화를 제공
통일된 정보공유체제 확립
정보(information) 기반  지식(knowledge) 기반
4
Overview of Semantic Web
Technology
RDF – W3C기반으로 지식 표현 기술  온톨로지 기술로 발전
Topic Maps – ISO 기반 지식 표현 기술
Layer of W3C Semantic Web
5
Technology - Topic Maps
ISO 중심의 semantic web 기술
ISO/IEC 13250 지식 표현 기술(knowledge representation) 표준
기술언어 : XTM(XML Topic Maps)
정보 자원의 구성, 추출, 네비게이션에 관계하는 새로운 패러다임
정보와 지식의 관리를 위한 최적화된 표현양식 제공
 정보와 지식의 분산처리, 통합관리에 중점
지식층과 정보층의 이중구조
• 정보층 : 특정 주제(Topic)과 주제 간의 연계(Relation)로 구성
• 지식층 : 디지털 컨텐츠
• 발생(occurrence)를 통해 상호연결
6
Technology - RDF
Resource Description Framework
특정자원에 대한 구조화된 메타데이터를 기술하는 XML기반 프레
임워크
상호 이용성(interoperability)
• application 간에 정보를 교환하여 다른 컴퓨터에서 이를 처리
triple 구조 하나의 statement 구성
• 자원: 주어(subject), URI를 이용한 고유 식별대상
• 속성: 술어(predicate), 자원을 정교하게 설명하기 위함.
– 속성명 또는 XML namespace에 정의된 URI로 정의
• 속성값: 목적어(object), 다른 URI, 자체가 자원이 될 수 있음.
7
RDF Technology
URI (Uniform Resource Identifier)
web의 지시자 : 자원의 이름을 지시, 그 내용을 알지 못함
• URL(Uniform Resource Location)이 한 종류
XML(eXtensible Markup Language)
“문서”에 구조화된 정보를 표현하는 언어
구조화된 정보 = 컨텐츠 + 역할(속성)
tag를 사용자가 정의 가능: XML namespace
• Document Type Definition (DTD) or XML schema를 이용
• 같은 데이터를 사용자 정의에 따라 여러 다른 구조로 표현 가능
• 문제 : 컴퓨터가 각기 다르게 정의한 tag를 어떻게 구분할 것인가?
8
RDF Technology
XML 구조
RDF 구조- XML namespace
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:love="http://love.example.org/terms/"
> <rdf:Description rdf:about="http://aaronsw.com/">
<love:reallyLikes rdf:resource="http://www.w3.org/People/Berners-Lee/Weaving/" />
</rdf:Description>
</rdf:RDF>
9
RDF Technology
Why RDF than XML?
XML tag를 컴퓨터가 자동해석, 의미연관성 파악, 추론 어려움
“문서”가 아닌 그 안에 담긴 “데이터(Resource, metadata)”를 표
현
RDF에 XML schema를 적용하여 쉽게 serialization
statement 해석 정보 제공
단순한 구조 : triples
parser를 이용하여 정보를 명확하게 model에 매핑 가능
HTML 정보를 RDF 정보와 병렬적으로 처리 가능
<XML serialization>
10
RDF Technology
RDF Schema
자원이 속한 클래스, 클래스 간의 관계, 속성간의 관계 정의
RDF statement에 사용될 용어와 타입 정의
• 클래스(class) : 자원과 속성
• 서브클래스(subClassOf) : 특정 application의 schema
11
RDF Technology
Ontology
RDF Schema에 “분류”와 “논리적인 추론”을 부과하여 기계가
web의 의미를 해석하는 semantic web을 완성
• 특정 주제 영역의 도메인을 계층구조로 나타냄 : 용어, 관계 정의
• 도메인그룹 내에서 합의된 지식
web ontology
• 다른 데이터베이스를 사용하는 동일한 의미의 2개의 용어가 같은 것
인지 비교, 결합하기 위한 프로그램
– application사이에 web 기반 지식을 생성, 처리, 공유, 재생산
종류
• DAML+OIL, SHOE, OWL (Web ontology language)
12
RDF Application
DAML+OIL: DARPA Agent Markup Language +OIL
modeling primitives를 가진 확장된 W3C기반의 언어
구성 : headers, class elements, property elements, instances
SHOE : Simple HTML Ontology Extension
HTML 문서와 다른 web 문서에 컴퓨터가 이해하는 semantic 지식
을 결합
agent를 이용하여 web pages와 documents의 의미있는 정보를
수집
13
RDF Application
OWL (Web ontology language)
DAML+OIL에서 파생된 web ontology 언어
속성과 클래스를 기술할 다양한 의미 표현 어휘를 제공
• 클래스 간 관계, 관계차수, 동치성, 풍부한 속성타입, 속성 특징, 열거
형 클래스 등.
3개의 하위 언어를 구성
• OWL Lite: 클래스 분류계층과 간단한 제약사항 표현이 필요한 사용
자들을 위한 언어
• OWL DL: 계산학적 완전성(모든 결론 계산될 수 있음), 결정가능성
(유한시간 내 완료)을 유지하여 최대의 표현력 요구하는 언어
• OWL Full: 최대의 표현력과 RDF의 모든 문법을 활용할 수 있는 언어
14
Semantic Web Services
SHOE application
semantic search
• SHOE 검색 엔진
the knowledge annotator
• SHOE를 포함한 web page에 그래픽한 주석을 달도록 하는 자바 프
로그램
Exposé
• SHOE를 포함하는 web page를 검색하여 관련 지식을 수집하는 web
로봇
PIQ (Parka Interface for Queries)
• Exposé에 의해 발견된 SHOE 정보를 비주얼하게 질의하도록 하는
자바 툴
15
Semantic Web Services
MusicBrainz (www.musicbrainz.org)
음악정보를 생성하는 음악 메타 데이터베이스 커뮤니티
CD Player program
• Musicbrainz가 CD들을 식별하고 CD에 대한 정보를 제공할 때 이용
Musicbrainz Tagger
• 개인 음악자료의 메타데이터 테그를 자동적으로 식별하고 생성
< MusicBrainz RDF Metadata >
16
Real World Cases
RSS (Really Simple Syndication)
뉴스, 블로그 사이트에서 주로 사용하는 XML기반 컨텐츠 표현 방식
RSS 관련 프로그램을 이용하여 최신정보 자동 수집
RSS 리더프로그램으로 읽고, 다른 형식으로 이용 가능
ex) Explorer 7 – RSS 리더(구독기) 
Google Desktop - 개인 검색 환경
웹 검색 뿐 아니라 개인 데스크탑에 대한 검색
검색기술 평가
• 현재 : 검색의 응답률(발견한 정보의 양)과 관련있는 정도로 평가
• 미래 : 사용자 별 정확도 파악(검색패턴, 사용자 선호도 반영)
유비쿼터스 단말기로 확장, 공유 기기 간의 정보검색 가능
17
Real World Cases
Ajax (Asynchronous JavaScript +XML)
자바스크립트 렌더링 엔진을 이용한 기술
Ajax를 이용하여 한번에 브라우저 읽어들여 사용자 이벤트를 자
바스크립트가 스스로 처리
• XML자료를 xmlhttp로 관리하므로 다시 페이지를 불러들일 필요없음
서버와의 통신은 백그라운드로 진행
이벤트마다 서버와의 통신으로 인한 overhead(대기시간)를 줄임
Application (http://www.google.com)
•
•
•
•
google gmail – 빠른 로딩, 비동기적 스크립트처리(추가옵션)
google maps – 별도의 설치없이 HTML내에서 지도검색
google 개인화 – HTML의 재배치
yahoo!, amazon
18
Conclusion
Semantic Web은 지식(knowledge) 기반 차세대 web 기술
W3C 기반 RDF + ontology 기술 표준으로 발전
의미있는 정보의 검색, 추론
컴퓨터 스스로 지식을 생산
이미 상용화된 많은 웹서비스에 기술 적용, 점차 고도화되고 변
형된 기술들이 등장
XML, RDF, DAML+OIL, SHOE
OWL, RSS, Ajax 등
web ontology (OWL)의 표준화와 함께 온톨로지 기술 발전 가
능성 기대
19
Reference
Wikipedia
http://en.wikipedia.org/wiki/Semantic_Web
The Semantic Web: An Introduction
http://infomesh.net/2001/swintro/
The Semantic Web In Breadth
http://logicerror.com/semanticWeb-long
웹 2.0 시대의 기회, 시맨틱 웹, 김태중, 2006, 디지털미디어리서치
http://www.dal.co.kr/chair/semanticweb/sw.html
Semnatic Web Overview, Prof.Joongmin Choi, Intelligent
System Lab,. Hanyang Univ.
20