8. 시맨틱웹 기반의 검색 시스템 구조 (이원희)

Download Report

Transcript 8. 시맨틱웹 기반의 검색 시스템 구조 (이원희)

시맨틱웹 기반의 검색 시스템 구조
2003. 7. 4
이원희
목 차
1. 서 론
2. 온톨로지
3. 시맨틱웹 기반 검색 구조
4. 시맨틱웹 개발을 위한 도구
5. 결 론
2
서 론
 현재의 웹 환경
 컴퓨터를 매개로 하여 사람과 사람들간의 정보 교환을 위해 발달
- 사용자가 원하는 유용한 정보의 추출이 어렵다
- 에이전트, 검색엔진, 자연어처리 등과 같은 기술이 웹 환경에서 적
용되기 위해 연구/개발되나, 한계점이 존재
- 부울연산에 의한 단어검색을 위주로 하는 현재 검색방법에서는 유
의어, 동음이의어 등과 같은 문제 발생
 XML
 정보의 정확한 표현은 가능
 의미 표현이 불가능하고 다양한 형태의 표현가능성으로 인한 정
보의 모호성을 증가시킴
 시맨틱웹
 웹 데이터에 대한 의미적 해석 및 처리의 취약 등의 문제점 해결
 컴퓨터간 정보교환이 가능, 웹 상의 데이터의 의미를 사람이 아
닌 컴퓨터가 이해, 처리 할 수 있는 새로운 정보기술
3
온톨로지(Ontology)
(1/2)
 Tim Berners-Lee
 시맨틱웹의 중요 기술
- 의미 표현을 위한 RDF/RDFS
- 이기종 환경에서 도메인의 지식을 공유하고 재사용하기 위한 온톨
로지(Ontology)
- 자동적이고 지능적인 기능의 수행과 개인화를 위한 에이전트
 온톨로지(Ontology)
 도메인 내에서 공유되는 데이터들의 개념화한 형식적이고 명백
한 규정
 특정분야에서 사용되는 표준 어휘들의 모음
 도메인내의 지식을 개념화 하고 이를 명세화 하는 것
4
온톨로지(Ontology)
(2/2)
 온톨로지(Ontology)의 종류
온톨로지의 종류
설명
도메인 지향 온톨로지 -도메인에 대한 특성화 또는 일반화 온톨로지
(Domain Oriented)
작업 지향 온톨로지
(Task Oriented)
일반적인 온톨로지
(Generic)
-업무에 대한 특성화 또는 일반화한 온톨로지
-공통적인 상위개념을 표현한 온톨로지
-온톨로지의 재사용에 유용한 온톨로지
-온톨로지를 이용한 자연언어 표현의 분석과 온톨로
지 생성에 중요
5
시맨틱웹 기반 검색 구조(1/2)
 시스템 구조(IITA IT정보센터)

현재의 웹 구조 + 시맨틱웹 기술
- 현재의 웹과 독립적으로 구성하게 되면 그에 소모되는 자원과 비용
증가
- 현재의 웹과 유사한 구조를 지님으로써 현재의 웹과 연동할 수 있
는 시스템 구조가 필요
 시멘틱웹 검색시스템 구조
1. 검색엔진 : 사용자가 시맨틱웹의 사용과 에이전트와 RDF, 온톨
로지를 이용한 추론엔진의 연동에 대한 서브시스템 구조
2. 온톨로지(Ontology) : 시맨틱웹에서 온톨로지를 생성하고 유지
관리하기 위한 서브 시스템 구조
6
시맨틱웹 검색 시스템 구조(2/2)
User
Web
Service
UI Agent
Web
Document
HTML
XML
Search Engine
(Crawler Angent)
Inference
Engine
RDF Query
Engine
Ontology
Crawler
Inference Rule
Translator
RDF
RDF Translator
OIL
DAML
Ontology evaluator
SHOE
Validator
Parser
Document Editor
Ontology
Validator
Ontology
Generator
Meta data
Repository
Ontology
Modeler
Data base
Ontology
Repository
Annotation
Tool
Ontology
Editor
Ontology Web
Language
Ontology Web
Language
Versioning Tool
Ontology
Integration
Tool
Ontology
Learner
Ontology
Integrator
Ontology
Selector
7
검색엔진 서브 시스템 구조(1/2)
 검색엔진 서브 시스템
 구성 요소
구성 요소
설명
RDF 질의 엔진
(RDF Query
Engine)
-웹 문서로부터 받은 RDF 질의어를 처리
-그에 부합하는 온톨로지 및 관련 온톨로지에 대한 정보를 온톨로지 크롤
러에 제공
온톨로지 크롤러
(Ontology Crawler)
-RDF 질의 엔진에서 제공한 온톨로지를 검색
-검색한 온톨로지를 추론 엔진에 제공
추론 엔진
(Inference Engine)
-온톨로지로부터 추론 규칙을 적용하여 추론의 기능을 수행
-질의어의 연관 관계를 파악하여 관련 용어를 검색 엔진에 제공
User
UI Agent
Web
Service
Web
Document
HTML
XML
Search Engine
(Crawler Angent)
Inference
Engine
RDF Query
Engine
Ontology
Crawler
Inference Rule
Translator
RDF
RDF Translator
OIL
DAML
SHOE
8
Validator
Parser
Document Editor
Ontology
Repository
검색엔진 서브 시스템 구조(2/2)
 온톨로지 검증을 위한 구성요소
 온톨로지는 검색에만 유용하게 사용되는 것이 아니라 사용자가 온톨로
지를 이용하여 페이지를 구성할 수 있다
 DAML, OIL, SHOE, OWL 등의 언어를 사용하여 시맨틱웹 문서를 작성
하기 위한 필수 구성요소
구성 요소
설명
문서편집기
(Document Editor)
-시맨틱웹 언어를 제공하기 위한 편
집기
-기존의 HTML, XML 편집기와 동일
User
UI Agent
Web
Service
Web
Document
HTML
XML
Search Engine
(Crawler Angent)
Inference
Engine
RDF Query
Engine
Ontology
Crawler
Inference Rule
Translator
문서 파서기(Parser)
-작성된 문서의 XML 문법을 검사
RDF
RDF Translator
문서 유효성 검사기
(Validator)
-스키마 또는 온톨로지를 참고하여
유효성을 검사
OIL
DAML
SHOE
Validator
Parser
Document Editor
Ontology
Repository
9
온톨로지 서브 시스템 구조(1/5)
 시맨틱웹에서의 온톨로지


추론 엔진에서 추론을 하기 위한 지식을 제공
도메인 내의 지식을 공유하고 이기종 환경에서의 상호운영을 보
장
 온톨로지 서브 시스템의 구성
1. 온톨로지 생성 모듈
2. 온톨로지 관리 모듈
3. 온톨로지 저장 모듈
10
온톨로지 서브 시스템 구조(2/5)
 온톨로지 서브 시스템의 구조
Ontology evaluator
Ontology
Repository
Ontology
Validator
Ontology
Generator
Meta data
Repository
Ontology
Modeler
Data base
Annotation
Tool
Ontology
Editor
Ontology Web
Language
Ontology Web
Language
Versioning Tool
Ontology
Integration
Tool
Ontology
Learner
Ontology
Integrator
Ontology
Selector
11
온톨로지 서브 시스템의 구조(3/5)
 온톨로지 생성
 수동적인 부분과 자동적인 생성이 가능하도록 시스템의 구성요소를 제
시
 온톨로지 생성 구성요소
구성 요소
온톨로지 모델러
(Ontology Modeler)
설명
-데이터 베이스를 참조하여 지식을 개념화
-개념화간의 계층적 구조를 위하여 구분 규칙(Taxonomy rule)적용
-온톨로지 생성기에 개념화 용어를 제공
온톨로지 생성기
(Ontology Generator)
-온톨로지 모델러로부터 받은 용어에 명세화
-온톨로지 언어(지식 표현 언어)로 작성
온톨로지 검사기
(Ontology Validator)
-작성된 온톨로지의 유효성을 검사
-온톨로지 언어의 문법적인 검사
- 온톨로지 모델러는 텍스트 방식이 아닌 계층적인 구조를 표현하는 트리 모델
이나, UML과 같은 방식의 그래픽 방법을 제공해야 한다
- 개념화를 자동화된 방법으로 수행하기 위해서는 구분 규칙을 제공하여 개념
간의 계층적인 구조를 제시 해야 한다.
12
온톨로지 서브 시스템의 구조(4/5)
 온톨로지 관리
 편집, 주석 및 온톨로지 통합 도구를 제공해야 한다
- 편집 : 온톨로지 수정을 위해 제공
- 주석 : 각각의 온톨로지에 사용자의 메모와 같은 부분을 기록
- 통합 도구 : 도메인의 온톨로지를 하나의 온톨로지로 통합
 온톨로지 통합 도구
구성 요소
설명
주석 도구
(Annotation Tool)
-온톨로지에 주석을 처리하기 위한 도구
-온톨로지를 사용하는 모든 사용자에게 제공
-주석을 하기 위한 언어로 온톨로지의 표현 언어로 동일한 언어를 제공
온톨로지 편집기
(Ontology Editor)
-온톨로지의 내용의 편집
-온톨로지 각 구성 요소의 편집 등을 제공
-편집하고자 하는 온톨로지의 버전을 선택
온톨로지 통합도구
(Ontology
Integration Tool)
-자동 및 수동 통합 방법을 모두 제공
-자동적인 통합 방법은 기계학습 등의 방법을 제공
-수동적인 방법은 온톨로지 편집기와 같은 편집기로 사용자가 직접 통합
할 수 있는 방법을 제공
13
온톨로지 서브 시스템의 구조(5/5)
 온톨로지 저장
 온톨로지 저장 구성요소는 온톨로지 저장, 저장된 구성요소의 버
전을 제공
 항상 온톨로지 무결성 등을 검사하는 모듈이 있어야 함
 온톨로지 저장 구성요소
구성 요소
설명
온톨로지 저장소(OntologyRepository)
-온톨로지 및 주석을 저장
-파일 서버와 같이 온톨로지를 분류하여 저장
온톨로지 평가기(Ontology Evaluator)
-온톨로지의 무결성 검사
버저닝 도구(Versioning Tool)
-온톨로지의 수정 등으로 인한 온톨로지 버전 제공
14
시맨틱웹 개발을 위한 도구
 구성요소 별 시맨틱웹 개발도구
15
결 론
 현재의 시맨틱웹 기술에 대한 연구
 초기단계로 구체화되어 있지 않고 각기 여러 요소 별로 독립적인 연구
가 진행
 독립적으로 연구가 진행되어온 시맨틱웹의 각 요소 기술들의 유기적인
통합이 필요
 개선된 마크업 언어 및 표준화 동향에 대한 연구화 함께 시맨틱웹에 대
한 효과적인 활용방안 등에 대한 연구가 필요
 시맨틱 웹의 응용





지능형 정보검색
지식 관리
자동화된 웹 서비스
에이전트 시스템
지능형 전자상거래 및 현재의 웹 응용
 새로운 기술의 빠른 도입을 위해 해결되어야 할 이슈
 손쉬운 온톨로지 도구 개발
 온톨로지 기반의 시맨틱웹 프로토타입
 기존 웹에 손쉬운 적용
16