Transcript Korean

2004 한국어정보처리연구회 동계 튜토리얼
■ 일 시 : 2004년 2월 13일(금)
■ 장 소 : 성신여대 수정관 420호
한국어정보처리와 온톨로지
Korean Information Processing and Ontology
울산대학교 컴퓨터정보통신공학부
옥 철 영
Korean Information Processing and Ontology
Contents
•
•
•
•
•
•
•
•
•
•
•
Introduction
What is an Ontology?
Conceptualization
Hierarchical Structure
Thesaurus & Semantic Network
Ontology Development
Ontology in Natural Language Processing
Ontology in Semantic Web
Ontology Tool
Demo
Conclusion
2/85
Korean Information Processing and Ontology
Introduction(1/5)
나 멍청한 컴퓨터
똑똑한 컴퓨터? 언어를
이해하는 컴퓨터!!
지난 추석에 차표를 못 구
해서 생각한 것이 차를 사
자는 생각이었다. 이것이
이유가 되었다.
10년 동안 자신만을 바라
보고 산 아내의 얼굴도 눈
에 선했다…...
입력문
3/85
Introduction(2/5)
Korean Information Processing and Ontology
• 최근의 학계 관심사
•
•
•
•
지식을 어떻게 체계화할 것인가?
지식을 어떻게 저장할 것인가?
저장된 지식을 어떻게 활용할 것인가?
지식 정보를 어떻게 표준화할 것인가?
• Ontology에 대한 관심이 높아진 이유
•
•
•
•
Semantic Web의 등장이 가장 큰 이유
지식 공유 및 지식 체계화의 한 방법으로 대두
한국어정보처리에서 형태/구문 분석 이상의 처리 단계 기대
국외의 Ontology 연구 활성화
4/85
Korean Information Processing and Ontology
Introduction(3/5)
E-Commerce
주요 응용분야
U-Computing
SCM
Semantic Web
NLP
Software Agent
GIS
Intelligent Web
E-Business Template Knowledge management
Ontology
XML, RDF
W3C OWL
논리 추론 기술
IEEE SUO
분류체계 관리 기술
DAML
지식표현 기술
요소기술
색인 기술
OntoWeb
국제활동
5/85
Introduction(4/5)
Korean Information Processing and Ontology
• Why develop an ontology?
• To share common understanding of the structure of information
• Among people
• Among software agents
• To enable reuse of domain knowledge
• To avoid “re-inventing the wheel”
• To introduce standards to allow interoperability
• To make domain assumptions explicit
• Easier to change domain assumptions
(consider a genetics knowledge base)
• Easier to understand and update legacy data
• To separate domain knowledge from the operational knowledge
• Re-use domain and operational knowledge separately
(e.g. configuration based on constraints)
6/85
Introduction(5/5)
Korean Information Processing and Ontology
인식론적 죽음(epistemological death) – Kenneth L. Pike(1994) [Linguistic Concepts]
벽의 구멍에 있는 쥐가 말하기를 : ‘밖에는 고양이가 있어.
난 멍청하지 않아. 구멍을 나가기 전에 고양이가 가버리길
기다리겠어.’
갑자기 쥐가 귀를 쫑긋 세우고 듣는다 : “으르렁, 야옹! 으르
렁 으르렁! 야옹!’ 그리고 말하기를, ‘아하, 개가 와서 고양이
랑 싸우고 있구나. 고양이가 바쁠 때 나가야지.’ 밖으로 막
나간다
고양이가 쥐를 잡고 끌어 올리면서 승리의 말을 한다 : ‘아버
지께서 잘 살려면 두 가지 언어를 사용해야 한다고 하신 말
씀이 맞아!’
고양이의 분류자질 공유는-보통
개에게만 주어진 으르렁거리는
능력은-쥐에게 불의의 기습을 한
다. 자신의 분류를 믿은 탓으로,
쥐는 “이중언어를 구사하는” 고
양이한테 목숨을 잃는다.
단지 하나의 분류법과 하나의 특성
의 구분에 기초해서, 우주를 “오직”
어떤 한 가지 자질 집합을 함의하는
것으로서 다룬다면 그 이론은 인식
론적 죽음의 위험에 빠진다.
음~, 온톨로지 구축도 쉬운 일이 아
니겠구나!
7/85
What is an Ontology?(1/13)
Korean Information Processing and Ontology
• Nicola Guarino(1995)
• Possible interpretations of the term “Ontology”
1. Ontology as a philosophical discipline
2. Ontology as an informal conceptual system
3. Ontology as a formal semantic account
4. Ontology as a specification of a “conceptualization”
5. Ontology as a representation of a conceptual system via a logical
theory
5.1 characterized by specific formal properties
5.2 characterized only by its specific purpose
6. Ontology as the vocabulary used by a logical theory
7. Ontology a s (meta-level) specification of a logical theory
8/85
Korean Information Processing and Ontology
What is an Ontology?(2/13)
철학적
The branch of
metaphysic that
studies the nature
of existence
이론적
A formal,
explicit
specification of
a shared
conceptualization
언어학적
A shared
vocabulary, which
can be used to
model a domain,
that is, the type of
objects and/or
concepts that exist,
and their properties
and relations
실제적
• Simple concept
hierarchies
• Thesaurus
• Semantic nets
• Word nets
• Lexical class
• Frame system
• Logical model
•…
9/85
What is an Ontology?(3/13)
Korean Information Processing and Ontology
• Philosophically
•
•
•
•
세상의 기본이 되는 구성 요소에 대한 명확한 이해와 정의
The branch of metaphysics that studies the nature of existence
A systematic account of existence
Objectives
• Describe world, classify and categorize
• Example
• Aristotle, …, Sowa, …
10/85
What is an Ontology?(4/13)
Korean Information Processing and Ontology
• Theoretically
• A formal, explicit specification of a shared conceptualization
• A shared vocabulary, which can be used to model a domain, that
is, the type of objects and/or concepts that exist, and their
properties and relations
• 어떤 영역에서 공통적으로 사용되는 어휘들의 집합을 표현
11/85
What is an Ontology?(5/13)
Korean Information Processing and Ontology
• In Natural Language Processing
• 신효필(2001)
• 어떤 개념들이 실세계에 존재하고 어떻게 그것들이 서로 관련
되는가에 대한 지식을 포함하는 전산적 단위
• 강신재(2002)
• 실세계(혹은 특정 도메인)에 존재하는 모든 개념들과 개념들의
속성, 그리고 개념들이 상호간 의미적으로 어떻게 연결되어 있
는가에 대한 정보를 가지고 있는 지식베이스
• Objectives
• Model lexical and domain knowledge
• Semantic Analysis
• Usage
• MT, IR, Information Extraction, QA System
• Example
• WordNet, LIP Ontology, Mikrokosmos Ontology…
12/85
What is an Ontology?(6/13)
Korean Information Processing and Ontology
• In Artificial Intelligence
• A meta-level description of a knowledge representation
• An explicit formal specification of how to represent the objects,
concepts, concepts and other entities that are assumed to exist in
some area of interest and the relationships that hold among them
• The hierarchical structuring of knowledge about things by
subcategorizing them according to their essential (or at least
relevant and/or cognitive) qualities
• Objectives
• Model common sense and domain knowledge
• Usage
• Knowledge representation and reasoning
• Examples
• CYC, HowNet…
13/85
What is an Ontology?(7/13)
Korean Information Processing and Ontology
• In Library & Information Science
• The hierarchical structuring of knowledge about things by
subcategorizing them according to their essential (or at least
relevant and/or cognitive) qualities
• Objectives
• Organize the bibliographic universe
• Model universal & domain knowledge
• Usage
• Provide access-points to bibliographic entities
• Collocation device
• Example
• Dublin Core, MARC, LCC, UDC, SAB…
14/85
What is an Ontology?(8/13)
Korean Information Processing and Ontology
• In Semantic Web
• “Web Ontology” : ontology for semantic web
• A program that wants to compare or combine information across
the two databases has to know that two terms are being using to
mean the same thing
• Ontologies can play a crucial role in enabling Web-based
knowledge processing, sharing, and reuse between applications
• The most typical kind of ontology for the web has a taxonomy
and a set of inference rules
• Using the Web Ontology Language
• RDF Schema, DAML+OIL, OWL…
• Objectives
• Provide semantics for web resources
• Usage
• Describe resources … and their contents
15/85
What is an Ontology?(9/13)
Korean Information Processing and Ontology
• Overall
• An Ontology is an explicit description of a domain
• Concepts
• Properties and attributes of concepts
• Constraints on properties and attributes
• Individuals (often, but not always)
• An Ontology is a set of concepts –such as things, events, and
relations– that are specified in some way (such as specific
natural language) in order to create an agreed-upon vocabulary
for exchanging information
• An Ontology defines
• a common vocabulary
• a shared understanding
16/85
What is an Ontology?(10/13)
Korean Information Processing and Ontology
• Ontology Examples (in practice)
•
•
•
•
•
•
•
•
•
•
Simple concept hierarchies
Semantic Network
Thesaurus
Frame system
Logical models
Lexical Field
Taxonomies on the web
Catalogs for on-line shopping
Domain-specific standard terminology
Etc.
17/85
What is an Ontology?(11/13)
Korean Information Processing and Ontology
• Types of Ontology(1)
• Generic Ontology (or Common Sense Ontology)
• aim at capturing general knowledge about the world, providing
basic notions and concepts for things like time, space, state, event,
etc.
• Domain Ontology
• capture the knowledge valid for a particular type of domain
(e.g. electronic, medical, mechanic, digital domain…)
• Task Ontology (and Method Ontology)
• Task ontologies provide items specific for particular tasks
(e.g. ‘hypothesis’ belongs to the diagnosis task ontology)
• Method ontologies provide terms specific to particular P는
(e.g. ‘correct state’ belongs to the Propose-and-Revise method ontology)
• Provide a reasoning point of view on domain knowledge
18/85
What is an Ontology?(12/13)
Korean Information Processing and Ontology
• Types of Ontology(2)
• Representational Ontology (or Frame Ontology)
• do not commit themselves to any particular domain
• provide representational entities without stating what should be
represented
• Frame Ontology defines concepts such as frames, slots, and slot
constraints allowing the expression of knowledge in an objectoriented or frame-based way
• Metadata Ontology
• provide a vocabulary for describing the content of on-line
information sources (like Dublin Core)
• Etc.
• Core Ontology, Upper Ontology, Application (or applied) Ontology,
…
19/85
What is an Ontology?(13/13)
Korean Information Processing and Ontology
• 쓰임에 따른 Ontology 분류
• Object of construction
• {Generic, Core, Upper} Ontology
• Domain Ontology
• {Task, Method} Ontology
• Metadata Ontology…
• Application
• Linguistic Ontology
• AI Ontology
• NLP Ontology
• Web Ontology…
• etc.
• Information Ontology  real-world based knowledge information
20/85
Conceptualization(1/7)
Korean Information Processing and Ontology
• Ontology 연구를 위한 두 가지 인식
• 개념(concept)이란 무엇인가?
• 개념화(conceptualization)란 무엇인가?
• 개 념(Concept)
• 사전적 정의
• (일반적) 어떤 사물 현상에 대한 일반적인 지식
• (사회과학적) 구체적·사회적 사실들에서 귀납하여 일반화한 추
상적인 사람들의 생각
• (철학적) 여러 관념 속에서 공통된 요소를 뽑아내어 종합하여
서 얻은 하나의 보편적인 관념. 언어로 표현되며, 일반적으로
판단에 의하여 얻어지는 것이나 판단을 성립시키기도 한다
21/85
Conceptualization(2/7)
Korean Information Processing and Ontology
• ‘개념’에 대한 전통적 견해
• Aristotel
• 개념을 유(類, genus)와 그리고 같은 유에 속하는 여러 종(種,
species)들을 서로 구별할 수 있는 필요충분조건들로써 정의
• 인간(MAN) = 이성(RATIONAL) + 동물(ANIMAL)
종차(種差, differentia)
종(種, species)
• 원소(原素, primitives) : 종차가 더 이상 분해될 수 없는 상태
 Aristotel의 원소를 범주(範疇, category)라 부름
 종류 : 실체(substance), 분량(quantity), 성질(quality), 관계(relation)…
• J.S.Mill(1865)
• 개연론적(probabilistic) 입장에서는 개념을 자질의 집합체(a
collection of features)로 정의
• W.Whewell(1858)
• 원형론적(prototype) 입장에서는 개념을 하나의 예(instance)나
또는 원형으로써 정의
22/85
Conceptualization(3/7)
Korean Information Processing and Ontology
• ‘개념화’에 대한 전통적 견해(1)
• ‘개념’에 대한 전통적 견해의 일반론
• 하나의 사물 또는 일정한 존재가 나타내는 여러 관념 속에서 공
통된 요소를 추상(抽象)하여 종합한 또다른 하나의 관념
• 개념화 과정
• 표상(表象)분석비교추상총괄명명(命名)
• Example
나무(Tree)
개념화
인간의 관념 속에 ‘나무’라는 개념은 세상에 존재하는 모든 종류의 나무가 가지는 요
소(속성) 중 각각의 나무만이 갖는 특이질적 요소는 사상(捨象)하고 공통된 요소만
을 추상하여 종합한 것을 인간의 머리 속에 간직해 놓은 또다른 하나의 관념
(1) T1, T2, …, Tn 모든 나무들 (여기에서 e는 요소를 뜻함)
eT1={t1 , t1 , …, t1 } 특정한 나무 T1이 인간의 관념 속에 간직된 모든 요소
1
2
n
eT2={t2 , t2 , …, t2 } 특정한 나무 T2가 인간의 관념 속에 간직된 모든 요소
1
2
n
◦
◦
◦
eTn={tn , tn , … tn } 특정한 나무 Tn이 인간의 관념 속에 간직된 모든 요소
1
2
n
(2) eT1 ∩ eT2 ∩ … ∩ eTn
≡ {t11, t12, …, t1n} ∩ {t21, t22, …, t2n} ∩ … ∩ {tn1, tn2, … tnn}
23/85
Conceptualization(4/7)
Korean Information Processing and Ontology
• ‘개념화’에 대한 전통적 견해(2)
• Ogden&Richards(1923)
• 기호(symbol)와 지시물(referent)과 사고(thought) 또는 지시
(reference) 사이에는 밀접한 관계가 있다고 봄
• 의미삼각도에 근거한 의미 형성 관계 설명
 개념 성립 관계(개념화)
CONCEPT, INTESION, THOUGHT, IDEA, SENSE
Symbolized
SYMBOL
WORD
Stands for
Refers to
REFERENT
OBJECT
EXTENSION
24/85
Conceptualization(5/7)
Korean Information Processing and Ontology
• 인지과학적 측면에서의 ‘개념’과 ‘개념화’(1)
• 과학적인 분석을 토대로 단어, 구, 또는 문장 등의 의미 기술
을 위하여 개념을 정의하고 그 구조를 기술
• ‘개념’ 설명을 위한 인지과학적 과정
• 도상(圖像, icon)
• 인간이 지각 작용을 할 때 대뇌에서는 지각을 통해 입력된 내용을
잠깐 동안 간직하게 되는데, 이 순간의 기록, 즉 간직된 내용
• 부분적이고 불완전한 정보
• 지각(知覺, perception)
• 영상(映像, image)
• 식형(式型, schema)
• 부분적이고 불완전한 도상을 함께 묶어 주어, 도상들이 합해져서
완전한 영을 이루게 하는 것
♣도상, 식형, 영상, 그리고 개념은 불가분의 관계가 있고, 또 이 모
든 것들이 지각작용을 통해서 거의 동시에 이루어짐
25/85
Conceptualization(6/7)
Korean Information Processing and Ontology
• 인지과학적 측면에서의 ‘개념’과 ‘개념화’(2)
• 지각작용의 구조와 과정
• 지각과정은 어떤 동물이나 나무 같은 외적 실존체 또는 장면(e)
를 보면 즉시 개념 도식의 구조(structure)(u)를 생성한다
지각된 것의 저장
운동장치
조립기
연상비교측정기
작동모형
지각 도상
지각 입력
<지각작용의 구조>
(a) 실존체(e)는 지각도상(s)을 제공한다.
(b) 연상 비교 측정기는 적어도 한 개 이상의 지각된 것 (p1, …, pn)을 발견하
고 이것들은 지각도상(s)의 일부분이나 또는 전부와 연결된다.
(c) 조립기는 위의 지각된 것 (p1, …, pn)을 모아서 지각도상(s)에 가깝게 만들
어 주는 작동모형(working model)을 만든다.
(d) 작동모형이 만들어지면 외적 실존체(e)는 지각된 것 (p1, …, pn)으로써 식
별할 수 있게 된다.
(e) 지각된 것 중의 어떤 것 (pi)이 그 작동모형에 있을 때 그에 해당하는 개념
(ci)가 있고 그 개념 (ci)은 pi의 해석이라고 불린다.
(f) 모든 개념 (c1, …, cn)은 개념관계(concept relations)들로써 연결되고 개념
도식(u)을 만든다.
(g) 지각된 것 (p)은 개념 (c)의 영상이라고 하고 또 어떤 개념은 영상이 없다.
(h) 어떤 개념 (c)이 어떤 영상(p)를 가질 때 그 개념 (c)은 구체적 개념
(concrete concept)이라고 한다.
(i) 어떤 개념 (c)이 영상을 갖지 못할 때 그 개념 (c)은 추상적 개념(abstract
concept)이라고 한다.
(j) 어떤 구체적 개념 (c)의 영상으로써 식별되는 실존체는 그 구체적 개념 (c)
의 예라고 한다.
<지각작용의 과정>
26/85
Conceptualization(7/7)
Korean Information Processing and Ontology
• ‘개념’과 ‘개념화’ 정리
• 개념
• 사람들의 일반적·추상적 지식, 생각, 관념  언어로 표현
• 개념화 과정의 결과
• 개념화
• 사물이나 표상을 어떤 성질·공통성·본질에 착안하여 그것을
추출하여 파악하는 과정
자동차
비행기
배
27/85
Hierarchical Structure(1/6)
Korean Information Processing and Ontology
• Classified Structure & Hierarchical Structure
표준국어대사전 어휘 분류
WordNet 2.0
K-시소러스
UOU Ontology
28/85
Hierarchical Structure(2/6)
Korean Information Processing and Ontology
• 분류적 구조(Classified Structure)
• 어떠한 기준에 의해 나누어진 부류(class)들의 집합체
• 부류의 상하 구조는 간단하게 부류의 깊이(depth)를 보여주
거나 언어학적 계층을 형성시킬 수 있는 구조로 판단
• Classification
• 대량으로 발생되는 정보를 일정한 기준(분류의 관점)으로 집단
화 및 코드화하여 정보를 정리 혹은 추출하고자 할 경우에 활용
되는 체계
• 유사성과 상이성에 따라 사물들을 배열
• 사물들을 정렬(sorting)하고 집단화(grouping)
• 분류의 조건 : 일관성, 포괄성, 상호배타성, 단계성
• 대표적인 예
• 국제십진분류(UDC), 국제특허분류(IPC)…
• 국제상품분류체계(UNSPSC), 과학기술연구분야분류…
29/85
Hierarchical Structure(3/6)
Korean Information Processing and Ontology
• 계층적 구조(Hierarchical Structure)
• 의미론적 상하관계를 중심으로 층위(level)를 이룬 집합체
• 상하위 층위(또는 노드)가 의미적으로 밀접한 연관성을 가
짐과 동시에, 엄밀한 의미에서의 상하관계가 형성되고, 보편
적인 개념화(추상화) 과정으로 인식되는 구조로 판단
• Classified Structure ≥ Hierarchical Structure
• 의미론에서의 상하관계(hyponymy)
• 어휘소의 의미에 대한 계층적 구조
• 한 쪽이 의미상 다른 쪽을 포섭하거나 다른 쪽에 포섭되는 관계
• 장소 포섭(locative inclusion) 관계 : 부분 계층적 구조
• 일반적인 표현 : ‘X는 Y 안에 있다’
• 부분-전체 포섭(part-whole inclusion) 관계 : 부분 계층적 구조
• 일반적인 표현 : ‘X는 Y를 갖는다’
• 부류 포섭(class inclusion) 관계 : 전체 계층적 구조
• 일반적인 표현 : ‘X는 Y이다’
30/85
Hierarchical Structure(4/6)
Korean Information Processing and Ontology
• 상하관계
• 단어의 계열 관계(paradigmatic relation)를 중심으로 연구
• 단어가 종적으로 대치되는 관계
• 엄밀한 의미에서의 상하관계
• X는 {부인, 의사, 하인, 과학자…}이다  X는 사람이다
• 포용적 의미에서의 상하관계(유사 상하관계)
• X는 {칼 ; 시계 ; 뱀 ; 개}이다.  X는 {무기 ; 선물 ; 유독성 동
물 ; 애완 동물}이다
• 가능형(probabilistic) & 문화제약형(culture-bound)
• 상하관계의 함의(entailment)
• 의미성분(semantic component) 분석에 의한 함의 분석
동물 : [+생명체] [+움직임]
새
: [+생명체] [+움직임] [+날개]
물고기 : [+생명체] [+움직임] [+아가미]
참새 : [+생명체] [+움직임] [+날개] [+갈색]
상어 : [+생명체] [+움직임] [+아가미] [회색]
동물<새:물고기<참새:상어
추상적·일반적
구체적·특수적
새
동물
(하위어)
(상위어)
31/85
Hierarchical Structure(5/6)
Korean Information Processing and Ontology
• 상하관계 형성을 위한 일반적인 방법
• 사전(dictionary, encyclopedia)의 뜻풀이를 이용하는 방법
• 사전 뜻풀이의 일반적인 구성인 “종차+유개념어” 활용
• 종차 : 동위 개념 중의 한쪽 개념에 특유한 성질
• 유개념어 : 어떤 개념의 외연이 다른 개념의 외연보다 크고 그것
을 포괄할 경우, 전자를 후자에 대하여 일컫는 말로 사용
 유개념어를 이용한 상하관계 연결
• 용례를 이용하는 방법
• 특정 기준에 의한 분류적 성격이 강함
• 실세계 지식을 반영하는 데 유리함
• 의미자질(semantic feature)를 이용하는 방법
• 의미성분 분석을 통한 의미자질 함의 관계를 파악
• 일반적인 온톨로지 구축 원리에 가까운 방법
32/85
Korean Information Processing and Ontology
Hierarchical Structure(6/6)
<계층적 구조>
장치
영희 생일에 자동차를 선물했다.
현대자동차에서 새로운 자동차를 개발하였다.
기아자동차 대리점에서 자동차를 샀다.
대전에 고속버스(자동차)를 타고 갔다.
모터쇼에는 신기한 자동차가 많다.
선물
모델
교통수단
<분류적 구조>
상품
기계
차
자동차
생산품
승용자동차
화물자동차
33/85
Thesaurus & Semantic Network(1/4)
Korean Information Processing and Ontology
• 시소러스(Thesaurus)
• 주어진 지식 영역에서 미리 수집하여 구성한 중요한 단어들
의 목록(통제어휘집)과 이 목록의 각 단어에 대해 관련성이
있는 단어의 집합
• 시소러스의 용어들간의 관계
• 상하관계(BT/NT)
• 동등관계(USE/UF)
• 부분-전체관계(BTP/NTP)
• 연관관계(RT), 사례관계(Instance)
• 국내·외적으로 다양한 시소러스가 구축되고 있음
• 도서관 관련 시소러스
• 신문기사 관련 시소러스
• 특정 분야별 시소러스
• 정보검색용 시소러스
• …
34/85
Thesaurus & Semantic Network(2/4)
Korean Information Processing and Ontology
• 의미망(Semantic Network)
• 형식적인 면에서 시소러스와 유사
• 한 어휘가 가지고 있는 다른 어휘들간의 관계를 망(network)
으로 나타낸 것
• 단어의 의미, 개념간의 연상관계, 지식 등을 표현하는 네트워크
• 주요 특징
• 개념들이 특정한 관계에 의해 연결되어 있는 지식에 대한 사고
방식을 보여 준다
• 노드와 링크, 관계 표시 등의 결합으로 이루어진 도식적인 표현
(diagrammatic representation)을 가진다
• 지식표현을 관리할 수 있는 알고리듬을 이용한 다양한 추론 기
술과 데이터베이스와 같은 역할을 고려한 전산적 표현
(computational representation)을 가진다
35/85
Korean Information Processing and Ontology
Thesaurus & Semantic Network(3/4)
의미망에 의한 문장 표현
의미망에 의한 개념 표현
36/85
Thesaurus & Semantic Network(4/4)
Korean Information Processing and Ontology
• 기존의 시소러스와 의미망 등을 이용한 Ontology 구축
• 몇 가지 논의 사항
• 기존의 시소러스와 의미망을 Ontology로 변환하여 사용할 수
있는가?
• 기존 시소러스와 의미망 검토 작업 필요
• 분류적 구조와 계층적 구조의 혼재
• 기존 시소러스와 의미망 통합 가능성 모색
• Generic Ontology와 Domain Ontology 구축 가능성 모색
• 새로운 Ontology를 구축하였을 경우, 기존의 시소러스와 의미
망을 유기적으로 연결할 수 있는가?
• Application에 대한 연구가 병행되어야 할 듯
• 기존의 시소러스와 의미망과의 매핑 방법 모색
• 시소러스, 의미망, 온톨로지, 지식베이스 등이 각각 별개로 관
리되면서 구축되어야 하는가?
37/85
Ontology Development(1/17)
Korean Information Processing and Ontology
• Ontology 개념 정립
• 구조적 체계 확립
• 분류적 구조 & 계층적 구조
• 분류 & 시소러스 & 의미망 & 개념화
• 개별성과 보편성
• 개별적 특성 반영 : 특정 분야의 성격
• 보편적 특성 반영 : 분야별 온톨로지 통합 가능성
• 정보 공유
• 온톨로지의 범용성
• 활용 분야마다 적절하게 사용, 변환 등이 가능
• 공통 개념에 대한 정리
38/85
Ontology Development(2/17)
Korean Information Processing and Ontology
• Ontology 구축 이전 생각해야 할 사항
• Ontology는 어떤 사람들이 구축해야 하는가?
• 각 분야별 전문가, 시스템 개발자, 언어학자…
• Ontology는 어떻게 구축해야 하는가?
• 자동/반자동/수동
• 응용 분야별로 Ontology 구축이 달라야 하는가?
• 언어처리의 Ontology/시맨틱 웹의 Ontology…
•
•
•
•
•
기구축된 시소러스, 분류 체계 등을 이용할 수 없는가?
시소러스, 의미망, 지식베이스 등과 구분될 수 있는가?
통합형 Ontology 구축이 가능한가?
범용적·국제적 Ontology 구축이 가능한가?
기타…
39/85
Ontology Development(3/17)
Korean Information Processing and Ontology
• The anatomy of ontologies
• Terms
• Concept
• Words
• Technical terms
•
•
•
•
Definitions of terms
Axioms
(Inference mechanisms)
Etc.
• Semantic relation & conceptual relation
• Semantic feature  property or attribute
• Standard type  Standardization
• …
40/85
Ontology Development(4/17)
Korean Information Processing and Ontology
• Language Resource
• Dictionary
• Korean Language Dictionary
• Dictionary in Specific field (terminological dictionary)
• Encyclopedia
• Corpus
• {Raw, POS tagged, Sense Tagged} Corpus
• Corpus in Specific field
• Web Document
• …
41/85
Ontology Development(5/17)
Korean Information Processing and Ontology
• Design and development approaches
•
•
•
•
•
Inspirational
Inductive
Deductive
Synthetic
Collaborative
42/85
Ontology Development(6/17)
Korean Information Processing and Ontology
• General development methodology
Specify
purpose
and
scope
Capture,
Define,
Organize
Generic
Inspirational
Domain
Inductive
Task
Deductive
…
Synthetic
Formalize,
Implement
Integrate
existing
resources
Evaluate
Collaborative
43/85
Ontology Development(7/17)
Korean Information Processing and Ontology
• Difference between Ontology & Web Ontology
정
의
활용분야
구축언어
Ontology
Web Ontology
공유된 개념화에 대한 형식적이고 명백하게 상세
웹 문서에 나타난 지식을 표현하고, 공유하며, 재
화하는 것
사용할 수 있도록 하는 온톨로지
지식 또는 정보의 체계화와
Semantic Web, E-Commerce,
응용화 등에 관련된 모든 분야
Agent, Web Service 등 웹 관련 분야
Web Ontology Language
특정한 온톨로지 구축 언어 없음
(RDF, DAML+OIL, OWL…)
구축대상
웹의 정보를 공유할 수 있는
단어, 어휘(개념), 전문용어…
단어, 어휘, 전문용어 등
구축사례
WordNet, CYC, UMLS, EDR,
실험적 수준
Lexical FreeNet, ETRI CoNet…
(기존 온톨로지의 변환)
44/85
Ontology Development(8/17)
Korean Information Processing and Ontology
• Interoperability of Ontology & Web Ontology(1)
• 궁극적 문제 의식
• Web Ontology의 Ontology로의 변환이 아니라 ‘Ontology를 어떻
게 구축할 것인가’에 초점
• Ontology의 효율적인 구축 방법론 연구 미비
• 국내의 Ontology 연구 활성화
• Ontology의 Web Ontology로의 변환하기 이전 단계
• 의미 있는 Ontology 구축을 통한 Web Ontology로의 변환
• Web Ontology로의 변환을 위한 기반 작업
• 시맨틱 웹 연구에 대한 국내 연구 환경 조성
• 학문들간의 연구 교류 필수
• 연구실 실험 수준의 온톨로지 구축 탈피
45/85
Ontology Development(9/17)
Korean Information Processing and Ontology
• Interoperability of Ontology & Web Ontology(2)
• Design Goals
• Shared ontologies
• Ontology evolution
• Ontology interoperability
• Inconsistency detection
• Balance of expressivity and scalability
• Ease of use
• XML syntax
• Internationalization
46/85
Ontology Development(10/17)
Korean Information Processing and Ontology
• Interoperability of Ontology & Web Ontology(3)
• Requirements_1
• Ontologies as distinct objects
• Unambiguous term referencing with URIs
• Explicit ontology extension
• Commitment to ontologies
• Ontology metadata
• Versioning information
• Class definition primitives
• Property definition primitives
• Datatypes
• Class and property equivalence
47/85
Ontology Development(11/17)
Korean Information Processing and Ontology
• Interoperability of Ontology & Web Ontology(3)
• Requirements_2
• Individual equivalence
• Local unique names assumption
• Attaching information to statements
• Classes as instances
• Complex data types
• Cardinality constraints
• User-display labels
• Supporting a character model
• Supporting a uniqueness of unicode strings
48/85
Ontology Development(12/17)
Korean Information Processing and Ontology
• Ontology 구축과 관련된 표준 연구-이강찬(2003)
• Ontology 구축을 위해 요구되는 기술
• Ontology 모델링 설계 방식 표준 개발
• Ontology 일치성(consistency) 표준 방식 연구
• Ontology 검증(validation) 표준 방식 연구
• Ontology 공유를 위한 통합(integration) 표준 방식 연구
• Ontology 중재(mediation) 기술
• Ontology간 충돌(conflict) 제거 방식 연구
• 논리 기반의 추론 방식 연구
• Ontology 처리를 위한 시맨틱 마크업 언어 표준안 개발
• RDFs, DAML+OIL, OWL 기반의 파싱 기술 연구
• 개념 및 지식 표현 기술 연구
49/85
Ontology Development(13/17)
Korean Information Processing and Ontology
• Ontology 구축을 위한 기반 작업(1) – 구축 대상(concept)
• Ontology 구축 대상 설정
• Concept, Word, Term…
• Ontology 구축 대상 정비
• 기초 어휘 수집
• 언어생활에서 빈도수가 높고 분포가 넓으며, 합성어나 파생어와
같은 이차 조어의 근간이 되는 최소한의 필수 어휘
• 전문분야의 특수성을 고려하여 그 분야 공통적인 개념 수집
• 정보 공유를 위한 공통적인 개념 수집
• Top-level, Middle-level, Bottom-level의 구성 확립
• Generic·Domain·Task Ontology 각각에 대한 개념{어휘, 단어, 용
어}의 구분과 개념어 확보
• 각 개념들의 뜻풀이(definition) 필요
• 기타
50/85
Ontology Development(14/17)
Korean Information Processing and Ontology
• Ontology 구축을 위한 기반 작업(2) – 관계(relation)①
• Semantic Relation
• 의미론(semantics)의 의미관계 이용
• 상하관계(hyponymy)
• Is_A relation, Kind_of relation, Part-Whole relation(개별적으로 관리)
• 동의관계(synonymy) : 완전 동의관계/부분 동의관계(유의관계)
• 반의관계(antonymy)
• 다의관계(homonymy)
• 부분-전체관계(part-whole relation)
• 문장의 표면 구조(surface structure)를 중심으로 분석
• 어휘의 계열(paradigmatic)/통합(syntagmatic) 관계 이용
• 필요에 따라 심층 구조(deep structure) 분석
• 국어사전이나 기존의 시소러스 등을 통한 필요한 의미관계 정
보 자동 추출 가능
51/85
Ontology Development(15/17)
Korean Information Processing and Ontology
• Ontology 구축을 위한 기반 작업(2) – 관계(relation)②
• Conceptual Relation
• 두 개의 개념 사이에 어떤 관계가 있는가를 나타내 주는 기능
• 개념들의 지시물 사이의 관계를 유지 상태 확인
• 전문분야일 경우 분야의 특수성이 반영된 개념관계 성립 가능
• 일원성(monadic), 이원성(dyadic), 삼원성(triadic)
• 개념구조에서 개념관계를 정하는 세 가지 방법
1. A cat is chasing a mouse
2. [CAT] → (CHASING) → [MOUSE]
3. [CAT] ← (AGNT) ← [CHASE] → (PTNT) → [MOUSE]
4. [AGENT] ← (LINK) → [CHASE] → (LINK) → [PATIENT]
(LINK)
(LINK)
[CAT]
[MOUSE]
(2)는 정의된 개념 CHASING을
이용한 구조
- 직접 자연언어와 자동적으로
연결시키는 데 어려움
(3)은 가장 기본적인 언어학적 관
계인 AGNT와 PTNT를 사용
- 논리, 자연언어의 의미론, 또는
일반 언어학적 연구에 많이 응용
(4)는 순수한 원소적 관계(primitive
relation)인 LINK와 두 개의 특수한 개념
[AGENT]와 [PATIENT]를 사용한 구조
- 형식 이론에 쓰이는 유일한 원소적 이원
성 관계이기 때문에 이것으로써 다른
개념관계를 다시 정의해야 하는 어려움
52/85
Ontology Development(16/17)
Korean Information Processing and Ontology
•
일반적인 개념관계
•
격관계(case relation) 또는 주제역할(thematic role)
• agent(AGNT), patient(PTNT), state(STAT), experience(EXPR), recipient(RCPT),
instrument(INST), destination(DEST), result(RSLT)…
•
공간관계(spatial relations)
• location(LOC); (IN), (ON), (ABOV) …
•
속성(attributes)
• general attributes(ATTR), more specific and characteristic attributes(CHAR), having a
part(PART)
•
문장간 관계(intersentential relations)
• before(BFOR), after(AFTR), cause(CAUS), purpose(PURP), method(METH), logical
operators; (AND), (OR), …
•
수학적 관계(mathematical relations)
• measure(MEAS), greater-than(>), less-than(<), equal(=), not-equal(≠), average(AVG),
count(CNT), functional arguments; (ARG1), (ARG2), …
•
매개 관계(metarelations)
•
kind(KIND), subtype(SUBT), description(DSCR), statement(STMT), representation(REPR), …
53/85
Ontology Development(17/17)
Korean Information Processing and Ontology
• Ontology 구축을 위한 기반 작업(2) – 속성(property)③
• Property
• 언어처리 기법 사용 가능
• 의미론에서의 의미성분(semantic component) 분석과 유사
• 의미관계, 개념관계 설정에 도움
• 개념에 대한 분명한 인식
• 의미자질(semantic feature)의 역할을 담당할 수 있음
54/85
Ontology in NLP(1/14)
Korean Information Processing and Ontology
• NLP에서의 Ontology 필요성
• 국제적 수준의 어휘 데이터베이스 구축
• 한국어를 대상으로 한 어휘 데이터베이스 구축 필요
• WordNet, EDR 개념사전, Lexical FreeNet…
• 국외의 어휘 데이터베이스를 번역하는 수준에서 탈피
• 한국어를 중심으로 한 어휘 데이터베이스 활용 작업 필요
• 다국어정보검색, 기계 번역 등에 유용
• 국외에서 활용할 수 있는 어휘 데이터베이스 구축
• 국내 언어처리 기술의 한 단계 성장 계기
• 한국어정보처리 기술의 성장을 위한 방법 중 하나
• 의미분석, 담화분석에서의 성장 가능성 모색
• 언어처리 기술을 이용한 다양한 소프트웨어 개발 가능
55/85
Ontology in NLP(2/14)
Korean Information Processing and Ontology
• Ontology 구축을 위한 언어처리 기술(1)
• 말뭉치를 활용한 개념, 관계, 속성의 자동 추출 기술 개발
• 말뭉치와 웹문서에서의 의미있는 개념, 관계, 속성의 자동 추출
• 자동 온톨로지 구축 기술의 토대 마련
• 언어처리의 의미 분석 단계 성장 가능성 모색
• 언어자원의 체계화 연구
• 언어자원 활용을 위한 언어 표준화
• 언어학적 지식을 바탕으로 한 언어 체계화
• 전문용어 표준화
• 한국어 WordNet을 위한 Synset 구축
• 범용적/국제적 온톨로지 구축을 위한 대역어 사전 구축
• 일반 단어를 비롯한 전문용어의 대역어 사전 구축
• 언어자원 기술(description)의 통일화
• 모든 용어의 사전적 기술 통일화
56/85
Ontology in NLP(3/14)
Korean Information Processing and Ontology
• Ontology 구축을 위한 언어처리 기술(2)
• 말뭉치 정제
• 의미태그 부착 말뭉치의 단계적 구축
• 다양한 의미 처리 기법 연구 가능
• 기구축된 말뭉치의 다각적인 분석
• 기초 어휘 수집, 격틀 사전 확보, 논항 정보 추정…
• 말뭉치 평가 척도 마련
• 기구축된 언어처리 도구의 재활용
• 응용 분야의 실질적 활용 측면을 고려한 재정비
• 형태소 분석기
• 품사 태거
• 구문 분석기
• 단어 의미 중의성 해결 시스템
57/85
Ontology in NLP(4/14)
Korean Information Processing and Ontology
• Ontology 구축을 위한 언어처리 기술(3)
• Ontology 구축 도구 개발
• 언어처리에 도움을 줄 수 있는 반자동 Ontology 구축 도구 개발
• Semantic Web을 위한 Web Ontology 변환 기능 고려
• 언어처리 전반에 사용될 수 있는 기능 고려
• 응용 분야에서의 Ontology(Thesaurus, Semantic Net) 구축에 도
움이 될 수 있는 구축 도구 개발
• 언어처리 분야의 응용 분야의 상호 교류 및 연구 결과 공유
• 언어처리에서의 Ontology 구축 표준안 마련
• Ontology 활용 방안의 다각적 모색
• 정보검색에서의 실질적인 활용 방법
• 기계번역에서의 실질적인 활용 방법
• 기타 응용 분야의 활용 방법
58/85
Ontology in NLP(5/14)
Korean Information Processing and Ontology
• 형태적·구문적 분석에서의 Ontology 활용
• 의미적 기술을 이용한 형태적·구문적 분석 기술
• 형태소 분석 단계에서의 중의성 해소 기술
• 인간의 형태소 분별 능력 수준의 형태소 분석 기술
• 형태소 해석기 및 품사 태거의 정확률 향상
• 기타
• 복합명사 분석 및 생성 기술, 고유명사 인식 기술…
• 구문 분석 단계에서의 중의성 해소 기술
• 인간의 구문 분별 능력 수준의 구문 분석 기술
• 구문 중의성 해소
• 구문 분석기의 정확률 향상
• 기타
• 명사구 인식 기술, 동사구 인식 기술, 하위범주화 사전 구축 기술…
59/85
Ontology in NLP(6/14)
Korean Information Processing and Ontology
• 의미적 분석에서의 Ontology 활용
• 의미 분석 단계에서의 핵심적 기술
• Word Sense Disambiguation 기술
• 문장 및 문맥 이해 기술
• 각종 의미 분석용 사전 구축 기술
• 기타
• 선택제약사전 구축 기술, 다국어 의미 분석 기술, 문장 생성 기술
…
• 담화 분석 단계의 성장 기술
• 문장/문맥 이해를 통한 문장/문맥 생성 기술
• 텍스트 요약 기술, 자연스러운 대화형 시스템 구축 기술
• 기타
• 지능형 로봇 기술에 탑재
• 음성처리 기술과의 융합을 통한 다양한 소프트웨어 개발
• …
60/85
Ontology in NLP(7/14)
Korean Information Processing and Ontology
• 정보검색에서의 Ontology 활용
• 정보검색 기술의 국제적 동향에 발맞춤
• 의미기반 정보검색 기술
• 언어처리 기술을 이용하여 사용자에게 원하는 의미 있는 문서를
보여주기 위해서는 지식을 효율적으로 체계화
• 지식기반 질의응답시스템 기술
• 사용자의 질의에 정확한 정답어나 정답문서를 보여주기 위해서
Ontology나 Knowledge Base 등이 반드시 필요
• Semantic Web 기술
• 시맨틱 웹 기술의 핵심 자원으로 Ontology가 필요한 실정
• 다양한 분야에서 Web Ontology를 필요로 하고 있음
• 전자상거래, 의미정보시스템, 도서관…
• 다국어 정보검색 기술…
61/85
Ontology in NLP(8/14)
Korean Information Processing and Ontology
• 기계번역에서의 Ontology 활용
• 기계번역에서의 Ontology 활용 강화 필요
• 대역어 사전의 한계 극복
• 국외에서는 다각적으로 모색 중
• WordNet을 이용한 기계번역
• Microkosmos를 이용한 기계번역
• 국외의 온톨로지를 번역하여 사용하는 수준에서 탈피
• 국내에서는 외국의 Ontology를 번역하는 사용하는 수준
• 국내의 Ontology를 중심으로 기계번역용 대역 Ontology를 구축할
필요가 있음
• 기계번역 판매 시장의 고부가가치 확보
• 국내 및 국외 시장의 경쟁력 확보
62/85
Ontology in NLP(9/14)
Korean Information Processing and Ontology
• 국내 Ontology 실질 구축 사례
• ETRI 개념망(음성/언어정보연구부 지식마이닝연구팀)
• 한국어 명사 중심으로 5만 여 어휘들의 계층적 구조 형성
• 현재 ETRI 한국어 명사 개념망 확장, 동사 개념망 구축 중
• 코어넷(KAIST KORTERM)
• 한국어-중국어-일본어 워드넷
• NTT 어휘 대계의 ‘어휘 의미 속성 체계’를 개념 체계로 설정
• 단어의 의미와 개념을 연결
• UOU Ontology(울산대 한국어처리연구실)
• 인간이 가지는 여러 관념 속에 포함된 공통적인 속성을 기반으
로, 인간의 보편적인 인지 체계와 개념 관계를 파악하여, 이것
을 표현한 언어를 대상으로 한 형식적이고 명세적인 온톨로지
• 기존 결과물 : 명사 의미 계층 구조(98), Korean Semantic Net(02)
• 협력기관 : 부산대 한국어정보처리연구실
63/85
Ontoloyg in NLP(10/14)
Korean Information Processing and Ontology
• UOU Ontology 소개(1)
UOU Ontology 기본 구조도
Hyponymy
Synonymy
Antonymy
Meronymy
Encyclopedia
POS
Proper Noun
Terminology
Machine
Readable
Dictionary
Dictionary
Vocabulary
S-V
Semantic
Relation
Case
Relation
Thesaurus
Korean
Dictionary
Example
-based
Search Site
Encyclopedia
ADV-V
Syntactic
Pattern
Ontology
Etc.....
Semantic
Class
O-V
Semantic Network
Category
Attribute
SubCategorization
birthplace
Profession
Works
Homepage
64/85
Ontology in NLP(11/14)
Korean Information Processing and Ontology
• UOU Ontology 소개(2)
•
•
•
•
UOU Ontology 구축 종류
언어 보편적인
온톨로지 개발
Task
Ontology
과학기술 분야
전자상거래 분야
경제 분야
생물학…
Generic
Ontology
Domain
Ontology
UOU Ontology
Ontology
Integration
• Workflow
• Management
• Enterprise…
통합형 온톨로지
개발
Web
Ontology
시맨틱 웹을 위한
웹 온톨로지 개발
65/85
Ontology in NLP(12/14)
Korean Information Processing and Ontology
• UOU Ontology 소개(3)
‘책’의 속성과 분류체계와의 연계성, 서술성 명사 ‘매입’의 속성
66/85
Ontology in NLP(13/14)
Korean Information Processing and Ontology
• UOU Ontology 소개(4)
도서 판매 관련 Domain·Task Ontology 생성 방법
67/85
Ontology in NLP(14/14)
Korean Information Processing and Ontology
• UOU Ontology 소개(5)
UOU Ontology의 활용적 측면
지능형 시스템
지식 경영
지식기반 시스템
음성처리
응용 기술
형태소분석
구문분석
의미분석
시맨틱 웹
/ 정보검색
추 론
기계번역
응
답
질의응답시스템
담화분석
WSD
전자사전
문서처리
한국어정보처리
감독
영화
감독
CF
감독
생물
방법
동물
정책
사람
경제정책
연구자 정치가
학자
선수
운동
선수
예술가 운동가 가격정책경기정책공업정책관세정책상업정책소득정책
금융정책
내셔널폴리스
68/85
Ontology in Semantic Web(1/8)
Korean Information Processing and Ontology
• The Semantic Web Vision
• Web made possible through established standards
• TCP/IP for transporting bits down a wire
• HTTP & HTML for transporting and rendering hyperlinked text
• Applications able to exploit this common infrastructure
• Result is the WWW as we know it
•
•
•
•
1st generation web mostly handwritten HTML pages
2nd generation (current) web often machine generated/active
Both intended for direct human processing/interaction
In next generation web, resources should be more accessible to
automated processes
• To be achieved via semantic markup
• Metadata annotations that describe content/function
• Coincides with Tim Berners-Lee’s vision of a Semantic Web
69/85
Ontology in Semantic Web(2/8)
Trust
Rules
Data
Proof
Logic
Data
Ontology Vocabulary
Selfdesc,
doc...
RDF + RDF Schema
Digital Signature
Korean Information Processing and Ontology
• Semantic Web
국외에서는 많은
온톨로지 자료를
바탕으로 많은
연구가 이루어지고
있으나 국내에서는
연구가 거의 없거나,
국외의 온톨로지를
이용하고 있는 실정
국내외적으로 많은
연구가 진행된 상태
XML + NS + XML Schema
Unicode
URI
외국 한국
Semantic Web의 계층 구조
70/85
Ontology in Semantic Web(3/8)
Korean Information Processing and Ontology
• Semantic Web 연구의 국내 상황
• Semantic Web의 기초 기술에 대한 연구 중심
• 현재 RDF, Metadata에 대한 연구에 현재 집중
• 문서의 구조적 처리에 집중되어 있는 실정
• 문서의 의미적 처리 부분에서 한 단계 성장
• 국내의 Ontology 없이 외국의 Sample Ontology를 이용한 연구
에 중점
• 외국의 Ontology를 이용한 각종 도구 개발
• 외국의 Ontology 구축 도구 이용
• Protégé-2000, OilEd…
• 특정한 Ontology 구축 작업 없이 표준화에만 치중
• 현재까지 ETRI, 일부 연구실을 중심으로 활발하게 진행 중
71/85
Ontology in Semantic Web(4/8)
Korean Information Processing and Ontology
• Semantic Web의 Web Ontology
• Ontology Language를 이용한 구축
• XML을 기반으로 한 Ontology Langauges
국내의 온톨로지 언어
연구 대부분을 차지함
OWL
OIL
XOL
SHOE
OML
DAML+OIL
RDF(S)
XML
• XOL(Xml-based Ontology Exchange Language)
• RDF(Resource Description Framework)
• SHOE(Simple HTML Ontology Extension)
• DAML(DARPA Agent Markup Language)
• OML(Ontology Markup Language)
• OIL(Ontology Inference Layer)
• OWL(Ontology Web Language)
72/85
Ontology in Semantic Web(5/8)
Korean Information Processing and Ontology
• Web Ontology Language – 김홍기(2002)
Logical Layer
- Formal Semantics
- Reasoning support
- Heavyweight ontologies
Schema Layer
- Definition of Vocabulary
- Lightweight ontologies
Data Layer
- Simple data model
and syntax For metadata
- RDF : Instances
Higher
Semantics
DAML+OIL, OWL
Semantics
RDF Schema
Structure
& Syntax
RDF
XML Schema
Three Layered Architecture of the Semantic Web
73/85
Ontology in Semantic Web(6/8)
Korean Information Processing and Ontology
• Web Ontology 구축을 위한 국외 활동
[W3C의 Web Ontology 관련 활동 구조]
Technical &
Society Domain
Other W3C
Domain
국내에서는 이러한 활동이
Semantic Web
Activity
RDF Interest Group
RDF Core
Working Group
전무한 상태
Other Activity
Other
Working Groups
Web Ontology
Working Group
Other Standard
Bodies
Other
Activity
Other Activity
74/85
Ontology in Semantic Web(7/8)
Korean Information Processing and Ontology
• ETRI의 Semantic Web 관련 연구(1)
• 이지아울(ezOWL)
• Visual Semantic Web Ontology Editor
• ezOWL Plugin is a Visual OWL Editor for Protégé-2000
75/85
Ontology in Semantic Web(8/8)
Korean Information Processing and Ontology
• ETRI의 Semantic Web 관련 연구(2)
• 온투모(OntoMo)
• OWL로 문서를 저작할 수 있는 business ontology modeler
• 모아(MoA)
• 이미 존재하는 시맨틱 웹 문서들을 결합한 새로운 온톨로지를
짧은 시간에 구축할 수 있는 business ontology integration tool
• 아울러(OWLer)
• 온톨로지 기반 추론 엔진
• 일차 논리 기반의 정리 증명 기법 활용
• 보쌈(BOSSAM)
• 규칙 기반 추론 엔진
76/85
Ontology Tool(1/5)
Korean Information Processing and Ontology
• Ontology Sub-system –이강찬(2003)
• Ontology 생성 구성요소
온톨로지 모델러
(Ontology Modeler)
온톨로지 생성기
(Ontology Generator)
온톨로지 검사기
(Ontology Validator)
• 데이터베이스를 참조하여 지식을 개념화
• 개념화간의 계층적 구조를 위하여 구분 규칙(taxonomy rule) 적용
• 온톨로지 생성기에 개념화 용어를 제공
• 온톨로지 모델러로부터 받은 용어에 명세화
• 온톨로지 언어(지식 표현 언어)로 작성
• 작성된 온톨로지의 유효성을 검사
• 온톨로지 언어의 문법적인 검사
• Ontology 통합 도구
주석 도구
(Annotation Tool)
온톨로지 편집기
(Ontology Editor)
온톨로지 통합 도구
(Ontology Integration
Tool)
• 온톨로지에 주석을 처리하기 위한 도구
• 온톨로지를 사용하는 모든 사용자에게 제공
• 주석을 하기 위한 언어로 온톨로지의 표현 언어로 동일한 언어를 제공
• 온톨로지의 내용 편집
• 온톨로지 각 구성 요소의 편집 등을 제공
• 편집하고자 하는 온톨로지의 버전을 선택
• 자동 및 수동 통합 방법을 모두 제공
• 자동적인 통합 방법은 기계학습 등의 방법을 제공
• 수동적인 방법은 온톨로지 편집기와 같은 편집기로 사용자가 직접 통
합할 수 있는 방법을 제공
77/85
Ontology Tool(2/5)
Korean Information Processing and Ontology
• Ontology editor survey results
• http://xml.com/2002/11/06/Ontology_Editor_Survey.html
78/85
Korean Information Processing and Ontology
Ontology Tool(3/5)
• Protégé-2000
79/85
Ontology Tool(4/5)
Korean Information Processing and Ontology
• OntoEdit(Ontoprise)
80/85
Ontology Tool(5/5)
Korean Information Processing and Ontology
• ETRI 개념망 관리 도구(v2.0)
81/85
Korean Information Processing and Ontology
DEMO
82/85
Korean Information Processing and Ontology
Conclusion(1/2)
체계적
• 각 학문 분야별
이론적 체계 바탕
• 기존 지식 정보의
이론적 체계 확립
• 기존의 시소러스,
의미망의 재사용성
• 각종 사전의 정립
• 지식 정보 관리를
위한 전문가 양성
•…
범용적
• 각 학문 분야에서
공통적으로 사용
가능해야 함
• 일회성 지식 정보
관리에서 탈피
• 체계적 구축 단계
를 바탕으로 하는
제학문적 연구
• 지식 정보 관리의
표준화 방향 모색
•…
국제적
• WordNet, UMLS
등과 같은 대규모
어휘 데이터베이스
구축 필요
• 실질적인 구축을
위한 국가적 차원
연구 지원 필요
• 지식 정보에 대한
국가경쟁력 확보
•…
응용
• 특정 영역별로
특성화된 지식정보
관리 체계 확립
• 실험적 수준에서
벗어나 응용 분야의
활발한 연구 활동
기대
•…
83/85
Conclusion(2/2)
Korean Information Processing and Ontology
• 이론과 실제를 통한 대규모 Ontology 구축
• 한국형 Ontology 구축 : 국제경쟁력 확보
• 국외의 Ontology 번역 이용의 한계 극복
• 학문적 교류를 통한 공동 연구의 장 마련
• 국가 지식 정보화의 중추적 역할 담당
• 각 분야별 핵심 기술로 자리매김
• Semantic Web의 핵심 기술
• Knowledge Management의 핵심 지식 자원
• 언어정보산업의 한 단계 성장 발전 가능
• 정부, 기업 차원의 지원 필요
• 정기적인 Workshop/Seminar 개최
• 제2회 KIPONTO Workshop 개최 예정(2004년 5월)
• 연 4회의 정기적인 세미나
84/85
Korean Information Processing and Ontology
감사합니다
인간의 말을 이해하는 똑똑한 컴퓨터!
울산대학교 한국어처리연구실
주
소 : (680-749) 울산광역시 남구 무거2동 산29 울산대학교 7호관 324호, 324-1호
전화번호 : (옥철영 교수연구실) 052-259-2222 / (이정철 교수연구실) 052-259-1687 / (KLPLab) 052-259-2625
F A X : 052-259-1687 / (연구실) 052-959-5312
이 메 일 : [email protected]
홈페이지 : http//nlplab.ulsan.ac.kr or http://www.urimal.info or http://klplab.ulsan.ac.kr
85/85