자원의 식별, URI - 닥치고 Linked Data

Download Report

Transcript 자원의 식별, URI - 닥치고 Linked Data

Linked Data 4 Principles
오
원
석
[email protected]
1. Linked Data 4 Principles
1
Linked Data 4 Principles
Linked Data 4 Principles
a method of publishing structured data so that it can be
interlinked and become more useful through semantic
queries. It builds upon standard Web technologies such
as HTTP, RDF and URIs.
but rather than using them to serve web pages for human
readers, it extends them to share information in a way that
can be read automatically by computers. This enables data
from different sources to be connected and queried
2
Linked Data 4 Principles
Linked Data 4 Principles
기본, 원칙
3
충실
Linked Data 4 Principles
1. Use URIs as names for things
2. Use HTTP URIs so that people can look
up those names
3. When someone looks up a URI, provide useful RDF Information, using
the standards (RDF*, SPARQL)
4. Include links to other URIs. so that they can discover more things.
Tim Berners-Lee
Date: 2006-07-27, last change: Date: 2009/06/18
http://www.w3.org/DesignIssues/LinkedData
URI
HTTP
RDF
4
SPARQL
Linked Data 4 Principles
1. URI를 이용하여 자원을 식별하라.
2. 기계나 사람이 URI로 식별된 자원을 룩업(look
록 하기 위해 HTTP(프로토콜)를 이용하라.
up, 탐색, 참조)할 수 있도
3. 기계나 사람이 식별된 URI를 룩업 했을 때 RDF 또는 SPARQL 등의 표준화된
형식으로 해당 URI가 포함하는 풍부한 정보를 제공하라.
4. 또 다른 자원으로의 연결(link)을 통해 더 많은 지식을 발견하고 활용할 수 있
도록 하라.
Tim Berners-Lee
Date: 2006-07-27, last change: Date: 2009/06/18
http://www.w3.org/DesignIssues/LinkedData
URI
HTTP
RDF
5
SPARQL
http://lod.nl.go.kr/page/KMO200932143
6
http://lod.nl.go.kr/page/KMO200932143
1
1. Use URIs as names for things
http://lod.nl.go.kr/resource/KMO200932143
7
식별 – 유일한 것
1. email
인터넷, 웹
2. URI
3. 주민등록 번호
현실 세계
4. 비자카드 번호
5. …
8
자원의 식별, URI
1. 하나의 개체에 대해 URI가 무조건 하나만 있어야 하는 것은 아닙니다.
- 이건 가능하지도 않을 뿐더러 그럴 필요도 없습니다.
2. 가능하다면 단순한 형태가 좋습니다.
- Linked Data는 기계를 위한 것이 더 크지만 사람도 배려하면 더 좋습니다.
3. (내부적으로) 중복을 피할 수 있는(식별을 유지할 수 있는) 형태가 좋습니다.
- 사람 이름 (특히 한국)
4. 또 다른 것들이 있지만 오늘은 여기까지만 ~~~
9
자원의 식별, URI
1. 하나의 개체에 대해 URI가 무조건 하나만 있어야 하는 것은 아닙니다.
- 이건 가능하지도 않을 뿐더러 그럴 필요도 없습니다.
http://dbpedia.org/resource/Yu_Ri_Sung
http://ko.dbpedia.org/resource/성유리
http://ko.wikipedia.org/wiki/성유리
http://wikidata.org/entity/Q487560
???
???
10
자원의 식별, URI
1. 하나의 개체에 대해 URI가 무조건 하나만 있어야 하는 것은 아닙니다.
- 이건 가능하지도 않을 뿐더러 그럴 필요도 없습니다.
같은 사람
URI
Name
bloodType
email
• 이미지 출처 :
http://????????.com/resource/yuri_finkl
URI
• 성유리
Name
•B
bloodType
• [email protected]
email
http://data.kdata.kr/resource/Sung_Yu-ri
• Sung Yu-ri
•O
• [email protected]
http://www.koreanmedi.com/html_news/article/view.php?Hcate1=1&Hcmode=view&Hcate2=815&Hid=5241
http://ko.wikipedia.org/wiki/성유리
11
자원의 식별, URI
1. 하나의 개체에 대해 URI가 무조건 하나만 있어야 하는 것은 아닙니다.
- 이건 가능하지도 않을 뿐더러 그럴 필요도 없습니다.
다른 사람
URI
http://data.kdata.kr/resource/Lee_Byungkyu_1974_baseball
URI
http://data.kdata.kr/resource/Lee_Byungkyu_1983_baseball
Name
• 이병규
Name
• 이병규
team
• LG Twins
team
• LG Twins
birthDate
• 이미지 출처 :
• 1974-10-25
birthDate
• 1983-10-09
http://www.mbn.co.kr/pages/news/newsView.php?news_seq_no=1411405
http://www.sportsseoul.com/?c=v&m=n&i=69804
12
자원의 식별, URI
2. 가능하다면 단순한 형태가 좋습니다.
- Linked Data는 기계를 위한 것이 더 크지만 사람도 배려하면 더 좋습니다.
http://data.kdata.kr/resource/Lee_Byung-kyu_1974_baseball
http://data.kdata.kr/resource/Lee_Byung-kyu_1983_baseball
http://data.kdata.kr/resource/11111000101010101010101001111
http://lod.nl.go.kr/resource/KAC201007577
owl:sameAs
http://lod.nl.go.kr/author/공지영
http://lod.nl.go.kr/author/이문열
13
자원의 식별, URI
3. (내부적으로) 중복을 피할 수 있는(식별을 유지할 수 있는) 형태가 좋습니다.
- 사람 이름 (특히 한국)
http://data.kdata.kr/resource/Lee_Byung-kyu_1974_baseball
http://data.kdata.kr/resource/Lee_Byung-kyu_1983_baseball
?
http://data.kdata.kr/resource/Lee_Byung-kyu_1983_baseball_doosanbears_xxx
http://lod.nl.go.kr/resource/공지영
http://lod.nl.go.kr/author/공지영
http://lod.nl.go.kr/author/공지영_[birthDate]_[deathDate]_xxx
14
URI 할당
• Linked Data에서의 식별은 개체를 웹상에서 고유하게 식별할 수 있어야 한다는 의미입니다.
• 다행스럽게도 웹은 우리에게 유일한 URI를 부여할 수 있는 기회를 제공합니다.
http://lod.nl.go.kr/author/공지영
Host
Context
Naming
http://ko.dbpedia.org/resource/공지영
Host
15
Context
Naming
http://lod.nl.go.kr/page/KMO200932143
2
2. Use HTTP URIs so that people can look up
those names
http://lod.nl.go.kr/resource/KMO200932143
16
HTTP 프로토콜
http://lod.nl.go.kr/author/공지영
Host
124.137.58.19
Context
Naming
• 온톨로지 또는 지식 표현에서의 URI와 Linked Data 에
서 URI의 차이
• Linked Data에서의 URI는 웹서버(HTTP 프로토콜)을
통해 발행(Publish) 될 수 있어야 함.
Web Server
17
HTTP 프로토콜 & LOD Platform
• http://lod.nl.go.kr/resource/KMO200932143
/data/KMO200932143
HTTP
Web Server
124.137.58.19
LOD Platform
/page/KMO200932143
SPARQL
Endpoint
18
Triple Store
http://lod.nl.go.kr/page/KMO200932143
• http://lod.nl.go.kr/page/KMO200932143
• http://lod.nl.go.kr/resource/KMO200932143
• http://lod.nl.go.kr/data/KMO200932143
19
http://lod.nl.go.kr/page/KMO200932143
3
3. When someone looks up a URI, provide useful information, using the standards
(RDF*, SPARQL)
20
• http://lod.nl.go.kr/data/KMO200932143
RDF
21
Content Negotiation
URI
• http://lod.nl.go.kr/resource/KMO200932143
URI : /resource/
• http://lod.nl.go.kr/data/KMO200932143
Machine : /data/
Human(Browser)
• http://lod.nl.go.kr/page/KMO200932143
: /page/
22
Browser
Content Negotiation
URI
• http://lod.nl.go.kr/resource/KMO200932143
URI : /resource/
Browser
Human (Browser) :
• http://lod.nl.go.kr/page/KMO200932143
/page/
23
Content Negotiation + HTTP  RDF
URI
• http://lod.nl.go.kr/resource/KMO200932143
URI : /resource/
• http://lod.nl.go.kr/data/KMO200932143
Machine : /data/
<nlon:OfflineMaterial rdf:about="http://lod.nl.go.kr/resource/KMO200932143">
<j.0:extent>294 p</j.0:extent>
<nlon:publicationPlace>파주</nlon:publicationPlace>
<dcterms:subject rdf:resource="http://lod.nl.go.kr/resource/KSH00350647"/>
<j.0:extent>23 cm</j.0:extent>
<nlon:datePublished rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime"
>2015-01-30T09:51:37</nlon:datePublished>
<owl:sameAs rdf:resource="http://libris.kb.se/bib/12404806"/>
<dc:creator>공지영</dc:creator>
<nlon:localHolding>EM4519211</nlon:localHolding>
<dcterms:subject rdf:resource="http://lod.nl.go.kr/resource/KSH00293924"/>
<bibo:isbn>9788936433703</bibo:isbn>
<dc:publisher>창비</dc:publisher>
………..
24
HTTP  SPARQL
http://www.w3.org/2002/07/owl#sameAs : http://libris.kb.se/bib/12404806
http://lod.nl.go.kr/ontology/ddcn : http://lod.nl.go.kr/ddc/895_e21
http://lod.nl.go.kr/ontology/kdcn : http://lod.nl.go.kr/kdc/813_e4
http://www.w3.org/1999/02/22-rdf-syntax-ns#type : http://lod.nl.go.kr/ontology/Book
http://www.w3.org/1999/02/22-rdf-syntax-ns#type :
http://lod.nl.go.kr/ontology/OfflineMaterial
http://purl.org/dc/terms/relation : http://lod.nl.go.kr/resource/CMO201400160
http://purl.org/dc/terms/creator : http://lod.nl.go.kr/resource/KAC201007577
http://purl.org/dc/terms/subject : http://lod.nl.go.kr/resource/KSH00293921
http://purl.org/dc/terms/subject : http://lod.nl.go.kr/resource/KSH00293924
http://purl.org/dc/terms/subject : http://lod.nl.go.kr/resource/KSH00347792
25
http://lod.nl.go.kr/page/KMO200932143
4
4. Include links to other URIs. so that they can
discover more things.
26
link to other URIs
http://libris.kb.se/bib/12404806
27
link to other URIs
• http://lod.nl.go.kr/resource/KMO200932143
• http://libris.kb.se/bib/12404806
도가니
표제정보 : 도가니
형식정보 : 도서
저자정보 : 공지영
발행년도 : 2009
주제정보 : 한국 현대 소설
한국 현대 문학
Children with disabilities -- Abuse of -- Korea (South) -- Fiction. (LCSH)
Child sexual abuse -- Fiction. (LCSH)
Korean language -- Fiction. (LCSH)
28
집필
원작
주연
주연
29
1, 2, 3 원칙
작가 : 공지영
영화 : 도가니
도서 : 도가니
30
4 원칙
작가 : 공지영
영화 : 도가니
도서 : 도가니
31
Linked Data 4 Principles
URI 로 식별하고 연계(링킹)하고
RDF 로 표현하고
SPARQL 로 질의하고
HTTP 로 유통해서~~~
보다 풍요로운 데이터 세상을 만들자.
32
2. 안타까운 몇 가지 이야기
33
첫 번째 이야기
1. 방화벽
-
SPARQL 질의
-
Content Fusion
1. GET/POST
-
마크업 요소의 근간인 꺽쇠(<, >) 사용 금지
2. 외부 서비스 연결 차단
-
인터링킹 대상의 콘텐츠 활용 불가
34
두 번째 이야기
2. 킬러 서비스
Linked (Open)
지능적인…
나이스한…
혁신적인…
의미 기반의…
팬시한….
Data
35
Service
세 번째 이야기
3. URI 통제, 무분별한 명명
1. Vocabulary
2. Naming Rule
3. Content Negotiation
36
네 번째 이야기
4. LOD의 활용
1. LOD 발행
2. SPARQL Endpoint
3. 실시간 처리 : 개념적 글로벌 데이터베이스
37
3. 마치면서
38
LOD 활용
내 데이터
[저자]
외부 데이터
공지영
도가니
[sameAs]
[원작영화]
[isbn]
9788936433703
영화: 도가니
http://data.kdata.kr/reso
urce/Gong_Ji-young
[subject]
한국현대소설
[sameAs]
[sameAs]
http://dbpedia.org/resource/
The_Crucible_(2011_film)
http://dbpedia.org/resource/ Gong_Ji-young
웹
[hasPhotoCollection]
[foaf:depiction]
http://wifo5-03.informatik.unimannheim.de/flickrwrappr/photos/The_Cruc
ible_(2011_film)
http://upload.wikimedia.org/wikipedia/common
s/4/49/공지영_Gong_Ji-young.jpg
39
Play Ground
App
App
App
App
Service
Service
Service
data
data
data
data
data
data
40
생각해 보며 마칠까요?
“We don’t have time to talk about new approaches,
we have a battle to fight here.”
Copyright by: http://www.sinclairdesign.com/index.php
41
감사합니다.
주식회사 리스트 대표이사 : http://li-st.com
대한민국 대표 LOD - KDATA : http://kdata.kr
새주소 기반 Linked Open Data - 주소데이터 : http://jusodata.kr
[email protected] , [email protected]