국가서지 LOD 발행 - 닥치고 Linked Data

Download Report

Transcript 국가서지 LOD 발행 - 닥치고 Linked Data

Linked Open Data Annual Conference(LODAC) 2015
1
국가서지 Linked Open Data
- 모든 지식이 서로 연결되는 세상 -
국립중앙도서관 디지털기획과 이현주
2015.2.5 / 국립중앙도서관 국제회의장
이 문서는 나눔글꼴로 작성되었습니다. 설치하기
Table of Contents
1. 국립중앙도서관 Linked Open Data
1)
왜 LOD로 개방하는가 (추진배경)
2)
국립중앙도서관 LOD (주요 내용)
2. 국가서지 LOD 추진현황
1)
국가서지 LOD 발행
2)
국내외 LOD와의 연계(Interlinking)
3)
국가서지 LOD 플랫폼 구축
3. 한·중·일 디지털도서관 프로젝트(CJKDLI)
1)
프로젝트 개요 및 추진경과
2)
CJKDLI Portal Pilot Site
2
Table of Contents
1. 국립중앙도서관 Linked Open Data
1)
왜 LOD로 개방하는가 (추진배경)
2)
국립중앙도서관 LOD (주요 내용)
2. 국가서지 LOD 추진현황
1)
국가서지 LOD 발행
2)
국내외 LOD와의 연계(Interlinking)
3)
국가서지 LOD 플랫폼 구축
3. 한·중·일 디지털도서관 프로젝트(CJKDLI)
1)
프로젝트 개요 및 추진경과
2)
CJKDLI Portal Pilot Site
3
1. 국립중앙도서관 Linked Open Data - ①/3
4
왜 LOD로 개방하는가
 도서관 데이터 : 서지(Bibliographic), 저자(Name Authority), 주제명(Subject Heading)
 국가대표도서관으로서 국가지식정보자원 수집하여 서비스ㆍ보존 . 이를 위해 서지ㆍ저자ㆍ주제 데이터 생성 관리
 데이터 형식 : (카드목록 → MARC, MODS)
 정보소통 환경 : 웹 - 데이터, 개방, 공유, 연결, Cross-Domain, 시맨틱
 관계 표현 및 확장, 입체적 표현 → FRBR, RDA
BIBFRAME
국가서지데이터를 정보수요자가 필요에 따라 활용할 수 있도록 표준형식에 맞게 개
방, 데이터 중심의 의미적 연결성 확보를 위한 데이터 인프라 구축 필요
웹 상의 다양한 데이터와의 연결을 통한 연관관계 구축, 데이터 공유ㆍ활용 플랫폼 구축 / 데이터 질적, 양적 향상
규칙 없이?
국제 표준!
or
and
하나만 ?
누구나 !
단절된 ?
연결된 !
1. 국립중앙도서관 Linked Open Data - ②/3
5
국립중앙도서관 LOD (Linked Open Data)
국립중앙도서관
DATA
LINKED
DATA
OPEN
DATA
서지(도서, 연속간행물, 온라인자료) 및 전거(저자, 주제명) 데이터
서로다른정보원에서발행된데이터들이상호조합과질의가가능하도록연결된데이터
누구나 자유롭게 데이터를 활용하고 재설계, 재생산할 수 있는 개방형 데이터
Linked Data 발행원칙에 맞추어 국립중앙도서관의 데이터를 개방함
기존의 KORMARC, MODS , DBMS 형태의 데이터를 RDF 형식으로 변환하여
웹 상에 Linked Open Data 형식으로 발행한 서비스
1. 국립중앙도서관 Linked Open Data - ③/3
국립중앙도서관 LOD
6
[주요 내용]
[변환] 국가서지 및 전거데이터의 LOD 발행
[연결] 국내외 LOD 제공기관과의 데이터 연계(Interlinking)
[개방] 이용자 요구에 맞게 활용 가능한 LOD 데이터 플랫폼 구축
Table of Contents
1. 국립중앙도서관 Linked Open Data
1)
왜 LOD로 개방하는가 (추진배경)
2)
국립중앙도서관 LOD (주요 내용)
2. 국가서지 LOD 추진현황
1)
국가서지 LOD 발행
2)
국내외 LOD와의 연계(Interlinking)
3)
국가서지 LOD 플랫폼 구축
3. 한·중·일 디지털도서관 프로젝트(CJKDLI)
1)
프로젝트 개요 및 추진경과
2)
CJKDLI Portal Pilot Site
7
2. 국가서지 LOD 추진현황 - ①/11
8
국가서지 LOD 발행
구분
[데이터 현황]
현 황 (2014.12.31 기준)
서지데이터(804만건) 단행본(397만), 연속간행물(7만), 온라인자료※ (400만)
전거데이터(76만건)
저자명(20만), 주제명(56만)
[※ 온라인자료 : 전자책, 전자저널, 음성/음향, 영상, 이미지, 웹사이트 등]
구분
단행본
서지
전거
데이터 건수
3,961,211
연속간행물
69,678
온라인자료
4,000,174
트리플 건수
102,347,758
1,311,267
81,775,628
저자명
201,567
1,778,777
주제명
560,951
10,299,856
[※ 2014. 12. 31 기준]
2. 국가서지 LOD 추진현황 - ②/11
국가서지 LOD 발행
9
[온톨로지 모델 / 단행본]
2. 국가서지 LOD 추진현황 - ③/11
국가서지 LOD 발행
10
[온톨로지 모델 / 연속간행물]
2. 국가서지 LOD 추진현황 - ④/11
국가서지 LOD 발행
11
[온톨로지 모델 / 온라인자료]
2. 국가서지 LOD 추진현황 - ⑤/11
12
국내외 LOD와의 연계(Interlinking) [데이터 현황]
 영국국립도서관 등 14개관 165만건 연계 (2014년 말 기준)
인터링킹
국가서지 LOD
LOD CLOUD
미국 의회도서관(LC)
주제 DATA
저자 DATA
온라인 DATA
서지 DATA
전자책
저자 DATA
전자저널
단행본
음성/음향
영상
이미지
일본 국립국회도서관
주제 DATA
연속간행물
주제 DATA
영국 국립 서지학 도서관
(BNB)
노르웨이 오슬로 박물관
(PODE)
캠브리지 대학교
(COMET)
스웨덴 학술데이터베이스
(LIBRIS)
OCLC 데이터베이스
(Worldcat)
독일 국립 도서관
(DNB)
KDATA (문화재, 국가)
생물정보
저자 DATA
KOLIS
국립중앙도서관
RAW DATA
KDATA (인물)
DCMS
한국사
RISS
DBpedia
Virtual International Authority File (VIAF)
2. 국가서지 LOD 추진현황 - ⑥/11
13
국내외 LOD와의 연계(Interlinking) [데이터 현황]
연결대상
구분
서지-국내LOD
연결 건수
생물정보LOD
2,833
KDATA
5,060
RISS LOD
국내
저자명-국내 LOD
연결 어휘
nlon:relatedSpecies
nlon:relatedHeritage
nlon:relatedCountry
한국사 LOD
53
owl:sameAs
서지
해외도서관 주제명
국외
해외 저자명
주제명
해외도서관
저자명
해외LOD
483
288
소계
서지
7,893
142
KDATA
해외도서관
계
독일국립도서관
스웨덴국립도서관
영국국립도서관
캠브리지대학도서관
OCLC WorldCat
미국의회도서관
일본국립국회도서관
LC Autority File
8,376
53,846
110,611
170,670
25,272
2,493
760,240
485,703
8,629
미국의회도서관
일본국립국회도서관
LC Autority File
가상국제전거파일(VIAF)
DBPedia
소계
총계
10,198
3,681
2,376
4,752
30
owl:sameAs
dct:subject
362,892
1,245,943
dcterms:creator
8,629
skos:closeMatch
13,879
owl:sameAs
7,158
1,638,501
1,646,877
[※ 2014. 12. 31 기준]
2. 국가서지 LOD 추진현황 - ⑦/11
국가서지 LOD 플랫폼 구축 (http://lod.nl.go.kr )
14
2. 국가서지 LOD 추진현황 - ⑧/11
15
국가서지 LOD 플랫폼 구축
[시스템 구성도]
NLKLOD 시스템
서비스 대상
Main Server
Clone Server
Linked Data 관리용
http://lod.nl.go.kr/***
서비스관리자
일반이용자용 서비스
http://lod.nl.go.kr/home
OntoBase
(트리플스토어)
서지
저자
온라인
주제
관리 DB
KOLIS연동
서지 데이터 수집 대상
(KOLIS 서버)
http://lod.nl.go.kr/sparql
서지
일반이용자, 외부응용시스템
OntoBase
(트리플스토어)
서지
저자
온라인
주제
온라인 데이터
수집 대상
(DCMS 서버)
ORACLE
변동 Queue
SPARQL Endpoint
이중화
MySQL
일반이용자
지도서비스용
수집 대상
KOLIS-NET
Google
인터링킹 수집 대상
LOD CLOUD
2. 국가서지 LOD 추진현황 - ⑨/11
16
국가서지 LOD 플랫폼 구축
[검색]
Linked Data (LOD)
SPARQL Endpoint (질의)
MARC/MODS (원 데이터)
※SPARQL:RDF검색을위한질의언어로
SPARQLEndpoint
(RDF입출력인터페이스)를통해질의
2. 국가서지 LOD 추진현황 - ⑩/11
국가서지 LOD 플랫폼 구축
17
[응용서비스]
 Open API
 관계 탐색
 패싯 탐색
 데이터 브라우저
2. 국가서지 LOD 추진현황 – ⑪/11
국가서지 LOD 플랫폼 구축
18
[SPARQL Endpoint]
Table of Contents
1. 국립중앙도서관 Linked Open Data
1)
왜 LOD로 개방하는가 (추진배경)
2)
국립중앙도서관 LOD (주요 내용)
2. 국가서지 LOD 추진현황
1)
국가서지 LOD 발행
2)
국내외 LOD와의 연계(Interlinking)
3)
국가서지 LOD 플랫폼 구축
3. 한·중·일 디지털도서관 프로젝트(CJKDLI)
1)
프로젝트 개요 및 추진경과
2)
CJKDLI Portal Pilot Site
19
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ①/7
20
한·중·일 디지털도서관 프로젝트(CJKDLI)
 (협정체결) 한국국립중앙도서관, 중국국가도서관, 일본국립국회도서관(’10.8)
 (목적) 삼국의 문화적·과학적 유산에 대한 통합적이며 용이한 접근 제공
 (추진경과)
3차 회의
(한국/’13.12)
시스템 측면
관리자 측면
사용자 측면
3국 국립도서관 포털
사이트 연계 및 통합검색
 3국 포털사이트 연계 우선 추진(OpenAPI),
 “CJKDLI 포털” 시범 사이트 구축(‘14.12)


Linked Open Data 플랫폼 구축
Linked Open Data 발행

한국, 중국, 일본 관리자들이 하나의 통일된 환경에서 LOD를 손쉽게 관리할 수 있도록 기능 구현


LOD 시각화, 소셜미디어 연계, 반응형 웹
Facet 검색, 연관정보 탐색, LOD 반출

LOD 기반의 Collection 구축
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) -②/7
21
CJKDLI 포털 Pilot Site
[메인 페이지]
반응형 웹
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ③/7
CJKDLI 포털 Pilot Site [컬렉션/도서]
22
Collection/Book
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ④/7
CJKDLI 포털 Pilot Site
23
[저자]
Collection > Author
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ⑤/7
CJKDLI 포털 Pilot Site
24
[타임라인]
Collection > Timelines
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ⑥/7
CJKDLI 포털 Pilot Site
25
[Visualization]
Visualization
3. 한·중·일 디지털도서관 프로젝트(CJKDLI) - ⑦/7
CJKDLI 포털 Pilot Site
26
[검색]
Visualization
AUTHOR
birthYear
출생년도
deathYear
사망년도
birthPlace
출생지
deathPlace
사망지
occupation
직업
subject
주제
BOOK
author
작가
genre
장르
form
서식
publisher
출판사
country
국가
language
언어
mediaType
매체 형식
27
감사합니다
이 문서는 나눔글꼴로 작성되었습니다. 설치하기