PowerPoint - 닥치고 Linked Data

Download Report

Transcript PowerPoint - 닥치고 Linked Data

KDATA
주식회사 리스트
허홍수
[email protected]
Linked Data
2
출처 : http://lod-cloud.net/state/2011-09-19/
KDATA
since May, 2012
3
HOW ?
데이터
수집
발행
LOD
연결
모델링
변환
4
데이터 수집
데이터
수집
각각의 도메인을 정해서 데이터를 수집
 엑셀에 데이터를 직접 생성
발행
모델링
LOD
연결
변환
 아르바이트 고용
 웹 크롤링
역사
 Open API
 데이터 제공 사이트에서 다운로드
데이터를 보유하고 있는 기관이 진입하기 용이하다..
5
데이터 수집 - 데이터셋
데이터
설명
출처
발행월
서울시 장난감 도서관
서울시의 장난감 도서관에 대한 데이터
안전행정부
2014.03
대한민국 작가
대한민국의 근현대 작가에 대한 데이터
Web Search
2014.02
의료기관
대한민국의 의료기관에 대한 데이터
보건복지부,
의료기관평가인증원,
한국보건산업진흥원
2014.01
서울시의회 용어
서울시 의회 용어에 대한 데이터
서울열린데이터광장
2014.01
도서관 정보
서울시의 서울시자치구 도서관에 대한 데이터
서울열린데이터광장
2013.04
서울청소년독서실
서울시의 청소년독서실에 대한 데이터
서울열린데이터광장
2013.04
대한민국의 산
대한민국의 산에 대한 데이터
Web Search
2013.03
문화시설
서울시의 문화시설에 대한 데이터
서울열린데이터광장
2013.02
야생동식물출현정보
서울시의 야생동식물 출현에 대한 데이터
서울열린데이터광장
2013.02
야생동식물정보
서울시의 야생동식물에 대한 데이터
서울열린데이터광장
2013.02
공원정보
서울시의 공원정보 및 프로그램에 대한 데이터
서울열린데이터광장
2013.02
공공시설물 인증제품
서울우수공공디자인 공공시설물 인증제품에 대한 데이터
서울열린데이터광장
2013.02
공공 WiFi 위치정보
서울시의 공공WiFi 위치정보에 대한 데이터
서울열린데이터광장
2013.02
제설함 위치정보
서울시의 제설함 위치 정보에 대한 데이터
서울열린데이터광장
2013.02
가격안정 모범업소
서울시의 가격안정 모범업소에 대한 데이터
서울열린데이터광장
2013.02
북촌 한옥마을
서울의 북촌 한옥마을에 대한 데이터
서울열린데이터광장
2013.02
행정데이터 표준용어
사전정보
행정데이터 표준용어 사전에 대한 데이터
서울열린데이터광장
2013.01
서울 지하철
서울시의 지하철에 대한 데이터
서울메트로
2012.12
6
데이터 수집 - 데이터셋
데이터
설명
출처
발행월
대학교
대한민국의 4년제 대학교에 대한 데이터
Web Search
2012.12
국립공원
대한민국의 국립공원에 대한 데이터(공원에 속한 시설 포함)
국립공원관리공단
2012.12
전통시장
서울소재 전통시장에 대한 데이터
서울열린데이터광장
2012.12
서울시 개방 화장실
서울소재 개방형 화장실에 대한 데이터
서울열린데이터광장
2012.12
사회적 기업
서울소재 사회적기업과 서울형 사회적 기업 데이터
서울특별시
2012.08
공공체육시설
대한민국의 전국 공공체육시설 현황 데이터
(2011년말 기준)
문화체육관광부
2012.08
교육청
대한민국의 시도교육청 및 교육지원청에 대한 데이터
초중고등학교
대한민국의 초등,중등,고등학교에 대한 데이터
특성화/마이스터/종합 대한민국의 특성화고, 마이스터고, 종합고등학교에 대한 데이
고등학교
터
대한민국의 스포츠 선수 및 스포츠팀에 대한 데이터(현재 야
스포츠 선수
구선수에 대한 데이터만 제공)
시도교육청 및
교육지원청
시도교육청 및
교육지원청
2012.08
2012.08
교육과학기술부
2012.08
프로야구선수협회
2012.07
엔터테인먼트
대한민국의 배우, 영화, 드라마, 가수 등의 데이터
방송사 및 Web Search
2012.07
역사
대한민국의 역사 사건 및 인물에 대한 데이터
Wikipedia, Web Search
2012.07
문화재
국가지정문화재인 국보, 보물, 사적, 명승, 천연기념물에 대한
지정일, 관리자, 소유자 등의 데이터
문화재청
2012.06
행정구역
대한민국의 행정구역(광역시/도, 시군구, 읍면동) 및 분류번호
2012.06
국가코드
세계 각국의 국가명, 알파2코드, 알파3코드 국가숫자, ITU코
드, 마크코드, 다이얼코드 등 다양한 코드
통계청
(2012.7.1일 기준)
Web Search
2012.06
7
데이터 수집 - 데이터 출처
데이터 출처
16
15
14
12
10
8
6
6
4
2
0
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
8
모델링
데이터
수집
발행
모델링
LOD
연결
표현력
변환
어휘
9
모델 설계
처음으로 생성하는 데이터에 대한 모델링을 열심히…
10
KDATA 클라우드
국립공원
관리공단
국립공원
자연환경
(산, 강)
열린데이터광장
생물
문화재청
문화재
열린데이터광장
도시공원
열린데이터광장
열린데이터광장
문화시설열린데이터광장모범업소
사회적 기업
서울메트로
지하철역
국가
열린데이터광장
전통시장
역사
(인물,사건)
음식
열린데이터광장
개방화장실
식당(맛집)
열린데이터광장
제설시설
통계청
행정구역
관광명소
방송사
드라마
기업
열린데이터광장
한옥마을
열린데이터광장
공공Wifi
영화
열린데이터광장
가수(그룹)
행사
열린데이터광장
도서관
보건복지부
병원
앨범
열린데이터광장
서울시의회
용어
4년제
대학교
교육과학
기술부
고등학교
교육청
교육기관
배우
프로야구
선수협회
야구선수
열린데이터광장
SGPD
인증제품
열린데이터광장
문화체육 독서실
프로야구팀
관광부
공공체육시설
데이터 증가, 도메인 확장에 따라 온톨로지 모델이 늘어남…
▶ 범용적이고 재활용 가능한 모델이 필요
11
KDATA 모델링 방향
표현력
어휘
데이터
분석
모델의 표현력을 높이기 보다는 간단한 모델, 일반적이고 쉬운 어휘 사용
12
변환
데이터
수집
발행
모델링
LOD
연결
변환
13
트리플 현황
데이터
트리플 건수
데이터
트리플 건수
서울시 장난감 도서관
324
대학교
2,833
대한민국 작가
3,621
국립공원
3,435
의료기관
7,847
서울시의회 용어
46,630
전통시장
3,556
도서관 정보
7,897
서울시 개방 화장실
47,340
서울청소년독서실
665
사회적 기업
5,604
대한민국의 산
6,728
공공체육시설
49,641
문화시설
9,418
야생동식물출현정보
139,608
교육청
1,130
야생동식물정보
115,104
공원정보
1,506
특성화/마이스터/종합 고등학교
공공시설물 인증제품
6,931
스포츠 선수
28,316
공공 WiFi 위치정보
1,671
엔터테인먼트
45,109
제설함 위치정보
39,218
가격안정 모범업소
16,212
역사
4,702
북촌 한옥마을
1,155
문화재
14,691
행정데이터 표준용어 사전정보
109,101
행정구역
2,969
서울 지하철
4,251
국가코드
3,898
초중고등학교
127,565
14
연결
데이터
수집
발행
모델링
LOD
동일 개체 연결
개체간의 관계 연결
Interlinking
생성
연결
변환
SPARQL
Endpoint
15
발행
데이터
생성된 트리플을 웹 상에 발행
수집
발행
모델링
LOD
연결
SPARQL
Clients
HTML/RDF
Browsers
SPARQL
HTML/
Linked Data
변환
Pubby
Triple Store
16
발행된 데이터
17
KDATA 2014
18
국내 LOD는 어디에?
국립중앙도서관LOD
서울시LOD
생물정보LOD
한국사LOD
제주도LOD
RISS LOD
주소데이터 LOD
NDSL LOD
19
LOD 연결 시도
SPARQL
Endpoint
Data
Set
20
매칭 비교
21
국내 LOD 연결
22
국내 LOD 연결 현황
동일 개체 연결
movie 제주도
data
LOD
676
590
개체간의 관계 연결
국립중앙도서관
생물정보
LOD
LOD
2,778
2,864
한국사 LOD
RISS LOD
85
390
서울시 LOD
3,421
23
LOD Cloud 2014
24
출처 : http://lod-cloud.net/
KDATA ?
25
KDATA 서비스
http://kdata.kr
26
KDATA 구성
5 Star
Useful SPARQL
KDATA Introduction
LOD Introduction
Class Category
LOD Live
Concept Category
Application
KDATA Category
SPARQL Endpoint
Endpoint
27
SPARQL Endpoint
http://kdata.kr/sparql
28
검색
29
검색 - 인터링킹
30
31