情報流通連携基盤共通API

Download Report

Transcript 情報流通連携基盤共通API

IT総合戦略本部 電子行政オープンデータ実務者会議
第4回 データ・ワーキンググループ提出資料
資料5
総務省オープンデータ実証実験での取組
~データカタログサイトの本格運用に向けて~
平成26年1月21日
総
務
省
情 報 流 通 行 政 局
情 報 流 通 振 興 課
【目次】
1.オープンデータ実証実験の概要
(1)全体概要
(2)実証実験の例
①統計情報・データカタログ実証
②自治体行政情報実証
(3)オープンデータ・アプリコンテスト
2.オープンデータ実証実験での取組と
政府データカタログサイトの本格運用に向けた示唆
(1)開発者向けサイト
(2)メタデータ
(3)API
(4)データカタログサイトと他のデータベースとの連携
1
1.オープンデータ実証実験の概要
2
1.オープンデータ実証実験の概要 (1)全体像
○ 分野を超えたデータの流通・連携・利活用を効果的に行うために必要となる、①情報流通連携基盤共通AP
I※(標準データ規格・標準API規格)の確立・国際標準化、②データの2次利用に関するルール(データガバ
ナンス方式)の策定、③オープンデータ化のメリットの可視化等のための実証実験を実施。
※共通API(Application Programming Interface):情報・データの相互運用性を確保するための共通のデータ形式や通信規約
【イメージ図】
<防災情報サービス>
<公共交通情報サービス>
浸水危険エリア
<地盤情報サービス>
国・県・市町村の
地盤情報を一覧表示
遅延情報
避難勧告エリア
リアルタイム
位置情報
様々な情報の組み合わせ
情報流通連携基盤共通API
自治体行政情報
社会資本情報
観光情報
防災情報
公共交通情報
統計情報
花粉症情報
・ 情報流通連携基盤共通API(第1版)について、平成24年度の実証実験の結果等を踏まえ、意見募集(Call for Comment)
を実施(平成25年10月10日まで)。http://www.opendata.gr.jp/cfc/
・ 平成25年度は、年度末の情報流通連携基盤共通API(第2版)の策定に向けて、統計情報・データカタログ実証、自治体行
政情報実証、社会資本実証、観光実証、防災実証等、7本の実証実験を実施中。
3
【参考】 情報流通連携基盤共通APIの意義
情報流通連携基盤共通APIは、(1)標準データ規格(データモデル、データ表現形式、共通ボキャブ
ラリ)、(2)標準API規格から構成。
【標準データ規格なし】
公開主体A
【標準データ規格あり】
公開主体B
DB
DB
人口統計
データ要求
公開主体B
公開主体C
DB
DB
DB
DB
標準データ規格
…
<dc:date>1985-04-01</dc:date>
<rdf:value>12345</rdf:value>
…
人口統計
データ要求
昭和60年,10.4千人
昭和61年,12.3千人
…
○○市人口統計
…
53854
52345
昭和61
公開主体A
人口統計
データ要求
1985年,1234人
1986年,1385人
…
CSV
昭和60
公開主体C
CSV
標準データ規格
…
<dc:date>1985-04-01</dc:date>
<rdf:value>52345</rdf:value>
…
人口統計
データ要求
標準データ規格
人口統計
データ要求
…
<dc:date>1985-04-01</dc:date>
<rdf:value>10425</rdf:value>
…
人口統計
データ要求
PDF
各組織のデータ形式がばらばらで、加工しづらい
【標準API規格なし】
公開主体X
【標準API規格あり】
公開主体Y
公開主体Z
DB
DB
DB
独自API
独自API
独自API
X用の
問い合わせ
機械可読なデータ形式に統一すること等で二次利用が容易に。
Y用の
問い合わせ
公開主体X
DB
標準API
標準APIやDB
の実装方法は、
標準API規格
の範囲外。
公開主体Y
公開主体Z
DB
DB
標準API
独自API
標準API
Z用の
問い合わせ
既存の独自APIに標準
APIを被せてもよい。
また、サービスが独自に
APIを提供することを妨げ
ない。
・サービスごとにデータの取得方法を調査し、アクセスする必要
・データ提供元によらず共通の問い合わせ形式でアクセス可能
・データの取得先もサービスごとに違う
・データの識別子から、そのデータの取得先を問い合わせられる
4
トータルコストが上昇
1.オープンデータ実証実験の概要 (2)例①:統計情報・データカタログ実証(概要)
○ オープンデータの利活用ニーズが高いと想定される、統計情報(次世代統計利用システムで提供されてるもの)や政府デー
タカタログサイト(試行版)と情報流通連携基盤システムを接続し、両者の連携可能性を実証する。
○ これにより、次世代統計利用システムや政府データカタログサイト(試行版)が提供するデータと他のデータとをマッシュアッ
プが可能となる環境を実現する。
○ また、統計情報については、従来は統計表ごとに検索していた、複数の統計表に対する統計情報検索を、情報流通連携基
盤共通APIを1回呼び出すことで実現させることにより、統計情報の取得を簡素化することを目指す。
実施主体: 株式会社横須賀テレコムリサーチパーク
連携主体: 内閣官房、総務省統計局、独立行政法人統計センター
コンテストによるアプリケーション
複数の統計表に対する
検索を要求
開発者サイト
提供
•
•
•
API仕様
サンプルコード
利用規約 等
結果を返却
情報流通連携基盤共通API
個々の統計表に対して
検索を要求
次世代統計利用システムAPI
統計
表#1
統計
表#2
…
データカタログAPI
統計
表#n
統計情報
データカタログ情報
本実証で扱うデータ
5
1.オープンデータ実証実験の概要 (2)例②:自治体行政情報実証(概要)
○
ユーザニーズに基づいた自治体版の「情報流通連携基盤システム」を構築し、広く地方公共団体に普及展開できるモデルを策
定する。
○ 広く普及展開可能なモデルを構築するためには、単に基盤システムを構築するだけでなく、情報流通連携基盤システムの設計
思想のドキュメント化、ニーズの高い自治体行政情報の特定、ポータルサイトの構築、自治体職員向けの補助ツールの整備、情
報サービスの構築によるメリットの可視化等を1つのパッケージとして整備する必要がある。
実施主体: エヌ・ティ・ティ・データ (LODイニシアティブ、日本マイクロソフト、インディゴ、jig.jp)
連携主体: 横浜市、鯖江市
【重点自治体行政情報の特定に係る
調査等】
・利活用ニーズの調査
・展開可能性の調査
・ニーズのあるサービス分野の調査
・公開・二次利用不可根拠の調査
【データ規格の構築】
・識別子の検討
・ボキャブラリの構築
・RDFスキーマの構築
サービス利用者
データ利用者
(地元住民)
(情報サービス
開発事業者)
②所在確認
【情報流通連携基盤システムの構築】
・簡易なシステム設計
・設計思想、手順のドキュメント化
・API、自治体行政情報DBの構築
・データ変換ツールの整備
・自治体職員向けのマニュアルの整備
・アンケート・ヒアリングによる基盤ステムの
検証
・重点自治体行政情報のWeb公開・
データカタログサイトの構築
・コンテストによるアプリケーションの開発
データ提供者
CKANによるデータカタログサイト
(横浜市・鯖江市)
データ変換ツール
⑤サービス提供
【自治体行政情報のオープンデータ
化の実証】
(自治体職員)
①登録
マニュアル
③内容確認
ボキャブラリ
RDFスキーマ
④データ取得
【アプリケーショ
ンの開発】
自治体行政情報データベース
・開発者サイト構築
情報流通連携基盤システム
【継続運用・普及に係る計画の策定等】
【「オープンデータ流通推進コンソーシアム」との連携・協力等】
6
1.オープンデータ実証実験の概要 (3)オープンデータ・アプリコンテスト
○ 総務省では、オープンデータのための技術・データの利用ルールの確立、オープンデータ化のメリットの可視化等のための
実証実験を実施しているところ、民間における公共データの活用を促進するため、本年度実施中の7つの実証実験でオープン
データ化された公共データを活用したアプリケーションの開発を一般公募により実施。
○ 応募のあったアプリケーションについて、オープンデータ流通推進コンソーシアムの利活用・普及委員会において審査を行い、
優秀なものについては、平成26年3月13日開催予定の第4回同委員会において表彰を実施。
主催
総務省 及び オープンデータ流通推進コンソーシアム
共催 株式会社エヌ・ティ・ティ・データ、富士通株式会社、日本アイ・ビー・エム株式会社、株式会社エヌ・ティ・ティ・データ経営研究所、
株式会社パスコ、株式会社横須賀テレコムリサーチパーク、ウェザー・サービス株式会社
後援
オープンストリートマップ・ファウンデーション・ジャパン 、 オープンナレッジファンデーションジャパン 、 クリエイティブ・コモンズ・ジャパン 、Code For Japan 、
Hack For Japan 、ビッグデータ・オープンデータ活用推進協議会 、特定非営利活動法人リンクト・オープン・データ・イニシアティブ、LODチャレンジ実行委員
会、独立行政法人 国立高等専門学校機構、国土交通省、気象庁
※その他調整中
表彰
実証実験・オープンデータ化される公共データ
実証実験
自治体行政情報実証
社会資本実証
観光実証
防災実証
公共交通実証
統計情報・データカタログ実証
花粉症関連情報実証
スケジュール
平成25年
平成26年
オープンデータ化される公共データ(例)
医療機関情報/バス停情報/AED設置場所 等
工事実績/社会資本情報/苦情・問い合わせ 等
観光情報/駐車場満空情報/タクシー平均移動時間 等
避難所情報/過去の災害/ライフラインの被害・復旧情報 等
遅延・運休等/走行位置/東京駅・新宿駅の構内施設 等
総務省統計局所管の統計情報
政府データカタログサイト(試行版)の掲載情報
花粉飛散量情報/気象情報/花粉症患者症状情報(統計処理済) 等
一般公募による
アプリケーションの開発
自治体行政情報
情報流通連携基盤
共通API
花粉症情報
11/28(木)
告知
1月上旬~下旬
開発者サイト公開・データ提供開始 ※既に6実証について公開済み
社会資本情報
統計情報
2/3(月)
応募受付開始
2/17(月)正午【厳守】 応募締切
公共交通情報
観光情報
3/13(木)10時~12時 第4回 利活用・普及委員会 (受賞者によるプレゼンテーション、表彰式)
防災情報
※詳細は、オープンデータ流通推進コンソーシアムのコンテスト専用ウェブサイト(http://www.opendata.gr.jp/2013contest/)を参照。 7
2.オープンデータ実証実験での取組と
政府データカタログサイトの本格運用
に向けた示唆
8
2.オープンデータ実証実験での取組と示唆 (1)開発者向けサイト
○ 平成24年度に実施した公共交通オープンデータ実証では、開発者向けサイト(API仕様、サンプルコード、データ一覧、利用
規約、FAQ、フォーラム機能等を掲載)を公開した上で、アプリケーション開発を一般公募したところ、わずか3週間で16のアプ
リケーションが開発された。
○ 本年度は、全ての実証実験において、「開発者向けサイト」を用意し、「オープンデータ・アプリコンテスト」で提供。
■統計情報・データカタログ実証の開発者向けサイト
■自治体行政情報実証の開発者向けサイト
示唆①:開発者向けサイ
ト
○ 民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけではなく、
開発者による開発のヒントとなる事項(API仕様、サンプルコード、データ一覧、利用規約、FAQ、フォーラム機能等)を掲載し
た「開発者向けサイト」を用意しておくことが重要。
9
【参考】 統計情報・データカタログ実証の開発者向けサイトが提供する機能
【データ一覧】
・ 本実証で利用できるデータ一覧を掲載
【API仕様・サンプルコード】
・ アプリケーションを開発する際に必要となる、データのアクセス仕様
及びその利用方法をイメージ可能なサンプルコードを掲載
・ 統計情報・データカタログ実証では、SPARQL(*1)準拠のAPIを提供
【フォーラム機能】
・ 開発者間の意見交換機能を提供
(*1) RDF(*2)形式のデータに関する検索を行う言語。W3C (World Wide Web Consortium)が規格化している。
(*2) 主語・述語・目的語という3つの組でデータを記述する枠組み。W3Cが規格化している。
10
2.オープンデータ実証実験での取組と示唆 (2)メタデータ
○ オープンデータ実証実験においては、メタデータの記述モデルにRDFを採用し、メタデータを記述するために利用するボキャ
ブラリは、広く流通しているものを取り入れつつ、実証に必要なボキャブラリを追加定義する方針をとっている。
○ 統計情報・データカタログ実証においても、統計情報の記述にはRDF Data Cube Vocabularyを、データカタログサイトに登録
されているデータの記述にはData Catalog Vocabulary(DCAT)(いずれもW3Cが勧告済み)の各ボキャブラリを採用している。
○ 政府のデータカタログサイト試行版も、DCAT等、国際標準に従って、メタデータ項目が作成されている。
■政府データカタログサイト試行版に掲載されているデータのメタデータ表記例
「http://www.soumu.go.jp/main_content/000224888.pdf」に掲載されている、「総務省」が作成した「総務省所管予算の概要」というPDF資料に関する、
データカタログサイトに格納されているメタデータは、以下のとおり(下記は、一部のメタデータを割愛している)。
http://www.data.go.jp/
data/dataset/soumu_0
5_ds_131126_00000001
rdf:type
dct:format
(参照先情報)
(ファイルフォーマット)
rdf:type
dcat:Dataset
(データ型)
(データ型)
(データセット)
dcat:title
(データセット名)
dcat:distribution
(参照先URL)
dct:creator
dcat:title
(作成者)
(参照先情報名)
dct:relation
(関連情報)
rdf:value
dcat:accessURL
財政
foaf:name
dct:IMT
(データ型)
(フォーマット名)
予算_平成25年度
(作成者名)
rdf:type
(リソース・参照先情報)
dct:keyword
(キーワード・タグ)
dcat:Distribution
(ファイルフォーマット)
PDF
http://www.soumu.go.jp/main_content/
000224888.pdf
総務省所管予算の概要
総務省
rdfs:label
(属性名)
rdf:value
(属性値)
publisher
大臣官房会計課
示唆②:メタデータ
○ メタデータを広く利用されているボキャブラリで記述するだけでなく、メタデータ項目の値の作成作業を効率化することも必要。
具体的には、メタデータの値に関する一定の基準を設け、各府省の職員が各種データファイルを作成する際に、その基準に
従いメタデータの値の記載も併せて行うようにする等、各府省の日常的な業務プロセスの中にメタデータ作成作業を位置づ
けておくことが有効。
⇒ 「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)」(平成25年6月25日 各府省情報化統
括責任者(CIO)連絡会議決定)の改訂。
11
○ あわせて、そのメタデータの値を効率的にデータカタログに登録する方法についても検討が必要。
2.オープンデータ実証実験での取組と示唆 (3)API
○ オープンデータ実証実験では、単にデータを公開するだけでなく、アプリケーションから必要なデータを自動的に取得できる
よう、API(Application Programming Interface)を用意。
○ その際、データのマッシュアップを想定し、複数のデータベースから共通の方法によりデータ取得が可能となるよう、共通の
API(情報流通連携基盤共通API)を用意。
■情報流通連携基盤共通APIが提供するAPI機能一覧
広く利用されている規格を収集・列挙し、これらの規格との相互運用性を考慮しつつ、実証において必要になる機能を追加。
機能名
概要
SPARQLベースのAPI
SPARQL-based command
SPARQL1.1準拠のデータ操作APIを提供。
RESTベースのAPI
Traceability/Realtime Data Management Command
トレースフォワード・トレースバックを含む、トレーサビリティに代表されるイベントを管理する機能。
Geographical Data Management Command
GIS等地理情報処理を必要とするデータ検索・取得・操作機能。
Notification Management Command
データの登録・更新をトリガとしてデータ利用者のシステムにコールバックする(Notification)仕組み。
Security Management Command
ユーザ・グループの管理と、データのアクセスルールに関する機能。
Vocabulary Management Command
ボキャブラリ情報の登録・検索・取得に関する機能。
Triple Management Command
RDFモデルの主語・述語・目的語からなる基本データの登録・検索・取得に関する機能。
Identification Resolution Command
IDをキーとしてデータを登録・検索する機能。
示唆③:API
○ 民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけでなく、ア
プリケーションから必要なデータを自動的に取得できるよう、API(Application Programming Interface)を用意することが重要。
○ マッシュアップを想定し、そのAPIの仕様は共通化しておくべき。
12
2.オープンデータ実証実験での取組と示唆 (4)データカタログサイトと他のデータベースとの連携
○ 統計情報・データカタログ実証では、共通のAPIにより、既存のデータベースである次世代統計利用システムと、データカタ
ログサイトとを連携させ、データのマッシュアップが可能となる環境を実現。
アプリケーション
共通のクエリ
(SPARQLクエリ)
共通のレスポンス
(SPARQLレスポンス)
情報流通連携基盤共通API
次世代統計利用システムAPI用
クエリ
レスポンス
データカタログAPI用
クエリ
次世代統計利用システムAPI
統計情報
レスポンス
データカタログAPI
データカタログ情報
示唆④:データカタログサイトと他のデータベースと
の連携
○ 既存データベースが存在する場合には、当該データベースのデータをカタログサイトに掲載する方法のほか、既存データ
ベースとカタログサイトに共通のAPIを用意し、開発者が共通の問い合わせ方式によりデータ取得可能な環境を用意する方法
も考えられる。
13