PowerPoint形式

Download Report

Transcript PowerPoint形式

参考資料6
平成26年3月18日
オープンデータ実務者会議データWG配布資料
情報共有基盤の推進状況について
平成26年4月1日
経 済 産 業 省
情報共有基盤とは
 情報共有基盤とは、行政やオープンデータの利便性向上を図るため、
「共通語彙基盤」「文字情報基盤」を合わせた取り組みにより実現され
る、関係機関間での情報共有の仕組みである。
オープンデータをマッシュアップす
るには、語彙や文字の共通化もし
くは変換の仕組みが必要
シームレスな情
報共有基盤
国・地方を通じた行政機関内での、住所、氏名、施設名等の語彙、さらには、氏名文字、法人
文字の正確で効率的な交換が必要
1
参考:世界最先端IT 国家創造宣言工程表
 公共データの民間開放(オープンデータ)の推進
経済産業省
共通語彙の
データベースを整備
↓
データ連携のための
基盤を作成
相互に連携
 利便性の高い電子行政サービスの提供
総務省
情報流通連携基盤
共通APIの整備
↓
情報流通連携基盤を
構築するための
規格を作成
2
検討体制
 情報共有基盤の推進のため、専門家による委員会を設置。
IT総合戦略本部
パーソナルデータに
関する検討会
新戦略推進
専門調査会
電子行政
分科会
防災・減災
分科会
各府省CIO
連絡会議
電子行政オープン
データ実務者会議
政府情報システム
刷新等WG
・・・
協力依頼
塗りつぶし部分は関連する会議体
報告
IT融合フォーラム
公共データワーキング
情報共有基盤推進委員会
委員長
有識者
関係団体
オブザーバ
須藤修(東京大学情報学環長)
武田英明(共通語彙基盤WG座長)、林史典(文字情報基盤WG座長)
JISA(ソフト業界)、JEITA(ハード業界)
内閣官房(IT総合戦略室、社会保障改革担当室)、総務省(行政管理局)
共通語彙基盤WG
文字情報基盤WG
<実施内容>
• 情報連携用語彙基盤DBの構築
• APIカタログの整備
• 情報連携用ツールの整備
<実施内容>
• 導入ガイドの作成
• 文字情報DBの構築
• フォント整備
• 標準化の実施
【主査】武田英明 (NII教授)
【関係省庁】(課長級)
IT室、社保室、内閣府防災、
総務省、国交省、国会図書館
情報セキュリティ
政策会議
オープンデータ視点での
検討
• 各委員会、WGの設置主体は経
済産業省、事務局は(独)情報
処理推進機構(IPA)
• 各WGの下には、具体的な検討
を行なうSWGを設置。
【主査】林 史典(聖徳大学教授)
【関係省庁】(課長級)
IT室、総務省、法務、省
3
共通語彙基盤
4
共通語彙基盤の現状①
 平成6年 「行政情報化推進基本計画」閣議決定
 省庁間の情報の共有及び円滑な流通に必要なデータコード、データ項目等基本的事
項の標準化
 平成24年 「IT防災ライフライン構築のための基本方針及びアクションプラン」IT戦略本部I
T防災ライフライン推進協議会決定
 公共情報交換標準スキーム(XMLベースの標準データ項目群)の検討を国際標準や
国内の既存フォーマットも考慮しつつ連携させ、災害時等において必要な行政情報を
迅速に提供するための検討を進め、実施可能な取組から実行する。
 平成24年 「新たな情報通信技術戦略 工程表」IT戦略本部決定
 データ活用を促進するためのフォーマット等の規範やマニュアルの整備、公共情報交
換標準スキーム等の支援システム・ツールの実証を行う。
 平成24年 共通語彙基盤(公共情報交換標準スキーム)に関する委員会を経済産業省内
に設立
5
共通語彙基盤の現状②
 平成25年 「世界最先端IT国家創造宣言」閣議決定
 データの組み合わせや横断的利用を容易とする共通の語彙の基盤構築に取り組む。
 国民がステークホルダーとして積極的に参加できるよう、クラウドを活用したオープン
な利用環境を、データ・フォーマット、用語、コード、文字等の標準化・共通化、APIの公
開等を行いつつ整備する。
 平成25年 「世界最先端IT国家創造宣言工程表」IT総合戦略本部決定
 2015 年度までに情報連携用語彙データベース(基本語彙の定義等をまとめたデータ
ベース)を開発・実証する。
 国際的な連携を踏まえた情報連携用語彙データベース(基本語彙の定義等をまとめ
たデータベース)の開発・実証を2013 年度~2015 年度に行う。
 平成25年 「電子行政オープンデータ推進のためのロードマップ」IT総合戦略本部決定
 ある内容を示す用語や同じ用語の定義が組織によって異なっているとデータを横断的
に又は組み合わせて処理・利用することが困難となるため、「新たな情報通信技術戦
略 工程表」を参照しつつ、新たなIT 戦略の策定に伴って定めることとする分担に従い
、用語やその定義の標準化、効率的なデータ連係のためのツール等の整備について
、内閣官房、総務省及び経済産業省が連携して進める。
 平成25年「情報連携用語彙データベース、ツールプロジェクト」開始
6
共通語彙基盤(IMI:
Infrastructure for Multi-layer Interoperability)とは
 情報を正しく効率的に交換、活用していくためには、人名、住所、物等、データを体系的、
かつ、構造的に定義して行く必要がある。
システム連携
共通語彙基盤は、用語の参照辞書を整備するこ
とで、各種データの同一性の確認を容易にし、そ
の結果として、システム間の連携やオープンデー
タの活用を容易にできるようにする仕組み。
語彙(ボキャブラリ)、
情報交換パッケージ(IEP)
項目名(Type/Sub-properties)
人型
氏名
性別
項目名(エントリー名)
ic:人型
ic:人_氏名
ic:人_性別
Substitutable Elements:
性別コード
性別名
生年月日
死亡年月日
現住所
本籍
国籍
ic:人_国籍
Substitutable Elements:
+ PersonSexCode
+ PersonSexText
BirthDate
DeathDate
PresentAddress
LegalResidence
データタイプ(英語)
cardinality
ic:PersonNameType
<abstract element, no type>
0..1
0..1
項目説明
人の情報を表現するためのデータ型。
氏名
性別
codes:性別コード型
ic:テキスト型
ic:日付型
ic:日付型
ic:住所型
ic:住所型
codes:GenderCodeType
ic:TextType
ic:DateType
ic:DateType
ic:AddressType
ic:AddressType
0..1
0..1
0..1
0..1
性別コード
性別の名称。
生年月日
死亡年月日
現住所
本籍
項目説明(英語)
サンプル値
Name of a Person
Gender of a Person
1
Gender of a Person
Gender of a Person
Date of Birth of a Person
Date of Death of a Person
1
男
-
Citizenship
<抽象要素>
<abstract element, no type>
+ CitizenshipText
ic:テキスト型
ic:TextType
+ CitizenshipCode
codes:国籍コード型
codes:CitizenshipCodeType
0..n
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
Mapping to NIEM
nc:PersonType
nc:PersonName
nc:PersonSex
オープンデータ
Mapping to ISA Joinup
Person
gender
国籍
nc:PersonSexCode
nc:PersonSexText
nc:PersonBirthDate
dateOfBirth
nc:PersonDeathDate
dateOfDeath
nc:PersonResidenceAssociationType
residency
-
nc:PersonCitizenship
日本国
nc:PersonCitizenshipText
392
nc:PersonCitizenshipFIPS10-4Code
語彙で意味を確認し、情報
交換パッケージから、情報
を抽出
・サービス設計の効率化
・安定した情報連携
citizenship
Substitutable Elements:
ic:人_国籍名
国籍コード
ic:人_国籍コード
ISO3166Alpha2
ic:人_ISO3166Alpha2
ISO3166Alpha3
ic:人_ISO3166Alpha3
ISO3166Numeric
データタイプ
ic:氏名型
<抽象要素>
Substitutable Elements:
ic:人_性別コード
ic:人_性別名
ic:人_生年月日
ic:人_死亡年月日
ic:人_現住所
ic:人_本籍
国籍名
出生国
出生地
氏名型
姓名
カナ姓名
ローマ字姓名
姓
カナ姓
ローマ字姓
名
カナ名
ローマ字名
ミドルネーム
カナミドルネーム
ローマ字ミドルネーム
旧姓
カナ旧姓
ローマ字旧姓
英語名
PersonType
PersonName
PersonSex
情報交換パッケージに
より、システム間を連携
・高速な情報連携
・設計の効率化
ic:人_ISO3166Numeric
ic:人_出生国
ic:人_出生地
ic:氏名型
ic:氏名_姓名
ic:氏名_カナ姓名
ic:氏名_ローマ字姓名
ic:氏名_姓
ic:氏名_カナ姓
ic:氏名_ローマ字姓
ic:氏名_名
ic:氏名_カナ名
ic:氏名_ローマ字名
ic:氏名_ミドルネーム
ic:氏名_カナミドルネーム
ic:氏名_ローマ字ミドルネーム
ic:氏名_旧姓
ic:氏名_カナ旧姓
ic:氏名_ローマ字旧姓
国籍の名称。
住民基本台帳で利用されている国籍コード。
+ ISO3166Alpha2
iso_3166:ISO3166Alpha2CodeType
iso_3166:ISO3166Alpha2CodeType
国名コード。ISO3166Alpha2。2文字コード。
+ ISO3166Alpha3
iso_3166:ISO3166Alpha3CodeType
iso_3166:ISO3166Alpha3CodeType
国名コード。ISO3166Alpha3。3文字コード。
+ ISO3166Numeric
BirthCountry
BirthPlace
PersonNameType
FullName
KanaFullName
RomanFullName
FamilyName
KanaFamilyName
RomanFamilyName
GivenName
KanaGivenName
RomanGivenName
MiddleName
KanaMiddleName
RomanMiddleName
MaidenName
KanaMaidenName
RomanMaidenName
iso_3166:ISO3166NumericCodeType
iso_3166:ISO3166NumericCodeType
国名コード。ISO3166Numeric。数字3桁コード。
ic:場所型
ic:場所型
ic:LocationType
ic:LocationType
0..1
0..1
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:テキスト型
ic:カタカナテキスト型
ic:テキスト型
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
ic:TextType
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
0..1
生まれた国。
生まれた場所。
氏名を表現するためのデータ型。
氏名(姓、名)。
氏名(姓、名)のカナ表記。
氏名(姓、名)のローマ字表記。
姓。
姓のカナ表記。
姓のローマ表記。
名。
名のカナ表記。
名のローマ字表記。
ミドルネーム。
ミドルネームのカナ表記。
ミドルネームのローマ字表記。
旧姓。
旧姓のカナ表記。
旧姓のローマ字表記。
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A county that assigns rights, duties, and privileges to a person because of
the birth or naturalization of the person in that country.
A location where a person was born.
A location where a person was born.
Full name of a Person
Full name in Katakana.
Full name in Roman alphabet.
Family name of a Person
Family name in Katakana.
Family name in Roman alphabet.
Given name of a Person
Given name in Katakana.
Given name in Roman alphabet.
Middle name of a person
Middle name in Katakana.
Middle name in Roman alphabet.
Maiden name.
Maiden name in Katakana.
Maiden name in Roman alphabet.
nc:PersonCitizenshipISO3166Alpha2Code
nc:PersonCitizenshipISO3166Alpha3Code
nc:PersonCitizenshipISO3166NumericCode
経済 太郎
ケイザイタロウ
Keizai Taro
経済
ケイザイ
太郎
タロウ
nc:PersonBirthLocation
nc:PersonBirthLocation
nc:PersonNameType
nc:PersonFullName
countryOfBirth
placeOfBirth
nc:PersonSurName
familyName
fullName
nc:PersonGivenName
given name
nc:PersonMiddleName
alternativeName
nc:PersonMaidenName
birthName
三鷹市立第四小学校
ic:建物_所在
ic:場所_地名
ic:場所_地理識別子
ic:場所_住所
東京都三鷹市下連雀1
丁目25−1
ic:住所_住所
ic:住所_構造化住所
ic:構造化住所_国
ic:構造化住所_都道府県
ic:構造化住所_市区町村
ic:構造化住所_町名
ic:構造化住所_街区符号
ic:構造化住所_住居番号
ic:構造化住所_地番
ic:構造化住所_方書
東京都
三鷹市
下連雀
1
25
1
ic:方書_方書
ic:方書_ビル名
ic:方書_部屋番号
ic:構造化住所_郵便番号
ic:構造化住所_住所ID
ic:構造化住所_住所コード
181-0013
ic:場所_経緯度座標
ic:経緯度座標系_測地系コード
ic:経緯度座標系_緯度
ic:緯度_度
ic:緯度_分
ic:緯度_秒
ic:経緯度座標系_経度
ic:経度_度
ic:経度_分
ic:経度_秒
ic:場所_UTM座標
ic:UTM座標系_UTM座標
ic:UTM座標系_UTM測地系ID
ic:UTM座標系_東距
ic:UTM座標系_グリッドゾーンID
ic:UTM座標系_グリッドゾーン格子 ID
ic:UTM座標系_北距
検索
ic:場所_MGRS座標
ic:MGRS座標系_MGRS座標
ic:MGRS座標系_MGRS座標格子ID
ic:建物_施設情報
ic:施設_ID
ic:証明_識別ID
ic:証明_証明種類
ic:証明_発行日
ic:証明_失効日
ic:証明_発行者
ic:施設_名称
ic:施設_種別
ic:施設_商用区分
ic:施設_概要
三鷹市立第四小学校
小学校
小・中一貫教育校「連
雀学園」に属する小学
校。
Schema.org
検索エンジン大手が整備する
構造化データマークアップの共通仕様
語彙間の整理をしておくこ
とで、検索を効果的に実施
・検索の利便性の向上
・効果的な広報の実施
7
共通語彙基盤の効果
 共通語彙基盤を導入することにより、地域・組織・部門・業種・業務の壁を越えた横断的な情
報連携やオープンデータ利活用が可能になると期待される。
情報連携・情報提供時の課題
共通語彙基盤の導入
共通語彙基盤(統一ルール)
自治体A
自治体B
病院情報
(通常時)
病院情報
(通常時)
公共交通
機関
運行情報
×
×
災害拠点
病院情報
×
駅情報
×
自治体A
自治体B
病院情報
(通常時)
病院情報
(通常時)
災害拠点
病院情報
駅情報
公共交通
機関
運行情報
駅情報
×
駅情報
バラバラの形式
統一の形式
アプリを
作りづらい!
情報が
見づらい!
情報提供主体や種別・役割ごとに表現形式や
データ形式が異なり一元的な情報活用が困難
アプリの横展
開が可能!
色々比較
しやすい!
同一施設の情報を(種別・役割によらず)一元
的・横断的に活用可能
8
共通語彙基盤の構造
 共通語彙基盤はコア語彙、共通語彙及びドメイン固有語彙から成り立つ。
コア語彙
どの分野でも利用される普遍的な語彙。
例)人、物、場所、日付 など
地理空間
・施設
病院
ドメイン共通語彙
分野固有の語彙の内、他の分野で
も参照する主要な語彙。
例)病院、駅名、避難所 など
住所
コア
語彙
ドメイン共
通語彙
ドメイン固有語彙
各分野での利用に特化した語彙。
例)病床数、時刻表 など
ドメイン
固有語彙
移動
・交通
駅
避難所
防災
災害
復旧費
財務
9
共通語彙基盤の利用イメージ(統一フォーマット例)
 ドメインごとの情報を組み合わせ、一つの物事を表す。
公共施設情報 (○○医院)
施設:病院
名称
場所
○○医院
住所
経緯度座標
地理識別子
施設ドメイン
(施設情報を表
すために必要な
事項)
連絡先
東京都
市区町村
江東区
...
...
緯度
35.xxxxxxxx
コア語彙
経度
139.xxxxxxxx
識別子体系
□□住所コード
識別子
13103xxxxxx
(様々なドメイ
ンで共通で使
用される語彙)
電話番号
03-xxxx-xxxx
...
スケジュール
ドメイン
共通語彙
アクセス
防災ドメイン
(防災情報を表
すために必要な
事項)
都道府県
防災:
災害拠点病院
内容
診療受付時間
開始時間
09:00:00+09:00
終了時間
17:00:00+09:00
曜日
MON,TUE,THU,FRI
最寄り駅
交通:駅
名称
△△駅
...
...
病床数
800
三次救急
True
ヘリ離着陸
False
10
共通語彙基盤(IMI)の検討状況
 方針検討と整備検証を以下の体制で実施。
経済産業省・情報処理推進機構(IPA) IMIプロジェクト
方針検討
・2012年度 事前調査
・2013年度 基礎調査とプロト構築
・2014年度 基盤整備と実利用での検証
コア語彙、ドメイン語彙の整備
・2015年度 利用モデル普及とドメイン展開
外部調整
・電子行政オープンデータ推進のため
のロードマップ
・電子行政アクションプラン
・有識者会議
普及
・情報交換パッケージの利用検証と
意見収集
情報処理推進機構 情報連携用語彙データベースPJ
データベースの整備(コア語彙を管理、検索するデータベース)
「財務」「移動・交通」「地理空間・施設」「防災」のうち、他分野と関連する部分からサンプ
ルを選び検討。セマンティックス、行政、国際語彙、標準の専門家による語彙の精査。
情報処理推進機構 情報連携用語彙データベース ツールPJ
ツール開発、自治体と協力した実証
「制度」「道路」「イベント」「観光」のうち、自治体業務で実施している部分からサンプルを
選び実証
11
共通語彙基盤の整備方針(トップダウン型)
 政府内で共通的にルールを作るほうが望ましい語彙
 住所、氏名、組織など、業務特性に依存しないもの
入力したいデータ
100-0013 東京都千代田区霞が関3-3-1尚友会館2階
株式会社田中商店
代表取締役 田中一郎
各種申請の入力様式
申請Aの記述様式
100-0013 千代田区 霞が関三丁目3-1 尚友会館2階
株式会社 田中商店 カブシキカイシャ タナカショウテン
田中 一郎 タナカ イチロウ
行政の申請においても、
基本的な語彙(住所、氏名等)
の記載方法が異なる
申請Bの記述様式
100-0013 千代田区 霞が関三丁目3-1尚友会館2階
チヨダクカスミガセキ
株式会社田中商店 タナカショウテン
代表取締役 田中 一郎 タナカ イチロウ
申請Cの記述様式
100-0013 東京都 千代田区 霞が関 3 3 1 尚友会館2階
株式会社田中商店
田中 一郎 タナカ イチロウ
12
共通語彙基盤の整備方針(ボトムアップ型)
 現場の状況を整理しボトムアップで作り上げていく語彙
 利用ニーズが高く、具体的な整理が各地で施行される領域
 情報連携用語彙データベースプロジェクトやツールプロジェクトの中でユースケースをもとに
整備していく。
避難所
避難所
指定避難所
福祉避難所
仮の定義
避難所の総称
自治体があらかじめ指定した避難所
生活に解除などが必要な方が入る避難所
災害時に避難所に特別に解放されてできる
仮設避難所
仮の避難所
広域で避難者支援を行うための活動拠点。臨
広域応援活動拠点
時ヘリポートや備蓄倉庫等を保有。
避難場所
避難場所の総称
避難場所へ避難する前に、近隣の避難者が
一時的に集合して様子を見る場所又は避難
緊急避難場所
者が避難のために一時的に集団を形成する
場所
大地震時に発生する延焼火災やその他の危
険から避難者の生命を保護するために必要
広域避難場所
な面積を有する大規模公園、緑地等のオープ
ンスペースをいう。
帰宅困難者受入施設
帰宅困難者が一時的に滞在する施設
帰宅者に対してトイレの提供等の各種支援を
災害時帰宅支援ステーション
する民間施設
都道府県の施設などで、市町村が一時的に
一時避難施設
利用する避難施設
自治体A
自治体A-1
自治体B
避難所
二次避難所
避難所
避難所
自治体B-1
避難施設
一時集合場所
広域応援活動拠点
地域防災拠点
広域避難地
広域避難場所
一時避難場所
広域避難場所
一時滞在施設、一時待機施設
災害時帰宅支援ステーション
帰宅困難者一時滞在施設
災害時帰宅支援ステーション 災害時帰宅支援ステーション
一時避難施設、一時避難
所、一時受入施設
都道府県と市町村の語彙が違っており、情報をマッシュアップできない
13
共通語彙基盤の整備方針(既存語彙連携型)
 既存語彙や外部語彙との連携する語彙
 府省、業界などで、国内、国際に通用している既存の語彙とは参照関係で連携する。
既に普及、または今後は普及が見込まれる、ドメイン専門部門等が整備した語彙
→積極的に活用。または、連携マップを整備。
公共施設情報 (○○博物館)
施設:博物館
名称
場所
○既存語彙をそのまま活用
○○博物館
住所
経緯度座標
地理空間
・施設
移動
・交通
コア
語彙
防災
ドメイン
共通語彙
ドメイン
固有語彙
財務
既存語彙(地図)
・・・
博物館
・・・
病院
・・・
ドメイン語彙は、
既存の語彙に準拠等
地理識別子
連絡先
都道府県
東京都
市区町村
江東区
...
...
緯度
35.xxxxxxxx
経度
139.xxxxxxxx
識別子体系
□□住所コード
識別子
13103xxxxxx
電話番号
03-xxxx-xxxx
...
スケジュール
内容
開館時間
開始時間
09:00:00+09:00
終了時間
17:00:00+09:00
曜日
アクセス
防災:
避難所
最寄り駅
MON,TUE,THU,FRI
交通:駅
名称
△△駅
...
...
受入可能人数
800
救護所
True
ヘリ離着陸
False
IMIの構造を使って、詳細情報を付加できる
(この部分も既存の構造があれば活用)
○複数語彙が並列している場合などは連携マップを整備
防災分野で使っている「啓開」
は、「開通」のことですね
観光業界さん。IMIで定義する
「啓開」の情報を送ります
防災語彙
避難路
通行規制
啓開
避難所
・・・
IMI
避難路
通行規制
開通
意味を明確化して連携
観光業界語彙
・・・
通行止
開通
・・・
14
各種ツールの整備例①(「施設・サービス」分野 @横浜市金沢区)
保育所の空き
状況等の入力
データ入力
支援ツール
共通語彙DB
保育所型
イベント型①
保育所型
医療機関の診療状況、保育所の
空き情報等を容易に把握
RDF
保育所
臨時休診日等
の入力
データ入力
支援ツール
医療機関型
公園型
イベント型①
医療機関型
医療機関
イベント型②
イベント型③
営業時間等
の入力
RDF
施設情報提供
ポータルサイト
(かなざわ育なび.net等)
RDF
イベント型②
データ入力
支援ツール
公園
管理者
HTML
HTML
住民
RDF
公園型
イベント型③
広域にわたる子育て情報
(保育所空き状況など)
を提供
子育て情報提供
サービス会社等
・各種「施設・サービス」を記述するための基本データ型を提案。
・データ入力支援ツールやDBの要件について考察。
15
各種ツールの整備例②(「イベントテンプレート」 @千葉県千葉市)
自治体
データ項目に関する属性等の
メタ情報(場所情報・日時)を付与
人が見やすい表示
子育てイベント
情報等
イベント型の
データ(HTML)
イベント型のデータ
(HTML+メタ情報)
HTML
小児検診・
予防接種など
子育てイベント
情報等
(一般的なサイト)
構造化データ
付与ツール
子育てイベント情報等
(場所情報、日時等の
メタ情報を追加)
メタ
情報
住民
イベントテンプレート
場所型
日時型
商品情報にメタ情報から
得たイベント情報を追加
共通語彙DB
子供向け商品情報
(子育てイベント情報等つき)
子供向け
商品メーカー等
・各種「イベントテンプレート」を提案。
・構造化データを付与するためのツールやDBの要件について考察。
16
今後の展開
 2月1日から稼働している共通語彙DBの機能検証結果を整理。
 ハッカソン等への情報提供(アプリ開発に特化した語彙)を通じた
検証の実施。
 今年8月までに共通語彙基盤の概念モデル(共通語彙基盤を支える
語彙データベースや各種ツールの要求事項)の構築を行う。
 関係政府機関、地方自治体間の情報交換シーンにおける共通語彙基
盤導入が進むよう、普及啓発を実施。
 負担軽減策としての各種変換ツール等を開発していく。
 導入可能な自治体については保有情報を共通語彙基盤準拠に変換で
きるよう支援する。
共通語彙基盤は、既存のコードや語彙体系に置き換わるわけではなく、
情報交換規約として構築していく。
17
文字情報基盤
18
文字情報基盤の現状
 平成9年「行政情報化推進基本計画(改定)」閣議決定
 情報システムにおいて使用している外字について, JIS第3水準及び第4水準の制定を待って
その解消を図るとともに, この場合においても残る可能性のある外字について,交換のルール
を策定する。
 平成14年「汎用電子情報交換環境整備プログラム」開始
 平成22年「文字情報基盤」開始(平成23年11月公開)
 平成24年「世界最先端IT国家創造宣言」閣議決定
 文字の標準化・共通化に関しては、今後整備する情報システムにおいては、国際標準に適合
した文字情報基盤を活用することを原則とする。
 平成24年「世界最先端IT国家創造宣言工程表」IT総合戦略本部決定
 2013 年度中に文字情報基盤導入ガイドの作成を行い、2015 年度以降はアクションプランを踏
まえ推進する。【内閣官房、経済産業省及び関係府省庁】
導入状況
累計ダウンロード数
5万件以上(他の民間ダウンロードサイト(窓の杜)の分を含まず)
札幌市、川口市等の先進自治体で導入。国や自治体の仕様への記載が増加中。
課題
・一部ベンダが未対応
19
文字情報基盤導入ガイドの概要
都道
府県
文字情報基盤:IPAmj明朝フォント(漢字58,814文字)
戸籍統一文字(漢字55,270文字)
交換
交換
戸籍のオンライン手続に使用することを目的として整理
した文字(辞書をベースに整理)
民間
国
市町
村
住民基本台帳ネットワークシステム統一文字(漢字19,563文字)
多くの住民が氏名に使う文字を整理
JIS漢字コード(10,050文字)
常用漢字(2,136文字)
法令、公用文書、新聞、雑誌、放送
等、一般の社会生活において、現
代の国語を書き表す場合の漢字使
用の目安を示す。
実用上の情報交換の必要
性から、出現頻度等を元に
文字を選定
(JISX2013:2004)
市町
村
システムにどのように実装していくかが難しいため、ガイドを作成
関連ドキュメント
文字情報基盤導入ガイド
・導入パターンの提示
利用場面毎の上記文字の推奨モデル
・縮退変換マップの計画
文字情報基盤からJISへの縮退推奨モデル
文字情報基盤導入テクニカルスタディ
・プライベート領域を使った暫定処置
変体仮名案
技術参照モデル(TRM)[作成予定]
・仕様書記載案
20
導入ガイド内容例:適用業務と文字の範囲
 導入ガイドでは、正確性と利便性をバランス良く導入するため、導入
方法を提示。
(*A)必要に応じ、文字情報基盤で整備された文字図形以外の文字図形を、「外字」等として利用することが有り得るが、できる限り文字情報基盤の文字範囲に収まるよう、調整
することが望ましい。
(*B)市場にある一般的情報機器の対応状況に応じ、変化する。
(*C)JIS
(*D)JIS
X 0213範囲以外の文字については、図形イメージによる表示、伝送を検討する。
X 0213範囲以外の文字については、表示を図形イメージによるものとするほか、Web上に漢字入力を支援するサービスを設けることを検討する。
(*) IVS(字形選択子)を使用するシステムでは文字情報基盤で整備した全ての文字(約6万文字図形)を区別可能。使用しないシステムでは約5万文字図形を区別可能。
21
国際標準化状況
 文字情報基盤の全約6万文字のうち、5万6千字以上についてISO/IEC 10646規格化*
が完了。
 2013年度中に4,400文字を標準化、数年内には標準化は完了予定。
 2015年度以降実装の文字を対象として、暫定導入のためのテクニカルスタディを提供。
2013年度
6,800
2014年度
2015年度以降
ISO/IEC 10646 第3版(2012年版)の
発行を受けたフォント実装
符号化未了文字数
6,100
ISO/IEC 10646 第4版(2014年発行予
定)を受けたフォント実装
約3700文字
2,400
約500文字
1,900
2013年12月 Unicode consortiumが登録を
受理し、パブコメ中 (~2014年3月)
現在IVD登録後にIVS実装
IVD: Ideographic Variation Database
IVS: Ideographic Variation Selector
UCS: Universal Multiple-Octet Coded
Character Set
約1900文字
2013年11月
IPAmj明朝ver.002.02公開
2014年夏(予定)
IPAmj明朝バージョンアップ
※ 国際符号化文字集合(ユニコード)の国際規格
ISO/IEC 10646
規格化完了!
2012年10月、ISO/IEC JTC1/SC2/WG2/IRG
へ提案し、受理済み(現在審議中)
22
文字情報基盤全体像と今後の方針
 文字、ガイド、支援ツールにより、府省や自治体の導入を総合的に支援していく。
文字
IPAmj明朝
フォント
文字情報
一覧
変体仮名
フォント
一覧
拡大縮小が自由にできるOpentypeフォーマット
文字の画像ファイルも併せて提供
各種文字コード間の関係や部首などの文字の基本情報を一覧で整理
変体仮名のフォントを提供し、文字情報基盤の運用を補助
ガイド
文字情報基盤導入ガイド
文字情報基盤導入
テクニカルスタディ
支援
ツール
文字縮退変換マップ(H26予定)
導入事例
調達仕様書記載例(H26予定)
文字データベース
普及セミナー
業務によって使うべき文字範囲の例示など基本的方針
符号化完了までの暫定運用推奨案
文字情報基盤からJIS第4水準までの縮退対応表
札幌市等での文字情報基盤導入実証の結果を整理
調達仕様書への記載例を提示
文字をだれでも使いやすくするデータベース
普及
23