インテリジェントコンテンツによる 情報の加工と利用

Download Report

Transcript インテリジェントコンテンツによる 情報の加工と利用

セマンティックコンピューティング
と認知ソフトウェア工学
産業技術総合研究所
情報技術研究部門
橋田 浩一
2005-07-31
セマンティックギャップ
 人間とコンピュータが意味を共有し
ていない。
 コンピュータが人間を理解できない。
 人間がコンピュータを理解できない。
 うまく協調できない。
2
コンピュータが人間を理解できない
 検索エンジンで欲しい情報が見付からな
い。無関係な情報が大量に出てきて関係
のある情報がほとんど出てこない。
 Webサイトを使いやすく構成し維持する
のが大変だ。
 社内メイルを禁止したら業績が上がった。
3
人間がコンピュータを理解できない
(コンピュータも自分を理解できな
い)
 Windows XPにサービスパック2を入れた
ら、どういうわけか無線LANにつながらな
くなった。
 MS Wordを使っていたら妙な点線が出て
きて消せない。
 イントラネットの中で業務ワークフローの
間の連携が取れない。
 デジタル編集技術が普及しない。
4
セマンティックコンピューティング
= Semantics-Oriented Architecture
 ガラス張りコンピュータ
 人間に理解できる意味に基づいてコンピュー
タシステムを設計・運用
 データモデル + プロセスモデル
 利用者に有意味なサービスを提供
 設計の最初から有意味
 検索要求を検索エンジンに正確に伝えられる
 利用者がシステムを理解・作成・改良
 利用者による改善 → 創発的最適化
5
エージェント
デバイス
情報家電
電子政府
翻訳
人事管理
要約
動的資源割当
プロジェクト管理
会計処理
セマンティック
オーサリング
ITS
ビヘイビ
空間推論
ア
マイニン
グ
プランニング
可能世界
シミュレーション
対話
音声認識
マルチエージェント
アーキテクチャ
意味的
アノテーション
ユビキタスプラットフォーム
グリッド
センサネット
6
画像理解
セマンティックプラットフォーム
オントロ
ジー
アドホック
無線通信
ネットワー
ク
ロボット
セマンティックサービス
意味検索
セマンティック
Webサービス
ユビキタス情報サービ
ス
プライバシ
セキュリティ
オントロジーと意味記述
オントロジー
= 概念階層 + 属性定義
クラス(概念)
非勤労者
ニート
市民
「勤労者」クラス
は「市民」クラス
に含まれる。
属性
勤労者
扶養者
主婦 ・・・ 学生
教師
会社員 ・・・ 個人業主
指導教官
小学生
8
中学生 ・・・ 大学生
「大学生」クラスのインス
タンスの「指導教官」属
性の値は「教師」クラス
のインスタンスである。
文書のオントロジー
クラス
市町村
公費負担者
様式第七
居宅介護
支援事業者
介護事業者
住所
名前
請求項目+
文字列
請求項目
属性
被保険者
要介護者
請求計算
請求計算
9
被保険者
番号
10
特許のオントロジー
制限
構成要素+
記述
技術内容
属性
前提
請求項
クラス
オープン型
請求項
11
クローズ型
請求項
ジェプソン型
請求項
オントロジーに基づいて
構造化された請求項
ジェプソン型
請求項A
イオン源(1)
構成要素
前提
構成要素
質量分析装置0
(1)からイオン
aを引き出す
質量分析部(2)
制限
構成要素
制限
(3)がcを検出して電気
信号として取り出す
構成要素
サブスリット(10)
電圧制御手段(12)
制限
制限
目的
(12)がV0の設定に
応じてVs、Vcをそれ
ぞれ決定する
12
要件
要件
イオン電子コンバータ(4)
電子検出器(3)
(2)がaを
質量分離
(2)がイオンbを取り出す
構成要素
構成要素
制限
要件
(4)がbを電
子cに変換
要件
(2)と(4)の間に(10)を配置
付帯条件
Vs=V0-k1
Vc=V0-k2
V0 = (1)に印加するイオン引出電圧
Vs = (10)に印加する電圧
Vc = (4)に印加するコンバータ電圧
k1とk2は定数
特許の明細書
検索質問Qのノードxごとに、リンクy-zが
データベースDに含まれてyのラベルがL
であるようなノードyとノードz∈F(x)が存
在するような、ラベルLのリストを、表示
部に表示する
displaying, on a display unit, a list of
labels L in which are present a node
誤った翻訳 z∈F(x) and a node y of which a link yz is contained in the database D and
of which the label y is L, for each of
the nodes x of a search question Q
13
意味構造による内容の明瞭化
検索質問Qの各ノードxについて、リストを
表示部に表示する
Lのリスト
yのラベルがLである。 z∈F(x)。
リンクy-zがデータベースDに含まれる。
displaying, on the display unit, a list
for each node x in retrieval query Q
正しい翻訳
List of L
The label of y is L. z∈F(x).
Link y-z is contained in database D.
14
制約に基づくコラボレーションの設計
 ビジネスルールをワークフロー(手続き)
ではなくオントロジー(制約)で定式化
 コンテンツの定式化も含む
作業中
状態
手番1
書込領域
15
遷移
状態
作業前
手番2
担当者
担当者
A氏
可
逆?
書込領域
B氏
セマンティックオーサリング
課題
 いかにして多くの利用者に(機械の代
わりに)意味構造化作業をさせるか?
 いかにして多くの利用者の知的生産
性を向上させるか?
 人間を創造に集中させる。
17
従来の文章による情報伝達
内容の復元に
多様な知識が必要
人間
伝えたい内容
文章作成
伝わる内容
文章
低精度
精度低
情報の欠落
順序化のコスト
18
人間
人間
伝わる
内容
コンピュータ
知的コンテンツによる情報伝達
内容の復元が楽
人間
伝えたい内容
セマンティック
オーサリング
粗粒度
知的
コンテンツ
伝わる内容
高精度
精度低
論理構造の保存
簡単な作業
意味処理可能
19
人間
細粒度
知的
コンテンツ
コンピュータ
人間
伝わる
内容
粗粒度知的コンテンツ
 セマンティックオーサリングの結果
 人間がわかりやすく作りやすい ・・・ 発想支援


伝えたい内容の構造を保存
文の順序等を決めなくてよい
対照
頭が痛い
胃の調子が良い
原因
原因
頭痛薬を飲む
原因
頭痛 が治る
20
セマンティックオーサリングは
文章作成より簡単(1/2)
対照
頭が痛い
胃の調子が良い
原因
原因
頭痛薬を飲む
原因
頭痛 が治る
21
セマンティックオーサリングは
文章作成より簡単(2/2)
 前頁の知的コンテンツと同じ内容の文章:
胃の調子が良かった。でも頭が痛かった
*
ので頭痛薬を飲んだら治った。
 前頁の原因に相当する関係*を反映する
ように書き換えるのは面倒:
胃の調子が良かったが頭が痛かった。
そこで頭痛薬を飲んだら頭痛が治った。
22
KJ法
川喜田二郎 (1967)
「発想法」中公新書.
23
Inspiration
24
発想支援システムによる
文章の品質向上
八木下 他 (1998)の実験
発想支援システム
でネットワーク型コ
ンテンツを作成
ネットワーク型コ
ンテンツに基づ
いて文章を作成
 見落としが少ない
 含まれる論点が多い
 考えが深まる
 推論の連鎖が長い
25
従来の発想支援システム
 意味的関係が規格化されていない
 ブレスト参加者か著者本人しかわからない
 共有・再利用が困難
 文章作成の手間
 見かけ上のコストが大きい → 普及せず
セマンティックオーサリング
 意味的関係の規格化
 共有・再利用が容易
 高精度の検索、要約、翻訳など
 文章生成の自動化
 コストが小さい → 普及
26
共同セマンティックオーサリング
駅前の違法駐
輪をなくしたい
解決案
解決案
駅の近くに駐輪
場を増設しよう
反対論
それ は経済
効率が悪い
違法駐輪車をす
ぐに撤去しよう
撤去した自転車
を6ケ月間保管
せねばならない
保管 する場所
が足りない
原因
28
反対論
原因
議論を支援するグループウェア
 IBIS, Coordinator, Open Meeting, etc.
 合議の効率化と品質向上




29
蒸し返し防止
同時多数発言可能
見落とし防止
議論の深化
従来のグループウェア
 グループワークにしか使えない
→ 普及せず
共同セマンティックオーサリング
 日常業務(個人用セマンティックオーサリン
グ)とグループウェアのシームレスな融合
 グループウェアのメリット
+ 高度な検索、要約、翻訳など
30
セマンティックプラットフォームのリッ
チクライアントとしてのセマンティック
オーサリング
ウィンドウシステム
セマンティックオーサリング
オントロジー
オペレーティングシステム
31
セマンティックプラットフォーム
認知ソフトウェア工学
認知ソフトウェア工学
 期待される適用領域
 エンタープライズシステム
 組み込みシステム
 コンテンツとプロセスのオントロジー
 人間の認知と親和性の高い概念体系
 プロセスではなく制約?
 簡単な仕様
 共同作業としてのソフトウェア作成
33
現場の能力を生かす業務システム
業務の意味に基づいてシステムを設計・運用
 漸進的・創発的な全体最適化
 利用者による改善の積み重ね
 業務と規程とシステムの擦り合わせ
 システム発注の明瞭化
 ベンダーロックインからの脱却
34
EA (Enterprise Architecture)
 組織を構成する人的資源、業務内容、組織、
社内で有する技術などの要素を整理し、階層
構造化することで、組織全体に対する組織の
状況オートマトン(situated
部分の構成要素の関係、組織の部分同士の
設計の原則と
automata)と本質的に同じ。
相互関係を明確にする。その上で、業務プロセ
しては当然。
スや取り扱うデータの標準化を行なう。
 1987年にJohn A. Zachman氏が提唱した情報
システムを設計するための枠組みが基礎と
なっており、1992年に情報システムだけでなく
組織全体を対象とするよう概念が拡張された。
(IT用語辞典 http://e-words.jp/w/EA.html)
35
グラスボックス vs. ブラックボックス
 知識循環型社会 vs. ユビキタス?
 ユビキタス

コンピュータが「見えない」のではなく「わかる」







36
Whenever people learn something sufficiently well, they
cease to be aware of it. (Weiser, 1991)
人間の活動を抑制するのではなく人間の能力を拡張
Cf. 東浩紀(2001) 動物化するポストモダン.
形式知 vs. 暗黙知?
モジュラリティ vs. 擦り合わせ?
プライバシ vs. セキュリティ?
自然なインタラクション?