presentation

Download Report

Transcript presentation

リスクコミュニケーションのための
情報共有支援システム
静岡大学工学研究科システム工学専攻
前田研究室2年 5063-0311 松田和道
2015/10/5
背景と目的
静岡県島田市

東海地震
地域リスクに対するリスクマネジメント・リスクガバナンス
リスクコミュニケーションが不可欠

リスクマネジメントの調査・分析
リスクコミュニケーション・情報共有の必要性
「eコミュニティしまだ」


地域の人々の活動を支援(blogで情報発信)
情報を共有することで地域の人々を結びつける
リスクコミュニケーションを行うことができる関係作り
「eコミュニティしまだ」での情報共有を
情報共有が必要
支援する情報システムの構築
2
研究方法

eコミュニティしまだの現状分析

情報共有支援システムの設計

情報共有支援システムの構築
3
eコミュニティしまだの現状分析

現在の情報共有支援






問題



共有ポータル:各コミュニティのHPへの共通の入口
WebGISの共有:各コミュニティが投稿した地図情報を1つの地図に集約
管理人ぶろぐ:関連する記事の紹介
イベント:交流の機会を与える
eコミカフェ:交流拠点
記事の独立
同じ話題について書かれた記事があるが、その記事を書いた人の間でコ
ミュニケーションがない
コミュニティ間の連携の不足
Web上の関係だけでない顔の見える信頼できる関係への発展の不足
記事間の関係、コミュニティ間の関係を可視化
記事・コミュニティを結びつけ、情報共有
4
可視化による情報共有支援
  記事間の関係、コミュニティ間の関係を可視化
気になる記事や気になるキーワードから類似する記事を可視化
自分の記事に類似する記事、興味のある記事に類似する記事の発見
情報共有支援システム
コミュニティの活動内容や興味のある話題の発見
活動内容や興味に共通点を持ったコミュニティの発見
トラックバック
eコミュニティしまだ

関連記事
気になる記事
類似
気になる記事
コミュニティ間の情報のやり取りの促進、連携
気になるキーワード
…
関連記事
関連記事
自分の記事に興味を持って
くれているコミュニティの発見
蓄積された大量の記事
文書間の関連を視覚的に表示
図1:情報共有支援のイメージ
5
情報共有支援システム
情報共有支援システム
クライアント
Webブラウザ
サーバ
“入力”
記事、キーワード
検索機能
① 単語→記事連想検索
② 記事→記事連想検索
(テキスト入力フォームから)
eコミュニティしまだ
③ 記事→記事連想検索
(TouchGraphから)
HTTPリクエスト
“TouchGraph”
記事グラフの生成
“XOOPS”
“GETA”
類似する記事の計算
“表示”
記事グラフ
計算結果
CGI
記事の詳細情報
記事情報
記事
図3:情報共有支援システムのUI
blogモジュール
“WordPress”
RSS
図2:情報共有支援システムの概要
記事情報
1回/日
6
TouchGraph

グラフィックベースでデータを表示するオープンソー
スのJavaプログラム


構成



Java applet
Webブラウザで表示可能
ノード(文字列を表示)
ノード間を繋ぐ枝
特徴

グラフに対してユーザが操作可能
ノードの移動、グラフの移動・拡大
・縮小・回転が可能
図4:TouchGraphの表示例
http://dss.sys.eng.shizuoka.ac.jp/rsdss/
7
汎用連想計算エンジンGETA

大規模かつ疎な行列を扱う、サーバ側で動作する
計算エンジン(C言語ライブラリ)



ネットワークを通じて複数のPCから作業可能
Perlモジュール
CGIを用いて計算結果を動的に
単語
Webページへ反映
w1 w2 w3 w4 w5 w6 …
WAM(Word-Article Matrix)

行や列に固有の属性を付加
行:文書 列:単語
文書間の類似性(近接度)の計算
文
書
d1
d2
d3
d4
d5
d6
:
3
1
1
2
2
4
5
1
7
図5:WAMのデータ構造
8
汎用連想計算エンジンGETA

Singhalの方法

単語と文書の間の類似度の計算
文書(記事)→単語連想検索
単語→文書(記事)連想検索
対象データ文書集合D
の中の選択された
文書集合Sにおける
各語tの類似度w(t|S)

N  1
w ( t | S )  log 1 
*
df
(
t
)

 #S
単語の数をn個とし、
それらの単語を
t1,…,tnとしたとき、
文書bの類似度s(b|{ti})
 v (t | d )
d S
N : D の文書総数
df ( t ) : D における単語
s ( b | {t i }) 
t を含む文書数
# S : S に含まれる文書数
v (t | d ) 
L  0 . 2 * [ dlen ( b )  L ]
*
dlen ( b ) : 文書 b の中の異なり単語種類
1  log[ tf ( t | d )]
L : 文書 D における文書の異なり
1  log[ tf (. | d )]
tf ( t | d ) : 文書 d における単語
1
1
n
 w (t
i
| s ) * v (ti | b )
1 i  n
数
単語種類数平均値
t の頻度
tf (. | d ) : 文書 d の全ての単語に関する
上記値の平均値
9
eコミュニティしまだのデータ構造

メインシステム


XOOPS
 オープンソースのCMS(コンテンツマネジメントシステム)
blog機能

blogモジュール「WordPress」
 記事情報をRSSフィード(RSSで記述された文書)として公開

RSS:Webサイトの見出しや要約などのメタデータ(データについての情
報を記述したデータ)を構造化して記述するフォーマット
記事に関するほぼ全ての情報が入手可能
 コミュニティごとに最新の記事10件分の情報しか取得できない
古い記事データ:htmlファイルから取得
RSSフィードから記事データを取得
10
システムのUI

ノード





記事タイトルを表示
コミュニティ名と作成年月日をポップアップ表示
ダブルクリックで記事本文を開く
GETAが計算した類似度の高い最大30件の記事
枝



トラックバック(赤色)
類似関係(近接度で分類)
 強(緑色):平均値以上
 中(水色):{(平均値+最小値)÷2}以上、平均値以下
 弱(灰色):{(平均値+最小値)÷2}以下
近接度
 文書XとYが含んでいる単語のうち共通部分(ともに含む単語)の割合
Pxy 

F xy
F x  F y  F xy
Pxy:文書xと文書yの近接度
Fxy:文書xおよび文書yが共に含んでいる単語の数
Fx:文書xが含む単語の数
Fy:文書yが含む単語の数
全てのノードが連結するまで生成される
11
評価
キーワード「地震」で検索
「しまだ環境ひろば ごみ分科会」の記事

防災対策にも風呂敷が利用できる
しかし…
左側の塊は

コメントもトラックバックもない
たくさんの記事に埋もれてしまう可
能性のあった記事を発見

地震の影響があった、あるいは影響がありそ
防災にも関心
うな場所についての記事の集合

2つのコミュニティで異なる時期(2005年12月
~2006年5月)に散発的に投稿されたもの
複数のコミュニティが共通の話題で繋がり、
時期の異なる記事にも繋がりがある
図6:キーワード「地震」で検索した結果
12
結果および考察
評価によって得られた本システムの特徴

記事の繋がり、コミュニティの繋がりを可視化できる
eコミュニティしまだで活動している人々、コミュニティを結びつけることを可
能にする情報共有支援の重要な要素の達成

複数のコミュニティの記事、時期の異なる記事を1つのグラフに表示できる
 意外な記事、意外なコミュニティとの繋がりの発見
 埋もれてしまいそうな記事のピックアップ
様々なコミュニティへの関心を高める可能性

入力したキーワードに関連する記事だけでなく、入力したキーワードに関
連するキーワードに関連する記事も発見できる
 関連のある幅広い記事の提供
新しい繋がりの発見、興味を生み出す助けになる可能性
13
結論

eコミュニティしまだで活動している人々、コミュニティを結び
つけることを可能にする情報共有支援
可能である可能性を示せた

今後に期待
人々に繋がり、コミュニティに連携

リスクコミュニケーションの支援
RSSの利用
サーバに与えるデータベースの更新作業の負荷を削減
汎用性を高めた
<課題>
検索条件の設定
 自由な検索
指定した種類の枝の表示・非表示
 枝の視認性の改善
 記事間の類似関係の詳しい把握
共有しているキーワードの表示
14
ご清聴ありがとうございました
eコミュニティしまだ

ICTを用いて地域の
様々な活動を支援


利用
WebGIS
blog
Blog
WebGIS
防災訓練
ハザードマップ作成
市民・コミュニティを結びつけ、
リスクコミュニケーションを支援
図1:eコミュニティしまだで書かれた記事
http://www.community-platform.jp/
16
共有ポータル

市民の活動を結びつけるために、共通の入り口である「共有ポータ
ル」と呼ばれるホームページが用意されている
最新の投稿記事
参加グループ一覧
図:eコミュニティしまだ(共有ポータル)
http://www.community-platform.jp/
ハザードマップ

住民たちが現地踏査などを基にワークショップで話し合い、作成した
ハザードマップを電子化したもの
図:eコミュニティしまだ(ハザードマップ)
http://www.community-platform.jp/
事例 ~コミュニティ間の連携~
19
eコミュニティしまだ

活動グループ数



7グループ(開始当時:2004年12月)
23グループ、合計人数126人(2006年2月)
40グループ、合計人数126人(2007年12月)
表:アクセス数(抜粋)
2004年10月
2004年11月
2006年10月
2006年11月
2007年10月
2007年11月
2007年12月
1ヶ月合計 セル
Files
数
74
0
20,931
0
767,500 26
837,119 26
979,934 36
901,684 36
1,016,097 36
(H19.12.31 現在)
20
近接度

ノード間をつなぐ枝の生成
文書間の類似関係を表す類似性尺度の検討が必要
単語
w1
d1
w2
w3
3
1
w4
w5
w6
d2
d3
文書
2
d4
1
2
5
1
共起度
異なる2つの単語が同じ
文書に出現する数
逆
4
d5
d6
…
7
文書間の類似度
異なる2つの文書に出てくる
同じ単語の種数
:
図:WAMにおける共起度と文書間の類似度
21
WAMの構造
表:WAM
行のname\列のname Ci
Ra
3
Rb
0
Rc
0



WAMは行列形式でできており、行に文書、列に単語が割り当てられ、行
列の要素は、文書内の単語の出現回数が保存されている
各行および列には通し番号(ID)が割り振られており、それぞれのIDは
対応する固有の名前(name)を持っている
WAMはCWとXRからなる



Cii Ciii Civ
0 2 1
1 5 0
0 4 3
表:CW
ID
1 2 3 4
行のname Ra Rb Rc
列のname Ci Cii Ciii Civ
XRの管理
行1: elem_num=3, freq_sum=6, (列=1,値=3), (列=3,値=2), (列=4,値=1)
行2: elem_num=2, freq_sum=6, (列=2,値=1), (列=3,値=5)
行3: elem_num=2, freq_sum=7, (列=3,値=4), (列=4,値=3)
列1: elem_num=1, freq_sum=3, (行=1,値=3)
列2: elem_num=1, freq_sum=1, (行=2,値=1)
列3: elem_num=3, freq_sum=11, (行=1,値=2), (行=2,値=5), (行=3,値=4)
列4: elem_num=2, freq_sum=4, (行=1,値=1), (行=3,値=3)
*elem_num:値が 0 でないその行(列)の要素の数
freq_sum:その行(列)の値の合計
CW: IDとnameの対応表
XR: 文書内の単語の出現回数を管理するファイル
XRでは、ゼロである要素は省略して管理される
疎な行列の場合、ゼロである要素が多いため、データ量が少なくて済む
WAMの構造は大規模かつ疎な行列を扱うのに適している
GETAは大規模かつ疎な行列に対して高速な計算ができる
22
eコミュニティしまだの
関係者からの意見

eコミュニティしまだに必要なシステム



しかし、今までこれをやる人材も時間もなかった
情報共有支援の1つになると考えられる
eコミュニティしまだで、記事の紹介などを行っている“編集者”
にとってとても助かるシステムである

昔の記事などを思い出して書くのも大変

強い自明な繋がりよりも、編集者も気付かない弱い繋がりが見
えると嬉しい

編集者それぞれ違った検索結果になると、面白い
23
可視化による情報共有支援

可視化方法の調査、検討
情報共有支援に必要なユーザインターフェースの要素の整理
表1:情報共有支援に必要なユーザインターフェースの要素
表示内容
・記事間の関係
・コミュニティ間の関係
表示の形
・ネットワーク図 or 散布図 or それらの組み合わせ
・2次元 or 3次元
文書間の関係
・文書と単語の関係
・トラックバック(ハイパーリンク)
プレゼンテーション機能など
・拡大、縮小、視点の移動
・関係線の種別化
・文書内容の閲覧
・グラフ以外の情報の表示
“参考文献”
前田恭伸(2006)
Yasunobu Maeda, Norio Kurita,
Saburo Ikeda(2006)
Patricia A. Medvick and
A. J. (Gus) Calapristi(2003)
松平淳(2006)
古谷寿基(2006)
大澤幸生(2006)
渡部勇(2001)
柴山悦哉(2001)
松尾利行(1997)
北田佳明(2007)
豊田純一(2007)
24