卒論発表.ppt

Download Report

Transcript 卒論発表.ppt

リスク情報サイト横断検索システム
静岡大学システム工学科 前田研究室
50613042 高柳真吾
研究背景
地震災害
・静岡県を中心とした地震防災対策強化地域では東
海地震による深刻な被害が予想される。
自助・共助・公助
・防災対策には行政による「公助」、自分の身を自分
で守る「自助」、地域や身近な人で助け合う「共助」
の連携が必須である。
研究背景と目的②
・情報共有による自助・共助・公助の連携
事前に公助による防災情報を知っておくことで災害時に
自助・共助で適切に防災活動を行う。
・情報共有の必要性
様々な防災機関で配信されている防災情報は防災機関
同士の連携が不足している面もあり情報提供に改善の
余地がある。
共有化した防災情報を利用者に提供することで
利用者の自助、共助能力の向上を目指すシステム
の構築を行う。
先行研究
共助を支援するシステム
中野[1]は島田市の市民活
動団体のブログポータルサ
イト「eコミュニティしまだ」の
記事の関連性を図示する
ことで、リスクコミュニケー
ションをし易い関係づくりを
支援した。
リスク情報サイト横断検索システム
中野のシステムを基に、防災情報に特化したシステムを構築する。
・概要
地震防災対策強化地域の住民に複数の防災
機関が配信する情報を共有化した情報を提供
する。
↓
災害時の自助共助能力を向上を支援する。
リスク情報サイト横断検索システム
検索窓の解説
「防災」と入力
防災
検索窓
図2:リスク情報サイト横断連想検索システム
検索窓にはキーワード
(文章でも構いわない)、
もしくは記事URLを入力
することができる。
検索ボタンを押すと
・浜松市の災害情報
・静岡県の災害情報
・気象庁 地震津波
・内閣府一日前プロジェ
クト
上記の四つのwebサイト
から検索ワードとの連想
検索を行う。
リスク情報サイト横断検索システム
関連ワードの解説
防災 対策
図3:リスク情報サイト横断連想検索システム、関連ワード表示部
検索された記事の中に含まれる単語で重要性の高いものを関連
ワードとして、最大50件表示する。
キーワードをクリックすることで検索窓に入力でき、これを用いて
再検索することができる
リスク情報サイト横断検索システム
グラフの解説
連想検索ボタン
図4:リスク情報サイト横断連想検索システム、グラフ表示部
これはノードといい、記事を表している。ダブルクリックすることで
別ウインドウでその記事を表示する。
ノードを一件指定して連想検索ボタンを押すことで指定したノードの記
事に対して類似度の高い記事を再検索することができる。
これは枝といい、記事と記事のつながりを表す。最大
20本表示する。
色の違いで文書の繋がりの強さを区別している。
連想検索
通常の単語検索はクエリ単語の出現回数から適合する文
書を判断するが、連想検索は各文書の単語の出現パター
ンから適合する文書を判断する。
連想検索
類似度計算 記事→単語連想検索
関連ワードを探し出す計算
対象データの文書集合Dの中の選択された文書集合Sにおける各語 t の類似度ω(t|s)
関連ワードを抽出する文書群(#S )対して 対象の単語(t) を含む文書が少ない、かつ
対象の単語(t) を含む文書の中で t の頻度が高ければ類似度が高いと判断する。
N :
df(t) :
#S :
Dの文書総数
Dにおける単語tを含む文書数
Sに含まれる文書数
tf(t|d):文書dにおける単語tの頻度
tf(.|d):文書dのすべての単語に関するtf(t|d)の平均値
連想検索
類似度計算 単語→記事連想計画
文書を単語の集まりとし、データベースから類似度の高い文書を選ぶ計算。
単語の数をn個とし、それらの単語をt1,…..,tn としたときの文書bの類似度。
文書を構成する単語の平均類似度を求めている。
文書の長さによる単語の種類の増加と単語の頻度の増加を考慮し、Shinghalの
文書長正規化を用いて補正している。
n
文書長正規化
dlen(b):文書bの中の異なる単語の種類数
L: 文書集合Dにおける文書の異なる単語種類平均値
近接度計算
• Touchgraphで記事間の枝を表示するために計算する。
• 繋ぐ記事2件が含む総単語数に対して、共通の単語数
(Fxy)が多ければ文書間に高い近接度があるとする。
: 文書xと文書yの近接度
: 文書xと文書yが共に含む
単語の数
: 文書xの持つ単語の数
: 文書yの持つ単語の数
結果及び考察 「避難」をキーワードに入力した場合
図5:「避難」をキーワードに入力した場合の出力
結果及び考察 「避難」をキーワードに入力した場合
出典: http://blogs.yahoo.co.jp/hamamatsu_saigai/24224722.html
「舞阪及び雄踏地域に避難勧告を発令」
・静岡県は市をひと括りに避
難
勧告を出している。対して浜
松市は市内の各地域に避難
勧告を出している。
・浜松市は市内の防災訓練情
報を配信している。静岡県は
県内の防災訓練情報の他に
防災機関の国民保護訓練の
情報を配信している。
防災機関の役割と影響の範
囲が読み取れる
出典: http://blogs.yahoo.co.jp/shizuoka_saigai/42787158.html
【訓練】避難勧告等発令情報(防災局発表)
結論
考察より
・利用者に知りたい防災情報の総合的な知識を提供
する。
・利用者にそれぞれの防災機関が行う防災対策の違
いを認識させる。
というシステムの目的を満たしていることを示せた。
対象とする防災機関を増やすことで、より実用的な
システムになると考えられる。
ご清聴ありがとうございました
結果及び考察
• 記事
「バイオトイレの寄贈がありました」
で検索した結果
直接関係のある物資の話題の記事
の他に、「バイオトイレの寄贈がありま
した」の記事の背景にある、避難所の
話題、医療の話題に関する記事を検
索した。
ユーザは意図した情報に関連する情
報を収集することが出来、総合的な
防災情報を得ることが出来ると考えら
れる。
図6:記事「バイオトイレの寄贈がありました」
を入力した場合の出力
TouchGraphとGETAの応用
• TouchGraph
グラフ表示に利用した
Javaプログラム
Java appletとして利用
出来るためWebブラウ
ザ上で利用者がグラフ
を操作することができ
る(拡大、枝の伸縮、
グラフの回転等)
図4:TouchGraph
近接度計算
• Touchgraphで記事間の枝を表示するために計算する。
• 単語の数の割に共通の単語数(Fxy)が多ければ文書間に高い近接度が
あるとする。
: 文書xと文書yの近接度
: 文書xと文書yが共に含む
単語の数
: 文書xの持つ単語の数
: 文書yの持つ単語の数
連想検索
汎用連想検索エンジンGETA
本研究ではデーターベース保存、
文書検索、関連ワード抽出に使用
した。
文書と単語頻度の関係をWAMと
呼ばれる仮想的な行列で表現す
ることにより、文書検索のための
必要な要素を効率よく収集し、
文書検索と関連ワード抽出に利用
する類似度を計算する。
図4:WAMイメージ
出典: http://blogs.yahoo.co.jp/hamamatsu_saigai/24224722.html
「舞阪及び雄踏地域に避難勧告を発令」
出典: http://blogs.yahoo.co.jp/shizuoka_saigai/42787158.html
【訓練】避難勧告等発令情報(防災局発表)