PPT - 慶應義塾大学 徳田研究室

Download Report

Transcript PPT - 慶應義塾大学 徳田研究室

俺デスク:ユーザ操作履歴に基づく
情報想起支援ツール
慶應義塾大学
大澤亮,高汐一紀,徳田英幸
アウトライン








背景・問題意識
目的
アプローチ
提案ソフトウェア概要
設計・実装
検証
機能拡張
まとめ
背景

近年,様々な情報が電子化され,ユーザはPC上で多くの
データを閲覧するようになった
– 文書,画像,音声

ユーザは過去読んだデータを再度読む可能性がある
背景

例えば...論文を作成していたとする
.....
問題意識

手動操作による階層
– ユーザが分類する手間
– 階層化の限界



分類Aにも分類Bにも当てはまる
分類Aにも分類Bにも当てはまらない
時系列順にソート
– 状況によっては有効だが,データが大量になると発見が困難
目的
–
–
–
–

忘れっぽい性格である.
整理が苦手である.
メモを取ったりするのが苦手である.
何回も同じ論文をダウンロードしている気がする...
通常作業中のユーザに手動操作を要求しない手
法で,履歴データ検索を効率化する
アプローチ

ユーザがデータを探す際,様々な検索クエリが投げられ
るようにする
– データのメタ情報を増やす

データを見つけやすいように視覚化する
アプローチ - 関連研究

大阪市立大学の前田氏による興味空間ブラウザ
– 数量化Ⅲ類を用いた
意味分類
意味的な分類と併用
は可能

アプローチ

過去の履歴を検索するにあたっては,ユーザは自分自身
の行動を思い出しながら探し出す
ユーザのPC上での操作をロギングし,データに
メタ情報を付加していけば検索を効率化できるの
ではないか
アプローチ① データ着目度


ユーザが過去に注目したデータを上位
にするようにソート
着目したデータを再度閲覧する可能性
が高いためある程度有効
よーく見ていた
ファイルのみ
探したい
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
アプローチ② データ間関連度

データ同士の関連性を算出する.
– 関連性を利用し「hoge.doc」を作っていたときに参照していたWeb
サイトを探すといったことが可能
– 記憶は連想からなるので有効
hoge.doc
関連検索
提案ソフトウェア(俺デスク)

ユーザの忘れかけた記憶を掘り起こしてくれるソ
フトウェア
– 着目度を利用したタイムラインビューア
– 関連検索ツール
着目度を利用したタイムラインビューア
着目度算出に利用するユーザ操作

データアクセス
–
–
–
–

アクセス時間
アクセス回数
クリップボード使用回数
選択文字列反転回数
スクリーンセーバの起動をフック
– ユーザが席を離れていないか監視

ウィンドフォーカスの変更
– ウィンドウにフォーカスがあたっているか
オプション(相関を利用したフィルタ)

ユーザが明示的にレーティングしたデータに対してユーザ操作との相
関を求めフィルタを作成する
ユーザA
ユーザB
タイムラインビューア - 関連研究

タイムマシーンコンピューティング
– Sony CSL 暦本氏
関連検索ツール
企画書を作っていたときに
参照していたWebページを
見つけたい!!
企画書
関連検索
関連度算出に利用するユーザ操作

データアクセス
– 同時刻に参照していたデータは関連が深いとする.

クリップボード利用
– データAでクリップボードにコピーし,データB にペーストした場合,
データA とデータB は関連が深いとする.
ああああああ
ああああああ
aaa.doc
bbb.doc
関連検索ツール
関連検索ツール – データの分類
検索対象がaaa.docだった時...
検索対象との
関係を表す
aaa.docに対してコピー源,カット源となっている
aaa.docからコピーし,ペーストしたデータ
頻繁にカット&ペーストを行っている(マージ作業と推定)
データの性質
を表す
ユーザは主にreadしていた(write作業がなかった)
ユーザはwrite作業を行っていた
もっと増やす予定...
設計 - システム概要
ユーザ
関連検索および時系列ビューア
メタ情報
データベース
俺デスク
イベント通知
オペレーティング
システム
プラグイン
アプリケーション
設計 - フックするOSのイベント



Fileへのアクセス,ファイルの移動,削除,コピー
スクリーンセーバ
ウィンドウフォーカス
– 実はほとんどのアプリケーションで開いているファイル名がウィン
ドウタイトルに表示される
設計 - プラグイン

Internet Explorer
– IEツールバー

Microsoft Office
– アドイン形式(ATLで実装)

Open Office
– Open Officeサービスマネージャ

Firefox
– Firefox Extension

Skype
– Skype APIを利用(通話履歴などの取得)

MSNメッセンジャ
– xmlとして保存された会話履歴をパースする
実装環境
対応OS
Windows 2000/XP
実装言語
Visual C++
イベント監視対象
(OS)
ウィンドウフォーカス,クリップボード,
マウス,キーボード,ファイルアクセス
イベント監視対象
(アプリケーション)
オフィス(Open Office, MS Office),
ブラウザ(Firefox, Internet Explorer),
メッセンジャ(MSN Messenger),VoIP(Skype)
イベント監視対象
(実世界)
電話(Skype Phone),
電子ペーパー(mimio)
使用ライブラリ
SQLite, Google Desktop SDK
検証

関連度
実験1.関連検索は有効に働くか

着目度
実験2.今回利用したユーザ動作は適切だったか
実験3.相関を利用したフィルタは有効に働くか
被験者基本情報

数日間,俺デスクを使い,履歴を蓄積する.
被験者数
15人
平均年齢
22.0才
性別(男:女)
平均PC歴
一日平均PC作業時間
2:1
5.1年
6.6時間
実験1.関連検索は有効に働くか
1.OpenOfficeで「世界の携帯電話」と言うタイトルでレポートを作成して
もらう(制限時間15分)
2.レポート作成中に参考にしたWebサイトのURL(5個)をレポートに記入
してもらう
3.レポート名をキーにして関連検索を実行する
4.記入したURLが俺デスクの結果として何位に表示されるか調べる
実験1.実験結果と考察
参考文献URL表示順位(位)
平均値
最小値
12.3
最大値
6.25
中央値
43.5
10.4
平均母集団312.5
実験2.利用したユーザ動作は適切だったか
1.一定時間ニュースサイトを参照し,各ページをレーティン
グしてもらう.(15分間)
2.興味深いと思ったページのレートを上げ,どうでもいいと
思ったページのレートを下げる
3.レートの値と各項目の相関係数を算出する.
実験2.実験結果と考察
着目度
項目
平均値
最低値
最大値
項目
アクセス時間
0.36
0.05
0.87
アクセス回数
0.25
0.03
0.49
選択文字列反
転回数
0.04
-0.23
0.41
各項目と着目度の相関係数(-1~1)
実験3.着目度を用いたフィルタは有効に働くか
1.実験2で算出した相関係数を基にフィルタを作成する.
2.実験1で作成したレポートをキーにして再度関連検索を
行う.
3.実験1の結果と比較する
実験3.実験結果と考察
参考文献URL表示順位(位)
平均値
最小値
12.3
最大値
6.25
中央値
43.5
10.4
フィルタ使用時の参考文献URL表示順位(位)
平均値
最小値
10.8
最大値
6.2
中央値
33.5
7.4
機能拡張

バージョン管理

ユーザコンテキストサーチ

プライバシへの考慮

グループウェア拡張
まとめ


ユーザの忘れかけた記憶を掘り起こしてくれるソ
フトウェア「俺デスク」を実装中である.
本日デモ展示いたしますので,是非手に触れて
ご利用ください.