機能構造とGUIを用いた 音声インタフェースのユーザビリティの改善
Download
Report
Transcript 機能構造とGUIを用いた 音声インタフェースのユーザビリティの改善
機能構造とGUIを用いた
音声インタフェースの
ユーザビリティの改善
小林研究室
実用化班4年
熊井 朋之
研究目的・背景
研究テーマ
様々なアプリケーションにおける
音声インタフェースのユーザビリティの改善
研究背景
音声インタフェース・・・一般的なインタフェースとして
認知されていない
既存の音声インタフェースの問題点
何と言っていいのか分かりにくい
(音声コマンドが分からない・想像したコマンド名とのミスマッチ)
音声入力の結果どうなったのか分かりにくい
(システムの状態遷移などの情報フィードバックの不足)
ユーザビリティの低下→使われないインタフェースに
提案手法
機能構造+GUIによるユーザビリティ改善
開く
機能構造
アプリケーションの持つ機能を
ツリー構造で記述
ファイル
ライブラリに追加
・・・
フルモード
表示
視覚エフェクト
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
再生
DL
・・・
・・・
メディアプレイヤー
オフ
オフ
提案手法
機能構造+GUIによるユーザビリティ改善
GUIによる情報提供
現在の状態
入力可能単語
認識結果 etc.
可視化
システム透過性の改善
システム理解の促進
システムを使用 (GUI、音声)しながらの
システム構造・音声コマンドの自然学習
パス探索
ツリー構造による記述
音声入力:コマンド推定からパス探索に
単語の連続入力や、ショートカットが可能な探索
探索範囲や厳密さの調整も可能
文法の自動作成
探索範囲からの文法の生成
単語順番の制限あり/なしの指定可能
開く
ファイル
・・・
•探索範囲や認識単語・文法を制限する
ライブラリに追加
フルモード
表示
再生
DL
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
•探索範囲や文法を制限しない
オフ
・・・
メディアプレイヤー
コマンドの位置が分からないときに探せる
視覚エフェクト
・・・
•認識精度の向上
•ユーザの意識する空間量軽減
•ツリー構造であることの印象大
オフ
パス探索
ツリー構造による記述
音声入力:コマンド推定からパス探索に
単語の連続入力や、ショートカットが可能な探索
探索範囲や厳密さの調整も可能
文法の自動作成
探索範囲からの文法の生成
単語順番の制限あり/なしの指定可能
開く
ファイル
・・・
•「再生」, 「音量」, 「上げる」
フルモード
表示
視覚エフェクト
メディアプレイヤー
DL
・・・
一時停止
上げる
音量
下げる
字幕
オン
・・・
再生
オフ
・・・
・・・
•「一時停止」
•「音量 上げる」
ライブラリに追加
オフ
実験
全機能をフラットに記述した音声インタフェースと提案手法の比較
実験タスク・・・アプリケーションの操作を想定した、
問題文からの該当コマンド名の検索
•その他被験者の振る舞いなど
90
80
70
達成率[%]
比較項目
•タスク達成率
•設問辺り達成時間
•アンケートによる主観的評価
1セット目
2セット目
100
60
50
40
30
20
•達成率:フラット2回目<ツリー1回目
初心者でも目的のコマンドを
実行できる可能性が高い
10
0
グループ1
フラット
グループ2
フラット
グループ1
ツリー
SystemResponceAccuracy
7
6
•アンケート評価:フラット<ツリー
グループ2
ツリー
グループ2ツリー
グループ2フラット
5
Speed
4
3
Likability
2
ツリーの構造の方が
使い勝手が良いと感じる人が多い
1
0
Cognitive
Demand
Habitability
Annoyance