Transcript 怒っているみたい
車内状況アウェアネスのための
感情音データベースの設計と評価
神戸大学
滝口 哲也 有木 康雄
対話システム
現状:
ユーザの心理状態によらず,一定の応答
目的地を入力
して下さい.
将来:
柔軟な応答
(怒っているみたい)
どうしましたか?
感情に注目し,「その場を読むシステム」
目的
入力:ユーザからの音だけを聞く
「状況や雰囲気を察する」
「場を読む」
(車内)状況アウェアネス
「気分が良さそうだ」,「疲れているみたい」
「普通だな」,
「怒っているみたい」
発表内容:感情音データ収録内容,予備実験結果
感情データベース
「状況」や「感情」を設定し,即興で発話を行う.
1.好きな音楽が流れて喜んでいる.
2.テレビに流れている情報を見て,喜んでいる.
または,ラジオ等を聞いて喜んでいる.
3.外の景色を見て,気分が良い.
4.渋滞等で,いらいらしている.
5.仕事や遊びで疲れている.
6.眠気がしている.
感情データベース(2)
「状況」や「感情」を設定し,即興で発話を行う.
7.道を間違えた.
(他人の指示が間違えていた.怒っている.)
8.道を間違えた.(自分のミスで間違えた.)
9.気分が良い.うれしい.楽しい.
10.疲れている.
11.怒っている.
12.通常な状況.
各自が任意の
状況を設定.
収録データ
状況4(渋滞でいらいらしている)
状況11(怒っている)
「甲子園での阪神ー巨人戦 観戦の帰り.
優勝がかかっているのに誤審により阪神は負けた.」
状況11(怒っている)
「必要以上のクラクションを相手の車に鳴らされた.」
収録背景
感情識別
特徴量 : ピッチ,パワー,MFCC
(言語情報)
「怒り」
「通常」
実験結果
Recognition rate [%]
「怒り」と「通常」の識別
95
90
85
80
75
70
Pitch+Power
MFCC
LDA+MFCC
まとめ
車内状況アウェアネスのための感情音データ
ベースの内容について述べた.
今後:
感情識別・(除去)に適した特徴量
表情データの利用
被験者の年齢層・男女別人数
25
[人数]
20
15
男性
女性
10
5
0
10代 20代 30代 40代 50代
頻度
発話時間の分布
90
80
70
60
50
40
30
20
10
0
5
15
25
35 45
時間 [sec]
55
65
収録条件
サンプリング周波数
44 kHz
量子化ビット数
24 bit
マイクロフォン
SONY ECM-66B
Hi-Visionカメラ
Victor GR-HD1
(1280×720)
収録データ
状況2(喜んでいる)
「テレビCM: QPパスタソースたらこを見ている.」
状況9(気分が良い.)
「甲子園での阪神ー巨人戦 観戦の帰り.
この日,阪神は優勝を決めた.」
状況設定例