怒っているみたい

Download Report

Transcript 怒っているみたい

車内状況アウェアネスのための
感情音データベースの設計と評価
神戸大学
滝口 哲也 有木 康雄
対話システム
現状:
ユーザの心理状態によらず,一定の応答
目的地を入力
して下さい.
将来:
柔軟な応答
(怒っているみたい)
どうしましたか?
感情に注目し,「その場を読むシステム」
目的
入力:ユーザからの音だけを聞く
「状況や雰囲気を察する」
「場を読む」
(車内)状況アウェアネス
「気分が良さそうだ」,「疲れているみたい」
「普通だな」,
「怒っているみたい」
発表内容:感情音データ収録内容,予備実験結果
感情データベース

「状況」や「感情」を設定し,即興で発話を行う.
1.好きな音楽が流れて喜んでいる.
2.テレビに流れている情報を見て,喜んでいる.
または,ラジオ等を聞いて喜んでいる.
3.外の景色を見て,気分が良い.
4.渋滞等で,いらいらしている.
5.仕事や遊びで疲れている.
6.眠気がしている.
感情データベース(2)

「状況」や「感情」を設定し,即興で発話を行う.
7.道を間違えた.
(他人の指示が間違えていた.怒っている.)
8.道を間違えた.(自分のミスで間違えた.)
9.気分が良い.うれしい.楽しい.
10.疲れている.
11.怒っている.
12.通常な状況.
各自が任意の
状況を設定.
収録データ

状況4(渋滞でいらいらしている)

状況11(怒っている)
「甲子園での阪神ー巨人戦 観戦の帰り.
優勝がかかっているのに誤審により阪神は負けた.」

状況11(怒っている)
「必要以上のクラクションを相手の車に鳴らされた.」
収録背景
感情識別
特徴量 : ピッチ,パワー,MFCC
(言語情報)
「怒り」
「通常」
実験結果
Recognition rate [%]
「怒り」と「通常」の識別
95
90
85
80
75
70
Pitch+Power
MFCC
LDA+MFCC
まとめ
車内状況アウェアネスのための感情音データ
ベースの内容について述べた.
今後:
感情識別・(除去)に適した特徴量
表情データの利用
被験者の年齢層・男女別人数
25
[人数]
20
15
男性
女性
10
5
0
10代 20代 30代 40代 50代
頻度
発話時間の分布
90
80
70
60
50
40
30
20
10
0
5
15
25
35 45
時間 [sec]
55
65
収録条件
サンプリング周波数
44 kHz
量子化ビット数
24 bit
マイクロフォン
SONY ECM-66B
Hi-Visionカメラ
Victor GR-HD1
(1280×720)
収録データ
状況2(喜んでいる)
「テレビCM: QPパスタソースたらこを見ている.」
状況9(気分が良い.)
「甲子園での阪神ー巨人戦 観戦の帰り.
この日,阪神は優勝を決めた.」
状況設定例