プレゼンテーション

Transcript プレゼンテーション

1/15
1-2-9
ニューラルネットワークを用いた
母音範疇の獲得モデルに関する研究
日本音響学会 2007年秋季研究発表会
2007年9月19日
宮澤幸希, 白勢彩子, 菊池英明
早稲田大学人間科学学術院
研究の目的
生得か学習か、何を学ぶのか
2/15

言語認知のメカニズムを明らかにする
→ 学習過程に注目
→ 乳児の言語獲得能力の明確化を目指す


明示的なフィードバック（教示）を必要としない
話者や環境の変化に対して頑強
言語経験による
学習
？
生得的な
言語機構（制約）
言語獲得モデルによる学習実験
3/15
言語の獲得と知覚の
メカニズム
先行研究から得られた知見
母国語音韻体系の知覚
子音範疇化と母音マグネット効果
4/15
同
定
率
・
弁
別
率
[%]
100
90
80
70
60
50
40
30
20
10
0

カテゴリA 同定率

カテゴリB 同定率
2刺激の弁別率
1
2
3
4
5
刺激番号
6
図. 子音範疇化知覚

生後間もない乳児も
子音範疇を知覚
7
8

誕生直後：
言語間で共通の子音
生後7ヶ月：
母国語の子音のみ
生後6ヶ月で母国語の母音範疇を獲得（Jusczyk,2000）


子音ほど明確な範疇化知覚は示さない
異なる話者が発した母音も、同一の音として知覚
母国語音韻体系の知覚
生得的な制約と学習

生後6ヶ月の乳児は、2種類の人工音素を、
2分間の聴取で聞き分けた（Kuhl,2004）


5/15
きわめて短期間で、異なる範疇の存在を知覚
生得的な制約をもつメカニズムが、学習によって
特定の言語に最適化されるという考え


制約の例：聴覚系の応答特性？神経回路の配線？
学習の例：成人の音声の統計的分布
モデルによるシミュレーションを行なう
6/15
言語獲得のモデル
母音範疇の形成過程を再現するモデル
7/15
SOMの利用

Self-Organizing Maps（SOM,



Kohonen,1989）
大脳皮質感覚野の情報処理を参考に考案
入力信号の分布傾向を教師なしで分類可能
入力信号のカテゴリ数を推定可能
大脳一次聴覚野のモデル
として適当と仮定
母音範疇の獲得モデル

SOMモデルを使用してシミュレーションを行なう


母音体系と母音数の獲得過程
どの程度の学習量で獲得できるか
先行実験
有声・無声子音の獲得モデル
8/15



入力：成人英語話者のVOTの統計的分布
結果：SOMが獲得した有声・無声子音境界は、
人間の境界とほぼ等しかった（宮澤ら,2006）
結論：
言語獲得における /d/
同
自己組織的機構と、定率
(%)
統計的分布に
基づいた学習の
重要性が示された
100
Human
Chinchilla
SOM Model
80
60
40
20
0
0
10
20
30
40
VOT(ms)
50
60
70
80
母音範疇の獲得モデル
入力値と評価値

SOMの入力データ
入力データ




9/15
評価データ
日本語話し言葉コーパス（CSJ）講演再朗読音声
（60代男性）のF1, F2 （フレーム長： 20ms）
無音部、ノイズ部、エラーデータを除去
F1, F2, （F2-F1）、過去2フレーム分の
F1, F2, （F2-F1）を加えた9次元の特徴量
学習結果の評価データ

CSJの音素ラベルデータに基づき、母音中心を
正解情報つきデータセットを作成
母音範疇の獲得モデル
モデルの概要

制約なし条件（ -Bias モデル）



10/15
言語に特化した機構のないモデル
SOMは重み0で初期化
制約あり条件（ +Bias モデル）


分散収束理論に基づく母音体系のF1，F2
の値を
分散収束理論に基づく母音体系
入力として、あらかじめSOMの学習を行っておく
乳児の母音知覚能力が、一次聴覚野の神経細胞の
結合状態として生得的に備わっている、と仮定
母音範疇の獲得モデル
評価方法

母音範疇を求める



11/15
「密度ヒストグラムによるクラスタ数推定法（寺島ら,1996)」を使用
SOMのクラスタを統合して、カテゴリ数と境界を求める
評価データと比較して、正解率を求める
カテゴリ数：5
正解率：0.728
12/15
実験結果と結論
実験結果
各実験条件の結果
10
学習量10～100

－Bias
＋Bias
10
0
50
0
10
00
15
00
25
00
50
00
10
00
0
15
00
0
20
00
0
50
00
0
0.8
0.7
0.6
正 0.5
解 0.4
率 0.3
0.2
0.1
0

LearningSteps[回]

学習量100～1000

－Bias
＋Bias
制約あり（+Bias）の
ほうが正解率高、
母音数5に近い
制約あり（+Bias）と
制約なし（-Bias）の
差はなくなる
10
0
50
0
10
00
15
00
25
00
50
00
10
00
0
15
00
0
20
00
0
50
00
0
10
7
カ 6
テ 5
ゴ 4
リ 3
数 2
[個] 1
0
13/15
LearningSteps[回]
上表. 学習量とカテゴリ数
下表．学習量と正解率
14/15
まとめ


母音範疇の獲得過程を、生得的な制約を
除いた／仮定したモデルによって再現した
学習の初期段階では、制約が有効に機能した



言語獲得の初期段階において、
生得的な仕組みが効果的に働いている可能性
制約の種類に関しては、より詳細な検討が必要
学習が進行すると、生得的な制約のあり／なし
による差は少なくなる
15/15
今後の研究方針

範疇化知覚の獲得に関する詳細な検討



言語理解にとって、カテゴリカルな知覚形式は
どのような利点があるのか？
音声の統計的分布はどのような性質をもつか？
音韻全体の獲得過程を再現するモデル



必要な特徴量選択の問題
時間的に変化する特徴量の扱い
獲得した音韻情報の統合による単語の学習

プレゼンテーション

Transcript プレゼンテーション

Directory