Transcript 声が作られる仕組み
発声のしくみ -声道の共鳴と音源の生成- 音声生成のプロセス 音源には言葉の音色はなく、声道(口の中)で音が共鳴 することにより音色が作られる 母音、子音の生成プロセス 声道音響管 声道模型教材VTM-10 筒型声道模型 プレート型 声道模型 電気式人工声帯 笛式人工声帯 人間 筒型声道模型の断 面積変化を人間の 声道形状に投影 円形と長方形の 断面積の比較 声道は屈曲 *Chiba & Kajiyama ,The Vowel Its Nature and Structure ,1941 声道共鳴のしくみ 唇から反射してきた波が声帯の位置で増大する 振幅 空気体積速度の分布パタン 声道内の位置 声帯 時間 唇 音源信号 均一音響管の共鳴 音速=34000cm/秒 共振周波数=音速/波長 17cm 34000/(17×4)=500 Hz 34000/(17/1.25)=2500 Hz 3400/(17/0.75)=1500 Hz 34000/(17/1.75)=3500 Hz 均一音響管の音声スペクトル 声道の音響特性 母音のスペクトログラフ ホルマント周波数 F3 F2 F1 母音のスペクトル包絡 ホルマント周波数 F1 F2 F3 F4 母音のホルマント周波数 母音5角形 ホルマント周波数の相対的配置は、 舌の相対的対置と一致する 声道断面積 声道断面積関数 唇 声帯 MRI3次元画像による 声道断面積の計測 声道断面積と声道共鳴特性 /i/ /a/ 声道断面積関数 唇 声帯 声道共鳴特性 (音声スペクトル) /u/ /e/ 声道断面積から声道の 共鳴特性(音声スペクト ル)が決定される 声帯が振動する仕組み r1 k 1 r2 k2 m2 m1 x1 (t ) p1 (t ) d1 p2 (t ) x2 (t ) d2 声帯振動は肺から送り出される空気の流れのよって生じる自励振動. (ガラスに鉛筆を押し付けて動かす音がなるのと同じ仕組み) 肺からの空気圧によって声帯が開き、ある程度開くと声帯のバネの性質 とベルヌーイの負圧(空気の流れの2乗に比例する圧力)によって声帯が 閉じる. 声帯振動のしくみ 声門を流れる空気流 (声門体積速度) 声道の音響インピーダンスのリアクタンス(電気回路のコイルに相当)成分 の影響により、声門体積速度波形は右側に傾き、頂点の部分が丸びをおびる 声帯振動と声質 強い声では、OQが小でSQが小.弱い声では、OQが大でSQが大. 声帯音源のスペクトルは、1オクターブで約12~ 18dB減衰する特性をもつ. 強い声の方が減衰が小さい(倍音に富んだスペクトルになる) 乱流音源の生成(1) せばめ 障害物(歯) 摩擦音源(2) 声門の狭め 声道の狭め 摩擦音源の強さ Aspiration Friction 破裂音源の生成(1) 上唇 唇破裂音 下唇 口蓋 舌破裂音 舌 破裂音源の生成(2) Aspirationは英語では強いが 日本語では弱い 音声生成のメカニズム 体積速度 口蓋帆 音圧 Ai 肺 制御パラメータ 制御される対象 肺圧 声の大きさ 声帯 声門の開き 声帯張力(K) 声の高さ 有声/無声 声道 声道断面積 A1,A2,…,AN 音韻性(音色) 音声生成のモデル Ag Ai Zg c2U g c1 2 3 Ag (t ) Ag (t ) p (t ) c j A2 A 1 1 zb j C j A c2 za R j L Qi ki mi 声帯振動モデル r1 k 1 r2 k2 m2 m1 x1 (t ) p1 (t ) d1 p2 (t ) x2 (t ) d2 声帯の運動方程式 mi xi (t ) ri xi (t ) ki xi (t ) kc ( x1 (t ) x2 (t )) di pi (t ) 声門の開きをAg 0とした時、声門面積は Agi (t ) Ag 0 xi (t ) 声帯音源 音声生成モデルによる子音の生成 乱流音源のモデル