テキスト音声変換技術

Download Report

Transcript テキスト音声変換技術

文字から声をつくる仕組み
音声のもつ情報
• 言語情報
単位の数
文
単語
言語的に区別できる
最小の音声の単位
• 個人性情報
• 感性情報
∞
大
2千~1万
音節
101
音素
27
小
日本語の音素
日本語の母音は5つ
日本語の子音は約22

[fu]
[
u
音素以外の音韻表記
 長母音では、「e:ga」(映画)ように、母音の時間長が長くなる
 促音/Q/(日本語表記で「行った」の「っ」)は、2音素の間に
無音区間が挿入される
 撥音/N/(日本語表記の「ん」は、後続する音素によって
異なる音素として発音される
/N/
p,b,m の前では[m]
kaNpai
kampai
t,d,n の前では[n]
kaNtai
kantai
k,g,N
の前では[N]
kaNkaku kaNkaku
日本語の音節
日本語の音節は、CV(子音+
母音)からなる.
右表の下線付きを除いて
100音節ある.
音声合成技術
• 録音編集方式と規則合成方式
• 録音編集方式は、音声品質は高いが語彙が限定
• 規則合成方式は、任意語彙を対象とするが、音声
品質は劣る
録音編集方式と規則合成方式
規則音声合成
テキスト解析部
音韻、韻律生成部
文から文節への分解
規則音声合成
音韻変形規則
• 助詞 「は」 ⇒ wa
「へ」 ⇒ he
• 長母音化
/o/に/u/が続くと/o:/になる
/ei/が/e:/になる
<例> 東京 toukyou
氷 koori
小売 kouri
公理 kouri
映画 eiga
⇒ to:kyo:
⇒ ko:ri
⇒ ko:ri
⇒ e:ga
• 無声子音にはさまれた/i/と/u/は無声化する <例> 少し sukoshi
鹿 shika
語尾の「です」「ます」の/u/は無声化する
• 語頭以外の/g/は鼻音化する.
<例> メガネ megane
芸術 geijyutsu
• 撥音/N/の発音は後続子音によって変化する <例> kaNpai ⇒ kampai
kaNtai ⇒ kantai
音声単位
複合単位
VCV単位の音声パラメータ
スペクトル
パラメータ
規則音声合成
アクセントパタン
アクセント規則(1)
アクセント規則(2)
ピッチ周波数パタンの生成
規則合成方式
音声合成のパラメータ