Transcript テキスト音声変換技術
文字から声をつくる仕組み 音声のもつ情報 • 言語情報 単位の数 文 単語 言語的に区別できる 最小の音声の単位 • 個人性情報 • 感性情報 ∞ 大 2千~1万 音節 101 音素 27 小 日本語の音素 日本語の母音は5つ 日本語の子音は約22 [fu] [ u 音素以外の音韻表記 長母音では、「e:ga」(映画)ように、母音の時間長が長くなる 促音/Q/(日本語表記で「行った」の「っ」)は、2音素の間に 無音区間が挿入される 撥音/N/(日本語表記の「ん」は、後続する音素によって 異なる音素として発音される /N/ p,b,m の前では[m] kaNpai kampai t,d,n の前では[n] kaNtai kantai k,g,N の前では[N] kaNkaku kaNkaku 日本語の音節 日本語の音節は、CV(子音+ 母音)からなる. 右表の下線付きを除いて 100音節ある. 音声合成技術 • 録音編集方式と規則合成方式 • 録音編集方式は、音声品質は高いが語彙が限定 • 規則合成方式は、任意語彙を対象とするが、音声 品質は劣る 録音編集方式と規則合成方式 規則音声合成 テキスト解析部 音韻、韻律生成部 文から文節への分解 規則音声合成 音韻変形規則 • 助詞 「は」 ⇒ wa 「へ」 ⇒ he • 長母音化 /o/に/u/が続くと/o:/になる /ei/が/e:/になる <例> 東京 toukyou 氷 koori 小売 kouri 公理 kouri 映画 eiga ⇒ to:kyo: ⇒ ko:ri ⇒ ko:ri ⇒ e:ga • 無声子音にはさまれた/i/と/u/は無声化する <例> 少し sukoshi 鹿 shika 語尾の「です」「ます」の/u/は無声化する • 語頭以外の/g/は鼻音化する. <例> メガネ megane 芸術 geijyutsu • 撥音/N/の発音は後続子音によって変化する <例> kaNpai ⇒ kampai kaNtai ⇒ kantai 音声単位 複合単位 VCV単位の音声パラメータ スペクトル パラメータ 規則音声合成 アクセントパタン アクセント規則(1) アクセント規則(2) ピッチ周波数パタンの生成 規則合成方式 音声合成のパラメータ