Transcript PowerPoint
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化) 1 量子化(Mid-tread型) 出力y 入力x 通信ネットワーク特論(量子化・符号化) 2 量子化(対数) 出力y 入力x •入力にlog適用後、 均一量子化すれば実現可 通信ネットワーク特論(量子化・符号化) 3 μ則対数圧縮 1 QUANTIZER CHARACTERISTIC y sgn( x ) log e ( 1) 0.8 ここに、x : 正規化入力、 0 x 1 0.6 y : 量子化出力、 1 ( x 0) sgn( x ) 0 ( x 0 ) 1 ( x 0) 0.4 0.2 OUTPUT log e ( x 1) 0 255 128 32 -0.2 -0.4 ITU標準:μ=255 (北米、日本) -0.6 -0.8 -1 -1 -0.5 0 INPUT 0.5 1 通信ネットワーク特論(量子化・符号化) 4 量子化の例 2 2-bit midriser 1.5 1 V 0.5 0 -0.5 -1 -1.5 -2 0 0.01 0.02 0.03 Time [sec] 0.04 0.05 0.06 通信ネットワーク特論(量子化・符号化) 5 量子化ノイズ 2 1.5 1 V 0.5 0 -0.5 -1 -1.5 -2 0 0.01 0.02 0.03 Time [sec] 0.04 0.05 通信ネットワーク特論(量子化・符号化) 0.06 6 Power [W] 量子化ノイズのパワースペクトル密度 10 -2 10 -3 10 -4 10 -5 10 -6 10 -7 10 -8 10 -9 10 -10 PSD Function 0 0.5 1 1.5 2 2.5 Frequency [kHz] 3 通信ネットワーク特論(量子化・符号化) 3.5 4 7 宿題1 以下の計算機シミュレーションを行う 1. 振幅が1の正弦波を線形量子化し、量子化ノ イズを測定する。 – 量子化器のビット数を2,3,4,5,6としたときの量子化 ノイズパワーsq2[dB]を計算する sq 2 10 * log 10 (var( x x q )) ここに、var( y ) : y の分散 x : 原信号(正弦波) x q : 量子化後の信号 通信ネットワーク特論(量子化・符号化) 8 宿題1(続) – これを以下の理論値と比較せよ ( 4 . 77 6 . 02 N )[ dB ] ここに、N : 量子化ビット数 – 上記理論値を導け 通信ネットワーク特論(量子化・符号化) 9 宿題1(続) 2.音声信号を録音し、線形量子化と対数量子化 し、SNを比較する。 – 4bitの線形量子化と則圧縮を行う y sgn( x ) log e ( x 1) log e ( 1) ここに、 255 sgn( x ) 1( x 0 ) 0( x 0) 1( x 0 ) 通信ネットワーク特論(量子化・符号化) 10 宿題1(続) – 音声信号を最大値1,0.1,0.01,0.001として正規化して 線形、則量子化のSNを計算する。 SN 10 * log 10 (var( x ) / var( e )) [ dB ] x : 原信号 e : 量子化ノイズ • 方法(計算機環境、言語等)、プログラムリスト、 波形プロット等を必要に応じて含める。 • 結果と考察は必須。 通信ネットワーク特論(量子化・符号化) 11 音声信号の高能率符号化 • 音声は一般に冗長度が高い →うまく除去すれば情報圧縮可能 – 音声を波形として統計的性質を利用 • 波形符号化 – 高品質 – 高レート(低圧縮率) – 音声の発生機構(声道モデル)を利用 • 情報源符号化 – 人工的な品質 – 低レート(高圧縮率) – 双方を併用 • ハイブリッド符号化 通信ネットワーク特論(量子化・符号化) 12 信号の冗長性を利用した圧縮(DPCM) • 音声、画像等隣接サンプル間の相関が強い →うまく利用して伝送帯域圧縮 通信ネットワーク特論(量子化・符号化) 13 DPCMの効果 0.2 入力x (音声) V 0.1 0 -0.1 -0.2 0 0.1 0.2 0.3 Time [sec] 0.4 0.5 0 0.1 0.2 0.3 Time [sec] 0.4 0.5 0.2 r(t)=x(t)-x(t-1) 0.1 V 差分 出力r 0 -0.1 -0.2 通信ネットワーク特論(量子化・符号化) 14 音声の情報源符号化 インパルス列 (声帯振動波) 有声 × フィルタ (声道特性) 無声 ノイズ ゲイン 通信ネットワーク特論(量子化・符号化) 15 MPEG1オーディオ符号化 • 聴覚(マスキング)特性積極活用 • 3つのレイヤー 符号化 レイヤー レート * [k b ps ] 可変レート 符号化 圧縮率 Ⅰ 384 × 4 Ⅱ 192 × 8 Ⅲ 128 ○ 12 *:標準レート、transparent quality 通信ネットワーク特論(量子化・符号化) 16 マスキング • 大きな音の周波数的近傍は聞こえない。 M:マスカー a, b: 聞こえない(マスクされる) c, d: 聞こえる マスキング閾値 音圧 aM b c d 通信ネットワーク特論(量子化・符号化) f 17 MPEG1 Layer Ⅲの構成 入力 信号 帯域分割 (32帯域) FFT 復号 出力 帯域合成 DCT/ 可変長ウィ ンドウ 量子化 (非線型) ハフマン 符号化 ディジタル チャネル マスク閾 値算出 * IDCT (インターネット、 メモリ、 ディスク、...) 逆量子化 ハフマン 復号 *:帯域内音レベル対量子化雑音レベルより算出 通信ネットワーク特論(量子化・符号化) 18 画像符号化 • 静止画像符号化 – ほとんどが直交変換(DCT)利用 – 画像の周波数偏在(低域集中)を利用 • 動画像符号化 – ほとんどがDCTベース – フレーム内、フレーム間差分符号化 – 動き補償:画面内の一部が平行移動した場合補正 し、符号化効率稼ぐ 通信ネットワーク特論(量子化・符号化) 19 画像の2次元周波数(フーリエ)変換 原画像 フーリエ変換画像 通信ネットワーク特論(量子化・符号化) 20 原画像 通信ネットワーク特論(量子化・符号化) 21 2次元FFT画像 通信ネットワーク特論(量子化・符号化) 22 画像のフーリエ変換係数のジグザ・グスキャン • x,y両方向低周波 成分から高周波に 向けてスキャン • 成分がある程度小 さくなった点でス キャンを止める 通信ネットワーク特論(量子化・符号化) 23 静止画符号化 通信ネットワーク特論(量子化・符号化) 24 動画符号化 通信ネットワーク特論(量子化・符号化) 25 動き補償 通信ネットワーク特論(量子化・符号化) 26 音声・画像符号化標準 種別 形態 画像 静止 通信 JPEG G IF T IF F PNG ランレング 放 送 / ス符号 蓄積 J B IG 音声 動 音声 M C -D C T ADPCM (p x6 4 k b ps , (3 2 k b ps ,G.7 2 6 ) H .2 6 1 /2 6 3 ) M P -M L Q /A C E L P (6 .3 /5 .3 k b ps , G.7 2 3 .1 ) G S M (R P E -L P T ) (1 3 k b ps ) マ ル チ メ デ ィ ア 会 議 (H .3 2 3 ) M P E G 1 /2 / 4 通信用標準転用 通信ネットワーク特論(量子化・符号化) 音響 M P E G 1 /2 /4 A u d io (1 2 8 k b ps typ . CD 品 質 ) A C -3 (D o lb y) AT R A C ( S o n y, 1 4 6 /6 4 k b ps ) Tw in V Q (N T T ) 27