Transcript PowerPoint

量子化(Mid-riser型)
出力y
入力x
通信ネットワーク特論(量子化・符号化)
1
量子化(Mid-tread型)
出力y
入力x
通信ネットワーク特論(量子化・符号化)
2
量子化(対数)
出力y
入力x
•入力にlog適用後、
均一量子化すれば実現可
通信ネットワーク特論(量子化・符号化)
3
μ則対数圧縮
1
QUANTIZER CHARACTERISTIC
y  sgn( x )
log e (   1)
0.8
ここに、x : 正規化入力、 0  x  1
0.6
y : 量子化出力、
 1 ( x  0)

sgn( x )   0 ( x  0 )
 1 ( x  0)

0.4
0.2
OUTPUT
log e (  x  1)
0
255
128
32
-0.2
-0.4
ITU標準:μ=255
(北米、日本)
-0.6
-0.8
-1
-1
-0.5
0
INPUT
0.5
1
通信ネットワーク特論(量子化・符号化)
4
量子化の例
2
2-bit midriser
1.5
1
V
0.5
0
-0.5
-1
-1.5
-2
0
0.01
0.02
0.03
Time [sec]
0.04
0.05
0.06
通信ネットワーク特論(量子化・符号化)
5
量子化ノイズ
2
1.5
1
V
0.5
0
-0.5
-1
-1.5
-2
0
0.01
0.02
0.03
Time [sec]
0.04
0.05
通信ネットワーク特論(量子化・符号化)
0.06
6
Power [W]
量子化ノイズのパワースペクトル密度
10
-2
10
-3
10
-4
10
-5
10
-6
10
-7
10
-8
10
-9
10
-10
PSD Function
0
0.5
1
1.5
2
2.5
Frequency [kHz]
3
通信ネットワーク特論(量子化・符号化)
3.5
4
7
宿題1
以下の計算機シミュレーションを行う
1. 振幅が1の正弦波を線形量子化し、量子化ノ
イズを測定する。
–
量子化器のビット数を2,3,4,5,6としたときの量子化
ノイズパワーsq2[dB]を計算する
sq 2  10 * log
10
(var( x  x q ))
ここに、var( y ) : y の分散
x : 原信号(正弦波)
x q : 量子化後の信号
通信ネットワーク特論(量子化・符号化)
8
宿題1(続)
–
これを以下の理論値と比較せよ
 ( 4 . 77  6 . 02 N )[ dB ]
ここに、N : 量子化ビット数
–
上記理論値を導け
通信ネットワーク特論(量子化・符号化)
9
宿題1(続)
2.音声信号を録音し、線形量子化と対数量子化
し、SNを比較する。
– 4bitの線形量子化と則圧縮を行う
y  sgn( x )
log e (  x  1)
log e (   1)
ここに、  255
sgn( x )  1( x  0 )
 0( x  0)
  1( x  0 )
通信ネットワーク特論(量子化・符号化)
10
宿題1(続)
– 音声信号を最大値1,0.1,0.01,0.001として正規化して
線形、則量子化のSNを計算する。
SN  10 * log
10
(var( x ) / var( e )) [ dB ]
x : 原信号
e : 量子化ノイズ
• 方法(計算機環境、言語等)、プログラムリスト、
波形プロット等を必要に応じて含める。
• 結果と考察は必須。
通信ネットワーク特論(量子化・符号化)
11
音声信号の高能率符号化
• 音声は一般に冗長度が高い
→うまく除去すれば情報圧縮可能
– 音声を波形として統計的性質を利用
• 波形符号化
– 高品質
– 高レート(低圧縮率)
– 音声の発生機構(声道モデル)を利用
• 情報源符号化
– 人工的な品質
– 低レート(高圧縮率)
– 双方を併用
• ハイブリッド符号化
通信ネットワーク特論(量子化・符号化)
12
信号の冗長性を利用した圧縮(DPCM)
• 音声、画像等隣接サンプル間の相関が強い
→うまく利用して伝送帯域圧縮
通信ネットワーク特論(量子化・符号化)
13
DPCMの効果
0.2
入力x
(音声)
V
0.1
0
-0.1
-0.2
0
0.1
0.2
0.3
Time [sec]
0.4
0.5
0
0.1
0.2
0.3
Time [sec]
0.4
0.5
0.2
r(t)=x(t)-x(t-1)
0.1
V
差分
出力r
0
-0.1
-0.2
通信ネットワーク特論(量子化・符号化)
14
音声の情報源符号化
インパルス列
(声帯振動波)
有声
×
フィルタ
(声道特性)
無声
ノイズ
ゲイン
通信ネットワーク特論(量子化・符号化)
15
MPEG1オーディオ符号化
• 聴覚(マスキング)特性積極活用
• 3つのレイヤー
符号化
レイヤー
レート
* [k b ps ]
可変レート
符号化
圧縮率
Ⅰ
384
×
4
Ⅱ
192
×
8
Ⅲ
128
○
12
*:標準レート、transparent quality
通信ネットワーク特論(量子化・符号化)
16
マスキング
• 大きな音の周波数的近傍は聞こえない。
M:マスカー
a, b: 聞こえない(マスクされる)
c, d: 聞こえる
マスキング閾値
音圧
aM
b
c
d
通信ネットワーク特論(量子化・符号化)
f
17
MPEG1 Layer Ⅲの構成
入力
信号
帯域分割
(32帯域)
FFT
復号
出力
帯域合成
DCT/
可変長ウィ
ンドウ
量子化
(非線型)
ハフマン
符号化
ディジタル
チャネル
マスク閾
値算出 *
IDCT
(インターネット、
メモリ、
ディスク、...)
逆量子化
ハフマン
復号
*:帯域内音レベル対量子化雑音レベルより算出
通信ネットワーク特論(量子化・符号化)
18
画像符号化
• 静止画像符号化
– ほとんどが直交変換(DCT)利用
– 画像の周波数偏在(低域集中)を利用
• 動画像符号化
– ほとんどがDCTベース
– フレーム内、フレーム間差分符号化
– 動き補償:画面内の一部が平行移動した場合補正
し、符号化効率稼ぐ
通信ネットワーク特論(量子化・符号化)
19
画像の2次元周波数(フーリエ)変換
原画像
フーリエ変換画像
通信ネットワーク特論(量子化・符号化)
20
原画像
通信ネットワーク特論(量子化・符号化)
21
2次元FFT画像
通信ネットワーク特論(量子化・符号化)
22
画像のフーリエ変換係数のジグザ・グスキャン
• x,y両方向低周波
成分から高周波に
向けてスキャン
• 成分がある程度小
さくなった点でス
キャンを止める
通信ネットワーク特論(量子化・符号化)
23
静止画符号化
通信ネットワーク特論(量子化・符号化)
24
動画符号化
通信ネットワーク特論(量子化・符号化)
25
動き補償
通信ネットワーク特論(量子化・符号化)
26
音声・画像符号化標準
種別
形態
画像
静止
通信
JPEG
G IF
T IF F
PNG
ランレング
放 送 / ス符号
蓄積
J B IG
音声
動
音声
M C -D C T
ADPCM
(p x6 4 k b ps ,
(3 2 k b ps ,G.7 2 6 )
H .2 6 1 /2 6 3 ) M P -M L Q /A C E L P
(6 .3 /5 .3 k b ps ,
G.7 2 3 .1 )
G S M (R P E -L P T )
(1 3 k b ps )
マ ル チ メ デ ィ ア 会 議 (H .3 2 3 )
M P E G 1 /2 /
4
通信用標準転用
通信ネットワーク特論(量子化・符号化)
音響
M P E G 1 /2 /4
A u d io
(1 2 8 k b ps typ .
CD 品 質 )
A C -3
(D o lb y)
AT R A C ( S o n y, 1
4 6 /6 4 k b ps )
Tw in V Q
(N T T )
27