Transcript Document
第一章
光、影像、浮水印和抽樣原理
1
內容
1.1 前言
1.2 光與顏色
1.3 人眼與照像機的關係
1.4 彩色模式的轉換 - RGB、YIQ、HSV、YUV和YCbCr
1.5 隱像術與浮水印
1.5.2 基本原理
1.6.1 形態學
1.6.2 離散餘弦轉換
1.7.2 避免混疊效應
1.7 影像抽樣原理
1.6 人臉的定位應用
1.5.1 影像的位元平面剖析
1.7.1 傅利葉轉換
1.8 結論
2
1.1 前言
光的特性和組成,人眼和相機的關係。色彩模式(Color
model)的轉換,隱像術(Image Hiding)和浮水印
(Watermark)之一。人臉定位:形態學(Morphology)和離散
餘弦轉換(Discrete Cosine Transform, DCT) 。
傅立葉轉換(Fourier Transform) 。迴積定理(Convolution
Theorem) , 影像抽樣原理。
3
1.2 光與顏色
光(Light): 粒子,波。人:可見光,不能看見頻率(Frequency)低於
可見光的紅外線和微波,也無法看見頻率高於可見光的紫外線和
加瑪射線。
亮度(Brightness)和頻率的關係,如圖1.2.1所示。低頻率的紅光和
高頻率的紫光的亮度都不如比較中間頻率的黃綠光來的強。
亮
度
黃
綠
紅光波長: 700 109
紫光波長: 400 109
紫
紅
可見光
頻率
圖1.2.1 亮度與頻率的關係
4
1.3 人眼與照像機的關係
影像處理前的輸入影像有很大的比例是由照像機(Camera)拍攝而
得。
瞳孔:光圈,調節光通量,流明(Luminance)為單位。
視
網
膜
瞳
孔
睫
狀
肌
水
晶
體
眼
角
膜
圖1.3.1 人眼示意圖
視
神
經
束
5
1.4 彩色模式的轉換
在影像的彩色模式中,比較常見的有下列幾種:
(1)RGB, (2)YIQ,(3)HSV,(4)YUV ,(5)YCbCr 。
RGBYIQ
Y :亮度(Luminance);I :In-phase,色彩從橙色到青色;Q :Quadraturephase,色彩從紫色到黃綠色。(NTSC 電視系統標準)
Y 0.299 0.587 0.114 R
I 0.596 0.275 0.321 G
Q 0.212 0.523 0.311 B
(1.4.1)
範例1:R,G,B)=(100,50,30),試求其對應的灰階值。
解答:
Y 0.299 100 0.587 50 0.114 30 63
解答完畢
6
(40,30,20)
(10,20,40)
I
(
100
,
150
,
200
)
(
50
,
250
,
120
)
範例2:
將 I 轉換成YIQ影像,這裡(10,20,40)代表R=10, G=20和B=40。
解答:
Y11 0.299 10 0.587 20 0.114 40 19.29
I11 0.596 10 0.275 20 0.321 40 12.38
Q11 0.212 10 0.523 20 0.311 40 4.1
YIQ影像為
I YIQ
(32,9,1)
(19,12,4)
(
141
,
46
,
4
)
(
175
,
77
,
84
)
解答完畢
7
圖1.4.1 彩色Lena影像
圖1.4.2 轉換的高灰階Lena影像
8
RGBHSV
0.5R G R B
H 1 cos
2
R G R B G B
H H1 if B G
1
H 360 H1 if B G
Max(RR,,G
G, B) min(
Min(R, G, B)
max(
S
S
Max(R
R,,G
G,, B
B))
max(
Max(RR,,G
G,, B
B))
max(
V
V
255
255
(1.4.2)
H=0時代表紅色,H=120時代表綠色,H=240時代表藍色。
S=0時,表示影像為灰階式的影像。
當H = 0且S=1時,影像為紅色。當V=0時,表示黑色。反之,當
V=1時,表示白色的亮光。
9
HSV系統可以圖1.4.3表示其座標系統。
圖1.4.3 HSV彩色系統
HSV=HSB=HIS,B:Brightness,I:Intensity 。
10
YUVYIQ
I U sin(33) V cos(33)
Q U cos(33) V sin(33)
在JPEG系統中,我們第一步輸入RGB彩色影像。第二步將RGB彩
色轉換成YCbCr彩色系統。
Cb ( B Y ) / 2 0.58
Cr ( R Y ) / 2 0.58
(1.4.3)
Cb 代表“Blue Minus ‘Black and White’ ”
Cr 代表“Red Minus ‘Black and White’ ”
11
1.5 隱像術與浮水印
1.5.1 影像的位元平面剖析
(a) R平面
(b) G平面
(a) B平面
圖1.5.1.1 彩色Lena影像的三張分解圖
12
灰階Lena影像分解成八個位元平面
(a) 第一張位元平面
(b) 第二張位元平面
(e) 第五張位元平面
(f) 第六張位元平面
(c) 第三張位元平面
(d) 第四張位元平面
(g) 第七張位元平面
(h) 第八張位元平面
圖1.5.1.2 灰階Lena影像的八張位元平面剖析
13
把圖1.5.1.2(e) ~ (h) 疊在一起可得到圖1.5.1.3。
圖1.5.1.2(e) ~ (h) 的合成影像
14
範例1:給44子影像,子影像的每一個像素之灰階值佔用
八個位元,請算出第三張位元平面。
8
7
6
5
32
31
30
29
10
11
12
13
0
1
2
3
解答:子影像轉換成
00001000
00000111
00000110
00000101
00100000
00011111
00011110
00011101
00001010
00001011
00001100
00001101
00000000
00000001
00000010
00000011
將右邊第三位元全部收集起來,得到第三位元平面:
解答完畢
0
1
1
1
0
1
1
1
0
0
1
1
0
0
0
0
15
範例2:前述的隱像術之優缺點為何?
解答:
植入容易
原影像
植入浮水印的影像
取出困難
滿足上圖的函數也叫單程函數(One-way Function)。利用位元平面
來植入影像的最大缺點為:一旦經過壓縮後,所植入的影像很容
易受到破壞,解壓後所取出的影像常常已遭到破損。
解答完畢
16
1.5.2 基本原理
隱像術
把A影像隱藏在B影像並且讓人無法察覺B影像中藏了A影像。
PSNR
令B'為將A隱藏在B後的結果。PSNR (Peak Signal-to-Noise Ratio)
很常被用來評估B'和B的相似性,PSNR的定義如下
2552
PSNR 10 log10
MSE
1 N 1 N 1
MSE 2 ( B' ( x, y ) B( x, y ))2
N x 0 y 0
浮水印
可把A看成標誌(Logo),通常這個標誌可想成一種版權。
17
SVD隱像術方法
已知有一 N × N 的灰階影像 A,假設 A 的秩(Rank)為 r,
則 A 的SVD可表示為
A U V t
V和U為正交矩陣(Orthogonal Matrix)且 diag( 1 , 2 ,..., n ),其中
1 , 2 ... n 滿足 1 2 ... r 0 和 r1 r2 ... n 0。
這裏 σ i 等於 i , i 為矩陣At A的第 i 個特徵值(Eigenvalue)。
18
範例1:如何知道 λ i 0 ?
解答:利用
AX
2
AX AX X t At AX
t
X t X X t X
X
AX
X
2
2
2
0
解答完畢
19
範例2:如何知道A可進行SVD分解?也就是,如何得到
1 0 V1t
t
A U V (U1U 2 )
0 0 V2
U1 1V1t
t
(1.5.2.1)
解答:
20
8 8
2 2
t
例如,令 A
,則 A A
。
8
8
2 2
A t A 的特徵值(Eigenvalues)為 1 16 和 2 0 。將特徵值開根號,A
的奇異值為 1 4 和 2 0。特徵值為16的特徵向量為 V1 1, 1t
而特徵值為0的特徵向量為 V2 1, 1t,利用這二個特徵向量可建構出
1 1 1
V (V1 ,V2 )
2 1 1
利用 AV U 可得 AV1 1u1
所以
1
1 2 2
u1
AV1
1
4 2 2
1
2
1
2
1
2
1
2
21
又由 AV U ,可得 AtU V t 。利用 At u2 0 可找出
1
u2
2
t
1
,
。A的SVD可表示為
2
t
A U V
1
2
1
2
1
2 4 0 2
1 0 0 1
2
2
1
2
1
2
1
結合SVD及VQ之方法[20],在壓縮和失真之間得到一個較好的平衡 。
22
圖1.5.2.1(a)為待植入的F16影像,圖1.5.2.1(b) 為將F16植入圖1.4.2
後的結果。F16經隱像後,效果的確蠻好的,畢竟在圖1.5.2.1(b)中,
用肉眼實在看不出F16隱藏其中。
(a) 待植入的F16
(b) 用SVD將F16植入圖1.4.2後的結果
圖1.5.2.1 隱像後的效果
23
範例3:一般而言,怎樣分辨浮水印和資料隱藏?
解答:
浮水印: 確定影像的所有者。
資料隱藏: 將資料隱藏起來。
解答完畢
24
1.6 人臉的定位應用
1.6.1 型態學
圖1.6.1.1 輸入的影像
圖1.6.1.2 皮膚色所在
封閉(Closing)算子
開放(Opening)算子
25
擴張(Dilation)和侵蝕 (Erosion)
A:待處理的區塊集; B:結構化元素集(Structuring Elements)
擴張運算
D( A, B) A B A b
bB
侵蝕運算
E ( A, B) AΘ ( B) A b
b B
y
y
5
y
5
5
4
3
4
3
4
3
2
1
2
1
2
1
1
1
A
B
x
1 2
3 4
5
圖1.6.1.3 集合A和B
1
1
x
1 2
3 4
5
圖1.6.1.4 D(A,B)
1
1
x
1 2
3 4
5
圖1.6.1.5 E(A,B)
26
範例1:今將圖1.6.1.3的區塊集改成下圖所示的區塊:
試求D(A, B)和E(A, B)。
解答:
D A, B
解答完畢
E A, B
27
範例1.1:延用圖1.6.1.3的結構化元素集B,請分別算出此三區塊集
經開放算子及封閉算子運算後的結果,並加以說明。
Y
10
9
8
7
6
5
4
3
2
1
X
1
2
3
4
5
6
7
8
9
10
28
解答:
封閉算子:擴張再侵蝕。經由擴張運算
可以得到下圖的結果。
將擴張運算所得區塊集進行侵蝕運算,
得下圖的結果。
Y
10
9
8
7
6
5
4
3
2
1
X
1
2
3
4
5
6
7
8
9
10
開放算子:侵蝕再擴張
經由侵蝕運算可以得到下圖
將侵蝕運算所得區塊集進行擴張運算
得下圖的結果。
Y
Y
10
10
9
9
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
X
X
1
2
3
4
5
6
7
8
9
10
此即為封閉算子運算後的結果。
解答完畢
1
2
3
4
5
6
7
8
9
10
29
範例2:如何利用擴張運算子D和侵蝕運算子E以求得影像中輪廓
的外圍?
解答:I:原影像,B:結構化元素集。D(I, B)將影像的輪廓擴張;
E(I, B)可將影像的輪廓侵蝕。[D(I, B)-E(I, B)]:物體的輪廓外圍,這
裏的‘-’代表兩影像相減。:
介於D(I,B)和E(I,B)之間的環形區域可視為物體I的輪廓。
解答完畢
30
範例4:如何利用色調範圍來過濾皮膚色?
解答: 首先利用人工點選的方式,將所有訓練影像中的皮膚色予
以框出來,然後將色調抽取出來,並且將統計出來的平均
值 μ 和標準差 用於濾波器的設計,下面為其示意圖:
31
1.6.2 離散餘弦轉換(Discrete Cosine Transform)
DCT
令 f(x,y) 為框框內位於(x,y)的灰階值減去128,則DCT的計算公式
如下
N 1 N 1
1
(2 x 1)i
(2 y 1) j
D(i, j )
C (i )C ( j ) f ( x, y ) cos
cos
2N
2N
2N
x 0 y 0
1 / 2
,i 0
c(i )
, otherwise
1
1 / 2
c( j )
1
(1.6.2.1)
, j0
, otherwise
IDCT
f(x,y)也可透過IDCT(inverse DCT)得到,公式如下
1
f ( x, y)
2N
N 1 N 1
C(i)C( j)D(i, j) cos
i 0 j 0
(2 x 1)i
(2 y 1) j
cos
2N
2N
(1.6.2.2)
透過式子(1.6.2.2)求得f(x,y)後再加上128即可得到位於影像中(x,y)
位置的原始灰階值。
32
DC(Direct Current、直流值)
1 1 1 N 1 N 1
1
D(0,0)
f
(
x
,
y
)
cos
0
cos
0
2 N 2 2 x 0 y 0
2 2N
N 1 N 1
f ( x, y)
x 0 y 0
此處N=8,則
1 7 7
D(0,0) f ( x, y )
8 x 0 y 0
AC(Alternative Current、交流值)
20
23
12
5
7
9
22
30
-481 107
41
57
-26 -159 -43
-70
22
32
16
5
8
12
11
23
-316 -104 -11
14
32
100
18
41
29
32
16
11
70
30
20
20
0
41
9
-67
-56
9
47
40
100 142
3
45
44
200
50
22
-49
-29
37
-77
85
10
-91
-43
103 120
33
41
200
50
22
70
114
26
-9
103 -49
-26
86
53
120 210
22
123
23
70
69
160
-60
-17
-23
-9
-22
12
-55
-94
12
24
126
90
20
6
60
64
-7
56
-2
-7
27
43
12
212 252 243
26
149 221
61
90
-74
-4
-77
-25
74
-41
-44 103
222
圖1.6.2.1 8x8的灰階圖案及其灰階值
圖1.6.2.2 DCT後的結果
33
範例2:當D(0, 0)>1000時,原88灰階影像為何種影像?
解答:令全黑的灰階值為0,而全白的灰階值為255。已知
1
f ( x, y ) 1000
x 0 y 0 64
7
7
D (0, 0) 8
原88灰階影像可能為一幾近全白的平滑影像。
解答完畢
圖1.6.2.3為DCT後的頻率域之
紋理方向示意圖。通常若框住
皮膚色的框框是臉部時,在高
頻區會有一些較大的係數表現。
當DC值過小時和AC值過大,
可進一步判斷有臉部的框框。
圖1.6.2.3
DCT頻率域的紋
理方向示意圖
34
範例3:如何在臉部上找出眼睛和嘴巴的部位?
解答:假設找到的臉部如下所示:
利用水平投射法(Horizontal Projection)
我們可發現在(a, b)和(c, d)兩區間有頻率較高的波峰(Peak),依
位置而言,可合理推估(a, b)區間為眼部所在,而(c, d)區間為
嘴巴所在,畢竟這兩個部分的邊點數是較多的。
解答完畢
35
1.7 影像抽樣原理
1.7.1 傅利葉轉換
給一週期函數(Periodic Function) g(θ),0 2 ,傅利葉原先
的想法是將g(θ)用有正交性(Orthogonality)的傅利葉基底(Basis)
來表示。這些正交的基底為cosθ、cos2θ、cos3θ、…、sinθ、
sin2θ、sin3θ、…, 0 2 。
正交性
1
cos( m n) cos( m n)
2
cos m cos n
當m n時,
m n 0時,
2
2
0
0
m n 0時,
2
0
cosm cosnd 0
cosm cosnd
cosm cosnd 2
36
求解傅利葉係數
有了傅利葉基底後,g(θ)可表示成
a0
g ak cosk bk sin k
2 k 1
則從
2
0
(1.7.1.1)
am , m 0
g ( ) cosmd
a0 , m 0
可推得
am
1
2
0
g ( ) cos md , m 0,1,2,...
從
2
0
g ( ) sin md bm (m 0)
可推得
bm
1
2
0
g ( ) sin md , m 1,2,3,...
37
g
()
範例1:我們來看個例子吧!
解答:令 g ,
ak
bk
1
π
cos kd 0
1
sin k d
2
0
d(
cos k
)
k
π
-3
π-2
π圖1.7.1.1 g(θ)
2
2
cos k (1) k 1
k
k
2
k 1
g
(
)
(
1
)
sin k
k 0 k
1
1
1
2[sin sin 2 sin 3 sin 4 ...]
2
3
4
S1 2 sin
g()
3
2
只取第一項
1
S 2 2[sin sin 2 ] 只取前二項
2
1
1
S3 2[sin sin 2 sin 3 ] 只取前三項
2
3
解答完畢
π 2
π
π
1
-3
-2
-1
1
-1
圖1.7.1.2 g(θ)的三個近似圖
-2
38
2
FFT
2 i
i
N
令 W i e 為1的基本根(Primitive Root)且滿足 WNN 1。若
N=8時,傅利葉矩陣為
1
1
1
1
1
1 1
N
1
1
1
F8
1
1
1
1
W2
W4
W6
1
W2
W4
W6
FFT可在 O( N log N ) 時間內完成,首先將 X
分別表示成
W1
W2
W3
W4
W5
W6
W7
X1
X
3
Xo X5
:
X
N 1
W3
W6
W1
W4
W7
W2
W5
W4
1
W4
1
W4
1
W4
W5
W2
W7
W4
W1
W6
W3
W6
W4
W2
1
W6
W4
W2
1
W7
W6
5
W
W4
3
W
W 2
W 1
分成偶半部和奇半部,
X0
X
2
Xe X4
:
X
N 2
39
令 u FN / 2 X e 和 v FN / 2 X o。利用算出的 u 和 v ,可得
N
i
u
W
v
,
0
i
N i
i
2
yi
N
ui N / 2 WNi vi N / 2 ,
i N
2
當 0 i N /2
yi
W
ij
N
0 j N
偶數j
W
ij
N
0 j N
Xj
奇數j
W
0 j N
WNik/2 X 2 k WNi
0 k N /2
0 k N /2
Xj
0 k N /2
ui WNi vi
yi WNik/2 X 2 k WNi
ij
N
0 k N /2
當 N /2 i N
Xj
WN2 ki X 2 k
0 k N /2
(1.7.1.2)
0 k N /2
0 k N /2
WN(i/2 N /2) k X 2 k WNi
ui N /2 WNi vi N /2
WNi (2 k 1) X 2 k 1
WNik/2 X 2 k 1
WNik/2 X 2 k 1
0 k N /2
WN(i/2 N /2) k X 2 k 1
40
範例2:可否利用替代法證明 T ( N ) 2T ( N / 2) ( N ) O( N log N )。
解答:已知 T ( N ) 2T ( N / 2) ( N ) ,可推得
T ( N ) 2T ( N / 2) ( N )
2T ( N / 2) CN
2 2 T ( N / 4) CN CN
.
.
.
2 k T ( N / 2 k ) CN ... CN CN
2 k T ( N / 2 k ) (1 ... 1 1)CN
N
T (2) (log N 1)CN
2
N
CN log N CN
2
O( N log N )
解答完畢
41
分開性(Separability)
回到二維的FT,假設一張影像位於 (x,y) 的灰階值為 f(x,y),則二
維的FT定義為
1
F (u, v)
N N
N 1 N 1
f ( x, y)e
j 2 [
( ux vy )
]
N
(1.7.1.3)
x 0 y 0
IFT(Inverse FT)依下式求得
1
f ( x, y )
N
N 1 N 1
F (u, v)e
j 2 [
( ux vy )
]
N
(1.7.1.4)
u 0 v 0
式子(1.7.1.3)可改寫成下列的型式
1
F (u, v)
N
1
N
N 1
j 2 ux N 1
N
x 0
y 0
e
N 1
f ( x, y )e
F ( x , v )e
j 2 ux
N
j 2 uy
N
(1.7.1.5)
x 0
式子(1.7.1.5)中 F(x,v) 可看成先對 y 軸進行FT再對 x 軸進行FT。
(1.7.1.5)式顯示的是FT的分開性(Separability) 。
42
範例3:假如我們想把FT後的結果從原點(Origin)移到中央(Center)
該如何辦到呢?
解答:首先將乘上 ( 1) x y,則 f ( x, y)(1) x y 的FT如下所算
N 1 N 1
x y
f ( x, y)( 1) e
( ux vy)
j 2
N
x 0 y 0
N 1 N 1
f ( x, y ) e
x 0 y 0
N 1N 1
f ( x, y ) e
( ux vy )
j 2
j ( x y )
N
e
由f(x,
y)(-1)x+y的FT等於
f ( x, y ) e
x 0 y 0
N
N
(u 2 ) x ( v 2 ) y
j 2
N
x 0 y 0
N 1N 1
N
N
x y )
( ux vy )
2
2
j 2
j 2
N
N
(
F (u
F (u
N
N
,v )
2
2
e
(1.7.1.6)
N
N
, v ) ,可得知已將FT的結果從
2
2
原點移至中央處了。式 (1.7.1.6) 顯示了FT的平移性(Translation)。
解答完畢
43
放大性(Scaling)
若將 f ( x, y ) 乘上一個係數C,則 C f ( x, y ) 經FT作用後得
到 CF (u, v ) ,這個性質稱作放大性質。令 x z ,則
1
1
u
x
z
F ( ) 為傅利葉配對(Fourier Pair ),
f (x ) 和
| |
具有倒數放大性質(Reciprocal-Scaling)。
和
dx
dz 。可推得
f(x)
F(u)
1/2
-1/2
x
f(x)
F(u)
f(x)
-4π
-2π
F(u)
2π
4π
1/4
-1/4
f(2x)
x
1/2f(u/2)
44
u
迴積定理(Convolution Theorem)
兩函數 f(x) 和 g(x) 的迴積定義為
N 1
f ( x ) g ( x ) f ( m) g ( x m)
m 0
令
N 1
1
z( x)
N
f ( m) g ( x m)
m 0
則所有 z(x) 經FT作用後得
1
N
N 1
z( x)W
x 0
kx
1
2
N
1
N
N 1 N 1
f (m) g ( x m)W
kx
x 0 m 0
N 1
m 0
1
f ( m)
N
N 1
kx
g
(
x
m
)
W
x 0
1 N 1
1
f (m)W km
N m 0
N
F (u )G(u )
N 1
g ( x)W
kx
x 0
45
1.7.2 避免混疊效應
取樣間距(Sampling Interval) x
1
x
必須滿足
,如此才不會造成混疊效應(Aliasing)。
2Wu
F(u)
P(u)
Wu
-Wu
u
某函數
1/x
-1/x
u
取樣函數
F(u)*P(u)
T(u)
-Wu
F(u)和P(u)進行迴積運算
Wu
u
將T(u)乘上F(u)*P(u)可得F(u)
46
最後我們來看一個FT的實作結果。給一影像如圖1.7.2.1
所示,經FT作用後,其傅利葉頻譜顯示於圖1.7.2.2。
圖1.7.2.1 輸入的影像
圖1.7.2.2 傅利葉頻譜圖
47
1.8 結論
我們從光的組成談到人眼結構及其和照相機結構的對應
關係;四種色彩模式的轉換,形成高灰階影像與其分解
成八張位元平面,引出隱像術與浮水印;搭配DCT介紹
了人臉的定位應用。
48