Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος Οι στόχοι της ΨΕΕ είναι οι εξής: • Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό.

Download Report

Transcript Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος Οι στόχοι της ΨΕΕ είναι οι εξής: • Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό.

Slide 1

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 2

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 3

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 4

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 5

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 6

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 7

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 8

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 9

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 10

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 11

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 12

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 13

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 14

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 15

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 16

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 17

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 18

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 19

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 20

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 21

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 22

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 23

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 24

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 25

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 26

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 27

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 28

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 29

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 30

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 31

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 32

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 33

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 34

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 35

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 36

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 37

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 38

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 39

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 40

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 41

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 42

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 43

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 44

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 45

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 46

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 47

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 48

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 49

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 50

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 51

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 52

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 53

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 54

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 55

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 56

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 57

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 58

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 59

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 60

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 61

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 62

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 63

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 64

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).




Slide 65

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος

Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων

Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη

• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική

• Κωδικοποίηση
• Γραφικά Η/Υ

Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.

Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)

Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας

J πλήθος γραμμών

Κ πλήθος στηλών

JxK πλήθος εικονοστοιχείων

ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255

Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}

Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B  B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.

Είδος εικόνας

J

K

B

bits

bytes

Δυαδική

100

100

1

10000

1250

Αποχρώσεων του γκρι

100

100

8

80000

10000

Έγχρωμη RGB

100

100

24

240000

30000

ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ

J
K
E

JK
A

J

ΜΟΝΑΔΕΣ

pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)

Φαινόμενο της σκακιέρας

K

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1

N   I jk
j0 k 0

J 1 K 1

k

 k  I
j 0 k  0

jk

,

N
J 1 K 1

j

 j  I
j 0 k  0

N

jk

Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

1

1

0

0

1

1

1

1

1

1

1

0

0

1

1

1

0

(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)

(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)

3,4,2,2
0,5,2,2,2
5,2,3,1

Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)

Μη συνδεδεμένο χωρίο
(not connected component)

Συνδεδεμένο χωρίο
(connected component)

Κωδικοποίηση αλυσίδας (chain coding)

3

2
1
0

4
5

6

7

Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.

Υπογραφή (signature)

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250

250

100

100

250

50

100

10

250

50

100

10

250

100

250

100

250

250

250

250

10

250

50

50

g

H(g)

h(g)

10
50
100
250

3

0.125

4

0.167

6

0.250

11

0.458
1.000

H (g ) 

1

I ( k , j)  g
12

h (g ) 

10

8

H (g )
255

 Η(g)
g 0

255

 h(g)  1

6

4

g 0

2

0
0

50

100

150

200

250

300

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14

14

25

25

25

25

26

27

27

27

g

H(g)

h(g)



P(g)

4

4/15

11/15

255*11/15 = 187

26

1

1/15

12/15

255*12/15 = 204

27

3

3/15

15/15

255*15/15 = 255

2 39

2 22

2 05

0

1 88

0

1 71

1

1 54

1

1 37

2

1 20

2

86

3

1 03

3

69

4

52

4

35

5

1

6

5

18

6

241

25

225

255*7/15 = 119

209

7/15

193

5/15

177

5

161

14

145

255*2/15 = 34

129

2/15

97

2/15

113

2

81

10

65

I΄(k,j) = [(G-1)P(I(k,j)]

14

49

P(g) = P(g-1)+ h(g).

14

33

i 0

14

1

P( g )   h(i )

10

17

g

10

ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο

Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο

Κατωφλίωση και πολυκατωφλίωση

Συχνά

τα

εικονοστοιχεία

ενός

αντικειμένου

μιας

εικόνας

παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό

οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.

Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση

C1

Τ

C2

g

 C αν g  T
g 1
C 2 αν T  g

0 αν I
C ( I
 T)


jk
1
jk
I  
jk
1 αν I
C ( I
 T)

jk
2
jk


Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1

 h( g )  1
g 0

T 1

G 1

p1   h( g )

p2   h( g )

g 0

p1+p2=1.

g T

G 1

T 1

G 1

 h( g ) g

   h( g ) g

1 

μ=p1μ1+p2μ2

 2   ( g   ) 2 h( g )

g 0

2 

g 0

p1

 h( g ) g
g T

p2

G 1

μ1

g 0

1

 12   ( g  1 ) 2
g 0

 22 

1
p2

h( g ) 1 1
  ( g  1 ) 2 h( g )
p1
p1 g 0

G 1

(g  
g T

μ2

2

) 2 h( g )

 w2  p1 12  p2 22

 b2  p1 (1   ) 2  p2 ( 2   ) 2  p1 p2 (1   2 ) 2
 b2 


1    w2   b2 


 b2
 2
w

 2   w2   b2

 b2 

p1 (1   ) 2
1  p1



2

 b2

1






t  max ( b2 (T ))
T

t=107

Παράδειγμα

Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)

ρ(g) 

T 1
h(g)
, 1   h(g)
1
g 0
T 1

h(g)
h(g)
1 T-1
log(
)  log(1 )   h(g) log(h(g))
1
1 g 0
g 0 Ρ1

E1 (T )  
255

h(g)
h(g)
log
, 2  1  1
2
g T Ρ 2

Ε 2  

 log(1  1 ) 

1 255
 h(g) log(h(g))
1  1 g T

t  max ( E (T ))
T

t=111

Παράδειγμα

Πολυκατωφλίωση

h(  )

1

17

33

49

65

81

97

113 129 145 161 177 193 209 225 241



G( 0 ) αν f ( x ,y ) T ( 1 )

G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y )  .
 .

G( J 1 ) αν T ( J 1 ) f ( x ,y )

Πολυκατωφλίωση – ΝΔ Kohonen

w0

o j (t )  I ( x, y )  w j (t )

w1

oc(t) = min{oj(t)}
I

α(t) (I( x, y )  w j (t )) αν j  Ν c

Δw j  
0 αν j  N
c


wj-

x

2

wj1

I(x,y)

wj
wj+1
wj+2

wJ-1

Γειτονιά του j νευρώνα για d(t)=2

wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1

t
)
T

d ( t ) d ( 0 )( 1

t
)
T

Πολυκατωφλίωση – ΝΔ Kohonen

Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν

ΝΔ
Kohonen

Reddi

Kapur

Παπαμάρκο
υ

1

T0

164

164

42

114

2

T0
T1

151
227

112
191

42
210

167
226

3

T0
T1
T2

106
179
229

97
149
205

42
139
210

117
184
227

4

T0
T1
T2
T3

106
178
224
237

95
142
192
230

42
118
164
210

117
184
227
-

Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.

Εύρεση ακμών

 f f 
f (x, y)   , 
 x y 

 f   f 
f ( x, y)      
 x   y 
2

2

 f

   y
f


x









Άλλες μάσκες

1I(k, j)  (1K I(k, j),1J I(k, j))
1K I(k, j)  I(k, j)  I(k  1, j)
1J I(k, j)  I(k, j)  I(k, j  1)

 2 I (k , j )  ( 2 K I (k , j ),  2 J I (k , j ))
 2 K I (k , j )  I (k  1, j )  I (k  1, j )
 2 J I (k , j )  I (k , j  1)  I (k , j  1)

Εύρεση ακμών με τον τελεστή Laplace

Εύρεση ακμών με τον τελεστή Laplace

 2 f ( x , y)
x 2

 2 f ( x , y)
y 2

1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)

 2 f ( x, y) 

 2 f (x, y)  2 f (x, y)

x 2
y 2

1

2=

1

-4
1

1

Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN

100

100

100

100

100

G 1

G 1

200

10

20

150

100

g 0

g 0

200

50

50

150

100

200

200

200

150

150

80

80

80

80

80

l   p( g )l ( g )   h( g )l ( g )
H (G)  l  H (G)  1
G 1

G 1

g 0

g 0

H (G)   p( g ) log2 p( g )   h( g ) log2 h( g )

g

H(g)

h(g)

10

1

0.04

20

1

0.04

50

2

0.08

80

4

0.16

100

7

0.28

150

5

0.2

200

5

0.2

25

1

0

•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος

0
0.08
0.16

1

0
0.32

1

0
0.6

1
0

0
\

1
0.4

1

1
g
h(g)

10

20

50

80

100

150

200

00000

00001

0001

001

01

10

11

Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)

Μετασχηματισμός συνημιτόνου
g 2 n  
g 0 n  

1
3

g1 n  

Έστω οι ακολουθίες τιμών για n=0,1,2

2

cos( (2n  1))
3
3

2

cos( (2n  1))
3
6

n: 0

1

f (n)

1

3

g0 (n)

1
3

g1 (n)

1
2

g 2 (n)

1
2

6
3

1
3

0 

2
2
1
3
1
2
1
6




g 0  g1  g 2  1,
 


g 0  g1  g T0  g1  0  g 0  g1
 


g 2  g1  g T2  g1  0  g 2  g1
 


g 0  g 2  g T0  g 2  0  g 0  g 2



1 1 1
f  (1,3,2), g 0  (
,
,
)
3 3 3


1
1
1
2 1
g1  (
,0,
), g 2  (
,
,
)
2
2
6
3 6
 f 0  1 
f   f1   3
f 2  2
1 
 1

 1 
6




g 0 (0)
g1 (0)  2 
g 2 (0)
3




g 0   g 0 (1)    1 , g1   g1 (1)    0 , g 2   g 2 (1)    2 
3
3
1

g 0 (2)  1 
g1 (2)  
g 2 (2)  1
 3

 2 
6 




Η οικογένεια των συναρτήσεων είναι ορθοκανονική

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

n=1
F0
g0

g2
F2
F1

g1

f

Επειδή η βάση είναι ορθοκανονική
2
 
F0  g 0  f  g 0 (0)  f 0  g 0 (1)  f1  g 0 ( 2)  f 2   g 0 ( n )  f n  g T0  f
n 0

2
 
F1  g1  f  g1 (0)  f 0  g1 (1)  f1  g1 ( 2)  f 2   g1 ( n )  f n  g1T  f
n 0

2
 
F2  g 2  f  g 2 (0)  f 0  g 2 (1)  f1  g 2 ( 2)  f 2   g 2 ( n )  f n  g T2  f
n 0

T
 F0  g 0 
 
F   F1   g1T   f  g 0 g1 g 2
 F2  g T2 
F  GT f  G  F  G GT f





T

f 
 f  G F

G T  G 1 (επειδή η βάση είναι ορθοκανονική)
2

Fk   g k (n )  f n
n 0

k  0,1,2

2

 f n   g k (n )  Fk
k 0

g 0 n  

1
2

2

, g1 n  
cos( (2n  1)), g 2 n  
cos( (2n  1))
3
6
3
3
3

ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν  3

g 0 n  

1
, g k n  
N

2

cos(
k (2n  1))

2N

Η οικογένεια των συναρτήσεων είναι ορθοκανονική

1
2

, g k n  
cos(
k (2n  1))

2N
N
όπουN φυσικόςαριθμός, n, k  0,...,N - 1
g 0 n  

N -1

 gk , gm   
n 0

2

2

cos(
k (2n  1))
cos(
m(2n  1))

2N

2N

1 k  m
 g k , g m  
0 k  m

Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 )  g k 1 ( n 1 )  g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 ) 

1
,
N1 N 2
2
πk (2n 2  1)
 cos( 2
),
N2
2N 2

g 0k 2 (n1 , n 2 ) 

1
N1

g k 1k 2 ( n 1 , n 2 ) 

2
πk (2n  1)
2
πk (2n 2  1)
 cos( 1 1
)
 cos( 2
)
N1
2 N1
N2
2N 2

Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C

Συμπίεση εικόνας με τη χρήση του ΜΣ

#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}

Ανακατασκευή με 8 συντελεστές

Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ

 

y

ρ

(ε)
A
ρ
Ο

θ
(α)

x

θ

(β)

Σχήμα 8.

ρν = xκ συνθν + yκ ημθν

y

 x   y    y   (  ) 
x
2


(  )
2
  y
  y   

(  )
2

y

0
   (   )
2

2




  
2
2

 max  x 2  y 2

Ο μετασχηματισμός του Hough

y

(0,1)


) (1,0.
5)
τοξεφ(2)
O(0, )
0)

x

(2,0)

3
 
2

 




2

 J
M
2

2

    


2

,    (

yP
)
xP

   




    
2
2
2

   



  
2
2

Μορφολογία

• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες

ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).